AI 摘要
NVIDIA发布了多模态模型Nemotron 3 Nano Omni,专为处理长上下文设计,能够同时理解文本、图像、音频和视频。该模型在文档分析、自动语音识别、音视频理解以及智能体计算机使用等实际应用场景中表现优异。在多项基准测试中,Nemotron 3 Nano Omni均展现出领先的准确性和效率。
NVIDIA 发布 Nemotron 3 Nano Omni,这是一款面向长上下文的多模态模型,能够处理文本、图像、音频和视频。
它在文档分析、自动语音识别、音视频理解及智能体计算机使用等实际应用中表现出色,并在多项基准测试中展现了领先的准确性和效率。