# NVIDIA 发布 Cosmos 3：首个面向物理AI推理与动作的开源全能模型

- 来源：Hugging Face：Blog（RSS）
- 发布时间：2026-06-01 12:44
- AIHOT 分数：75
- AIHOT 链接：https://aihot.virxact.com/items/cmpus0sgk00flsl0z326j9nxx
- 原文链接：https://huggingface.co/blog/nvidia/cosmos-3-for-physical-ai

## AI 摘要

NVIDIA 发布 Cosmos 3，基于 Mixture-of-Transformers（MoT）架构的开源全能模型，统一世界生成、场景理解、因果推理和策略生成。该模型通过自回归与扩散子序列联合注意力，在单一前向过程中处理文本、图像、视频、音频和动作等多模态。本次发布包含两个版本：Cosmos 3 Nano（16B 参数，8B 推理器 + 8B 生成器，面向工作站级 GPU）和 Cosmos 3 Super（64B 参数，32B + 32B，面向 Hopper 和 Blackwell GPU，用于大规模合成数据生成与研究）。两者均已上架 Hugging Face，并提供 Diffusers 集成、GitHub 后训练脚本和开源合成数据数据集。

## 正文

这是一则列表来源，站内未收录完整正文。
