6月1日

22:05

The Decoder：AI News（RSS）

MiniMax M3：具有百万token上下文窗口的开源权重模型挑战闭源领先者

中国AI公司MiniMax发布了新模型M3。它被定位为首个同时具备顶级编码性能、100万token上下文窗口以及原生多模态能力的开源权重模型。

多模态模型发布编码

21:35

The Decoder：AI News（RSS）

Nvidia在GTC台北大会押注物理AI：发布新世界模型、驾驶大脑及开源人形机器人

Nvidia在GTC台北大会上发布了一系列面向机器人、自动驾驶和视频系统的模型。核心发布包括升级版世界模型Cosmos 3、显著扩展规模的驾驶模型Alpamayo 2 Super，以及一个开源的人形机器人参考平台。这些产品共同推进了其在物理AI领域的布局。

具身智能开源/仓库模型发布

21:35

The Decoder：AI News（RSS）

Nvidia的Nemotron 3 Ultra成为最聪明的美国开源模型，但中国仍然领先

根据Artificial Analysis基准评估，Nvidia发布的Nemotron 3 Ultra模型被评为目前最强大的美国开源大语言模型。但这一成就并未改变中国在开源大语言模型领域仍然保持领先的格局。

开源生态推理模型发布

21:09

Chubby♨️@kimmonismus

NVIDIA在GTC Taipei上宣布完全开源Cosmos 3。这是首个针对物理AI的"全能模型"，具备原生视觉推理能力，可理解真实世界、预测未来并生成机器人应采取的行动。本次发布包含两个变体：Super（32B）和Nano（8B）。模型权重、代码及数据集均已完全开放。

NVIDIA AI: Introducing Cosmos 3: Our latest frontier model for Physical AI Cosmos 3 is the world's first fully open omnimodel with ...

具身智能开源/仓库模型发布

关联讨论 8 条

21:02

SiliconFlow@SiliconFlowAI

MiniMax M3 现已上线 SiliconFlow 平台

MiniMax M3 现已在 SiliconFlow 平台上线，并提供限时7天的50%折扣。定价为：缓存 $0.06、输入 $0.30、输出 $1.20（每百万 token）。M3 是首个同时具备三大前沿能力的开源模型：一是编码与智能体能力，在 SWE-Bench Pro 评测中击败了 GPT-5.5 和 Gemini 3.1 Pro；二是支持 100万 token 上下文窗口（通过 MiniMax Sparse Attention 技术实现）；三是具备原生多模态能力，支持图像、视频与计算机操作。

多模态开源/仓库模型发布编码

关联讨论 6 条

20:47

MiniMax (official)@MiniMax_AI

1. 视频控制 + 游戏 + M3 2. 开放权重 + 海量上下文 + 强编码能力 3. 现在就取消我的周末计划【引用 @MinLiBuilds】：跟祖传的 20K context 说 bye bye 了。 MiniMax M3 发布了，三个亮点： 1M context、原生多模态、Agentic。我这次做了一次完整评测，使用CC workflow 、 @ZenMuxAI和MiniMax M3：给一张截图，做一个"凡人修仙剑阵对决手势游戏"。要求是：支持双人对决、使用 workflow 拆解任务、加入石头剪刀布机制。 2 小时后，游戏真的跑起来了。这一代LLM的版本答案我知道了： 1M 上下文 + 多模态+ agent 模式。 1M context 是推理深度的基础，多 agent 负责拆任务和执行。

实践哥MinLi: 跟祖传的 20K context 说 bye bye 了。 MiniMax M3 发布了,三个亮点: 1M context、原生多模态、Agentic。我这次做了一次完整评测,使用CC workflow 、 @ZenMuxAI和MiniM...

智能体多模态开源/仓库模型发布

20:43

🚨 AI News | TestingCatalog@testingcatalog

NVIDIA宣布将于本周晚些时候发布Nemotron 3 Ultra，这是一个550B参数的开放权重模型。根据Artificial Analysis，它被定位为美国实验室最智能的开放权重模型。 Soon 👀

NVIDIA AI: Nemotron 3 Ultra is coming this week. ⌛️

开源/仓库推理模型发布

20:39

karminski-牙医@karminski3

MiniMax 发布新模型 MiniMax M3，声称是首个同时整合三项前沿能力的开源权重模型。这三项能力为：编码与智能体前沿能力，在 SWE-Bench Pro 等基准测试中取得具体分数；MiniMax 稀疏注意力机制将上下文长度扩展至 1M；以及原生多模态能力。模型权重与技术报告预计在约 10 天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

智能体模型发布编码

关联讨论 6 条

18:47

MiniMax (official)@MiniMax_AI

确实如此 😎 #M3

Arif: MiniMax M3 scores 90.3% GPT 5.5 Scores 92.4% Just a 2.1% gap now at @convex. Incredible to see the open-source models cl...

开源生态推理模型发布

18:47

MiniMax (official)@MiniMax_AI

MiniMax M3 模型现已在 Novita AI 平台上线，并提供首周半价优惠。作为首个开源权重模型，它集成了前沿编码与智能体能力，在 SWE-Bench Pro 上得分 59.0%，Terminal Bench 2.1 上得分 66.0%，MCP Atlas 上得分 74.2%。该模型上下文窗口最高可达 1M tokens，由 MiniMax Sparse Attention 技术支持，并从一开始即支持原生多模态，可处理文本与视觉理解任务。Novita AI 作为其 Day-0 API 发布合作伙伴，为开发者提供接入服务。

Novita AI: 🚀 We're launching MiniMax M3 from @MiniMax_AI on Novita AI as a Day-0 API launch partner. The first open-weights model ...

多模态推理模型发布

关联讨论 6 条

18:42

Berryxia.AI@berryxia

KwaiKeye开源多模态大模型Keye VL 2.0-30B-A3B

KwaiKeye开源了多模态大模型Keye VL 2.0-30B-A3B，采用Apache 2.0许可。该模型总参数为30B，但仅激活3B参数。其核心亮点是通过DeepSeek稀疏注意力技术实现了256K的上下文长度。该模型的视频理解能力表现出一个反直觉的特性：喂入的帧数越多，其准确率反而持续上升。在基准测试中，其表现已与Qwen3 VL、Gemini 3 Flash等模型相当。

Adina Yakup: Keye VL 2.0-30B-A3B 🔥 New multimodal model from @KwaiKeye ✨ 30B/3B active - Apache 2.0 ✨ 256K context via DeepSeek Spar...

多模态开源生态推理模型发布

14:53

歸藏(guizang.ai)@op7418

MiniMax 发布大版本升级 M3 模型

MiniMax 发布了其大版本号模型升级 MiniMax M3。该模型标配 1M 超长上下文，采用新的 MSA（MoE with Segment-wise Attention）稀疏注意力架构，在 100 万上下文下每 token 计算量降至约上一代的 1/20。M3 从训练起即融合了原生多模态能力。在基准测试中，其取得了 SWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0%、MCP Atlas 74.2% 等成绩。此外，其 API 推出小于 512k 调用的限时七天五折优惠。模型权重与技术报告预计约 10 天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

多模态模型发布编码

关联讨论 6 条

14:17

MiniMax (official)@MiniMax_AI

这很火🔥 M3 首日上线 @OrcaRouter 快去跑起来（首周五折👀）

OrcaRouter 🐳: 🚀 @MiniMax_AI M3 is now available on OrcaRouter. One of the most anticipated open model releases, bringing next-gen spa...

智能体开源/仓库模型发布

14:04

IT之家（RSS）

让机器人看懂世界：英伟达推出全球首款全开源全模态物理 AI 大模型 Cosmos 3

英伟达推出全球首款全开源全模态物理AI大模型Cosmos 3。该模型基于混合Transformer架构，可在单一系统中融合文本、图像、视频、音效及动作内容的理解与生成，将物理AI的训练与评估周期从数月缩短至数日。Cosmos 3在Artificial Analysis、Physics-IQ等多个评测基准上排名第一，提供Super和Nano版本用于机器人与自动驾驶的训练与实时推理，Edge版本即将推出。

具身智能多模态开源生态模型发布

关联讨论 8 条

13:36

🚨 AI News | TestingCatalog@testingcatalog

MiniMax发布开源模型M3

MiniMax发布了新开源权重模型M3，现已通过API和MiniMax Agent提供服务。该模型在SWE-Bench Pro上得分59.0%，在Terminal Bench 2.1上得分66.0%，并支持高达1M的上下文窗口。同时，MiniMax Agent更新了持久记忆与进化技能等能力。此外，MiniMax Code也已发布，模型权重与技术报告将在约10天后公开。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

多模态开源生态模型发布编码

关联讨论 6 条

13:36

Hugging Face：Blog（RSS）

NVIDIA 发布 Cosmos 3：首个面向物理AI推理与动作的开源全能模型

NVIDIA 发布 Cosmos 3，基于 Mixture-of-Transformers（MoT）架构的开源全能模型，统一世界生成、场景理解、因果推理和策略生成。该模型通过自回归与扩散子序列联合注意力，在单一前向过程中处理文本、图像、视频、音频和动作等多模态。本次发布包含两个版本：Cosmos 3 Nano（16B 参数，8B 推理器 + 8B 生成器，面向工作站级 GPU）和 Cosmos 3 Super（64B 参数，32B + 32B，面向 Hopper 和 Blackwell GPU，用于大规模合成数据生成与研究）。两者均已上架 Hugging Face，并提供 Diffusers 集成、GitHub 后训练脚本和开源合成数据数据集。

具身智能多模态模型发布

关联讨论 8 条

13:04

IT之家（RSS）

英伟达开源5500亿参数Nemotron 3 Ultra模型

英伟达发布面向AI智能体的开源模型Nemotron 3 Ultra，其为5500亿参数的混合专家模型。相较于同级别开源模型，该模型推理速度最高提升5倍，使用成本最高降低30%。模型已适配Hermes Agent、LangChain Deep Agents等主流框架，并已助力CrowdStrike、Palantir等企业构建智能体系统。该模型预计于6月4日通过Hugging Face、ModelScope等平台以NVIDIA NIM微服务形式提供。

智能体开源生态模型发布

关联讨论 8 条

13:04

IT之家（RSS）

英伟达推出 Alpamayo 2 Super 开源推理模型，助力 L4 自动驾驶研发

英伟达开源了 Alpamayo 2 Super 视觉-语言-动作（VLA）模型，参数规模从 100 亿增至 320 亿。该模型支持 360 度感知与推理式自动标注，专为研发 L4 自动驾驶设计。模型可通过知识蒸馏压缩，部署于 DRIVE AGX Thor 芯片。代码与权重将在夏季于 GitHub 和 Hugging Face 开源。

具身智能多模态推理模型发布

12:35

Artificial Analysis@ArtificialAnlys

NVIDIA发布最大Nemotron 3模型Nemotron 3 Ultra

NVIDIA在Computex上发布了Nemotron 3 Ultra，总参数达550B（激活参数55B），是目前最大的Nemotron 3模型。该模型在美国开放权重模型中智能性最强，在Artificial Analysis Intelligence Index评测中得分为48，超越了Gemma 4 31B（39分），但仍落后于月之暗面（Kimi）的K2.6（54分）。在推理速度方面，其在预发布端点上超过了300 tokens/s，远高于同级别中国模型通常的50-100 tokens/s。该模型将提供BF16权重及NVFP4量化版本以提升推理性能。

开源/仓库推理模型发布评测/基准

关联讨论 8 条

12:03

IT之家（RSS）

同事件精选81

黄仁勋：英伟达下一代 AI 超级芯片平台 Vera Rubin 全面投产

英伟达 CEO 黄仁勋在 2026 台北电脑展宣布，下一代 AI 超级芯片平台 Vera Rubin 全面投产。该平台是 POD 级基础架构，与上一代 Grace Blackwell 平台相比，其大规模智能体吞吐量提高了 10 倍。凭借开源 MGX 设计，其供应链规模是 Grace Blackwell 的两倍，产品预计于今年秋季开始发货。

推理数据/训练模型发布

同一事件，精选展示《NVIDIA Vera Rubin 平台如何解决智能体 AI 的规模扩展问题》

推荐理由：Vera Rubin 全面投产，智能体吞吐量提升 10 倍，供应链规模翻倍，这是英伟达给 AI 算力瓶颈的一记重拳，做智能体应用的同行该开始计划升级硬件了。

11:46

MiniMax (official)@MiniMax_AI

@CreaoAI 行动迅速 🔥 M3在第一天就上线了，快去试试【引用 @CreaoAI】：MiniMax M3现已在CREAO上线。采用稀疏注意力推理，在长上下文下解码速度最高提升15.6倍，专为需要处理海量代码库、文档和转录文本而不减速的智能体打造。从模型下拉菜单中选择M3即可运行。⚡

Creao AI: MiniMax M3 is now live on CREAO. Sparse-attention reasoning with up to 15.6× faster decoding at long context, built for ...

智能体推理模型发布

11:46

MiniMax (official)@MiniMax_AI

@cline 说得好 🔥 稀疏注意力将计算量降至前代的1/20。现在可以在 Cline 上免费试用。

Cline: The new MiniMax-M3 is their first model to have 1m context, multimodal, and agentic coding capability. Congratulations t...

多模态模型发布编码

11:46

MiniMax (official)@MiniMax_AI

出发吧🔥 M3 + @visionagents_ai 实现实时语音与视频去构建些令人兴奋的东西吧！【引用 @visionagents_ai】：祝贺 @MiniMax_AI 团队发布 M3！ 👉 一款前沿级开源权重模型 👉 100万 token 上下文窗口 👉 原生多模态（图像与视频）

Vision Agents: Congrats to the @MiniMax_AI team on the release of M3! 👉 A frontier-class open-weight model 👉 1M context window 👉 Nat...

多模态开源/仓库模型发布视频

关联讨论 6 条

11:39

MiniMax：Blog（网页）

精选83

MiniMax M3：前沿编码、100万token上下文与原生多模态一体模型

MiniMax M3 是一个开源前沿模型，具备先进的编码与AI智能体能力。它支持100万token的超长上下文窗口，并采用名为MSA（MiniMax Sparse Attention）的新型稀疏注意力架构。该架构使模型在100万token上下文下的每token计算成本降至前代的1/20，预填充速度提升9倍以上，解码速度提升15倍以上。在SWE-Bench Pro编码基准上，MiniMax M3得分59.0%，超越GPT-5.5和Gemini 3.1 Pro，性能接近Opus 4.7。该模型可通过MiniMax Code、Token Plan和API服务使用。

多模态开源/仓库推理模型发布

关联讨论 6 条

推荐理由：MiniMax M3 把开源模型的编码能力推到了 GPT-5.5 和 Opus 4.7 这条线上，还附带 1M 上下文和原生多模态，这是开源社区真正能打的前沿选项，做 Agent 的值得立刻跑一下。

11:15

MiniMax (official)@MiniMax_AI

M3在我们发布当天就登陆了OpenRouter 🔥。 100万token上下文，前沿编码+智能体能力，原生多模态。首周半价。

OpenRouter: MiniMax-M3 is live on OpenRouter! A frontier-class open-weight model that combines a 1M-token context window, frontier c...

智能体多模态模型发布编码

关联讨论 6 条

11:15

MiniMax (official)@MiniMax_AI

M3现已在@AskVenice上线，支持匿名使用🔥 开源权重，前沿编码与智能体能力，1M上下文，原生多模态。首日即上线

Venice: MiniMax-M3 by @MiniMax_AI is now live on Venice. The first open-weight model to deliver frontier coding and agentic perf...

智能体多模态开源/仓库模型发布

11:15

MiniMax (official)@MiniMax_AI

儿童节快乐，M3模型重磅发布！

Elaina: A fun fact: Right now in China it's June 1st Children's Day @MiniMax_AI just brought their best gift M3👧🎁

模型发布

10:55

OpenRouter@OpenRouter

MiniMax-M3现已在OpenRouter上线！一款前沿级开源权重模型，结合了1M-token上下文窗口、前沿的编码和智能体性能，以及原生多模态（图像与视频）能力。

多模态模型发布编码

关联讨论 6 条