6月1日

12:03

IT之家（RSS）

英伟达 CEO 黄仁勋在台北电脑展表示，AI减少岗位的说法是胡说八道，实际上软件工程师数量正在增加。他认为“有用”的AI时代已至，token是新的利润单位，AI是GDP生成器。同时，黄仁勋称下一代超级AI芯片Vera Rubin是其最雄心勃勃的产品，由4万名工程师参与研发，将于今年下半年推出，他预计其将比Grace Blackwell更加成功。

推理行业动态部署/工程

12:03

IT之家（RSS）

至高 480GB 内存，英特尔进一步介绍数据中心 GPU "Crescent Island"

英特尔介绍了将于今年晚些时候推出的AI推理数据中心GPU "Crescent Island"。该卡支持从FP4到FP64的数据类型，配备至高480GB LPDDR5x内存，采用350W PCIe AIC设计，主打每瓦词元效率并拥有开源软件生态。其Xe3P GPU架构将应用于PC、数据中心、边缘及工作站领域，包括下一代PC芯片。

产品更新推理

12:03

IT之家（RSS）

同事件精选81

黄仁勋：英伟达下一代 AI 超级芯片平台 Vera Rubin 全面投产

英伟达 CEO 黄仁勋在 2026 台北电脑展宣布，下一代 AI 超级芯片平台 Vera Rubin 全面投产。该平台是 POD 级基础架构，与上一代 Grace Blackwell 平台相比，其大规模智能体吞吐量提高了 10 倍。凭借开源 MGX 设计，其供应链规模是 Grace Blackwell 的两倍，产品预计于今年秋季开始发货。

推理数据/训练模型发布

同一事件，精选展示《NVIDIA Vera Rubin 平台如何解决智能体 AI 的规模扩展问题》

推荐理由：Vera Rubin 全面投产，智能体吞吐量提升 10 倍，供应链规模翻倍，这是英伟达给 AI 算力瓶颈的一记重拳，做智能体应用的同行该开始计划升级硬件了。

11:46

MiniMax (official)@MiniMax_AI

@CreaoAI 行动迅速 🔥 M3在第一天就上线了，快去试试【引用 @CreaoAI】：MiniMax M3现已在CREAO上线。采用稀疏注意力推理，在长上下文下解码速度最高提升15.6倍，专为需要处理海量代码库、文档和转录文本而不减速的智能体打造。从模型下拉菜单中选择M3即可运行。⚡

Creao AI: MiniMax M3 is now live on CREAO. Sparse-attention reasoning with up to 15.6× faster decoding at long context, built for ...

智能体推理模型发布

11:39

MiniMax：Blog（网页）

精选83

MiniMax M3：前沿编码、100万token上下文与原生多模态一体模型

MiniMax M3 是一个开源前沿模型，具备先进的编码与AI智能体能力。它支持100万token的超长上下文窗口，并采用名为MSA（MiniMax Sparse Attention）的新型稀疏注意力架构。该架构使模型在100万token上下文下的每token计算成本降至前代的1/20，预填充速度提升9倍以上，解码速度提升15倍以上。在SWE-Bench Pro编码基准上，MiniMax M3得分59.0%，超越GPT-5.5和Gemini 3.1 Pro，性能接近Opus 4.7。该模型可通过MiniMax Code、Token Plan和API服务使用。

多模态开源/仓库推理模型发布

关联讨论 11 条

推荐理由：MiniMax M3 把开源模型的编码能力推到了 GPT-5.5 和 Opus 4.7 这条线上，还附带 1M 上下文和原生多模态，这是开源社区真正能打的前沿选项，做 Agent 的值得立刻跑一下。

09:28

IT之家（RSS）

戴尔向 CoreWeave 交付全球首套可运行的 NVIDIA Vera Rubin NVL72 系统

推理行业动态部署/工程