6月2日

19:34

蚂蚁 inclusionAI：HuggingFace 新模型

同事件精选61

蚂蚁 inclusionAI 开源万亿参数 MoE 基座模型 Ling-2.6-1T-base

Ling-2.6-1T-base 是蚂蚁 inclusionAI 开源的万亿参数 MoE 基座模型（总参约 1T，激活 63B）。它由 Ling-2.0-1T-base 升级而来，采用 Lightning Attention 与 MLA 以 7:1 混合的线性注意力架构，经约 9.6T token 的迁移预训练、持续预训练和中训练，上下文窗口从 4K 分阶段扩展至 256K。在 MMLU（86.82）、SimpleQA、LongBenchv2（43.54）等基准上超越前代。该模型仅供研究（继续预训练、微调、蒸馏等），不直接提供对话功能。

Hugging Face 开源生态推理模型发布

同一事件，精选展示《蚂蚁 inclusionAI 推出万亿参数推理模型 Ring-2.6-1T》

推荐理由：Ling-2.6 用混合线性注意力把万亿 MoE 基座模型的上下文能力推到了 256K，对于研究长上下文和 MoE 的团队是个有价值的基座，但它是未对齐的预训练模型，不能直接当对话助手用。

17:55

蚂蚁 inclusionAI：HuggingFace 新模型

蚂蚁 inclusionAI 发布 Ling-2.6-flash-base 基础模型

Ling-2.6-flash-base 是蚂蚁 inclusionAI 发布的基础模型，采用闪速规模 MoE 与混合线性注意力架构（7:1 融合 Lightning Attention 与 MLA），总参数量约 104B、激活约 7.4B。模型从 Ling-2.0 检查点改造而来，经约 9.6T token 的迁移预训练、继续预训练和中段训练，上下文窗口从 4K 扩展至 256K。在知识、推理、数学、代码和长上下文基准上相比前代均有提升（如 MMLU 84.13，GSM8K 91.89）。该模型面向研究用途开放，支持继续预训练、微调和蒸馏，未经聊天对齐。

推理模型发布部署/工程

17:13

MarkTechPost（RSS）

阿里巴巴通义千问团队在百炼平台发布 Qwen3.7-Plus

通义千问（Qwen）团队在百炼平台发布了多模态智能体模型 Qwen3.7-Plus。该模型能理解图像和视频，并新增了自我编程、工具调用、深度推理和自主迭代能力。

智能体多模态模型发布

16:53

MiniMax (official)@MiniMax_AI

MiniMax发布M3模型，宣称是首个将编程与智能体能力、1M上下文长度及原生多模态三大前沿能力结合的开源权重模型。其编程与智能体能力在多个评测中表现突出：SWE-Bench Pro得分59.0%，Terminal Bench 2.1得分66.0%，SWE-fficiency 34.8%，KernelBench Hard 28.8%，MCP Atlas 74.2%。模型通过MiniMax Sparse Attention技术支持1M上下文。官方提供了API接入与新的MiniMax Code服务，模型权重和技术报告预计约10天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

多模态推理模型发布编码

16:13

MarkTechPost（RSS）

JetBrains 发布 Mellum2：用于多模型 AI 流水线快速专用任务的 12B MoE 模型

JetBrains 发布开源模型 Mellum2。该模型为 12B 参数的 MoE 架构，在 10.6 万亿个 token 上训练，采用 Apache 2.0 许可，专为多模型 AI 流水线中的快速、专用任务设计。

开源生态模型发布部署/工程

14:07

IT之家（RSS）

JetBrains 开源 Mellum2 模型：12B 参数，升级为 AI 智能体编程助手

JetBrains 开源了面向软件工程的模型 Mellum2。该模型总规模为 12B 参数，采用稀疏 Mixture-of-Experts 框架，激活参数量为 2.5B。上下文窗口扩展至 131072 Token。Mellum2 支持生成编辑代码、调用外部工具及执行多步骤智能体式工作流。模型基础版、指令版和思考版均以 Apache 2.0 许可证开源。

开源生态模型发布编码

13:36

StepFun@StepFun_ai

我们可能对"可用性"的讨论还不够。当Flash模型同时将速度、成本和智能带入"可用"范围时，智能的供给方式发生了结构性变化。

E01: A Lab note for Step 3.7 Flash launch. -- When Flash models bring speed, cost, and intelligence into the "usable" range a...

推理模型发布

12:35

SenseTime@SenseTime_AI

同事件精选73

感谢使用我们的模型来创建这些复杂的图表和图表。看到具有挑战性的信息被转化为清晰、准确和可读的视觉效果真是太棒了。这就是我们的目标。😄

The AI Colony: SenseNova U1 just released an infographic-specialized version and +18.2 on IGenBench Q-ACC isn't a rounding error. It me...

Hugging Face 图像生成开源生态模型发布

同一事件，精选展示《商汤发布信息图生成模型升级，增强多项核心能力》

推荐理由：SenseNova U1 这波信息图特化不是刷分，+18.2 Q-ACC 证明模型真的懂了排版，做汇报、做图表的可以直接上 Hugging Face 扒下来用。

12:35

SenseTime@SenseTime_AI

将复杂信息转化为准确的图表和示意图。这就是 SenseNova-U1-8B-MoT-Infographic。了解更多：https://x.com/SenseTime_AI/status/2061465029959209106?s=20

Future Stacked: AI-generated infographics with garbled text have been a running joke. SenseNova U1's new infographic-enhanced model fina...

Hugging Face 图像生成多模态模型发布

关联讨论 1 条

12:06

StepFun@StepFun_ai

阶跃星辰发布其推理优化型模型Step 3.7 Flash。该模型为196B MoE架构，从设计之初就专注于推理效率。其采用多矩阵分解注意力机制，使KV-cache成本仅为DeepSeek模型的约22%；同时通过注意力与FFN解耦技术，实现了硬件优化的高效服务。该模型已通过Fireworks AI提供，采用Apache 2.0许可，并可用于构建智能体应用。

Fireworks AI: Many research labs only consider inference efficiency after the fact. Step 3.7 Flash is a 196B MoE model, and built for ...

智能体开源/仓库推理模型发布

11:53

MiniMax (official)@MiniMax_AI

MiniMax宣布推出首个开源权重模型M3。该模型结合了三大前沿能力：在编程与智能体方面，它在SWE-Bench Pro等评测上取得了具体分数；通过MiniMax Sparse Attention技术，其上下文窗口可扩展至1M tokens；并且模型从零开始原生支持多模态。模型的权重与技术报告将在约10天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

开源生态模型发布编码

关联讨论 11 条

10:36

Alibaba Cloud@alibaba_cloud

阿里云发布通义千问3.7-Plus多模态智能体模型

阿里云推出Qwen3.7-Plus，这是一个统一视觉与语言的多模态智能体模型。其定位为多功能编码智能体与生产力助手，支持全模态输入，能够跨GUI与CLI执行任务。该模型具备视觉智能体能力，涵盖感知、推理、定位及搜索增强问答，并能跨多种智能体框架泛化。目前已在阿里云百炼平台通过API上线。

智能体多模态模型发布

关联讨论 1 条