BestBlogs 早报 · 06-02|MiniMax M3、AI Coding 规范、视频 Agent

在线阅读和收听：https://www.bestblogs.dev/explore/brief/2026-06-02

导语

AI 能力边界在这个夏天被连续刷新。今天的早报围绕三条主线展开：MiniMax M3 作为国内首个集前沿 Coding、1M 超长上下文与原生多模态于一体的开源模型正式亮相，24 小时自主完成 CUDA 算子优化的实测让 benchmark 数字有了具体重量；Chromium 3500 万行代码库的 AI Coding 规范体系，展示了工程团队如何把 AI 工具真正制度化；xAI 的 Ethan He 则给出一个更深的判断--视频模型的智能上限跟着 LLM 走，下一个前沿不是更好的视频，而是视频 Agent。

速览部分覆盖了语音智能体工程化实践、AI Friendly 架构设计、英伟达 Agent 工厂全栈发布、RAG 工程化认知纠偏、Rippling 生产级多智能体落地，以及吴恩达对 AI 工程师角色演化的判断，还有 MiniMax 自身作为 AI Native 公司的组织实践分享。

精讲一：MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你

MiniMax M3 于今日正式发布，是目前国内第一个同时具备前沿 Coding 能力、1M 超长上下文与原生多模态的开源模型。

三项能力的意义

在此之前，这三项能力是海外闭源前沿模型（如 GPT-5.5、Gemini 3.1 Pro、Claude Opus）的专属标配。M3 是国内首个将这三者同时开源的模型，也是目前全球唯一的开源实现。

Coding 能力方面，M3 在 SWE-Bench Pro 上得分 59.0%，超过 GPT-5.5 和 Gemini 3.1 Pro，接近 Opus 4.7；在面向自主 Agent 的端到端评测框架 Claw-Eval 上取得最高分。值得关注的不只是数字本身，而是 M3 背后训练方式的转变：团队构建了交互式用户模拟器框架，让模型在训练阶段就接触到需求澄清、方案讨论、多轮迭代等真实开发场景，而非单轮任务假设。

MSA：把长上下文真正变成可 Scale 的维度

1M 上下文并非只是参数设置--它需要底层注意力机制的彻底重构。M3 自研的 MSA（MiniMax Sparse Attention）是一种全新稀疏注意力架构，通过精确的 KV 分块和 KV outer gather Q 算子优化，在 100 万上下文下每 token 计算量仅为上代模型的 1/20，prefill 阶段加速 9 倍，decoding 阶段加速超过 15 倍。与全注意力相比，MSA 在多个对照实验中能力基本打平，却拥有硬件友好、易实现、真正可 scale 的特点。

两个让人印象深刻的实测

CUDA 算子优化：给 M3 一份任务描述、一个 benchmark 脚本、一个不能直接运行的 Triton 骨架，没有任何参考实现，要求在 NVIDIA Hopper 架构 GPU 上优化 FP8 GEMM kernel。在约 24 小时的连续执行中，M3 完成了 147 次 benchmark 提交、1959 次工具调用，将 Hopper FP8 硬件峰值利用率从 7.6% 推进至 71.3%，实现 9.4× 加速。最优解出现在第 145 次提交--在多个性能平台期后模型仍未放弃，这种长程自主迭代能力是最直接的实证。

让 M3 「训」模型：给 M3 四个仅完成预训练的 Base 模型，在 12 小时内自主完成数据合成、训练、评测、迭代全流程，目标是让这些模型在数学推理、工具调用、代码生成等任务上具备基本能力。任务开放度远高于 CUDA 优化--没有明确的反馈结构，M3 需要自主判断研究方向。最终结果显示，M3 在 PostTrainBench 的表现显著优于对比模型，验证了其在开放研究任务中的长程规划能力。

ginobefun@hongming731 · X

71导出 Markdown

2026-06-02 06:59·31天前

在 X 看原推· x.com

AI 摘要

本期早报聚焦三个主题。核心是 MiniMax 发布其开源模型 M3，这是国内首个同时具备前沿 Coding 能力、1M 超长上下文和原生多模态的模型。M3 在 SWE-Bench Pro 上得分 59.0%，其自研 MSA 稀疏注意力架构显著降低了长上下文计算开销。实测中，M3 可在 24 小时内自主完成 CUDA 算子优化。此外，早报还简述了 Chromium 项目对 AI Coding 的规范化实践，以及 xAI 工程师关于视频 Agent 发展前景的观点。

http://x.com/i/article/2061582822029283328

BestBlogs 早报 · 06-02|MiniMax M3、AI Coding 规范、视频 Agent

在线阅读和收听：https://www.bestblogs.dev/explore/brief/2026-06-02

BestBlogs 早报 · 06-02|MiniMax M3、AI Coding 规范、视频 Agent

导语

精讲一：MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你

BestBlogs 早报 · 06-02|MiniMax M3、AI Coding 规范、视频 Agent

导语

精讲二：深入解析 Chromium 的 AI Coding 开发体系

精讲三：为什么视频智能体模型是下一个前沿--Ethan He，xAI Grok Imagine 负责人

速览

补充阅读

今日阅读路径

精讲一：MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你

精讲二：深入解析 Chromium 的 AI Coding 开发体系

精讲三：为什么视频智能体模型是下一个前沿--Ethan He，xAI Grok Imagine 负责人

速览

补充阅读

今日阅读路径