阿绎 AYi@AYi_AInotes

精选76

2026-04-29 08:58·65天前

精选理由

把 token 成本砍到对手四分之一而智能分不降，Agent 规模化终于有了真正的成本解决方案，做 Agent 的必看。

AI 摘要

蚂蚁集团发布Ling-2.6系列模型，通过MoE架构与Fast-Thinking机制，将推理激活率降至7%，在实现接近GPT-5.4非推理水平综合智能的同时，大幅降低token成本。该模型在SWE-bench Verified等真实Agent场景测试中表现领先，旨在解决Agent规模化应用的成本痛点。目前已在OpenRouter提供免费API并即将开源，推动行业焦点从刷榜转向生产落地。其高效率特性尤其适合高频任务，在部分任务中速度比Claude Sonnet 4.6快6倍、成本低50倍。

说个暴论，2026 年 AI 行业的转折点，不是 GPT-5.5，也不是 o3，是蚂蚁@AntLingAGI 刚刚发布的 Ling-2.6-1T。

我用 Ling-2.6-1T 跑了一个查理芒格的 100 个思维模型的硬核任务，结果真的太炸了，具体大家看视频演示。

当大家都在卷参数、卷推理分、卷更长上下文，只有它反其道而行之，把 token 效率当成了第一公民。

最震撼的是这组数据：在 Artificial Analysis 全评测中，它展现出极高的智能-输出比（生成 16M tokens），

整体 token 成本可降至可比模型的约四分之一，综合智能却接近 GPT-5.4 的非推理水平，

直接落在所有模型都梦寐以求的"高智能 + 极低生产成本"象限。这才是真正的生产级 AI，而不是实验室刷榜玩具。

Agent 时代最大的痛点从来不是模型不够聪明，而是用不起。

一个复杂任务调用十几次模型、几十次工具、拉几百 K 上下文，

token 成本指数级爆炸，很多 Agent 方案一到规模化就死掉， Ling 把这个天花板直接抬高了数倍。

它走的是和 o1 类模型完全相反的路线：别人靠慢思考堆 token 刷榜，靠 MoE 优化的 Fast-Thinking 机制实现又快又准。

写代码、搭 UI、编排 Agent、多步工作流--我们每天 90% 的事，根本不需要深度多跳推理，需要的是精确、稳定、快、便宜。

而这些，Ling 全部做到了：SWE-bench Verified SOTA 级表现（72.2+）、AIME26 高分、指令遵循和工具调用榜单全面领先。

蚂蚁的底气很简单：背靠支付宝 13 亿用户 + 全世界最复杂的金融支付场景，天然拥有海量真实 Agentic 数据。

Ling 系列从一开始就不是为了刷榜，而是为了每天处理上亿次生产请求而生。

更狠的是它的打法：OpenRouter 已上线一周免费 API（262K 上下文），官方确认即将开放权重--这明显在抢生态，和当年 DeepSeek 路数一样，

但这次握着的是生产级效率这个最大杀器。

这意味着2026 年的游戏规则彻底变了：不再是谁参数多谁牛，而是谁能在真实生产成本下跑赢。

过去的刷榜竞赛已进入尾声，真正的生产落地竞赛才刚刚开始。

阿绎 AYi@AYi_AInotes · X

精选76导出 Markdown