美团龙猫的 LongCat-2.0 专为 agentic coding 设计的 MoE 模型,架构上三种专家分工有点意思,SWE-bench 59.5 接近闭源水平,已经能在硅基流动上直接调,做 coding agent 的可以跑跑看。
美团 LongCat 推出旗舰模型 LongCat-2.0,采用 1.6T 参数 MoE 架构(约 48B 活跃参数),原生支持 1M 上下文窗口。定价为 Input Cache $0.015/1M tokens、Input $0.75/1M tokens、Output $2.95/1M tokens。模型专为 Agentic Coding 设计,包含三大技术:LSA 稀疏注意力实现高效 1M 扩展;Zero-Compute Experts 动态激活 33B–56B 参数/token,无算力浪费;MOPD 将专家分为 Agent / Reasoning / Interaction 三组,按任务门控路由。在 SWE-bench Pro 上取得 59.5 分,性能接近主流闭源模型。现已上线 SiliconFlow Day 0 服务。
@OpenRouter 上 "Owl Alpha" 背后的完整模型来了🦉 让我们来认识一下 @Meituan_LongCat 的最新旗舰模型 LongCat-2.0 现已在 SiliconFlow 上线 Day 0🔥 💰 输入缓存/输入/输出:每 1M 模型 token $0.015/0.75/2.95 ⚙️ 1.6T 参数 MoE(约 48B 激活参数)· 原生 1M 上下文窗口 🧠 从头为智能体编码而构建: ◆ LSA:可高效扩展到 1M 的稀疏注意力机制 ◆ 零算力专家:每 token 动态激活 33B–56B 参数,无算力浪费 ◆ MOPD:三个专用专家组(智能体 / 推理 / 交互),按任务由门控路由 🏆 SWE-bench Pro 59.5:性能与主流闭源模型持平 开始构建 🐱👇