4月24日

10:55

公众号：DeepSeek（深度求索）

DeepSeek-V4 预览版：迈入百万上下文普惠时代

DeepSeek-V4 预览版发布，支持百万级上下文窗口，提供顶级长文本记忆能力，模型配置选择更灵活。

DeepSeek 模型发布

09:00

公众号：蚂蚁百灵（Ling）

Ling-2.6-1T 发布：万亿旗舰"快思考"模型，对标 GPT-5.4

蚂蚁百灵发布万亿参数旗舰 Ling-2.6-1T，采用 MLA 与 Linear Attention Hybrid 架构，以“快思考”机制实现低 Token 开销高效推理。综合智能对标 GPT-5.4 (Non-Reasoning)，在 AIME26 上显著领先其他非思考模型；在 SWE-bench Verified、TAU2-Bench、BFCL-V4 等 Agent 基准上达到开源 SOTA。支持 256K 超长上下文（MRCR 高分）并表现优异的 IFBench。现已通过 OpenRouter 和官方平台提供一周免费 API 调用，将于近期正式开源。

智能体开源生态推理模型发布

08:00

Hugging Face：Blog（RSS）

精选78

DeepSeek-V4：智能体可实际使用的百万token上下文

DeepSeek发布新一代模型DeepSeek-V4，其核心突破在于实现了长达百万token的上下文窗口，并确保智能体能够有效利用这一扩展的上下文能力。该模型延续了通过开源与开放科学推动人工智能发展与普及的使命，标志着大模型在长上下文理解和实际应用方面迈出重要一步。

智能体 DeepSeek 开源生态模型发布

关联讨论 3 条

推荐理由：DeepSeek 把上下文窗口推到百万 token 不稀奇，关键是「agent 能实际用」这六个字。如果实测成立，RAG 的很多工程妥协可以扔掉了，做长文档和复杂 agent 的人该第一时间跑一遍。

01:53

公众号：小米 MiMo

MiMo-V2.5-TTS-Series + ASR 正式发布

模型发布语音

4月23日

17:50

公众号：腾讯混元

精选67

Hy3 preview发布并开源：混元重建后首个模型，Agent能力大幅提升

智能体开源/仓库模型发布

推荐理由：混元重建后的第一枪，Agent能力大幅提升且直接开源，虽然已过首发热度，但对关注国产模型Agent能力的人还是个值得拉下来跑的repo。

08:00

蚂蚁百灵：Developer Blog（网页）

精选67

Ling-2.6-flash 发布：更快响应、更强执行、更高 Token Efficiency

针对智能体任务中Token消耗快速增长的问题，Ling-2.6-flash模型正式发布。该模型采用混合线性架构等技术进行系统性优化，旨在实现更高推理效率和更低使用成本。其推理速度在4卡H20条件下最快可达340 tokens/s，在Artificial Analysis评测中仅消耗约对比模型1/10的Tokens。模型在多个Agent相关基准测试中达到同尺寸SOTA水平，保持了强大的任务执行与工具调用能力。

智能体模型发布部署/工程

推荐理由：蚂蚁百灵这次打的是「省 token」这张牌，104B 总参但只激活 7.4B，Agent 场景评测对齐同尺寸 SOTA，输出 token 消耗只有竞品的 1/10。做 Agent 产品、被推理成本卡脖子的团队值得认真看看这个路线。