12月18日

08:00

OpenRouter：Announcements（RSS）

精选57

OpenRouter 推出 Response Healing：将 JSON 缺陷减少 80% 以上

OpenRouter 推出 Response Healing 新功能，可在响应到达应用前自动修复大语言模型产生的格式错误的 JSON，从而将 JSON 缺陷减少 80% 以上。

产品更新部署/工程

推荐理由：如果你无数次被 LLM 返回的残缺 JSON 搞到崩溃，OpenRouter 这个 response healing 能自动修复 80% 的缺陷，以后 debug 可以少肝半小时。

08:00

OpenRouter：Announcements（RSS）

OpenRouter 12月发布亮点：结构化输出响应修复、聊天室通知与长上下文模型排名

OpenRouter 推出结构化输出的响应修复（Response Healing）功能，新增聊天室通知，发布长上下文模型排行榜，并位列 Brex 增长最快 AI 基础设施榜单第一。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

OpenRouter 十二月发布：响应修复、聊天室通知、长上下文模型排名，登顶 Brex 最快增长 AI 基础设施榜单

OpenRouter 十二月版本更新引入响应修复（Response Healing）机制以提升结构化输出可靠性，新增聊天室通知功能，并推出长上下文模型排名。此外，OpenRouter 在 Brex 评选的增长最快 AI 基础设施公司榜单中位列第一。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

OpenRouter Response Healing 上线：将 JSON 错误减少 80%+

OpenRouter 推出 Response Healing 新功能，可在 JSON 响应到达应用程序之前自动修复大语言模型输出的畸形 JSON，从而将 JSON 缺陷减少 80% 以上。

产品更新编码

08:00

OpenRouter：Announcements（RSS）

十二月发布亮点

Anthropic 在十二月多项更新中重点推出结构化输出的 Response Healing 功能，可自动修复格式错误。平台新增聊天室通知系统，并发布长上下文模型性能排行榜，Claude 3.5 Sonnet 在 200K 上下文评测中领先。公司同时宣布其 AI 基础设施在 Brex 年度榜单中位列增长最快首位。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

精选61

Response Healing：将 JSON 缺陷减少 80% 以上

OpenRouter 推出新功能 Response Healing，可在 LLM 生成的畸形 JSON 响应抵达用户应用前自动修复。该功能旨在将 JSON 格式错误减少超过 80%，直接提升 API 响应的结构完整性与可靠性，减少下游应用的处理负担。

智能体产品更新部署/工程

推荐理由：做 Agent 的人最怕 JSON 解析炸掉整个 pipeline，OpenRouter 这个 Response Healing 相当于在网关层加了自动纠错，接入成本几乎为零，值得试试。

12月16日

16:55

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/AEnvironment

inclusionAI 发布了 AEnvironment，这是一个用于智能体 AI 开发的标准化环境基础设施。该平台旨在为 AI 智能体的构建、测试和部署提供统一、可复现的环境，解决开发过程中因环境差异导致的兼容性与一致性问题。它通过预配置的标准化设置，简化了开发流程，提升了协作效率与系统可靠性。

智能体开源/仓库部署/工程

12月11日

09:00

公众号：蚂蚁百灵（Ling）

AReaL v0.5.0：强化学习框架的架构革新，执一驭万，智体同协

AReaL v0.5.0 是由蚂蚁百灵（Ling）发布的强化学习运行时服务框架，专为智能体与推理设计。

智能体产品更新推理

12月3日

21:45

蚂蚁 inclusionAI：GitHub 新仓库

精选63

蚂蚁集团开源AState：面向强化学习的高性能状态管理系统

蚂蚁集团开源了AState，这是一个专为强化学习设计的高性能通用状态数据管理系统。它旨在解决RL训练与推理中的I/O效率低下、权重同步性能不足及状态恢复不鲁棒等核心挑战。系统采用三层架构：提供张量原生接口的API层、支持多种部署模式的服务层以及具备高效可扩展传输能力的基础层。其关键特性包括统一的张量级API、高性能权重同步和拓扑感知设计。在万亿参数规模下，AState能在约6秒内完成权重同步，远低于业界常见的分钟级延迟，目前已作为ASystem的关键组件在蚂蚁内部生产环境部署。

智能体开源/仓库部署/工程

推荐理由：蚂蚁把万亿参数 RL 训练的权重同步从分钟级压到 6 秒，这套 AState 系统是真刀真枪的工程解法，做大规模 RL infra 的团队值得拆一拆它的 RDMA P2P 架构。

11月26日

17:00

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/asystem-amem

该项目是一个针对NCCL通信库的扩展库，核心功能是高效卸载NCCL所分配的GPU内存。它通过将NCCL占用的显存资源进行智能释放与转移，旨在缓解大规模分布式训练中的显存压力，从而提升整体系统效率与资源利用率。

开源/仓库部署/工程

11月24日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选77

Claude开发者平台推出高级工具使用功能，提升AI代理效率

Anthropic在Claude开发者平台发布三项新功能，以解决传统工具调用消耗大量上下文、易出错的问题。工具搜索工具允许按需加载工具，内部测试中将上下文消耗从约7.7万令牌降至8700令牌，降幅达85%，并将准确率从49%提升至74%。程序化工具调用支持在代码环境中调用工具，减少对上下文窗口的影响，例如Claude for Excel可借此处理数千行数据。工具使用示例则提供了展示工具有效使用方法的通用标准。这些功能共同提升了AI代理处理大规模工具库的能力。

智能体 Anthropic MCP/工具产品更新

推荐理由：做 Agent 的人都卡在工具一多上下文就爆、调用就错这两个坑上，Anthropic 这三个功能直接把工具管理从「全塞进去」变成「按需加载+代码编排+示例纠错」，是目前最工程化的解法。

11月18日

08:00

公众号：月之暗面（Kimi）

全球估值最高AI搜索应用Perplexity上线 Kimi K2 Thinking模型

summary_zh

产品更新搜索

11月17日

10:43

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/asystem-awex

inclusionAI 发布了 asystem-awex，这是一个专为强化学习工作流设计的高性能训练-推理权重同步框架。该框架的核心目标是实现从训练到推理的秒级参数更新，从而显著提升强化学习模型的迭代效率与部署实时性。它解决了传统流程中参数同步延迟高的问题，为需要快速在线学习和决策的应用场景提供了关键技术支撑。

开源/仓库数据/训练部署/工程

11月5日

17:54

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/dFactory：轻松高效的 dLLM 微调

inclusionAI 发布了 dFactory 平台，旨在简化去中心化大语言模型的微调过程。该平台通过自动化工作流和优化的资源调度，显著降低了技术门槛与计算成本。用户无需深厚专业知识，即可利用分布式计算资源对如 LLaMA 等模型进行高效定制。关键改进包括将典型微调任务时间缩短约 40%，并支持多节点协作训练，提升了模型迭代效率。

开源/仓库数据/训练部署/工程

10月24日

00:00

Mistral AI：News（网页）

介绍 Mistral AI Studio

企业AI团队常将原型卡在生产环节，主要瓶颈在于缺乏一套系统来跟踪模型输出变化、复现结果、监控真实使用数据、运行领域特定评估、私有增量微调模型以及满足安全合规的部署。Mistral AI Studio 作为生产级AI平台，基于 Mistral 运营大规模系统的经验而构建，为团队提供构建、评估和运行AI所需的基础设施。其核心功能包括：用于数据驱动闭环的可观测性、基于 Temporal 的有状态智能体运行时，以及用于模型和提示词版本管理的 AI 注册表。

智能体产品更新部署/工程

10月21日

08:00

OpenRouter：Announcements（RSS）

Provider Variance：OpenRouter 推出 Exacto

OpenRouter 推出 Exacto，旨在回答同一个大语言模型在不同 AI 服务供应商上是否表现不同的问题。该工具帮助用户量化供应商间的性能差异，为模型部署选择提供参考。

MCP/工具产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

OpenRouter 推出 Exacto，聚焦模型在不同提供商的性能差异

OpenRouter 发布 Exacto 功能，旨在解决同一模型在不同 AI 提供商之间的表现差异问题。该工具帮助用户识别并评估不同部署环境下的模型输出质量变化。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

精选68

Provider Variance： Introducing Exacto

同一AI模型在不同服务提供商上的性能表现可能存在显著差异。为了量化这种“提供商方差”，研究团队推出了Exacto评估平台。该平台通过标准化测试揭示，即使是相同的模型（如GPT-4、Claude或LLaMA），在不同云服务或API提供商处运行时，其输出质量、响应速度和稳定性都可能产生高达30%的波动。这一发现对企业和开发者的模型部署策略具有直接影响，强调在选择服务商时需进行针对性性能基准测试。

产品更新部署/工程

推荐理由：OpenRouter 推出 Exacto，直接回答了开发者最头疼的问题：同一个模型换家供应商跑出来的结果到底差多少。做 Agent 或多模型路由的产品人，这个工具能帮你少踩很多坑。

10月20日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选73

超越权限提示：让Claude Code更安全、更自主

Claude Code引入沙盒化技术，通过文件系统与网络双重隔离来增强安全性，并大幅减少权限提示。内部测试显示，该技术将权限提示安全地降低了84%。新推出的沙盒运行时（作为开源研究预览版）允许开发者自定义目录和网络访问权限，使Claude能在限定范围内自主运行命令。同时，网页版Claude Code在云端隔离沙盒中运行，即使遭遇提示注入或代码入侵，也能有效保护Git密钥等敏感凭证不被泄露，从而提升开发安全性与效率。

Anthropic 产品更新安全/对齐编码

推荐理由：Claude Code 的沙箱方案把安全和自主性这对矛盾解开了，权限提示减少 84% 不是数字游戏，是真把 agent 从「每步都要你点确认」变成「在笼子里自己跑」，做 coding agent 的团队该认真看看这套 OS 级隔离思路。

10月16日

00:00

Anthropic：Engineering（事故复盘 + 工程实践 · 网页）

精选73

为智能体配备现实世界技能：Agent Skills 开放标准

Anthropic 推出了“Agent Skills”开放标准，旨在为通用智能体（如Claude）提供可组合、可扩展且可移植的领域专业知识。一个Skill是一个包含指令、脚本和资源的文件夹，其核心SKILL.md文件采用渐进式披露设计，智能体可根据任务动态加载所需信息，从而最小化上下文占用。例如，PDF技能赋予了Claude直接操作PDF表单的新能力。该框架允许用户通过封装和共享程序性知识来定制智能体，无需为每个用例构建碎片化的定制代理。

智能体 Anthropic MCP/工具产品更新

推荐理由：Agent Skills 把「给 Agent 喂知识」从手写 prompt 变成了可复用的文件夹协议，做 Claude Code 或 Agent 产品的人现在就该动手试，这比 MCP 更轻量也更贴近日常开发。

10月14日

17:50

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/linghe

inclusionAI 开源了专为大语言模型训练设计的高性能内核库 Linghe。该库旨在优化 LLM 训练过程中的计算效率，通过底层内核创新提升训练速度并降低资源消耗。Linghe 支持当前主流的 Transformer 架构模型，为开发者和研究者提供了更高效的训练工具，有望加速 LLM 的开发与迭代进程。

开源/仓库数据/训练部署/工程

10月1日

08:00

OpenRouter：Announcements（RSS）

精选58

OpenRouter 推出每月100万免费BYOK请求

OpenRouter 向每位客户每月提供100万次“Bring Your Own Key”（BYOK）请求，完全免费。

智能体产品更新部署/工程

推荐理由：这个公告虽然旧了，但 OpenRouter 的 BYOK 免费额度至今仍在，对想低成本折腾模型的个人开发者来说，每月 100 万次请求比很多付费计划都香。

08:00

OpenRouter：Announcements（RSS）

OpenRouter 推出每月 100 万次免费 BYOK 请求

OpenRouter 为每位客户每月免费提供 100 万次 BYOK（Bring Your Own Key）请求，用户可携带自有 API 密钥使用服务。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

精选60

每月 100 万次免费 BYOK 请求

所有客户每月可免费获得 100 万次“自带密钥”（BYOK）请求。这一政策将 BYOK 功能从付费服务转变为免费提供的基础配额，大幅降低了企业使用自有密钥管理数据安全的技术与成本门槛。免费额度覆盖了绝大多数中小规模企业的典型月请求量。

产品更新部署/工程

推荐理由：OpenRouter 给 BYOK 用户每月免 100 万次请求，对用自己 API key 跑 Agent 的开发者来说是实打实的成本减免，值得顺手薅。

9月29日

16:07

蚂蚁 inclusionAI：GitHub 新仓库

精选58

inclusionAI/dInfer

inclusionAI团队发布了dInfer，一个专为扩散语言模型设计的高效推理框架。该框架旨在解决扩散模型在文本生成领域推理速度慢、资源消耗大的核心挑战。dInfer通过一系列底层优化技术，显著提升了推理效率，能够更快地生成文本，同时降低计算成本，为扩散模型在更广泛的实际应用场景中部署提供了关键技术支持。

开源/仓库推理部署/工程

推荐理由：蚂蚁把扩散语言模型的推理框架开源了，这类模型的推理效率一直是落地瓶颈，做端侧或低成本部署的团队值得看看能不能接上。

9月2日

00:00

Mistral AI：News（网页）

Le Chat 推出自定义 MCP 连接器与记忆功能

Mistral AI 于 2025 年 9 月 2 日宣布为 Le Chat 推出更新。更新包括：处于测试阶段的企业级 MCP 连接器目录，提供 20 多个安全的连接器，覆盖数据、生产力、开发、自动化与商务等领域，支持搜索、总结并操作各类工具，且允许用户自定义连接器。此外，新增记忆功能（beta），可基于用户偏好和事实提供个性化回复，并支持从 ChatGPT 快速导入记忆。所有功能均向免费套餐用户开放，并支持多端部署。

MCP/工具产品更新

00:00

Mistral AI：News（网页）

Le Chat 推出记忆功能测试版

Mistral AI 为其对话AI产品 Le Chat 推出“记忆”测试版功能。该功能旨在让AI助手能根据上下文记住并关联信息，其设计基于三大原则：透明（用户可知何时、为何调用记忆）、自主（用户可随时关闭、编辑或删除记忆）和数据主权（记忆可导出）。辅助功能“记忆洞察”帮助用户探索记忆内容。产品强调记忆的可控性与实用性，后续将优化分类、遗忘与可视化能力。

产品更新

9月1日

17:30

公众号：DeepSeek（深度求索）

DeepSeek关于AI生成合成内容标识的公告

DeepSeek已在平台内对AI生成合成内容添加标识，并明确提醒用户相关内容由AI生成。

DeepSeek 产品更新

8月26日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 上线首个图像模型 Gemini 2.5 Flash Image Preview

OpenRouter 现已上线 Gemini 2.5 Flash Image Preview，这是该平台首个图像生成模型，支持 SOTA 图像生成、角色一致性以及多图像输出。

Google 产品更新图像生成多模态

08:00

OpenRouter：Announcements（RSS）

OpenRouter 上线首个图像模型 Gemini 2.5 Flash Image Preview

OpenRouter 现已提供 Gemini 2.5 Flash Image Preview，这是平台上的首个图像模型。该模型具备 SOTA 图像生成能力，支持角色一致性（character consistency）和多图像输出（multi-image outputs）。

产品更新图像生成

08:00

OpenRouter：Announcements（RSS）

首个图像模型在 OpenRouter 上线

Gemini 2.5 Flash Image Preview 模型已在 OpenRouter 平台正式发布。该模型是首个在该平台上线的图像生成模型，具备当前最优的图像生成能力。其核心特性包括出色的角色一致性和支持多图像输出功能，为开发者与用户提供了新的图像生成工具选项。

产品更新图像生成部署/工程

8月7日

08:00

OpenRouter：Announcements（RSS）

精选66

GPT-5 现已上线

GPT-5 已在 OpenRouter 平台正式推出。该模型具备长上下文处理能力，专门针对复杂推理任务与代码工作流进行了优化。此次发布标志着新一代大语言模型开始接入开放路由网络，为开发者与用户提供更强大的多步骤逻辑处理和编程辅助功能。

产品更新推理编码

推荐理由：OpenRouter 上架 GPT-5 本身不算新闻，但对用 OpenRouter 做多模型路由的开发者来说，这是终于能切到最新旗舰的信号，值得第一时间跑一遍自己的 benchmark。

8月4日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 应用支持语音输入与 PDF URL 发送

现可通过 URL 发送 PDF 文件以及使用语音输入功能，且适用于任意模型。

产品更新多模态

08:00

OpenRouter：Announcements（RSS）

OpenRouter 应用新增语音输入和 PDF URL 支持

OpenRouter 平台现支持在应用中使用语音输入功能，并允许通过 URL 发送 PDF 文件。该功能适用于平台上的任意模型。

产品更新多模态语音

08:00

OpenRouter：Announcements（RSS）

为应用添加 Audio Inputs 和 PDF URLs 支持

平台宣布为所有模型的应用新增音频输入与通过URL发送PDF文件的功能。用户现在可以直接使用语音与各类模型（如GPT、Claude、LLaMA）进行交互，同时支持通过链接直接上传PDF文档进行处理。这两项更新旨在提升多模态交互的便捷性，扩展了应用处理非文本输入和数据获取的方式，无需再依赖传统的文件上传步骤。

产品更新多模态部署/工程

7月29日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 推出 Presets 特性：跨应用无缝迁移模型配置

OpenRouter 新增服务器端预设（Presets）功能，用户可一次定制模型配置并在不同应用间无缝使用，简化模型工作流。

产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

OpenRouter 推出服务端 Presets 功能

OpenRouter 上线服务端 Presets，支持用户一次定制模型配置（如参数、提示词）后跨应用直接调用，无需重复设置，简化跨平台模型工作流。

智能体产品更新部署/工程

08:00

OpenRouter：Announcements（RSS）

Presets：如何在应用间无缝迁移模型配置

新推出的服务端 Presets 功能实现了模型配置的“一次定制，处处使用”。该功能允许用户将包括模型、参数、提示词和工具在内的完整配置保存为可复用的预设方案，并能通过链接或代码片段跨应用无缝共享。这简化了从开发到生产的工作流，避免了重复配置，提升了团队协作与部署效率。

MCP/工具产品更新部署/工程

7月17日

00:00

Mistral AI：News（网页）

Mistral AI 为 Le Chat 推出五项重要更新

Mistral AI 为 Le Chat 推出五项重要更新：Deep Research（预览版）模式可快速生成结构化研究报告；语音模式启用新 Voxtral 模型实现自然对话；Think 模式由 Magistral 推理模型支持，提供原生多语言推理；Projects 功能可将相关对话组织至独立文件夹；并联合 Black Forest Labs 推出 Le Chat 内的高级图像编辑功能。用户现在可在 chat.mistral.ai 或移动应用中免费试用这些新功能。

产品更新多模态推理语音

7月15日

08:00

OpenRouter：Announcements（RSS）

Venice 上线 OpenRouter：主打隐私与无审查

Venice 作为新提供商加入 OpenRouter，提供其旗舰无审查模型，主打隐私、高性能和非限制性 AI 体验。

行业动态部署/工程