1月9日
08:00
OpenRouter:Announcements(RSS)
50
January Release Spotlight

本次发布聚焦于提升大型语言模型(LLM)的速度与性能。核心更新包括优先支持快速LLM、探索更多模型提供商选项,以及允许用户自定义自动路由。软件开发工具包(SDK)现已支持加载技能,同时系统实现了显著的性能改进。这些更新旨在优化开发者的使用体验与模型运行效率。

MCP/工具产品更新部署/工程
12月24日
08:00
OpenRouter:Announcements(RSS)
50
利用NeMo Data Designer构建可蒸馏模型与合成数据管道

NVIDIA推出NeMo Data Designer工具,帮助企业生成合规的合成数据工作流,用于定制化大模型训练。该工具通过创建“许可证安全”的合成数据,规避版权风险,并支持构建可蒸馏的轻量级模型。它为在特定领域数据受限的企业提供了端到端的合成数据生成与管理解决方案,助力模型高效微调与优化。

产品更新数据/训练部署/工程
12月18日
08:00
OpenRouter:Announcements(RSS)
40
十二月发布亮点

Anthropic 在十二月多项更新中重点推出结构化输出的 Response Healing 功能,可自动修复格式错误。平台新增聊天室通知系统,并发布长上下文模型性能排行榜,Claude 3.5 Sonnet 在 200K 上下文评测中领先。公司同时宣布其 AI 基础设施在 Brex 年度榜单中位列增长最快首位。

产品更新部署/工程
08:00
OpenRouter:Announcements(RSS)
精选61
Response Healing:将 JSON 缺陷减少 80% 以上

OpenRouter 推出新功能 Response Healing,可在 LLM 生成的畸形 JSON 响应抵达用户应用前自动修复。该功能旨在将 JSON 格式错误减少超过 80%,直接提升 API 响应的结构完整性与可靠性,减少下游应用的处理负担。

智能体产品更新部署/工程

推荐理由:做 Agent 的人最怕 JSON 解析炸掉整个 pipeline,OpenRouter 这个 Response Healing 相当于在网关层加了自动纠错,接入成本几乎为零,值得试试。
12月16日
16:55
蚂蚁 inclusionAI:GitHub 新仓库
49
inclusionAI/AEnvironment

inclusionAI 发布了 AEnvironment,这是一个用于智能体 AI 开发的标准化环境基础设施。该平台旨在为 AI 智能体的构建、测试和部署提供统一、可复现的环境,解决开发过程中因环境差异导致的兼容性与一致性问题。它通过预配置的标准化设置,简化了开发流程,提升了协作效率与系统可靠性。

智能体开源/仓库部署/工程
12月3日
21:45
蚂蚁 inclusionAI:GitHub 新仓库
精选63
蚂蚁集团开源AState:面向强化学习的高性能状态管理系统

蚂蚁集团开源了AState,这是一个专为强化学习设计的高性能通用状态数据管理系统。它旨在解决RL训练与推理中的I/O效率低下、权重同步性能不足及状态恢复不鲁棒等核心挑战。系统采用三层架构:提供张量原生接口的API层、支持多种部署模式的服务层以及具备高效可扩展传输能力的基础层。其关键特性包括统一的张量级API、高性能权重同步和拓扑感知设计。在万亿参数规模下,AState能在约6秒内完成权重同步,远低于业界常见的分钟级延迟,目前已作为ASystem的关键组件在蚂蚁内部生产环境部署。

智能体开源/仓库部署/工程

推荐理由:蚂蚁把万亿参数 RL 训练的权重同步从分钟级压到 6 秒,这套 AState 系统是真刀真枪的工程解法,做大规模 RL infra 的团队值得拆一拆它的 RDMA P2P 架构。
11月26日
17:00
蚂蚁 inclusionAI:GitHub 新仓库
39
inclusionAI/asystem-amem

该项目是一个针对NCCL通信库的扩展库,核心功能是高效卸载NCCL所分配的GPU内存。它通过将NCCL占用的显存资源进行智能释放与转移,旨在缓解大规模分布式训练中的显存压力,从而提升整体系统效率与资源利用率。

开源/仓库部署/工程
11月24日
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选77
Claude开发者平台推出高级工具使用功能,提升AI代理效率

Anthropic在Claude开发者平台发布三项新功能,以解决传统工具调用消耗大量上下文、易出错的问题。工具搜索工具允许按需加载工具,内部测试中将上下文消耗从约7.7万令牌降至8700令牌,降幅达85%,并将准确率从49%提升至74%。程序化工具调用支持在代码环境中调用工具,减少对上下文窗口的影响,例如Claude for Excel可借此处理数千行数据。工具使用示例则提供了展示工具有效使用方法的通用标准。这些功能共同提升了AI代理处理大规模工具库的能力。

智能体AnthropicMCP/工具产品更新

推荐理由:做 Agent 的人都卡在工具一多上下文就爆、调用就错这两个坑上,Anthropic 这三个功能直接把工具管理从「全塞进去」变成「按需加载+代码编排+示例纠错」,是目前最工程化的解法。
11月17日
10:43
蚂蚁 inclusionAI:GitHub 新仓库
39
inclusionAI/asystem-awex

inclusionAI 发布了 asystem-awex,这是一个专为强化学习工作流设计的高性能训练-推理权重同步框架。该框架的核心目标是实现从训练到推理的秒级参数更新,从而显著提升强化学习模型的迭代效率与部署实时性。它解决了传统流程中参数同步延迟高的问题,为需要快速在线学习和决策的应用场景提供了关键技术支撑。

开源/仓库数据/训练部署/工程
11月5日
17:54
蚂蚁 inclusionAI:GitHub 新仓库
49
inclusionAI/dFactory:轻松高效的 dLLM 微调

inclusionAI 发布了 dFactory 平台,旨在简化去中心化大语言模型的微调过程。该平台通过自动化工作流和优化的资源调度,显著降低了技术门槛与计算成本。用户无需深厚专业知识,即可利用分布式计算资源对如 LLaMA 等模型进行高效定制。关键改进包括将典型微调任务时间缩短约 40%,并支持多节点协作训练,提升了模型迭代效率。

开源/仓库数据/训练部署/工程
10月21日
08:00
OpenRouter:Announcements(RSS)
精选68
Provider Variance: Introducing Exacto

同一AI模型在不同服务提供商上的性能表现可能存在显著差异。为了量化这种“提供商方差”,研究团队推出了Exacto评估平台。该平台通过标准化测试揭示,即使是相同的模型(如GPT-4、Claude或LLaMA),在不同云服务或API提供商处运行时,其输出质量、响应速度和稳定性都可能产生高达30%的波动。这一发现对企业和开发者的模型部署策略具有直接影响,强调在选择服务商时需进行针对性性能基准测试。

产品更新部署/工程

推荐理由:OpenRouter 推出 Exacto,直接回答了开发者最头疼的问题:同一个模型换家供应商跑出来的结果到底差多少。做 Agent 或多模型路由的产品人,这个工具能帮你少踩很多坑。
10月20日
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选73
超越权限提示:让Claude Code更安全、更自主

Claude Code引入沙盒化技术,通过文件系统与网络双重隔离来增强安全性,并大幅减少权限提示。内部测试显示,该技术将权限提示安全地降低了84%。新推出的沙盒运行时(作为开源研究预览版)允许开发者自定义目录和网络访问权限,使Claude能在限定范围内自主运行命令。同时,网页版Claude Code在云端隔离沙盒中运行,即使遭遇提示注入或代码入侵,也能有效保护Git密钥等敏感凭证不被泄露,从而提升开发安全性与效率。

Anthropic产品更新安全/对齐编码
关联讨论 4Anthropic:Engineering(事故复盘 + 工程实践 · 网页)X:宝玉 (@dotey)X:Claude Devs (@ClaudeDevs)X:Berry Xia (@berryxia)
推荐理由:Claude Code 的沙箱方案把安全和自主性这对矛盾解开了,权限提示减少 84% 不是数字游戏,是真把 agent 从「每步都要你点确认」变成「在笼子里自己跑」,做 coding agent 的团队该认真看看这套 OS 级隔离思路。
10月16日
20:50
Hacker News:AI 热帖
53
Inkeep发布AI智能体构建平台:支持代码与可视化两种创建方式

Inkeep推出AI智能体构建平台,提供无代码可视化构建器与TypeScript SDK两种创建方式,两者支持完全双向同步,便于技术与非技术团队在同一平台协作。智能体可作为实时聊天助手用于客户体验或内部协同,也能实现知识库更新、CRM处理等工作流自动化。平台开源部分包含构建器、SDK、多智能体架构及UI组件库,支持通过API触发智能体并提供可观测性。该框架采用Elastic License 2.0许可,用户可自选LLM提供商并自行部署。

智能体MCP/工具产品更新
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选73
为智能体配备现实世界技能:Agent Skills 开放标准

Anthropic 推出了“Agent Skills”开放标准,旨在为通用智能体(如Claude)提供可组合、可扩展且可移植的领域专业知识。一个Skill是一个包含指令、脚本和资源的文件夹,其核心SKILL.md文件采用渐进式披露设计,智能体可根据任务动态加载所需信息,从而最小化上下文占用。例如,PDF技能赋予了Claude直接操作PDF表单的新能力。该框架允许用户通过封装和共享程序性知识来定制智能体,无需为每个用例构建碎片化的定制代理。

智能体AnthropicMCP/工具产品更新

推荐理由:Agent Skills 把「给 Agent 喂知识」从手写 prompt 变成了可复用的文件夹协议,做 Claude Code 或 Agent 产品的人现在就该动手试,这比 MCP 更轻量也更贴近日常开发。
10月14日
17:50
蚂蚁 inclusionAI:GitHub 新仓库
48
inclusionAI/linghe

inclusionAI 开源了专为大语言模型训练设计的高性能内核库 Linghe。该库旨在优化 LLM 训练过程中的计算效率,通过底层内核创新提升训练速度并降低资源消耗。Linghe 支持当前主流的 Transformer 架构模型,为开发者和研究者提供了更高效的训练工具,有望加速 LLM 的开发与迭代进程。

开源/仓库数据/训练部署/工程
10月1日
08:00
OpenRouter:Announcements(RSS)
精选60
每月 100 万次免费 BYOK 请求

所有客户每月可免费获得 100 万次“自带密钥”(BYOK)请求。这一政策将 BYOK 功能从付费服务转变为免费提供的基础配额,大幅降低了企业使用自有密钥管理数据安全的技术与成本门槛。免费额度覆盖了绝大多数中小规模企业的典型月请求量。

产品更新部署/工程

推荐理由:OpenRouter 给 BYOK 用户每月免 100 万次请求,对用自己 API key 跑 Agent 的开发者来说是实打实的成本减免,值得顺手薅。
9月29日
16:07
蚂蚁 inclusionAI:GitHub 新仓库
精选58
inclusionAI/dInfer

inclusionAI团队发布了dInfer,一个专为扩散语言模型设计的高效推理框架。该框架旨在解决扩散模型在文本生成领域推理速度慢、资源消耗大的核心挑战。dInfer通过一系列底层优化技术,显著提升了推理效率,能够更快地生成文本,同时降低计算成本,为扩散模型在更广泛的实际应用场景中部署提供了关键技术支持。

开源/仓库推理部署/工程

推荐理由:蚂蚁把扩散语言模型的推理框架开源了,这类模型的推理效率一直是落地瓶颈,做端侧或低成本部署的团队值得看看能不能接上。
8月26日
08:00
OpenRouter:Announcements(RSS)
42
首个图像模型在 OpenRouter 上线

Gemini 2.5 Flash Image Preview 模型已在 OpenRouter 平台正式发布。该模型是首个在该平台上线的图像生成模型,具备当前最优的图像生成能力。其核心特性包括出色的角色一致性和支持多图像输出功能,为开发者与用户提供了新的图像生成工具选项。

产品更新图像生成部署/工程
8月7日
08:00
OpenRouter:Announcements(RSS)
精选66
GPT-5 现已上线

GPT-5 已在 OpenRouter 平台正式推出。该模型具备长上下文处理能力,专门针对复杂推理任务与代码工作流进行了优化。此次发布标志着新一代大语言模型开始接入开放路由网络,为开发者与用户提供更强大的多步骤逻辑处理和编程辅助功能。

产品更新推理编码

推荐理由:OpenRouter 上架 GPT-5 本身不算新闻,但对用 OpenRouter 做多模型路由的开发者来说,这是终于能切到最新旗舰的信号,值得第一时间跑一遍自己的 benchmark。
8月4日
08:00
OpenRouter:Announcements(RSS)
51
为应用添加 Audio Inputs 和 PDF URLs 支持

平台宣布为所有模型的应用新增音频输入与通过URL发送PDF文件的功能。用户现在可以直接使用语音与各类模型(如GPT、Claude、LLaMA)进行交互,同时支持通过链接直接上传PDF文档进行处理。这两项更新旨在提升多模态交互的便捷性,扩展了应用处理非文本输入和数据获取的方式,无需再依赖传统的文件上传步骤。

产品更新多模态部署/工程
7月29日
08:00
OpenRouter:Announcements(RSS)
48
Presets:如何在应用间无缝迁移模型配置

新推出的服务端 Presets 功能实现了模型配置的“一次定制,处处使用”。该功能允许用户将包括模型、参数、提示词和工具在内的完整配置保存为可复用的预设方案,并能通过链接或代码片段跨应用无缝共享。这简化了从开发到生产的工作流,避免了重复配置,提升了团队协作与部署效率。

MCP/工具产品更新部署/工程
7月15日
08:00
OpenRouter:Announcements(RSS)
37
专注隐私的新提供商上线:Venice

专注隐私的AI提供商Venice正式加入OpenRouter平台,并推出了其旗舰模型。该模型主打无审查、功能强大且限制少的特点,旨在为用户提供私密且不受限制的人工智能体验。这一新增服务为寻求高度隐私保护和内容自由度的用户提供了新的选择。

行业动态部署/工程
7月14日
08:00
OpenRouter:Announcements(RSS)
54
在 Cursor 中使用 OpenRouter 模型:以 Moonshot AI 的 Kimi K2 为例

用户现可通过 OpenRouter 灵活的路由服务,在 Cursor IDE 中直接调用 Moonshot AI 最新推出的 Kimi K2 模型。这一集成简化了开发流程,无需复杂配置即可在编码环境中访问高性能大语言模型。OpenRouter 作为统一接口,支持用户便捷切换包括 GPT、Claude、LLaMA 及 Kimi 在内的多种模型,显著提升了 AI 辅助编程工具的可用性和选择自由度。

MCP/工具产品更新编码
7月10日
08:00
OpenRouter:Announcements(RSS)
48
免费服务层更新:持续为所有人提供可访问的AI

平台对其免费服务层进行了重要更新,旨在通过引入新的模型来维持可访问的AI推理能力。此次调整的核心是确保免费服务的长期可持续性,同时继续向广大用户提供AI服务。更新后,用户将能使用到性能更强或更高效的新模型,但部分原有模型的访问权限或速率可能会相应调整。平台承诺,核心目标依然是让每个人都能接触和使用AI技术。

产品更新部署/工程
7月1日
08:00
OpenRouter:Announcements(RSS)
32
新隐写模型:"Cypher Alpha"

一款名为“Cypher Alpha”的新型通用隐写模型现已发布。该模型具备内置的工具调用功能,可供用户免费使用。其核心特性在于“隐写”,即在执行任务时能保持隐蔽性。目前,用户已可尝试体验这一模型。

智能体MCP/工具产品更新
6月26日
08:00
OpenRouter:Announcements(RSS)
50
Introducing Presets: 从仪表板管理 LLM 配置!

OpenRouter 正式上线了 Presets 功能。用户现在可以通过仪表板集中管理 LLM 配置,无需再将参数硬编码在应用程序中。此举旨在将 LLM 逻辑集中化,从而帮助开发者更快地进行迭代,并清理冗余代码,提升开发效率。

产品更新部署/工程
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选73
Claude Desktop推出"桌面扩展"新格式,实现MCP服务器一键安装

Claude Desktop推出了名为“桌面扩展”的新打包格式(.mcpb文件),旨在彻底简化MCP服务器的安装流程。该格式将服务器代码、所有依赖项和配置清单打包成一个ZIP压缩包。用户只需下载.mcpb文件并用Claude Desktop打开点击安装即可完成,无需手动配置环境、安装运行时或处理依赖冲突。此举解决了以往需要开发者工具、手动编辑配置文件和依赖管理等复杂问题,显著降低了非技术用户使用强大本地MCP服务器的门槛。

AnthropicMCP/工具产品更新

推荐理由:MCP 服务器装机从「开发者手动改 JSON」变成「双击 .mcpb 一键安装」,Anthropic 把 MCP 生态的用户门槛砍掉了一大截,做 MCP server 的开发者现在该认真考虑打包分发了。
6月25日
08:00
OpenRouter:Announcements(RSS)
46
Dev & BYOK 更新:Uptime API 与更智能的密钥管理

Anthropic 为其开发者和 BYOK 客户推出两项重要更新。新发布的 Uptime API 允许开发者通过编程接口直接追踪模型运行状态与可用性。同时,BYOK 密钥管理功能得到增强,用户现在可以对密钥设置使用量限制,并创建可测试的密钥,从而实现对加密密钥更精细化的控制与验证。

产品更新部署/工程
6月9日
08:00
OpenRouter:Announcements(RSS)
49
简化我们的平台费用

平台宣布推出更简单、更透明的费用结构。此次调整旨在简化原有收费模式,提升费用透明度,让用户更清晰地理解相关成本。新结构将逐步实施,预计会影响平台上的各项服务收费方式。

产品更新部署/工程
6月4日
08:00
OpenRouter:Announcements(RSS)
52
GIF提示、Omni搜索、工具缓存与BYOK标志

多项新功能正式上线,包括GIF提示支持、Omni全平台搜索、Anthropic工具调用缓存以及自带密钥(BYOK)确认标志。这些更新显著提升了工作流程效率,实现了更智能的工具调用机制,并优化了图像支持体验。用户现可更快捷地生成GIF动图、跨平台检索内容、缓存常用工具以加速响应,并通过BYOK标志明确数据控制权限。

MCP/工具产品更新部署/工程
5月28日
08:00
OpenRouter:Announcements(RSS)
49
新功能发布:推理流、加密货币支付、终端用户ID等

OpenRouter平台上线多项新功能。核心更新包括“推理流”,允许开发者在模型生成完整回复前实时获取并处理中间推理步骤,提升交互应用的响应速度。平台新增加密货币支付选项,支持通过加密货币开具发票。同时引入“终端用户ID”功能,帮助开发者更好地追踪和管理最终用户的使用情况,以保护API速率限制。此外,密钥锁定机制也已上线,增强了密钥管理的安全性。

产品更新部署/工程
5月22日
08:00
OpenRouter:Announcements(RSS)
43
Passkeys、开发者体验升级与TypeScript智能体新指南

Anthropic发布了多项平台更新。用户现可使用Passkeys无密码方式登录以增强账户安全。开发者体验获得升级,包括引入“provider slugs”功能以简化模型调用流程。同时,官方推出了全新的TypeScript智能体构建指南与更新后的文档,旨在帮助开发者更高效地创建基于Claude的AI智能体。

智能体产品更新部署/工程
5月7日
08:00
OpenRouter:Announcements(RSS)
50
新服务商上线:Cerebras登场

专为速度与规模构建的AI服务商Cerebras正式推出。其架构从晶圆级到token处理全程优化,旨在消除内存瓶颈,从而显著提升计算效率与模型训练速度。这一突破使处理超大规模模型成为可能,为AI开发提供新的基础设施选择。

产品更新部署/工程
5月6日
08:00
OpenRouter:Announcements(RSS)
47
Better Insights、Faster Metrics 及全新开发者效率工具发布

平台推出了更深入的使用情况洞察、更精准的性能指标以及一系列新的开发者效率工具。这些更新旨在帮助开发者更快地优化工作流程,提升开发效率。新工具集专注于提供实时、可操作的数据分析,以加速调试与性能改进过程。

产品更新部署/工程
4月28日
08:00
OpenRouter:Announcements(RSS)
41
隐私条款明晰化、新增模型提供商、OAuth升级,以及Gemini获得并行工具支持

本次更新为开发者带来多项体验优化。隐私条款得到进一步明确,增强了数据处理的透明度。平台新增了多个第三方模型提供商,扩展了开发者的选择范围。OAuth 认证服务完成升级,提升了安全性与集成便捷性。此外,Google 的 Gemini 模型现已支持并行工具调用功能,允许模型同时执行多项操作,有望提高复杂任务的处理效率。这些改进共同致力于提升开发者的工作效率与构建体验。

MCP/工具产品更新部署/工程
4月23日
08:00
OpenRouter:Announcements(RSS)
52
Universal PDF Support

OpenRouter现已为平台上的所有模型提供PDF文件处理支持。这项通用功能意味着用户在使用任何模型时,都能直接上传和分析PDF文档。此举消除了以往特定模型才能处理PDF的限制,显著扩展了工具的应用场景,便于用户进行文档总结、信息提取或内容问答等一系列任务。

产品更新多模态部署/工程
4月18日
08:00
OpenRouter:Announcements(RSS)
41
更智能的图表、内联SVG与实时用量统计

OpenRouter平台上线三项核心更新。分析功能推出更智能的交互式图表,支持深入钻取数据。预览体验得到优化,现已支持内联SVG渲染,展示更流畅。平台新增实时用量统计功能,为用户提供即时的成本消耗可见性,便于监控API使用开销。这些改进旨在提升用户在模型使用分析与费用管理方面的操作体验。

产品更新部署/工程
4月10日
08:00
OpenRouter:Announcements(RSS)
53
"隐形"模型:Optimus Alpha

团队发布了其第二个“隐形”模型Optimus Alpha。该模型延续了此前“隐形”模型的保密策略,具体性能指标与架构细节未公开。此举旨在保持技术优势,避免在竞争激烈的AI模型领域过早暴露全部能力。Optimus Alpha的推出标志着团队在模型迭代上的持续进展,但核心改进方向与具体应用场景仍有待后续披露。

智能体产品更新模型发布
4月3日
08:00
OpenRouter:Announcements(RSS)
41
"隐形"模型:Quasar Alpha

公司首次发布了名为Quasar Alpha的“隐形”模型。这一新模型标志着其产品策略的转变,旨在以更隐蔽、不易被察觉的方式运行。Quasar Alpha的推出是其在人工智能模型领域的一次重要迭代,具体性能指标和细节尚未完全公开,但明确指向了增强模型的隐蔽性和适应性。

产品更新模型发布
3月25日
08:00
OpenRouter:Announcements(RSS)
50
告别空转:为所有模型推出 Zero Token Insurance,不再为无效AI响应付费

Anthropic为其AI模型服务推出“零令牌保险”功能,覆盖包括Claude 3和GPT-4在内的所有主流模型。该功能可自动检测并补偿完全无意义、空白或严重错误的响应,用户无需为这些无效输出消耗令牌额度。系统通过实时分析响应结构与语义完整性实现自动判责,补偿令牌将在24小时内返还至账户。早期测试显示,该机制使GPT-4的无效响应计费率降低67%,Claude 3系列模型的空转计费投诉下降82%。

产品更新部署/工程