5月5日

07:16

Claude Code：GitHub Releases（RSS）

精选60

v2.1.128版本更新

本次更新包含多项功能优化与错误修复。主要功能上，/color 命令支持无参数随机选色，/mcp 命令显示已连接服务器的工具数量，--plugin-dir 参数新增支持 .zip 插件包。用户体验方面，优化了 /model 选择器的显示。关键问题修复包括：解决了通过标准输入传输超大文件时导致的崩溃循环、修复了长 URL 在全屏模式下无法逐行点击的问题，以及修正了并行 Shell 工具调用中一个命令失败会错误取消同级调用的问题。此外，还处理了 MCP 服务器重连时工具列表刷屏等多个稳定性问题。

智能体 Anthropic 产品更新

推荐理由：Claude Code 的日常维护版本，修了一堆小 bug 并给了 /color 随机色、插件支持 zip 等细节提升，重度用户建议升，非用户不必关注。

5月2日

01:18

Claude：Blog（网页）

精选64

零基础项目经理借助Claude Code，六周内独立开发并上线压力管理应用

毫无编程经验的项目经理Kostiantyn Vlasenko，借助Claude Code在72小时内独立开发出压力管理应用Respiro，并于六周后成功上线苹果应用商店。该应用能通过手机实时检测用户压力信号，并即时引导呼吸练习。其架构由15个以上并行运作的专用子智能体构成，涵盖设计、开发、审查等模块。Claude协助完成了从技术选型、代码重构到苹果账号注册、服务集成乃至界面调试等一系列复杂操作，甚至支持了后续的市场推广工作。

智能体 Anthropic 教程/实践

推荐理由：一个零编程经验的项目经理，用 Claude Code 六周做完压力管理 App 并上架。关键不在技术，而在「管人经验拿来管 AI agent」的思路，对非技术背景的创业者太有参考价值。

5月1日

08:00

Apple Machine Learning Research（RSS）

精选64

强化智能体：面向工具调用智能体的推理时反馈机制

本文提出一种将评估机制嵌入工具调用智能体实时执行循环的新方法。通过引入一个专门的评审员智能体，在推理时对主智能体的中间决策轨迹进行即时评估，并生成结构化反馈。这使得主智能体能在单次运行中动态调整其工具选择与参数调用，无需依赖传统的提示调整或模型重训练。该实时干预机制旨在直接纠正错误，提升了工具使用的准确性与可靠性，突破了传统后验评估无法在运行中修正行为的局限。本工作已被ACL 2026的自然语言生成、评估与指标研讨会接收。

智能体 MCP/工具论文/研究

推荐理由：Apple 把评估嵌进 agent 执行循环，不是事后分锅，而是让 reviewer 实时纠错，这对 tool-calling 类应用是个真方向，做 agent 架构的值得细读。

04:16

Claude：Blog（网页）

精选64

构建企业级AI智能体：领先企业的转型指南

2025年数据显示，美国员工工作AI使用率已从2023年的20%升至40%。真正获得持续竞争优势的企业正将智能体AI深度嵌入工作流程，并将机构知识编码成可累积的系统。本指南以欧莱雅、Lyft和乐天为例，提出企业AI转型三大支柱：跨越“智能体思维鸿沟”、基于实际工作流程培训员工、在压缩信息密集型流程时保留人工判断，以及构建能创造收入的新产品能力。Claude Cowork平台为此提供了无需定制开发的团队级解决方案，并包含六个月的落地框架。

智能体 Anthropic 教程/实践

推荐理由：从 L'Oréal、Lyft 这些案例看，企业怎么把 AI 智能体扎进业务流程，比泛泛而谈的 AI 转型文章实在得多。

02:15

Claude：Blog（网页）

精选64

Claude Code 构建经验：提示缓存的优化实践

Claude Code 团队分享了大规模优化提示缓存的核心策略。提示缓存基于前缀匹配工作，能显著降低延迟与成本，高命中率还能支持更宽松的订阅速率限制。关键实践包括：将静态系统提示和工具定义置于提示词前端以最大化共享前缀；通过消息而非修改提示词来传递更新信息，避免缓存失效；在会话中不切换模型、不增删工具，以维持缓存前缀稳定。此外，针对工具过多或“计划模式”等场景，可通过发送轻量存根或设计专用工具来规避缓存失效，从而在复杂功能中持续利用缓存优势。

智能体 Anthropic MCP/工具教程/实践

推荐理由：Claude Code团队把提示缓存的坑和优化方法全盘托出，从提示顺序、工具加载到压缩技巧，每一个经验都是钱和延迟换来的，做agent的同行可以直接拿去做架构参考。

02:00

OpenAI：Alignment 研究博客（RSS）

精选66

无需人类同步监督的智能体操作自动审查机制

一项名为“自动审查”的新机制为代码智能体的部署提供了更安全的默认方案。该机制通过一个独立的审查智能体，对主智能体可能越界的操作进行异步的批准或拒绝，从而无需人类进行实时同步监督。这种方法旨在提升自主智能体在代码生成与执行过程中的安全性与可控性，是保障AI代理在边界内可靠运行的关键技术进展。

智能体 OpenAI 安全/对齐论文/研究

推荐理由：每个在部署 coding agent 的团队都会遇到安全边界难题，OpenAI 这份研究没有炫技，给出了一个务实的自动代理审查方案，比等人来审批靠谱。

4月30日

20:00

Cursor Blog

精选55

持续优化智能体工具链：上下文演进与效果评估

Cursor团队以构建软件产品的方式迭代优化其智能体工具链，核心围绕上下文窗口的演进。早期模型能力有限，工具链依赖大量静态上下文和防护机制；随着模型能力提升，团队已转向提供更多动态上下文获取方式并移除限制。评估改进效果采用线上线下结合：通过CursorBench等基准测试进行标准化质量评估，同时进行线上A/B测试，使用“代码保留率”和用户反馈语义分析衡量真实场景表现。团队持续监控并修复工具调用错误，以应对日益复杂的工具链状态。

智能体 Anthropic OpenAI 教程/实践

推荐理由：Cursor 这篇 agent harness 复盘是今年聊 agent 基础设施最好的文章之一，从上下文管理到多 agent 调度，全是实战迭代的血泪经验，做 agent 的团队该逐字读。

08:00

OpenRouter：Announcements（RSS）

OpenRouter 四月发布亮点：视频生成、工作区、Agent SDK、重排序模型与前沿模型

OpenRouter 四月发布涵盖视频生成、工作区（workspaces）、Agent SDK、重排序模型（reranker models）以及一批前沿模型（frontier model）的推出。

智能体产品更新视频

08:00

OpenRouter：Announcements（RSS）

OpenRouter 四月更新：视频生成、工作区、Agent SDK、Reranker 模型及前沿模型发布

OpenRouter 在四月推出多项更新，涵盖视频生成、工作区功能、Agent SDK、Reranker 模型以及一批前沿模型。

智能体产品更新视频

08:00

OpenRouter：Announcements（RSS）

April Release Spotlight

本月发布聚焦视频生成、工作空间、智能体SDK与重排序模型。多家公司推出前沿大模型，包括GPT、Claude和LLaMA系列的新版本。核心变化体现在模型多模态能力增强，特别是视频生成功能成为竞争焦点。部分新模型在标准基准测试中性能提升超过15%，同时上下文窗口扩展至百万token级别。开发者工具方面，新的智能体SDK支持更复杂的任务编排，而重排序模型显著提升了检索精度。

智能体产品更新多模态模型发布

06:20

Google Research：Blog（网页）

精选57

谷歌研究团队应用实证研究辅助工具的四个领域

自去年秋季推出实证研究辅助（ERA）工具以来，谷歌研究团队已将其应用于多个科学领域以解决实际问题。在流行病学中，它助力流感与新冠预测；在宇宙学里，协助分析星系数据以探究暗能量；在大气监测方面，提升了二氧化碳排放的追踪精度；在神经科学领域，则用于解析大脑活动数据。这些实践表明，ERA能帮助科学家生成专家级的实证软件，其成果超越了黑箱模型，可发现兼具可解释性与机制准确性的解决方案，从而有效加速科学发现进程。

智能体 Google 现象/趋势

推荐理由：Google 把自家 ERA 工具在流行病学、宇宙学、气候监测、神经科学四个方向的实战案例摊开讲，虽然不是新模型发布，但对做 AI for Science 的人来说，这是一份难得的「AI 科研助手到底能干嘛」的全景参考。

02:43

LMSYS：Blog（Chatbot Arena 团队）

精选74

秒级更新万亿参数--大规模分布式强化学习中的点对点权重传输技术

LMSYS团队针对SGLang中的强化学习工作负载，提出了一种基于RDMA的点对点权重更新机制，作为传统NCCL广播方法的补充。该设计利用源端CPU引擎副本和Mooncake TransferEngine进行P2P RDMA传输，将拥有1T参数的Kimi-K2模型的权重传输时间从53秒大幅缩短至7.2秒，提速7倍。其代价是每个训练等级需在CPU内存中额外占用一个32G的推理引擎副本。此优化最大限度地减少了网络冗余，允许推理服务器更快恢复rollout过程，且兼容所有主流开源模型。

智能体开源生态论文/研究部署/工程

推荐理由：LMSYS 把分布式 RL 训练的权重同步从 NCCL 广播改成 RDMA P2P，1T 参数模型传输快了 7 倍，做大规模 RL infra 的团队该认真看看这个工程方案。

02:41

Claude：Blog（网页）

精选66

企业级部署指南：如何利用Claude Cowork推动全员AI协作

Anthropic发布《企业级Claude Cowork部署指南》，旨在帮助非技术岗位员工规模化应用AI。该指南基于内部团队及Thomson Reuters等客户实践，提供了从试点到全面推广的完整路径。核心内容包括一个五级成熟度模型、试点用例评估方法以及为期六个月的组织级部署路线图。Claude Cowork作为桌面应用，能深度集成本地文件、Slack、Google Drive及浏览器，并结合Claude for Excel/PPT实现跨文档工作流，适用于金融、法律、销售等多行业的生产场景。

智能体 Anthropic 产品更新

推荐理由：Claude Cowork 把 agent 能力从开发者命令行搬到全公司桌面，配了五级成熟度模型和六个月落地路线图，企业 IT 负责人和产品经理值得拿这份指南当部署参考。

02:36

Cloudflare Blog

精选65

Agents 现可创建 Cloudflare 账户、购买域名并部署

Cloudflare 宣布 AI 代理现可作为独立客户直接使用其服务。代理能够自主创建 Cloudflare 账户、开通付费订阅、注册域名，并立即获取 API 令牌以部署代码。人类用户可保留授权监督权限，但无需手动操作控制台、复制粘贴 API 令牌或输入信用卡信息。这一更新使代理能够以自动化流程完成从账户开设到服务部署的全链路操作。

智能体产品更新部署/工程

推荐理由：Cloudflare 把 AI 代理当成真正客户，从注册到部署一气呵成，这比给个 API 更彻底，做 agent 框架的同学该看一眼。

00:40

Mistral AI：News（网页）

Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体

Mistral AI推出旗舰模型Mistral Medium 3.5，这是一个128B参数的密集模型，拥有256K上下文窗口，在SWE-Bench Verified上获得77.6%的分数。该模型现作为Vibe和Le Chat的默认引擎，并驱动两项新功能：Vibe远程编程智能体可将编码任务移至云端异步并行执行，用户可通过CLI或Le Chat启动并在完成后接收通知；Le Chat的新工作模式则是一个由该模型驱动的智能体，能处理研究、分析和跨工具操作等多步骤复杂任务。这些更新旨在将开发者从本地线性任务中解放出来，提升工作效率。

智能体开源生态模型发布编码

4月29日

23:40

Claude：Blog（网页）

精选58

智能体时代的产品开发：Claude Managed Agents 如何解放产品经理

Claude产品经理Jess Yan分享了处于测试版的Claude Managed Agents如何改变其工作流程。这套可组合的API能大规模构建和部署云端智能体，使她能在短时间内将想法转化为可运行的原型。她的日常工作由此分流：使用Claude进行开放式探索，然后利用Claude Code基于Managed Agents编写定制智能体来自动化特定任务，如采用分析和舆情监控。这些智能体接管了以往难以规模化的操作性工作，让她能将更多时间投入到与团队和用户的创造性合作中。

智能体 Anthropic MCP/工具教程/实践

推荐理由：Anthropic PM公开用Claude Managed Agents搭建数据分析、舆情监控和演示生成agent的真实流程，对于想要用agent重构产品开发节奏的团队有实际参考价值，但不算爆炸性更新。

20:00

OpenRouter：Announcements（RSS）

OpenRouter 集成 Stripe Projects，支持通过 CLI 一行命令创建账户并获取 API 密钥与计费

运行 stripe projects add openrouter/api 即可从命令行获取 OpenRouter 账户、API 密钥和 Stripe 计费，AI 智能体同样可以执行此操作。

智能体产品更新部署/工程

20:00

OpenRouter：Announcements（RSS）

精选60

OpenRouter 推出 CLI 创建账户功能，集成 Stripe 计费

运行 stripe projects add openrouter/api 即可从命令行创建 OpenRouter 账户、获取 API 密钥并配置 Stripe 计费。AI 智能体同样可自动化完成该操作，无需手动注册。

智能体产品更新部署/工程

推荐理由：OpenRouter 把注册和计费全塞进一条 CLI 命令，Stripe Projects 加持，agent 都能自己开户了，重度 API 玩家可以省点事，不过就一工具链缝合，不打开也知道。

20:00

Cursor Blog

精选75

使用 Cursor SDK 构建可编程智能体

Cursor 正式推出 SDK 公开测试版，开发者仅需几行 TypeScript 代码即可构建和部署智能体。该 SDK 提供与 Cursor 应用相同的运行时、框架及前沿模型（如 GPT-5.5）支持，并允许将智能体部署于本地或 Cursor 云的专用虚拟机。借助其生产级云基础设施，如安全沙箱和持久状态管理，智能体正从个人工具演变为组织的可编程基础设施。许多团队已将其集成至 CI/CD 流水线、工作流自动化及核心产品中。

智能体产品更新编码

推荐理由：Cursor 把自家产线拆出来给外部用，对于想把 AI 代理嵌入 CI/CD 或产品的团队，省掉了自建完整 agent 栈的麻烦，对做自动化编码的开发者是个必看的更新。

09:35

Tomer Tunguz 博客（VC 分析）

精选63

AI销售中的三个核心问题

AI销售策略正从询问软件预算转向三个核心问题：软件总预算、劳动力总预算，以及客户期望三年后两者的比例。这一转变将销售对话提升至战略层面。当前数据显示，销售、支持和工程部门的人力与软件成本比分别为10:1、4:1和最高25:1，高比率意味着巨大的AI替代潜力。新的销售流程分为两步：先切入现有软件预算，再拓展至AI所释放的劳动力预算，最终目标是重新定义企业对成本结构的认知。

智能体大佬观点现象/趋势

推荐理由：Tunguz 用一张劳动力/软件支出比率表把 AI 销售的底层逻辑讲透了，做 ToB SaaS 或 Agent 产品的人看完会重新想自己的定价天花板在哪。

4月28日

23:39

Mistral AI：News（网页）

Mistral AI 发布 Workflows 公开预览版，为企业AI工作流提供编排支持

Mistral AI 正式推出 Workflows 公开预览版，该产品定位为企业AI的编排层，旨在通过提供持久性、可观察性和容错性，帮助AI驱动的工作流从概念验证可靠过渡到生产环境。它集成于Studio平台，允许开发者用Python编写工作流，并可发布至Le Chat供组织成员触发。其核心功能包括持久化执行（支持从断点恢复）、完整的步骤跟踪与审计，以及通过 wait_for_input() 等方法实现人工介入审批。目前已有ASML、ABANCA等企业客户使用其自动化货物放行、文档合规检查等关键业务流程，将原本耗时数小时的人工操作缩短至几分钟。

智能体产品更新部署/工程

12:33

OpenAI：官网动态（RSS · 排除企业/客户案例）

Choco 利用 AI 智能体实现食品分销自动化

Choco 通过集成 OpenAI API 构建了 AI 智能体系统，以自动化餐饮行业的食品采购与分销流程。该系统能自动处理订单、协调物流并优化库存，将人工操作时间减少了 70%，订单处理效率提升 50%。这一变革显著降低了供应链中的食物浪费，并帮助公司实现了业务规模化增长，展示了 AI 在传统产业中的实际应用价值。

智能体行业动态

12:33

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选70

一个用于编排的开源规范：Symphony

Symphony 是一个用于 Codex 编排的开源规范，能够将问题跟踪器转化为持续运行的智能体系统。该系统通过自动化任务协调与执行，显著提升工程团队的产出效率，同时减少开发者在不同任务间频繁切换带来的认知负担。其核心在于以标准化、可扩展的方式，将日常开发流程转化为由智能体持续驱动的工作流。

智能体 OpenAI 产品更新开源/仓库

推荐理由：OpenAI 把 Codex 的编排层抽成开源规范，等于告诉所有做 coding agent 的团队，底层调度逻辑不用自己造轮子了。做 AI 编程工具的值得花半小时看架构思路。

08:31

Claude Code：GitHub Releases（RSS）

精选60

Claude Code v2.1.121 更新：新增功能、体验优化与内存泄漏修复

本次更新为 Claude Code 带来多项增强与修复。新增功能包括 MCP 服务器的 alwaysLoad 配置、claude plugin prune 命令以及 /skills 界面搜索框。用户体验方面，优化了全屏模式滚动、对话框键盘滚动和长 URL 点击体验。重点修复了处理多张图片或使用 /usage 命令时可能出现的数 GB 内存泄漏问题，并解决了 Bash 工具在工作目录被删除后失效等稳定性缺陷。此外，还改进了 MCP 服务器的错误重试机制和终端会话标题的本地化显示。

智能体 Anthropic 产品更新编码

推荐理由：Claude Code 这版修了一堆让人抓狂的内存泄漏和崩溃问题，加上 alwaysLoad 和 plugin prune 两个实用功能，重度用户值得立刻升级，但对非用户来说只是例行迭代。

01:27

公众号：小米 MiMo

小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动

小米开源 MiMo-V2.5 系列模型，同时启动 Orbit 百万亿 Token 计划，携手全球开发者与 Agent 框架共建开源繁荣生态。

智能体开源生态模型发布

4月27日

21:22

Google Blog：AI（RSS）

加入 Google 与 Kaggle 的全新 AI Agents Vibe Coding 课程

Google 与 Kaggle 再度推出为期 5 天的 AI Agents 强化课程，现已开放注册。该课程旨在教授开发者如何构建和部署 AI 智能体，内容涵盖从基础概念到实际应用。课程形式为短期集中学习，参与者将通过 Kaggle 平台进行实践。

智能体 Google 教程/实践

19:22

公众号：阶跃星辰（Step）

阶跃与腾讯云达成战略合作，共同打造智能座舱 Agent 助手

近日，阶跃与腾讯云达成战略合作，双方将围绕智能座舱 Agent 展开深度共创，打造全新的智能座舱 Agent 助手。该助手以语音为入口，实现免唤醒、连续对话、情绪识别的超自然交互，并能基于用户情绪、驾驶状态、环境和历史信息秒懂意图，精准推荐腾讯系音乐、视频、地图等内容与应用生态。同时，产品打通腾讯在支付、地图、出行服务等领域的生态接口，从需求直达交易闭环，为用户提供一站式服务。

智能体行业动态语音

4月24日

20:00

OpenRouter：Announcements（RSS）

同事件精选67

使用Agent SDK搭建自定义编码智能体

OpenRouter Agent SDK 提供 create-agent-tui 和 create-headless-agent 两种技能，可在几分钟内脚手架搭建个性化编码智能体。前者附带终端 UI，后者为无头模式，适用于脚本与管道自动化场景。

智能体教程/实践编码

同一事件，精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能，可快速搭建个性化编码智能体》

推荐理由：虽然隔了一个多月，但这个官方教程把 Agent SDK 的脚手架玩法拆得很透，想自己搭 coding agent 的开发者抄一遍就能跑起来，省得从头写 harness。

20:00

OpenRouter：Announcements（RSS）

同事件精选57

OpenRouter Agent SDK：构建多轮智能体工作流

OpenRouter Agent SDK 提供 callModel 函数，能将聊天补全转换为支持工具调用、停止条件和成本追踪的多步智能体，覆盖 300 多个模型。

智能体 MCP/工具产品更新

同一事件，精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能，可快速搭建个性化编码智能体》

推荐理由：OpenRouter把agent构建压缩进一个callModel函数，内置工具调用、停止条件和成本追踪，对已在它生态里的开发者省下不少样板代码，可惜时效过了。

20:00

OpenRouter：Announcements（RSS）

同事件精选61

OpenRouter Agent SDK：构建多轮智能体工作流

OpenRouter Agent SDK 提供 callModel 函数，将单次聊天补全转换为支持工具调用、停止条件与成本追踪的多步智能体工作流，覆盖 300 多个模型。

智能体产品更新

同一事件，精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能，可快速搭建个性化编码智能体》

推荐理由：如果你在用 OpenRouter 拼 agent，这个 SDK 把多模型调用和工具链包成一行 callModel，省了适配 300+ 模型的体力活，值得看一眼。

20:00

OpenRouter：Announcements（RSS）

精选55

OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能，可快速搭建个性化编码智能体

OpenRouter Agent SDK 推出 create-agent-tui 和 create-headless-agent 两类技能（skills），用于快速搭建（scaffold）个性化编码智能体。前者提供终端 UI（terminal UI），后者为无头模式（headless），适用于脚本和流水线（scripts and pipelines）。

智能体教程/实践

关联讨论 1 条

推荐理由：一个用 OpenRouter Agent SDK 快速搭建编码 agent 的脚手架，适合想省时间的开发者，但内容本身是常规文档，42 天前的教程现在已经没什么新意。

20:00

OpenRouter：Announcements（RSS）

精选55

Agent SDK：在 OpenRouter 上构建多轮智能体工作流

OpenRouter 发布 Agent SDK，其核心是 callModel 函数。该函数可将一次聊天完成转化为具备工具调用、停止条件与成本追踪功能的多步骤智能体工作流。这一工具兼容平台上的 300 多个模型，使开发者能够便捷地构建复杂的多轮交互智能体应用。

智能体 MCP/工具产品更新

推荐理由：OpenRouter 把多轮 agent 编排封装成一个 callModel 函数，300+ 模型统一调用，做 agent 产品的人可以少写不少胶水代码，但本质上是工程封装而非技术突破。

20:00

OpenRouter：Announcements（RSS）

使用 Agent SDK 构建你自己的 Harness

Anthropic 发布了 Agent SDK，开发者可利用 create-agent-tui 和 create-headless-agent 技能，在几分钟内搭建个性化的编码智能体。该 SDK 支持两种模式：一是提供终端用户界面的交互式代理，二是无界面的“headless”代理，便于集成到自动化脚本和流水线中。这显著降低了为特定编码任务定制 AI 助手的门槛。

智能体产品更新编码

15:41

Steve Yegge：Medium（RSS）

Gas City 正式发布

Gas City 是 Gas Town 的彻底重写版本，作为构建自定义智能体工厂的 SDK 于本周发布 v1.0.0。它将技术栈解构为可组合的、声明式的 “pack” 构建块，用于部署任意拓扑的协作智能体团队。系统默认包含一个完整的 “Gas Town” pack，可作为原版的直接替代品。Gas City 基于 MEOW 栈和 Dolt 构建，提供智能体身份、消息传递、上下文、状态等开箱即用的服务，并暴露 Factory Worker API，完全开源并采用 MIT 许可证。

智能体 GitHub 开源/仓库开源生态

12:19

Anthropic：Newsroom（网页）

精选59

Anthropic与NEC合作，共建日本最大AI工程团队

Anthropic与NEC达成战略合作，旨在打造日本规模最大的AI原生工程团队。NEC将成为Anthropic在日本的首个全球合作伙伴，为集团全球约3万名员工部署Claude AI工具。双方将针对金融、制造和地方政府等领域，联合开发安全的行业专用AI解决方案，并将Claude集成到NEC的安全运营中心及下一代网络安全服务中。NEC内部将设立卓越中心，通过技术培训构建AI工程团队，并广泛应用Claude Code等工具。目前，全球员工的工具部署与行业解决方案的联合开发已同步启动。

智能体 Anthropic 行业动态

推荐理由：NEC 三万人上 Claude，是 Anthropic 在日本市场拿下的最大企业单子，信号意义大于产品本身。做 To B 的可以观察日本企业 AI 采购节奏，但对普通开发者没什么可抄的。

10:00

公众号：火山引擎

双第一！火山引擎智能体安全实力获权威认证

智能体安全/对齐

09:00

公众号：蚂蚁百灵（Ling）

Ling-2.6-1T 发布：万亿旗舰"快思考"模型，对标 GPT-5.4

蚂蚁百灵发布万亿参数旗舰 Ling-2.6-1T，采用 MLA 与 Linear Attention Hybrid 架构，以“快思考”机制实现低 Token 开销高效推理。综合智能对标 GPT-5.4 (Non-Reasoning)，在 AIME26 上显著领先其他非思考模型；在 SWE-bench Verified、TAU2-Bench、BFCL-V4 等 Agent 基准上达到开源 SOTA。支持 256K 超长上下文（MRCR 高分）并表现优异的 IFBench。现已通过 OpenRouter 和官方平台提供一周免费 API 调用，将于近期正式开源。

智能体开源生态推理模型发布

08:00

Hugging Face：Blog（RSS）

精选78

DeepSeek-V4：智能体可实际使用的百万token上下文

DeepSeek发布新一代模型DeepSeek-V4，其核心突破在于实现了长达百万token的上下文窗口，并确保智能体能够有效利用这一扩展的上下文能力。该模型延续了通过开源与开放科学推动人工智能发展与普及的使命，标志着大模型在长上下文理解和实际应用方面迈出重要一步。

智能体 DeepSeek 开源生态模型发布

关联讨论 3 条

推荐理由：DeepSeek 把上下文窗口推到百万 token 不稀奇，关键是「agent 能实际用」这六个字。如果实测成立，RAG 的很多工程妥协可以扔掉了，做长文档和复杂 agent 的人该第一时间跑一遍。

4月23日

17:50

公众号：腾讯混元

精选67

Hy3 preview发布并开源：混元重建后首个模型，Agent能力大幅提升

智能体开源/仓库模型发布

推荐理由：混元重建后的第一枪，Agent能力大幅提升且直接开源，虽然已过首发热度，但对关注国产模型Agent能力的人还是个值得拉下来跑的repo。

08:00

蚂蚁百灵：Developer Blog（网页）

精选67

Ling-2.6-flash 发布：更快响应、更强执行、更高 Token Efficiency

针对智能体任务中Token消耗快速增长的问题，Ling-2.6-flash模型正式发布。该模型采用混合线性架构等技术进行系统性优化，旨在实现更高推理效率和更低使用成本。其推理速度在4卡H20条件下最快可达340 tokens/s，在Artificial Analysis评测中仅消耗约对比模型1/10的Tokens。模型在多个Agent相关基准测试中达到同尺寸SOTA水平，保持了强大的任务执行与工具调用能力。

智能体模型发布部署/工程

推荐理由：蚂蚁百灵这次打的是「省 token」这张牌，104B 总参但只激活 7.4B，Agent 场景评测对齐同尺寸 SOTA，输出 token 消耗只有竞品的 1/10。做 Agent 产品、被推理成本卡脖子的团队值得认真看看这个路线。