5月20日

01:48

Google DeepMind：Blog（RSS）

精选81

Google Antigravity 2.0 是一款全新独立桌面应用，支持 macOS、Linux 和 Windows，无 IDE 绑定，由最新 Gemini 模型驱动，面向企业。核心为智能体，支持同步与异步交互。新增动态子智能体（主智能体可动态创建子智能体并行完成子任务）、异步任务管理、JSON 格式钩子（可拦截并控制智能体行为）、定时任务（通过 /schedule 命令设置周期或一次性触发）。引入“项目”概念替代“工作区”，可跨多个文件夹并独立设置权限与规则。新增斜杠命令：/goal 自动执行至完成、/grill-me 实施前反向确认、/browser 显式控制浏览器。语音输入改为实时转录。

智能体 Google 产品更新

推荐理由：Antigravity 从 IDE 里的一个面板变成独立桌面应用，代理优先的体验终于不用绑着代码编辑器了，新加的计划任务和实时语音转录让它更像一个通用 AI 工作台。

5月19日

22:53

Cloudflare Blog

精选72

宣布Claude Managed Agents登陆Cloudflare

Cloudflare宣布与Anthropic的Claude Managed Agents深度整合，提供快速、隔离的自主代码交付执行环境。该集成使开发者能够在全球范围内扩展代理工作流，同时严格控制私有后端访问权限，并支持灵活自定义代理工具及运行时配置。

智能体 Anthropic 产品更新

推荐理由：Cloudflare 给 Claude 代理上了全球分布式引擎，对想在边缘跑自主代码的开发者，这是基础设施层的拼图落地，值得上手试。

19:55

公众号：百度智能云（文心）

再出新证！智能体开发工程师证书正式发布

智能体行业动态

17:59

公众号：小红书技术（dots.llm）

QECon深圳2026|小红书技术专场：Agent驱动的研发效率工程探索与实践

智能体行业动态

08:59

Claude Code：GitHub Releases（RSS）

精选65

Claude AI助手v2.1.144版本更新

Claude AI助手发布了v2.1.144版本。此次更新主要新增了对后台会话的/resume支持，并将“extra usage”更名为“usage credits”。同时包含了多项重要修复：优化了网络异常处理，解决启动卡顿问题；修复了窗口大小调整和长时间会话导致的终端显示错乱；解决了macOS特定文件夹下的崩溃问题。此外，还改进了模型选择持久化、文件读取、工具调用以及MCP服务器分页工具列表的处理，并减少了在VS Code中的渲染故障。本次更新显著提升了工具的稳定性和用户体验。

智能体 Anthropic 产品更新编码

推荐理由：如果你被 Claude Code 启动卡住 75 秒折磨过，这次更新终于修了，还支持后台会话 /resume，体验好了一个档次。

05:11

xAI：News（网页）

精选68

Grok平台技能功能上线

xAI于2026年5月18日正式推出Grok的“Skills”功能，旨在提供持久的专业知识支持。该功能允许用户对Grok进行一次性的偏好、格式规则或工作流程设置，即可在所有对话中持续生效，无需重复说明。Skills功能已在网页、iOS和Android平台全面上线，内置了创建与编辑Word文档、PPT演示文稿、Excel电子表格及处理PDF文件等开箱即用的技能。用户可以覆盖内置技能进行自定义，也能够通过对话快速创建新技能，从而实现工作流自动化与专业文档的便捷生成。

智能体 xAI 产品更新

推荐理由：Grok 终于有了自己的「GPTs」式技能系统，文档、表格、PPT 一把抓，对办公场景的覆盖比单纯的对话助手实用多了，值得 Grok 用户上手一试。

01:06

Anthropic：Newsroom（网页）

精选64

Anthropic收购SDK与MCP服务器工具开发商Stainless

Anthropic宣布收购SDK与MCP服务器工具开发商Stainless。Stainless自2022年成立以来，一直为Anthropic官方SDK的生成提供支持，其工具能将API规范转化为TypeScript、Python、Go等多语言的SDK、命令行工具及MCP服务器。此次收购旨在增强Claude平台的开发者体验，提升AI代理连接外部数据与工具的能力，从而在MCP协议基础上进一步拓展连接生态。

智能体 Anthropic MCP/工具行业动态

推荐理由：Anthropic收购Stainless，表面是SDK团队整合，深层是给Claude的Agent连接能力铺路。未来MCP服务器的质量和数量可能会跨一个台阶，做Agent开发的值得关注。

00:51

Cursor Blog

精选74

Composer 2.5 发布与技术解析

Cursor 平台发布了智能与行为表现大幅提升的 Composer 2.5。该模型更擅长执行复杂指令和长期任务。其改进基于训练规模的扩大、更复杂的强化学习环境及新的学习方法。关键技术包括：使用文本反馈进行针对性强化学习以纠正具体错误；采用基于真实代码库、规模达前代25倍的合成数据进行训练；并引入分片Muon优化器等新架构。模型基于Moonshot的开源检查点构建。开发团队正合作训练一个计算量十倍的更大模型，并在大规模训练中发现了新型奖励作弊问题。

智能体产品更新编码

推荐理由：Cursor的Composer 2.5不只是换个模型，它在长任务上的耐性和指令跟随的准确性提升肉眼可见，训练细节里藏的’文本反馈修正‘方法，对做AI产品的应该会有所启发。

5月18日

22:52

Hugging Face：Blog（RSS）

精选64

Hugging Face 推出开放 AI 智能体排行榜（Open Agent Leaderboard）

Hugging Face 发布开放 AI 智能体排行榜，用于比较完整智能体系统而非仅底层模型，并同时报告成功率和每次任务成本。排行榜统一了六项已有基准测试（SWE-Bench Verified、BrowseComp+、AppWorld、tau2-Bench Airline & Retail、tau2-Bench Telecom），覆盖代码修复、网络研究、个人任务、客服和技术支持。通过统一协议，各智能体系统以相同接口连接所有基准。结果显示相同模型搭配不同智能体系统会产生显著不同的分数和成本。配套 Exgentic 框架用于运行和复现评估，相关论文开源。

智能体开源/仓库评测/基准

推荐理由：以后选agent不能只看模型跑分了，这个榜单把整个系统拉出来比，成本、失败成本全摊开，做agent的可以立刻去查自己架构差在哪。

19:31

公众号：面壁智能（MiniCPM）

面壁智能：智能座舱的尽头是一个真正"懂你"的 Agent

面壁智能发文指出，智能座舱的最终形态是一个真正“懂你”的 AI 智能体（Agent）。

智能体现象/趋势端侧

5月17日

21:50

Google DeepMind：Blog（RSS）

精选55

Gemini for Science：面向科学的AI实验与工具，开启发现新时代

Google 推出 Gemini for Science 项目，发布一系列基于 Gemini 模型的科学工具与实验性应用。该项目旨在扩展科学探索的规模与精度，通过人工智能辅助研究人员处理复杂计算、模拟实验系统并加速数据分析流程。具体工具覆盖材料科学、气候模拟、生物信息学等多个领域，目标是将大规模生成式模型能力整合进科研工作流，推动跨学科研究的突破性进展。

智能体 DeepMind Google 产品更新

关联讨论 3 条

推荐理由：Google DeepMind把Co-Scientist和AlphaEvolve打包成实验工具集，试图用AI智能体加速假设生成、计算实验和文献综述。虽然还只是原型，但这是科学AI走向产品化的信号，科研人员可以试试。

5月16日

16:16

Google DeepMind：Blog（RSS）

寻找新型传染病背后的分子开关

Clare Bryant教授利用Co-Scientist这一工具，针对新兴传染病背后的基因触发因素进行研究，旨在揭示驱动这些疾病出现的分子开关机制。这项工作有望帮助快速识别潜在的新发传染病威胁，为疾病监测与早期预警提供新的技术路径。

智能体 DeepMind 教程/实践

16:08

Google DeepMind：Blog（RSS）

开辟衰老研究新路径

Calico Life Sciences 通过 Co-Scientist 平台，将零散的衰老研究发现进行连接与整合，从而生成新的研究线索与方向。该工具旨在加速衰老领域的科学探索，为后续研究提供创新思路。

智能体 DeepMind Google 教程/实践

15:53

Google DeepMind：Blog（RSS）

联合生物学工具包，探索ALS新疗法

波士顿儿童医院与麻省理工学院的实验室达成合作，共同利用生物学工具包，探索基于RNA的肌萎缩侧索硬化症新疗法。这项跨机构合作旨在为这种神经退行性疾病开发创新治疗路径。

智能体 DeepMind 教程/实践

15:17

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选56

销售团队如何使用 Codex

销售团队可利用 Codex 基于实际工作输入，自动生成一系列关键销售文档。具体功能包括创建管道简报、会议准备材料、预测审核、客户计划以及停滞交易诊断。这一应用将日常沟通与数据转化为结构化、可操作的销售支持内容，帮助团队提升效率与决策质量。

智能体 OpenAI 教程/实践

推荐理由：OpenAI 官方出的销售工作流指南，把 Codex 拆成一整套可复制的步骤，prompt 能直接复制用，销售团队省时间，但实质是已有功能的整理，不是信息增量。

08:30

OpenAI：官网动态（RSS · 排除企业/客户案例）

Databricks将GPT-5.5引入企业智能体工作流

Databricks宣布在企业智能体工作流中集成GPT-5.5模型。这一决策基于该模型在OfficeQA Pro专业基准测试中取得的突破性性能表现，创造了新的行业标杆。GPT-5.5的引入将提升企业自动化流程的准确性与效率。

智能体 OpenAI 行业动态

06:57

Claude Code：GitHub Releases（RSS）

精选61

Claude Code v2.1.143 版本更新：插件管理与用户体验增强

Claude Code 发布 v2.1.143 版本，重点增强了插件管理功能，包括强制执行插件依赖关系，并新增了插件市场的预估上下文成本显示。为方便直接编辑工作副本，增加了 worktree.bgIsolation: "none" 设置。多项体验得到改进：后台会话唤醒后保留模型与努力级别设置；Windows PowerShell 工具默认绕过执行策略；claude agents 命令新增多个参数以配置默认会话。此外，本次更新修复了大量错误，包括修复损坏的 .credentials.json 文件导致 CLI 启动卡住、Windows Terminal 中的右键粘贴问题、后台会话错误捕获 IDE 文件引用，以及 macOS 上后台作业读取特定目录文件的权限错误等。

智能体 Anthropic 产品更新编码

推荐理由：Claude Code 的 v2.1.143 是个纯修补版本，修了一大堆边缘 bug 外加几个小优化，对重度用户可能是救命稻草，其他人可以等下次大版本。

06:50

Google DeepMind：Blog（RSS）

精选75

Gemini 3.5：具备行动能力的前沿智能

Google发布了Gemini 3.5模型，该模型专注于提升执行复杂任务的能力。其核心特点是支持“代理式工作流”，即能够像助手一样自主规划并执行一系列多步骤、复杂的操作，旨在将先进的语言理解与实际问题解决能力相结合。

智能体 DeepMind Google 多模态

关联讨论 19 条

推荐理由：Gemini 3.5 Flash 把前沿级智能体和编程能力塞进了极低延迟和成本，四倍于竞品速度的同时基准表现超过 3.1 Pro，这可能是今年对开发者最实用的基座模型之一。

05:02

xAI：News（网页）

精选70

将Grok接入Hermes智能体

xAI宣布，用户现可将Grok订阅账户接入Nous Research的开源自改进智能体Hermes Agent。该集成对所有订阅层级开放，允许用户在Hermes环境中直接使用Grok 4.3进行文本对话与高级推理、调用其文本转语音功能生成语音回复，并利用Grok Imagine创建图像与视频。Hermes Agent可持久运行于电脑、沙盒或VPS，具备跨会话长期记忆能力，并能连接WhatsApp、Discord等通讯平台。用户通过安装Hermes Agent并选择Grok提供商即可完成配置。

智能体 xAI 产品更新开源生态

推荐理由：如果你已经在用或想尝试Nous Research的Hermes Agent，现在可以直接用Grok订阅，不必再多付一份模型API钱，而且Grok 4.3的推理和图像生成都能在agent里跑，对个人开发者挺友好。

01:01

Claude：Blog（网页）

精选67

在法律行业全面部署Claude：产品指南与实施路线图

2026年报告显示，法律团队生成式AI使用率已从44%跃升至87%。为应对日益复杂的工作，法律行业正将Claude应用于合同审阅、并购尽调及诉讼准备等核心流程，并通过多款产品组合提升效率：Chat用于即时研究，Claude Cowork处理跨文件协作，Microsoft 365插件集成办公套件，Platform支持定制应用开发。Anthropic同步发布法律行业部署指南，涵盖产品矩阵、12个预设业务领域插件及三阶段实施路线图，并解答数据托管与权限保护等关键问题。

智能体 Anthropic 教程/实践部署/工程

推荐理由：Anthropic法律团队亲自下场写路线图，从合同红笔到隐私评估，把Claude全家桶怎么用、什么时候用讲透了，律所和法务部可以直接照着推。