5月28日

15:15

IT之家（RSS）

阿里 Qoder 推出全托管 AI Agent 运行平台 Cloud Agents。该平台提供 Agent 底座、模型服务及运行环境，企业可通过 API 直接调用，能将 Agent 上线时间从 1 个月缩短至 1 天。Cloud Agents 支持独立沙箱、实时事件流追踪与审计，并原生支持 Skills 和 MCP 协议，可扩展多种企业能力。

智能体 MCP/工具产品更新

13:28

HuggingFace Daily Papers（社区热门论文）

将记忆视为持续演化的连接性

现有记忆增强大语言模型智能体常将记忆视为静态存储，这在动态环境中较为脆弱。为此，FluxMem框架提出将记忆建模为异构图，并通过初始连接形成、反馈驱动细化和长期巩固三个阶段，持续优化其拓扑结构。在执行时，该框架能修复缺失连接、剪除干扰、对齐抽象粒度，并将反复成功的轨迹蒸馏为可复用的程序化回路。在LoCoMo、Mind2Web和GAIA三个基准测试上，FluxMem均达到了SOTA水平，展现出在复杂智能体环境中强大的适应与泛化能力。代码将开源于GitHub。

智能体 GitHub MCP/工具论文/研究

11:28

HuggingFace Daily Papers（社区热门论文）

多模态智能体推理的智能体探索性策略优化

针对视觉语言模型在工具使用任务中存在的“思考-行动差距”（工具调用尝试率仅约30%，且其中约40%问题的所有工具调用均错误），研究提出AXPO（AI 智能体探索性策略优化）方法。该方法在标准强化学习（如GRPO）流程中，针对工具调用全错的子批次，固定思考前缀并重新采样工具调用及后续内容。在九个多模态基准和三种规模的Qwen3-VL-Thinking模型上，SFT+AXPO的平均性能优于SFT+GRPO（8B模型平均Pass@1和Pass@4均提升1.8个百分点）。8B的SFT+AXPO模型在Pass@4上甚至超越了参数量为其4倍的32B Base模型。

智能体 MCP/工具多模态数据/训练

09:36

Claude Code：GitHub Releases（RSS）

同事件精选67

Claude Code v2.1.153 版本更新

Claude Code 发布 v2.1.153 版本。主要新增 skipLfs 选项以跳过 Git LFS 下载；优化了 claude agents 的自动补全建议和 PR 列显示格式。本次更新修复了大量问题，包括：MCP 服务器的连接与重连、子代理的配置策略与严格模式行为、后台会话的管理与权限提示（如恢复、输入响应、临时文件处理），以及跨 macOS/Windows/VSCode 平台的稳定性。此外，还修复了 Windows 更新回滚、内存占用、会话恢复等多个具体问题。/model 命令现在会将选择设为新会话的默认模型。

Anthropic MCP/工具产品更新部署/工程

同一事件，精选展示《Claude Code v2.1.163 发布》

推荐理由：Claude Code 的一次日常小修小补，但修复了 OAuth 凭证泄露和内存泄漏这种真影响使用的 bug，且 /model 现在可以记住默认模型了，升级一下不亏。

08:00

HuggingFace Daily Papers（社区热门论文）

OpenSkillEval：为LLM智能体自动审计开放技能生态

OpenSkillEval是一个用于评估LLM智能体技能的自动评估框架。它不依赖静态基准，而是从演示生成、网页设计等五类应用的动态工件中自动构建超过600个任务实例，并收集了30个开源技能进行对比评估。研究发现，技能可用并不等同于有效使用，其增益高度依赖具体模型与智能体框架，许多流行的开源技能并未持续优于无技能的基础智能体。这强调了进行动态、任务导向评估的必要性。（https://yingjiahao14.github.io/OpenSkillEval-Web/）

智能体 MCP/工具论文/研究

03:33

Tomer Tunguz 博客（VC 分析）

精选61

软件之后是AI时代

软件时代正过渡至“智能体框架”时代。AI作为强大但需驯化的“野马”，其智能驯化包含七个核心组成部分：上下文与记忆、工具与行动、编排与循环、状态与持久性、沙箱与计算、可观测性与治理、成本与工作流优化。这些组件共同构成了一个生产级的智能体系统。这一转变将重塑软件竞争格局，模型通用化的未来中，最佳的智能体驾驭者将获胜。

智能体 MCP/工具现象/趋势

推荐理由：Tomer 把 agent 时代的竞争拆成七个组件，不是空谈，而是给了创业公司一个具体的 check-list，做 agent 产品的值得对照一下。

02:05

The Decoder：AI News（RSS）

Robinhood允许AI智能体为客户交易股票和进行信用卡消费

Robinhood现允许客户通过MCP协议将Anthropic的Claude等AI智能体连接到独立的投资账户。这些智能体能够自主交易股票。美国金融业监管局（FINRA）已将此类智能体列为新的风险领域，并警告其可能做出不受约束的决策。Robinhood自身也承认该产品并非适合所有客户。

智能体 MCP/工具产品更新行业动态

01:39

Google Developers Blog（RSS）

精选66

Google Pay 最新更新

Google Pay 正向"智能体商务"演进，推出了通用商务协议和新的 MCP 服务器，允许 AI 智能体管理集成与分析趋势。Android 平台更新引入了动态回调以支持快速结账，并通过 WebView 将支付功能扩展至社交媒体应用。此外，平台还推出了跨设备生物认证和新的交易信号，旨在帮助商家减少流程摩擦。

智能体 Google MCP/工具产品更新

推荐理由：Google Pay 往 agentic commerce 迈了一大步，新的通用协议和 MCP server 让 AI agent 能直接管支付和分析，做 agent 或支付的开发者都得看看。

5月27日

22:09

Runway：News（网页）

精选73

Runway 推出 Model Context Protocol 服务器

Runway 正式推出 Runway MCP 服务器，允许任何兼容 MCP 的 AI 智能体（如 Claude、ChatGPT、Cursor）在对话界面中直接生成图像与视频，无需切换工作流。该服务器接入了 Runway 最新的多款 SOTA 模型，包括 Gen-4.5、Seedance 2.0、GPT Image 2、Kling 3.0 及 Nano Banana Pro。其应用场景涵盖为产品制作营销视频、批量生成网站视觉素材、创作角色广告以及在应用开发中集成视觉内容。用户设置简便，通过 runwayml.com/mcp 添加服务器并登录现有 Runway 账户即可使用，无需单独申请 API 密钥。

MCP/工具产品更新多模态

关联讨论 1 条

推荐理由：Runway 把 Gen-4.5 和 Seedance 2.0 等模型接入了 MCP，以后做产品图、营销视频不用切窗口，这个集成对依赖视觉内容的 Agent 工作流是个 real upgrade。

20:37

TechCrunch：AI（RSS）

Robinhood 推出支持 AI 智能体交易股票的新功能

金融平台 Robinhood 推出一项新功能，允许用户创建一个带有预存余额的独立账户。该账户专门设计用于 AI 智能体执行股票交易操作，为自动化投资代理提供了专用资金渠道。

智能体 MCP/工具产品更新

20:32

Hacker News 热门（buzzing.cc 中文翻译）

将 Claude Code 作为日常工具：Claude.md、技能、子代理、插件和 MCP

文章探讨了将 Claude Code 作为日常开发工具的实践，重点介绍了其核心配置文件 Claude.md、技能系统、子代理功能、插件扩展以及通过 MCP（模型上下文协议）进行集成的方法，旨在提升开发者的工作流效率。

智能体 Anthropic MCP/工具教程/实践

10:19

HuggingFace Daily Papers（社区热门论文）

MUSE-Autoskill：通过技能创建、记忆、管理与评估实现智能体的自我进化

MUSE-Autoskill 提出了一个以技能为核心的智能体框架，使智能体能够通过统一的技能生命周期（创建、记忆、管理、评估与精炼）持续提升任务解决能力。该框架支持按需创建技能、跨任务存储与重用，并借助单元测试和运行时反馈进行持续改进。它还引入了技能级记忆，用于为每个技能积累跨任务经验。在 SkillsBench 上的初步实验表明，经过生命周期管理的技能可以提升任务成功率、效率、重用性及跨智能体迁移能力，突显了将技能作为长期、可感知经验且可测试的资产的重要性。

智能体 MCP/工具论文/研究部署/工程

09:04

Claude：Blog（网页）

精选75

Code w/ Claude 伦敦活动：重塑开发体验

在Code w/ Claude 伦敦活动上，Anthropic 宣布了 Claude Managed Agents 的两项新能力：自托管沙箱（公开测试版）和 MCP 隧道（研究预览）。这两项功能使 AI 智能体的工具执行环境与企业私有网络内的 MCP 服务器连接均可运行在客户自有基础设施或指定托管服务商处。活动还介绍了如何通过 Claude Code、优化思维预算以及模型努力级别来提升开发体验。目前，包括 Spotify、Base44 和 Legora 在内的客户已在使用这些新功能。

智能体 Anthropic MCP/工具产品更新

关联讨论 2 条

推荐理由：Claude 平台企业部署的最后一公里被补上了，自托管沙箱和 MCP 隧道让 agent 真正能进生产环境，做 2B 的企业级应用终于有了安全底座。

08:00

HuggingFace Daily Papers（社区热门论文）

AsyncTool：异步工具调用能力评测基准

当前对大语言模型智能体的评估忽略了工具使用的时序维度，尤其未考虑工具响应延迟的影响，且多局限于单任务场景。为此，研究团队提出了AsyncTool，这是一个评估智能体在具有延迟工具反馈的交互式多任务环境中表现的基准。它同时呈现多个异构任务，模拟真实的响应延迟，并在步骤、子任务和任务三个级别进行评估，引入了效率导向的指标。实验表明，延迟的工具反馈对现有智能体构成重大挑战并导致性能下降，而能更好协调任务切换与状态维护的模型表现更优。

智能体 arXiv MCP/工具论文/研究

04:07

Ars Technica：AI（RSS）

开源软件包 Starlette 中的关键漏洞威胁数百万 AI 智能体

开源 Python Web 框架 Starlette 中发现名为“BadHost”的关键漏洞。该软件包每周下载量高达 325 million 次，其漏洞可能直接威胁大量依赖它构建的 AI 智能体（AI Agent）服务。

MCP/工具安全/对齐开源/仓库部署/工程

5月26日