全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 346 条

全部一手资讯 X 论文

标签「MCP/工具调用」清除

6月3日周三

22:41Hugging Face：Blog（RSS）46为 Reachy Mini 添加 MCP 工具

21:30公众号：月之暗面（Kimi）67精选Kimi Work Beta版发布：面向知识工作者的本地Agent

17:47MarkTechPost（RSS）57Nous Research 发布 Hermes Desktop：Hermes Agent v0.15.2 的原生跨平台前端，支持流式工具输出

15:09IT之家（RSS）54行业首个：荣耀 Magic8/500/X70 全系列已支持微信 A2A 助手能力

15:09IT之家（RSS）66阿里千问向第三方 Agent、Skill 全面开放，肯德基、瑞幸等首批接入

14:35公众号：千问APP（阿里）58千问向第三方Agent、Skill全面开放，肯德基、瑞幸、东航首批接入

08:00HuggingFace Daily Papers（社区热门论文）46PACT：行动状态通信实现高效多智能体系统

05:16Claude：Blog（网页）77同事件精选Claude Code 新增动态工作流功能同一事件，精选展示《在Claude Code中引入动态工作流》

03:09IT之家（RSS）66微软发布 ACS 开源标准，让开发者精细化控制 AI 智能体行为

00:13OpenAI：官网动态（RSS · 排除企业/客户案例）70精选Codex 赋能每一种角色、工具和工作流

6月2日周二

14:40HuggingFace Daily Papers（社区热门论文）68MCP-Persona：首个面向真实场景个性化工具的LLM智能体基准测试

12:19OpenRouter：Announcements（RSS）77精选OpenRouter 5月发布亮点

08:00HuggingFace Daily Papers（社区热门论文）66Token Budgets：63起LLM智能体预算超支事故的经验目录与仿射类型Rust缓解案例研究

08:00HuggingFace Daily Papers（社区热门论文）60AuditFlow：用于结构化财务报告验证的可执行符号环境

6月1日周一

21:05IT之家（RSS）73精选王兴：美团 AI Agent"小美"与腾讯元宝即将深度合作，用户订单无缝连接

18:05IT之家（RSS）67字节跳动 AI 智能体平台扣子 Coze 3.0 版本上线，支持接入 Claude Code、Codex CLI 等平台

15:00HuggingFace Daily Papers（社区热门论文）52HarnessForge：面向自适应智能体系统的框架与策略协同进化

08:00HuggingFace Daily Papers（社区热门论文）52SkillHarm：通过自动化构造实现生命周期感知的技能投毒攻击基准

5月31日周日

09:49MarkTechPost（RSS）65使用 SkillNet 构建用于搜索、评估、图分析和任务规划的技能增强型 AI 智能体

08:00HuggingFace Daily Papers（社区热门论文）65SkillVerse多模态技能范式与VisSkillBot：AI智能体的技能应超越纯文本

08:00HuggingFace Daily Papers（社区热门论文）59SkillAdaptor：一种面向LLM智能体的自适应技能方法

5月30日周六

18:41Hacker News 热门（buzzing.cc 中文翻译）49Robinhood 现已支持您的 AI 代理进行股票交易

14:21IT之家（RSS）59Hermes Agent 加入工具搜索，"AI 养马"更省 tokens

11:18MarkTechPost（RSS）52Hermes Agent 为 MCP 推出工具搜索功能：Anthropic 评测显示 Opus 4 准确率提升 49% 至 74%

11:10Hacker News 热门（buzzing.cc 中文翻译）64MCP 死了？

09:21IT之家（RSS）74你的手机变遥控器，OpenAI 扩展 Codex 远程控制支持 Win10/Win11

04:42Claude Code：GitHub Releases（RSS）67精选v2.1.157 更新

00:33Tomer Tunguz 博客（VC 分析）65精选技能提炼

5月29日周五

21:30HuggingFace Daily Papers（社区热门论文）67CoHyDE：大语言模型重写器与稠密编码器的迭代协同训练，用于工具检索

21:14The Decoder：AI News（RSS）61新综述论文认为：代码是AI智能体的思考与行动方式，而非仅仅是其产出

17:44公众号：通义实验室（千问）64精选通义实验室发布教程：在 Android 手机部署 MCP 感知服务器

15:21IT之家（RSS）70精选阿里云开源百炼 CLI，Agent 可调用全套模型和应用能力

08:02公众号：阶跃星辰（Step）61同事件精选阶跃发布 Step 3.7 Flash，面向生产级 Agent 的高效率 Flash 模型同一事件，精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI——Step 3.7 Flash》

08:00HuggingFace Daily Papers（社区热门论文）49从提示词注入到持久控制：防御智能体框架中的木马后门

02:41Google Developers Blog（RSS）73精选使用 Google Pay & Wallet Developer MCP server 加速你的集成工作流

02:39Claude Code：GitHub Releases（RSS）73同事件精选Claude Code v2.1.154 发布：新增 Opus 4.8 与动态工作流同一事件，精选展示《在Claude Code中引入动态工作流》

00:33Tomer Tunguz 博客（VC 分析）61精选AI智能体时代下的安全变革

5月28日周四

23:18Artificial Intelligence News（RSS）50Google Pay 为 AI 智能体预备通用商务协议

20:47Mistral AI：News（网页）77精选发布 Search Toolkit

19:31公众号：百度智能云（文心）54百度搭子DuMate发布：你的上班搭子，真干活

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月3日

22:41

Hugging Face：Blog（RSS）

46

为 Reachy Mini 添加 MCP 工具

Reachy Mini 对话应用现在可通过 MCP 协议添加远程工具。执行 reachy-mini-conversation-app tool-spaces add 命令即可从 Hugging Face Spaces 安装远程工具（如搜索、天气），并自动启用至当前 profile 的 tools.txt 中。内置工具（头部动作、跳舞、表情、摄像头等）仍为本地 Python 代码，远程工具则通过 MCP 端点调用。profiles 通过 tools.txt 控制哪些工具可用，不在文件中的工具模型无法调用。用户也可编写自定义本地工具。远程工具适合无状态能力，便于发布、共享和迭代，无需修改应用本身。支持 install、list、remove 等子命令。

Hugging Face MCP/工具产品更新具身智能

21:30

公众号：月之暗面（Kimi）

精选67

Kimi Work Beta版发布：面向知识工作者的本地Agent

Kimi Work Beta版随Kimi最新Mac和Windows客户端推出，是基于Kimi Code的通用型本地Agent。它内置Kimi WebBridge浏览器操作方案，支持安装和使用Skill、运行定时任务，并能根据任务复杂度自主创建最多300个子Agent的团队。开发中使用的Kimi K2.6模型支持13小时连续编码、4000余次工具调用，累计产出超5万行有效代码，其中92%由AI自主生成。用户可用自然语言描述目标，Kimi Work即可拆解任务、并行执行、调用工具、操作浏览器，交付文档、表格、PPT等工作产物。

智能体 MCP/工具产品更新

关联讨论 4 条IT之家（RSS）X：Berry Xia (@berryxia)X：Kimi.ai (@Kimi_Moonshot)公众号：月之暗面（Kimi）

推荐理由：Kimi 把代码 Agent 的本地能力包装成了面向普通人的工作 Agent，300 个子 Agent 集群让繁琐的任务并行处理成为可能，对天天跟文档表格打交道的人是真提效。

17:47

MarkTechPost（RSS）

57

Nous Research 发布 Hermes Desktop：Hermes Agent v0.15.2 的原生跨平台前端，支持流式工具输出

Hermes Desktop 是一款免终端的图形界面，与 Hermes Agent CLI 共享同一智能体核心、技能和记忆。

智能体 GitHub MCP/工具产品更新

15:09

IT之家（RSS）

54

行业首个：荣耀 Magic8/500/X70 全系列已支持微信 A2A 助手能力

荣耀成为首个支持微信 A2A 助手能力的手机品牌。目前，荣耀 Magic8 系列、500 系列和 X70 的全系列机型均已支持该功能。用户需将荣耀 YOYO 智能体更新至 90.10.30.063 及以上版本，微信更新至 8.0.72 及以上版本，即可通过唤醒 YOYO 实现给微信好友发送消息、发起语音或视频通话。据悉，荣耀目前 50% 的活跃设备都已支持此能力。

MCP/工具端侧行业动态

15:09

IT之家（RSS）

66

阿里千问向第三方 Agent、Skill 全面开放，肯德基、瑞幸等首批接入

阿里千问 App 宣布向第三方 Agent 和 Skill 全面开放，所有企业均可在千问中运营自己的品牌 Agent。首批接入的企业包括瑞幸咖啡、肯德基、蜜雪冰城和东方航空，正在进行服务测试。这些 Agent 具备记忆与主动规划能力，可在特定场景下主动提供服务，例如东航 Agent 能智能推荐行程方案，瑞幸 Agent 可提前建议用户错峰点单。

智能体 MCP/工具产品更新

14:35

公众号：千问APP（阿里）

58

千问向第三方Agent、Skill全面开放，肯德基、瑞幸、东航首批接入

千问今日向第三方Agent、Skill全面开放。瑞幸咖啡、肯德基、东方航空已首批提供Skill服务，用户可体验到店自取等。企业未来可在千问APP中接入Skill并运营自有品牌Agent，自定义人设与服务边界，以对话形式提供服务。Agent具备记忆与主动规划能力，可在特定场景主动提供服务，如行程提醒、权益到期、复购推荐。东航Agent可理解出行计划后智能推荐行程方案，瑞幸Agent能主动建议提前下单。千问希望与各行业共建Agent服务生态。

智能体 MCP/工具产品更新

08:00

HuggingFace Daily Papers（社区热门论文）

46

PACT：行动状态通信实现高效多智能体系统

多智能体系统（MAS）中自由自然语言通信会导致token浪费和上下文膨胀。分析五种通信策略后发现无固定策略最优，但有效消息总包含下游智能体所需的行动中心信息。为此提出PACT协议，将通信视为公共状态更新问题，把每个智能体原始输出压缩为紧凑的行动状态记录再写入共享历史。PACT在不同MAS拓扑中均能实现相当或更强任务性能，同时大幅减少token消耗：在OpenHands上以每个已解决问题token消耗减少10%的代价提升解决率，在SWE-agent上解决率不变但输入token减半。代码已公开。

智能体 MCP/工具论文/研究部署/工程

05:16

Claude：Blog（网页）

同事件精选77

Claude Code 新增动态工作流功能

Claude Code 新增动态工作流功能，允许模型在运行时即兴创建和协调多智能体框架来处理复杂任务。该功能通过执行特定的 JavaScript 文件来生成和协调拥有独立上下文窗口的子代理，可解决单一上下文窗口中长时间执行任务可能出现的智能惰性等问题。工作流适用于研究、安全分析、代码审查等场景，通常消耗更多 token，更适合高价值复杂任务，其最佳实践仍在发展中。

智能体 Anthropic MCP/工具产品更新

同一事件，精选展示《在Claude Code中引入动态工作流》

推荐理由：Claude Code 现在能自己动态生成多代理协调器，这在调试、审查、研究等复杂任务上是个真正的生产力跃迁，但普通编码工作用它反而是杀鸡用牛刀。

03:09

IT之家（RSS）

66

微软发布 ACS 开源标准，让开发者精细化控制 AI 智能体行为

在 Build 2026 大会上，微软宣布推出名为 Agent Control Specification（ACS，智能体控制规范）的开源标准。该标准旨在为开发者提供统一且细粒度的 AI 智能体行为控制方式，允许团队通过策略规则明确规定智能体的允许操作、禁止操作、需人工审批的操作及审计记录要求。ACS 通过在工作流的多个拦截点执行策略检查来确保合规，并可集成分类器、大语言模型和检查逻辑。该标准以 SDK 形式发布，支持 LangChain、OpenAI Agents SDK 等多个主流开发框架。

智能体 MCP/工具 Microsoft 产品更新

00:13

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选70

Codex 赋能每一种角色、工具和工作流

OpenAI 的 Codex 新增了插件、站点和注释等功能。这些新功能旨在帮助分析师、营销人员、设计师、投资者等各类团队，利用 AI 完成更多工作。Codex 进一步拓展其作为 AI 编码工具的应用场景，以支持更广泛的角色、集成更多工具并优化现有工作流。

MCP/工具 OpenAI 产品更新部署/工程

关联讨论 5 条X：Rohan Paul (@rohanpaul_ai)X：OpenAI (@OpenAI)X：Sam Altman (@sama)IT之家（RSS）X：OpenAI Developers (@OpenAIDevs)

推荐理由：Codex不再只是开发者工具，六个角色插件和Sites功能把AI带进了营销、销售、投资等日常流，非技术团队可以直接上手，这是大企业AI落地的实用一步。

6月2日

14:40

HuggingFace Daily Papers（社区热门论文）

68

MCP-Persona：首个面向真实场景个性化工具的LLM智能体基准测试

MCP-Persona是首个专门评估LLM智能体在个性化MCP工具上表现的基准测试，涵盖Reddit、小红书、Lark和Slack等应用。在多个SOTA智能体上的实验表明，当前智能体在个性化工具使用方面仍面临重大挑战。该基准旨在弥合现有评估主要聚焦通用工具、忽视个人社交应用中工具与个人账户或本地数据库交互所带来的实际挑战这一空白。

智能体 MCP/工具论文/研究

12:19

OpenRouter：Announcements（RSS）

精选77

OpenRouter 5月发布亮点

OpenRouter 发布5月更新，推出语音与转录API、模型融合（Model Fusion）功能，并为平台添加了私有模型和企业工作区管控能力。此次更新共上线20个新模型，其中包括 Gemini 3.5 Flash 和 Claude Opus 4.8。

智能体 MCP/工具产品更新部署/工程

关联讨论 1 条OpenRouter：Announcements（RSS）

推荐理由：OpenRouter 五月交付了一整套平台级能力，从安全护栏到语音 API 再到模型融合，Pareto Code Router 按质量阈值选廉价模型这个思路，对 coding agent 的成本控制很实用。如果你重度依赖 OpenRouter，这次更新值得细读。

08:00

HuggingFace Daily Papers（社区热门论文）

66

Token Budgets：63起LLM智能体预算超支事故的经验目录与仿射类型Rust缓解案例研究

论文整理了2023-2026年间21个编排框架中63起LLM智能体预算超支生产事故，构建8簇故障分类（Cohen's kappa=0.837，N=113），附加47个结构条目。开发了1,180行无unsafe的Rust crate token-budgets，通过仿射所有权模型使克隆、双重花费及委托后使用在编译期报错。单智能体下4行Python计数器表现相当（0/30超支）；多智能体委托场景中Python asyncio模式30/30超支，Rust crate编译期拒绝相同模式。在5个运行时、3个提供商、160次温度分层实时API测试中，方案零预算违规且零误拒，静态过度预留4-6倍（自适应2.11倍）。二进制级别预算安全性暂未解决。

智能体 MCP/工具论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

60

AuditFlow：用于结构化财务报告验证的可执行符号环境

AuditFlow是图基多智能体框架，分离自适应搜索与确定性验证。从静态US-GAAP分类图和动态XBRL申报图构建符号环境，提供事实检索、分类遍历、数值检查和规则评估工具。两初级审计员从监管与证据视角检查案例，高级审计员解决分歧并请求进一步调查，最终证据聚合生成审计裁决、预期值、证据链和可信度分数。在FinAuditing衍生的FinMR样本上，使用GPT-5.5达82.09%联合审计准确率，比最强基线高14.93个百分点。移除确定性检查后准确率降至17.91%，表明符号环境执行了模型无法可靠替代的验证步骤。

智能体 MCP/工具论文/研究

6月1日

21:05

IT之家（RSS）

精选73

王兴：美团 AI Agent"小美"与腾讯元宝即将深度合作，用户订单无缝连接

美团2026年第一季度财报显示营收910.39亿元，净利润亏损68.27亿元。财报电话会上，CEO王兴透露其AI Agent“小美”将与腾讯元宝深度合作。用户在腾讯元宝中提交本地服务需求，将被无缝连接至美团的外卖点餐、配送等生态。王兴强调，面向智能体的服务（To A）正变得日益重要，美团已将AI助手“小团”置于App核心位置，并拓展AI服务外延。

智能体 MCP/工具行业动态

推荐理由：美团把「小美」接进腾讯元宝，是Agent在本地生活服务里落地的明确信号，虽然还是早期合作，但「服务AI Agent」这个提法值得留意。

18:05

IT之家（RSS）

67

字节跳动 AI 智能体平台扣子 Coze 3.0 版本上线，支持接入 Claude Code、Codex CLI 等平台

字节跳动发布AI智能体平台扣子Coze 3.0版本。该版本支持多人与多Agent协作的写作方式，开箱即用，并提供自媒体、法律、金融等行业的专家技能。新版本可接入Claude Code、Codex CLI等本地Agent，支持手机与电脑端的跨端同步。

智能体 MCP/工具产品更新

15:00

HuggingFace Daily Papers（社区热门论文）

52

HarnessForge：面向自适应智能体系统的框架与策略协同进化

HarnessForge提出元自适应框架，将LLM智能体系统形式化为框架-策略对，通过故障引导的框架定制和框架条件化的策略对齐实现协同进化。在五个跨领域基准上，基于Qwen3-4B和Qwen3-8B的HarnessForge相比仅优化框架或策略的基线最高提升12.0%，表明框架与推理策略的可执行兼容性对智能体系统自适应至关重要。代码已开源。

智能体 MCP/工具论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

52

SkillHarm：通过自动化构造实现生命周期感知的技能投毒攻击基准

SkillHarm是一个覆盖AI智能体技能使用生命周期的攻击基准，配以系统化风险分类。它定义两种攻击场景：固定载荷投毒（FPP）和自我变异投毒（SMP），并基于受害工作流组件（数据管道、系统环境、自主性）划分12种风险类型。AutoSkillHarm管道由自然语言驱动编码智能体，生成71个技能、879个攻击样本。实验显示FPP成功率最高86.3%，SMP最高69.3%，许多表面失败实因智能体未触及恶意文件而非真正抵抗。

智能体 MCP/工具安全/对齐

5月31日

09:49

MarkTechPost（RSS）

65

使用 SkillNet 构建用于搜索、评估、图分析和任务规划的技能增强型 AI 智能体

本教程展示如何实现 SkillNet 用例，将其作为一个实用框架，用于发现、安装、检查、评估和组织可重用的 AI 技能，以构建技能增强型 AI 智能体。

智能体 MCP/工具搜索教程/实践

08:00

HuggingFace Daily Papers（社区热门论文）

65

SkillVerse多模态技能范式与VisSkillBot：AI智能体的技能应超越纯文本

现有AI智能体的可复用技能多以纯文本形式存储，这在视觉中心任务中构成了瓶颈。研究提出了SkillVerse多模态技能范式，将声明式文本逻辑与显式视觉支持相结合，包含静态先验、动态先验和交错视觉技能三种可复用形式。配套系统VisSkillBot能自动将智能体经验转化为可复用的多模态技能。实验表明，视觉技能在需要空间对应、视觉证据和状态感知交互的GUI等任务中，持续优于纯文本技能。

智能体 MCP/工具多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

59

SkillAdaptor：一种面向LLM智能体的自适应技能方法

SkillAdaptor 是一种无需训练的步骤级技能自适应框架，能进行显式故障归因。它针对智能体失败的执行轨迹，识别首个可操作的故障步骤，并将责任归因于候选技能，随后在骨干模型冻结的前提下进行针对性更新与验证。在 WebShop、PinchBench 和 Claw-Eval 上使用 Kimi-K2.5、GLM-5 和 GPT-5.2 的评估表明，该框架在所有三项基准测试中均优于无技能和现有技能适应基线。

智能体 MCP/工具论文/研究

5月30日

18:41

Hacker News 热门（buzzing.cc 中文翻译）

49

Robinhood 现已支持您的 AI 代理进行股票交易

Robinhood 现已允许用户通过 AI 代理进行股票交易。该功能由 TechCrunch 于 2026 年 5 月 27 日报道。

智能体 MCP/工具产品更新

14:21

IT之家（RSS）

59

Hermes Agent 加入工具搜索，"AI 养马"更省 tokens

智能体 MCP/工具产品更新

11:18

MarkTechPost（RSS）

52

Hermes Agent 为 MCP 推出工具搜索功能：Anthropic 评测显示 Opus 4 准确率提升 49% 至 74%

Nous Research 的 Hermes Agent 为 MCP 添加了工具搜索功能，以解决上下文膨胀问题。该功能采用 BM25 渐进式模式披露机制。根据 Anthropic 的评测，在 Opus 4 模型上，此功能实现了 49% 到 74% 的准确率提升。

智能体 Anthropic MCP/工具开源/仓库

11:10

Hacker News 热门（buzzing.cc 中文翻译）

64

Hacker News上一篇题为“MCP 死了？”的文章引发讨论，获得了103分。文章来自quandri.io，发布于2026年5月29日，但未提供关于MCP（模型上下文协议）现状的具体论述或结论。

MCP/工具现象/趋势编码

09:21

IT之家（RSS）

74

你的手机变遥控器，OpenAI 扩展 Codex 远程控制支持 Win10/Win11

MCP/工具 OpenAI 产品更新编码

关联讨论 3 条X：OpenAI Developers (@OpenAIDevs)X：OpenAI (@OpenAI)X：Berry Xia (@berryxia)

04:42

Claude Code：GitHub Releases（RSS）

精选67

v2.1.157 更新

此版本主要改进了插件系统，现可自动加载 .claude/skills 目录中的插件，并通过 claude plugin init 创建；/plugin 命令增加了自动补全。claude agents 现在会应用 settings.json 中的 agent 字段，并支持 --agent 参数覆盖。更新修复了多个具体问题，包括处理不可用图片导致的崩溃、在 tmux 中的剪贴板复制失效（2.1.153 回归）、后台会话恢复后日期不正确等。此外，优化了长对话及恢复对话的性能，并改进了在 VS Code、Cursor 和 Windsurf 等 IDE 中的体验。

智能体 Anthropic MCP/工具产品更新

推荐理由：Claude Code 这个版本把插件从市场限制中解放出来，自动加载本地 skills 目录，对喜欢自己鼓捣定制工作流的开发者是个实实在在的便利。

00:33

Tomer Tunguz 博客（VC 分析）

精选65

“技能提炼”是一种知识转移方法，由前沿大模型（如 Opus 4.7、GPT-5.1、Gemini 3 Pro）负责撰写并优化标准化的 SKILL.md 流程文件。然后，本地运行的小模型（如 Qwen 35B、Gemma 26B）直接执行这些文件。此过程不同于压缩模型权重的知识蒸馏、训练权重的指令微调或检索事实的 RAG，其核心是提取并转移操作流程，让小模型按步骤执行，从而形成前沿模型作教师、小模型作执行者的循环。

智能体 MCP/工具大佬观点

推荐理由：Tomer 把个人代理的完整工作流摆了出来，用大模型写 skill 小模型执行，这条蒸馏思路比调 prompt 高级，想认真跑本地代理的人该盯一下。

5月29日

21:30

HuggingFace Daily Papers（社区热门论文）

67

CoHyDE：大语言模型重写器与稠密编码器的迭代协同训练，用于工具检索

CoHyDE 是一种迭代训练框架，旨在解决大语言模型智能体在大型 API 目录中进行工具检索时面临的核心瓶颈。用户查询常使用口语化、描述不充分的自然语言，而 API 目录使用固定的技术性术语。该框架将稠密编码器与 LLM 重写器视为一个协同演化系统进行训练：编码器在重写器生成的、符合目录风格的假设性描述上通过 InfoNCE 进行重训练；重写器则通过 DPO 根据编码器的检索分数进行偏好对齐。在 ToolBench 目录约 10k 工具的子集上，三轮 CoHyDE 迭代后，其在标准查询上的 NDCG@5 得分较最强单组件基线提升 +2.5 pp，在模糊查询上提升 +6.3 pp。消融实验证实，协同训练是该方法在结构化与模糊查询上均取得优势的关键。

智能体 arXiv MCP/工具论文/研究

21:14

The Decoder：AI News（RSS）

61

新综述论文认为：代码是AI智能体的思考与行动方式，而非仅仅是其产出

一篇新综述论文提出，自主AI智能体的真正瓶颈并非语言模型本身，而是工具、内存、测试与权限边界等构成的软件层。这一“约束层”将无状态模型转化为能行动的工作智能体。DeepSeek已在北京组建专门的Harness团队，其“模型加约束层等于AI智能体”的公式印证了该观点。

智能体 DeepSeek MCP/工具论文/研究

17:44

公众号：通义实验室（千问）

精选64

通义实验室发布教程：在 Android 手机部署 MCP 感知服务器

通义实验室发布教程，演示如何在 Android 手机上部署 MCP 感知服务器，使手机具备本地视觉与听觉分析能力。核心基于端侧 MNN 推理引擎和 Qwen3-VL 2B 模型（约 1.3GB），摄像头与麦克风采集的音视频在本地实时转化为结构化 JSON，再通过 MCP Tool 供 Claude Code 等云端 Agent 远程调用。整个过程不上传原始数据，仅传输语义提取结果。项目已开源，实测可识别红绿灯状态等场景。

MCP/工具多模态教程/实践端侧

推荐理由：如果你做Agent总觉得AI对物理世界是瞎子，这篇教程就是解药。把Qwen3-VL塞进手机当本地眼睛，不传原始视频只给结构化文字，隐私友好又能被Claude直接调用。

15:21

IT之家（RSS）

精选70

阿里云开源百炼 CLI，Agent 可调用全套模型和应用能力

智能体 MCP/工具产品更新

推荐理由：阿里云把百炼的全套能力打包成 CLI，Agent 开发终于不用再一个个接 API 了，做企业智能助手的可以试试。

08:02

公众号：阶跃星辰（Step）

同事件精选61

阶跃发布 Step 3.7 Flash，面向生产级 Agent 的高效率 Flash 模型

阶跃星辰发布并开源 Step 3.7 Flash，采用稀疏 MoE 架构（总参数 196B+1.8B，激活 11B），最高生成速度 400 Tokens/s。围绕原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排、Agent 生态兼容优化四大能力优化。在 Toolathlon 达 49.5%，ClawEval-1.1 达 67.1%，GDPval 达 45.8%，τ²-bench Telecom 通过率超 98%。兼容 Claude Code、KiloCode 等主流架构及 MCP/Skills 协议，支持云端与本地部署，已在 Kilo Code 等生态中完成接入验证。

智能体 MCP/工具多模态开源生态

同一事件，精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI--Step 3.7 Flash》

推荐理由：Step 3.7 Flash 用激活仅 11B 的 MoE 架构把 Agent 工作流稳定性做透了，兼容主流框架还开源，对需要低延迟、高可靠性的生产环境 Agent 是真正可用的选择。

08:00

HuggingFace Daily Papers（社区热门论文）

49

从提示词注入到持久控制：防御智能体框架中的木马后门

在本地智能体框架中，LLM智能体通过读写文件与复用状态增强了能力，但也面临多步木马攻击风险。攻击者可在文件或工具输出中嵌入提示词注入，智能体可能读取并执行这些隐藏指令。现有防御因检查步骤孤立，难以检测早期植入的后门。ClawTrojan基准测试在GPT-5.4模拟环境中实现了95.5%的攻击成功率。为此提出的DASGuard方案，通过扫描敏感文件中的控制文本、追溯其来源并移除非可信内容，实现了动态防御。

智能体 MCP/工具论文/研究

02:41

Google Developers Blog（RSS）

精选73

使用 Google Pay & Wallet Developer MCP server 加速你的集成工作流

Google 推出 Google Pay & Wallet Developer MCP server，这是一款开放标准工具，旨在将 AI 开发助手和 IDE 安全连接到实时的 API 与账户上下文。开发者无需离开开发环境，即可搜索官方文档、验证 Wallet pass 定义、检查集成状态以及管理商户账户。该集成旨在通过减少上下文切换并提供实时、可靠的 AI 支持来减少开发摩擦，从而加速开发工作流。

Google MCP/工具产品更新

推荐理由：这是 Google 为支付场景做的 MCP 服务器，把文档和账户操作直接塞进 IDE，减少上下文切换，做 Google Pay 集成的开发者可以试试看。

02:39

Claude Code：GitHub Releases（RSS）

同事件精选73

Claude Code v2.1.154 发布：新增 Opus 4.8 与动态工作流

Claude Code 更新至 v2.1.154 版本，正式引入 Opus 4.8 模型。新功能包括“动态工作流”，可通过 /workflows 指令让 Claude 在后台编排数十到数百个 AI 智能体协同处理复杂任务。Opus 4.8 的快速模式现已可用，成本降低为 2 倍标准费率可实现 2.5 倍速度提升。其他更新有：精简系统提示词成为默认设置（除 Haiku、Sonnet 及 Opus 4.7 及更早版本外），优化多选题决策逻辑，简化 /simplify 命令。此次更新修复了包括后台会话管理、终端渲染在内的多个 bug，并增强了自动模式对数据外泄的检测能力。

智能体 Anthropic MCP/工具产品更新

同一事件，精选展示《在Claude Code中引入动态工作流》

推荐理由：Claude Code 这版把多 agent 编排做成了产品功能，动态工作流让一个 prompt 能调度上百个 agent，再加上 Opus 4.8 快速模式只要 2 倍价格，做复杂任务的开发者可以试一下。

00:33

Tomer Tunguz 博客（VC 分析）

精选61

AI智能体时代下的安全变革

Lemonade的CISO Jonathan Jaffe探讨了AI智能体时代的安全新挑战。他指出，AI对攻击者和防御者同样强大，但可被利用的漏洞窗口正在缩小，因为AI能更快地生成、审查和修补代码。为此，安全团队正向工程团队转型，例如Lemonade的安全部门均由工程师组成，并构建了包含智能体的内部AI平台。同时，每个智能体（单个终端上可能运行200到10000个）都需要被赋予身份，并在操作点由策略进行更复杂的管控，这超越了当前身份与访问管理系统的能力。

智能体 MCP/工具大佬观点

推荐理由：Jaffe 给出的结论很提气，AI 对防御方的加成被市场严重低估了，尤其每个 Agent 必须拥有身份和策略控制这个预判，值得所有在做 Agent 架构的人看一遍。

5月28日

23:18

Artificial Intelligence News（RSS）

50

Google Pay 为 AI 智能体预备通用商务协议

Google Pay 正在彻底改造其支付基础设施，以应对即将到来的 AI 智能体交易浪潮。最新更新引入了通用商务协议和新的服务器架构，旨在将 Google Pay 定位为自主智能体而非人类用户执行购买的中央清算所。

智能体 Google MCP/工具产品更新

20:47

Mistral AI：News（网页）

精选77

发布 Search Toolkit

Mistral AI 发布了 Search Toolkit 的公共预览版。这是一个用于构建 AI 应用生产级搜索管道的可组合框架。该框架旨在解决团队在搭建搜索基础设施时，因数据摄取、检索和评估工具分散而耗费过多工程时间的问题。Search Toolkit 将这三者整合到单一框架与共享接口中，使团队能更专注于提升搜索质量。该工具开源，可部署在云端、本地或边缘环境，并支持企业搜索、RAG 等多种检索场景。

MCP/工具检索增强产品更新搜索

推荐理由：做 RAG 的团队都该看一眼，它把 ingestion、retrieval、evaluation 揉进一个开源框架，省下的大把集成时间够你调几次检索策略了。

19:31

公众号：百度智能云（文心）

54

百度搭子DuMate发布：你的上班搭子，真干活

百度搭子DuMate是一款PC端办公AI智能体，能看见用户屏幕、操作软件、处理文件。零门槛安装，不需配置环境；本地优先处理，数据不出设备，复杂任务自动调度上云。支持Word/Excel/PPT输出，内置百度搜索、深度研究等Skills生态。用户下载后可通过邀请码分享好友，双方各得2000积分。

智能体 MCP/工具产品更新端侧

1 2 345 6…9