全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 346 条

全部一手资讯 X 论文

标签「MCP/工具调用」清除

6月12日周五

00:13xAI：News（网页）70精选xAI 推出 Grok Build Plugin Marketplace

6月11日周四

19:30Artificial Intelligence News（RSS）61Visa 与 ChatGPT 集成，AI 智能体可实现零售购买

18:30公众号：火山引擎48银河证券×火山引擎：TRAE嵌入研发全流程，交付周期缩短一半

17:54MarkTechPost（RSS）59Nous Research 发布 Hermes Agent Profile Builder：身份、模型、技能和 MCP 服务器一站式仪表盘流

17:31IT之家（RSS）54WPS 笔记发布：AI 原生多模态，重新定义个人知识管理

10:50公众号：数字生命卡兹克70精选从0到1速通WorkBuddy：国内通用Agent产品教程

08:24Simon Willison 博客66datasette-agent 0.2a0 发布：新增 ask_user 和 save_query 工具

06:22MarkTechPost（RSS）55Microsoft SkillOpt 编码实现：仪表化提示优化、技能演化分析与基线比较

02:10Claude：Blog（网页）75同事件精选智能体表面的演进：使用 Claude Managed Agents 构建同一事件，精选展示《Code w/ Claude 伦敦活动：重塑开发体验》

6月10日周三

15:28IT之家（RSS）59一句话 P 图发朋友圈？美图秀秀宣布首批接入微信 AI 生态

08:00HuggingFace Daily Papers（社区热门论文）61Evoflux：面向紧凑型智能体的可执行工具工作流的推理时进化

05:06Claude：Blog（网页）75同事件精选Claude Managed Agents 新增定时运行和环境变量存储功能同一事件，精选展示《Code w/ Claude 伦敦活动：重塑开发体验》

6月9日周二

19:55Hugging Face：Blog（RSS）76精选一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

14:22IT之家（RSS）52滴滴宣布接入微信 AI 生态，用户可在聊天时直接叫车

07:50公众号：数字生命卡兹克61同事件精选微信正在变成Agent时代的操作系统同一事件，精选展示《微信AI官宣内测：两种接入模式供开发者选择》

06:16Claude Code：GitHub Releases（RSS）61同事件精选Claude Code v2.1.169 发布同一事件，精选展示《Claude Code v2.1.163 发布》

04:48OpenRouter：Announcements（RSS）66精选EU AI Act 合规：面向 AI 智能体的人工监督

02:50Claude：Blog（网页）72精选Claude 为 Connector 开发者推出性能监控仪表盘

6月8日周一

21:50Hugging Face：Blog（RSS）62精选开源社区支持 OpenEnv 用于智能体强化学习

18:20IT之家（RSS）63消息称京东首批内测接入微信 AI，涵盖电商、外卖、物流等业务

17:42公众号：数字生命卡兹克71同事件精选微信AI Agent生态曝光：嵌入小程序调用与手机厂商合作同一事件，精选展示《微信AI官宣内测：两种接入模式供开发者选择》

16:20IT之家（RSS）73精选微信AI官宣内测：两种接入模式供开发者选择

08:12Simon Willison 博客62datasette-agent-edit 0.1a0 发布

6月7日周日

18:35The Decoder：AI News（RSS）59Perplexity 推出 "Search as Code" 架构，让 AI 模型自行编写搜索管道

08:19IT之家（RSS）55微软警告：Claude Code存在提示词注入漏洞，可致GitHub凭证泄露

6月6日周六

03:34Claude：Blog（网页）76同事件精选Claude Cowork 产品指南同一事件，精选展示《Claude Cowork 入门最佳实践》

02:33Claude：Blog（网页）59Anthropic销售人员用Claude Code重建团队工作流

01:12Google Developers Blog（RSS）75精选Google Colab CLI 发布

6月5日周五

23:15IT之家（RSS）39谷歌 Chrome 149 稳定版发布，允许用户删除已下载的端侧 AI 模型

20:30公众号：卡尔的AI沃茨48OpenSquilla：用Meta Skill将多个Skill组织成稳定工作流，成本降至OpenClaw的1/9

18:52公众号：百度智能云（文心）57FluxA与百度智能云战略合作，为Agent经济搭建基础设施

17:54公众号：通义实验室（千问）70精选PawBench：给通用智能体一把可度量的尺

08:00HuggingFace Daily Papers（社区热门论文）55VoLo：面向开放词汇长时程操作的物理编排器

6月4日周四

23:42Hugging Face：Blog（RSS）66精选Hugging Face 为编码智能体重塑 hf CLI 输出格式

17:26HuggingFace Daily Papers（社区热门论文）70精选RHO：利用过往轨迹优化LLM智能体工具链的自监督方法

14:18公众号：千问APP（阿里）49肯德基Skill接入千问，点疯狂星期四直接到店取

12:11IT之家（RSS）61Nous Research 发布 Hermes Desktop 桌面端公测版

08:00HuggingFace Daily Papers（社区热门论文）69ToolSense：审计LLM中参数化工具知识的诊断框架

08:00HuggingFace Daily Papers（社区热门论文）58ToolMaze：LLM智能体在工具失效时的动态重规划与异常恢复基准测试

01:23Claude：Blog（网页）68精选Claude Code技能使用经验：Anthropic内部实践

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月12日

00:13

xAI：News（网页）

精选70

xAI 推出 Grok Build Plugin Marketplace

xAI 今日发布 Grok Build 内置插件市场。插件将技能、斜杠命令、AI 智能体、钩子、MCP 服务器和 LSP 打包为可安装包，用户无需离开终端即可浏览、安装和更新。首发合作伙伴包括 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 和 Superpowers。在 Grok Build 中输入 /marketplace 或使用 CLI 即可安装，每个远程插件均固定到特定 commit SHA 并经过验证。开发者可提交 PR 到 xai-org/plugin-marketplace 发布自己的插件。

MCP/工具 xAI 产品更新编码

关联讨论 1 条X：xAI (@xai)

推荐理由：Grok Build 这下可以像浏览器装扩展一样装插件了，涵盖数据库、部署、调试，开发者不必离开终端，这类集成对 AI 编程环境的体验影响挺大的。

6月11日

19:30

Artificial Intelligence News（RSS）

61

Visa 与 ChatGPT 集成，AI 智能体可实现零售购买

Visa 将支付基础设施接入 ChatGPT，使 AI 智能体能够推荐零售产品并执行金融交易。该部署去除了零售漏斗最后阶段的人工干预——自主智能体将处理用户提示、评估商家目录，并利用 Visa 支付通道在任何支持商户处完成结账流程。

智能体 MCP/工具 OpenAI 产品更新

18:30

公众号：火山引擎

48

银河证券×火山引擎：TRAE嵌入研发全流程，交付周期缩短一半

银河证券与火山引擎合作，引入TRAE企业版并推进SDD（规格驱动开发）范式，将AI Coding嵌入研发全流程。研发需求交付周期缩短1/3至1/2，AI代码采纳率最高达87%，前端UI还原度稳定在90%以上（H5/Vue页面达98%以上）。子账户与融券系统重构周期从4个月压缩至2个月，Bug率降低25%，单元测试覆盖率提升30%，券池规模扩大10倍，服务客户量扩大20倍。通过MCP集成打通Ones、GitLab、DevOps等工具链，组织级Skill库减少60%手写测试工作量。TRAE企业版已覆盖银河证券100个研发席位，累计培训超130名研发人员。

MCP/工具教程/实践编码

17:54

MarkTechPost（RSS）

59

Nous Research 发布 Hermes Agent Profile Builder：身份、模型、技能和 MCP 服务器一站式仪表盘流

Nous Research 为 Hermes Agent 仪表盘新增 Profile Builder，用户可在单一流程中构建包含身份、模型、技能和 MCP 服务器的完整 Agent 配置文件，替代以往多步 CLI 配置方式。

智能体 MCP/工具产品更新

17:31

IT之家（RSS）

54

WPS 笔记发布：AI 原生多模态，重新定义个人知识管理

6月5日，金山办公发布AI原生多模态笔记产品WPS笔记，摒弃传统文件夹，采用多级AI自动标签组织内容。支持语音、图片、文字、网页等录入；语音转写具备AI实时纠正和声纹区分发言人功能，图片可提取公式并支持LaTeX编辑及梯形校正。全域多模态检索可同时搜索文字、图片、音频。内置WPS灵犀助手，能完成整理、摘要、润色、创建任务清单等操作，支持自定义Skill和记忆设置。开放外部MCP接入，允许Cursor、Claude等第三方AI应用直接读取笔记。

MCP/工具多模态教程/实践

10:50

公众号：数字生命卡兹克

精选70

从0到1速通WorkBuddy：国内通用Agent产品教程

WorkBuddy是面向国内用户的通用Agent产品，支持Windows和Mac，提供免费版和58元/月个人专业版，企业版已推出。内置代码开发、日常办公、设计创意三种场景模式及100多个行业领域AI专家。模型集成腾讯混元、DeepSeek（推荐V4 Pro）、GLM、Kimi等国产大模型，也支持接入兼容OpenAI协议的外部API。拥有Skills市场和MCP连接器生态，可打通QQ邮箱、腾讯会议、腾讯文档等服务。教程通过公众号周报生成和功能网页开发两个案例演示实际用法。

智能体 MCP/工具教程/实践

关联讨论 1 条公众号：数字生命卡兹克

推荐理由：补上那批「好是好但用不了」的遗憾，WorkBuddy 用微信扫码登录加技能市场把门槛拉到地面，这篇从 0 到 1 的教程能让你半天内把日常办公任务自动化掉。

08:24

Simon Willison 博客

66

datasette-agent 0.2a0 发布：新增 ask_user 和 save_query 工具

datasette-agent 0.2a0 新增两个核心功能。工具可通过 ToolContext 对象的 await context.ask_user(...) 向用户提问，支持 yes/no、多选（options=[...]）或自由文本（free_text=True）。问题未回答时 agent 挂起，问题以表单形式渲染在聊天界面并持久化到内部数据库，服务器重启后对话可继续。工具应在执行副作用前调用 ask_user()，回答后从头重放。另一内置工具 save_query 允许 agent 将 SQL 保存为 Datasette 存储查询，但必须经人工批准——显示完整 SQL 及提议的名称、数据库和可见性，用户确认后才会存储。ask_user 功能基于作者昨日用 Claude Fable 5 构建的新 LLM alpha 实现。

智能体 MCP/工具产品更新

06:22

MarkTechPost（RSS）

55

Microsoft SkillOpt 编码实现：仪表化提示优化、技能演化分析与基线比较

实现了一个端到端的 Microsoft SkillOpt 仪表化工作流，包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线，运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环，检查训练历史，可视化准确率、编辑预算行为和 token 用量，并将进化后的技能与基线进行比较。

MCP/工具 Microsoft 教程/实践部署/工程

02:10

Claude：Blog（网页）

同事件精选75

智能体表面的演进：使用 Claude Managed Agents 构建

Anthropic 推出 Claude Managed Agents，一套可组合 API 套件，用于构建和部署生产级智能体。该产品从早期简单 API 演进至 Claude Agent SDK，再到将智能体调度层与代码执行沙箱解耦的 Managed Agents。通过只追加日志的会话机制，Managed Agents 解决了托管伸缩、会话持久化、文件系统管理、执行隔离、凭证安全与可观测性等生产部署挑战。团队借助该方案可在数天内完成从原型到生产环境的转化，无需自建基础设施。

智能体 Anthropic MCP/工具产品更新

同一事件，精选展示《Code w/ Claude 伦敦活动：重塑开发体验》

推荐理由：Claude Managed Agents 把代理部署的复杂基础设施打包成了 API，让团队从原型到上线只需几天而不是几个月，尤其凭证隔离和延迟优化对生产环境很关键，想部署可靠代理的团队可以认真看看。

6月10日

15:28

IT之家（RSS）

59

一句话 P 图发朋友圈？美图秀秀宣布首批接入微信 AI 生态

微信6月8日发布开发者接入微信AI生态指引，开放平台支持开发者授权接入。美图秀秀作为首批内测开发者完成初步适配，将围绕人像美容、拼图、证件照、智能消除、画质修复等核心场景接入微信AI Agent。京东、美团、滴滴、携程、同程、肯德基等也同步宣布作为首批内测团队接入微信AI生态。

MCP/工具图像生成行业动态

08:00

HuggingFace Daily Papers（社区热门论文）

61

Evoflux：面向紧凑型智能体的可执行工具工作流的推理时进化

Evoflux是一种推理时进化搜索方法，通过结构化编辑、执行反馈、自适应强度、元引导重设计和多样性剪枝，将紧凑型语言模型的可执行工具工作流修复为可运行图。在覆盖250个工具和MCP服务器的MCP-Bench任务上，Evoflux将小型规划器的执行可行性从约3%提升至17-24%。相比之下，同一数据上的SFT和SFT+DPO表现持平、不如或崩溃至低于零样本水平；ReAct可达更高峰值但方差和token成本更高。结果表明，在稀缺教师轨迹预算下，基于执行反馈的搜索更可靠。

智能体 MCP/工具论文/研究

05:06

Claude：Blog（网页）

同事件精选75

Claude Managed Agents 新增定时运行和环境变量存储功能

Claude Managed Agents 今日在 Claude Platform 公开测试两项新功能：代理可按 cron 计划自动执行周期性任务（如夜间数据同步、周度合规扫描、每日摘要），无需用户自建调度器，支持暂停、恢复、归档或按需触发；vaults 新增环境变量支持，允许代理通过 CLI 进行认证请求，真实密钥仅附加在网络边界，代理无法读取。已集成的 CLI 包括 Browserbase、KERNEL、Notion、Ramp 和 Sentry。Rakuten、Actively AI、Ando、Milana 等团队正在使用这些功能实现自动化数据报表、跨账户搜索、招聘提醒等场景。

智能体 Anthropic MCP/工具产品更新

同一事件，精选展示《Code w/ Claude 伦敦活动：重塑开发体验》

推荐理由：Claude Managed Agents 现在能定时跑任务和用 vault 安全连接 CLI 了，这基本解决了企业 agent 落地的两个最大痛点——自动化和凭证管理。做 agent 的团队应该仔细读。

6月9日

19:55

Hugging Face：Blog（RSS）

精选76

一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

一个编码Agent调用HuggingFace上的两个Space，从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像，再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点（.ply），自动完成坐标系校正、取景、压缩为.ksplat（体积缩小约3倍），并构建基于Three.js的滚动切换、拖拽旋转查看器，最终部署为静态Space。整个过程无需客户端库，每个Space通过agents.md暴露可调用API。

智能体 Hugging Face MCP/工具多模态

推荐理由：Hugging Face 把 agents.md 做成每个 Space 的标准说明书，agent 能直接读懂并链式调用图像和 3D 模型，这篇用 3D 巴黎画廊 demo 告诉你这事儿已经跑通了，做 AI 工具链的可以立刻照着试。

14:22

IT之家（RSS）

52

滴滴宣布接入微信 AI 生态，用户可在聊天时直接叫车

滴滴作为首批合作伙伴，已将核心网约车服务融入微信 AI Agent。用户通过微信内 AI 交互说出“帮我叫一辆滴滴去机场”等指令，系统可根据行程距离、时效与个人偏好自动推荐最优车型并一键唤起叫车，全程不跳转。滴滴顺风车、滴滴代驾等更多服务也将接入。6月8日，微信发布《关于开发者接入微信 AI 生态的指引》，提供自动模式与开发模式两种接入选项。京东、美团、滴滴、携程、同程和肯德基均宣布作为首批内测团队接入。

智能体 MCP/工具行业动态

07:50

公众号：数字生命卡兹克

同事件精选61

微信正在变成Agent时代的操作系统

微信近期密集布局AI Agent：据外媒，用户在主界面右滑可唤出Agent对话窗口，自动调用小程序完成点单等任务；与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力，允许手机语音助理发起微信音视频通话或发送消息；6月8日发布开发者指引，提供自动接入模式，通过GUI Agent帮助数百万小程序实现AI调用。微信试图整合内部小程序生态与外部硬件，成为AI时代的操作系统，并触及Agentic Commerce（代理式交易）模式。

智能体 MCP/工具现象/趋势

同一事件，精选展示《微信AI官宣内测：两种接入模式供开发者选择》

推荐理由：微信 Agent 的拼图今天终于凑齐了，自动改造百万小程序这一步，让微信从聊天工具直接跨向 Agent 时代的操作系统，比当年公众号革命还大。

06:16

Claude Code：GitHub Releases（RSS）

同事件精选61

Claude Code v2.1.169 发布

Claude Code v2.1.169 新增 --safe-mode 标志及环境变量，用于禁用所有自定义配置以排查问题；新增 /cd 命令，可在不破坏提示词缓存的情况下切换工作目录；新增 disableBundledSkills 设置隐藏内置技能。修复了企业 MCP 策略在重连、IDE 配置及首次会话中不被强制的问题，以及 macOS 用户每轮约 30–50ms 的 UI 卡顿、Windows 下 claude -p 和 Git 凭证弹窗等多项 bug。改进了任务创建的可靠性，恢复 Vertex/Foundry 默认 5 分钟空闲超时，并降低 CPU 占用。

智能体 Anthropic MCP/工具产品更新

同一事件，精选展示《Claude Code v2.1.163 发布》

推荐理由：全是修 bug 的版本里藏了两个实用命令，/cd 换目录不丢缓存和 safe-mode 跳过所有自定义直接排查，重度用户的小痛点被摸到了。

04:48

OpenRouter：Announcements（RSS）

精选66

EU AI Act 合规：面向 AI 智能体的人工监督

使用智能体 SDK 的人机协作（HITL）工具，可满足 EU AI Act、Colorado AI Act 和 NIST AI RMF 对 AI 智能体的合规要求。

MCP/工具安全/对齐教程/实践

推荐理由：虽然讲的是合规，但直接把监管要求翻译成可落地的代码模式，对做高风险Agent的团队来说是一份照着改就能过审的实操手册。

02:50

Claude：Blog（网页）

精选72

Claude 为 Connector 开发者推出性能监控仪表盘

Claude 为目录中已发布的 Connector 新增性能监控仪表盘（公开测试版）。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟，并按工具细分错误归因；还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号（Admin/Owner 权限或自定义角色）。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录，该目录已有超 300 个第三方 Connector，每日被数百万人使用。

Anthropic MCP/工具产品更新

关联讨论 1 条X：Claude Devs (@ClaudeDevs)

推荐理由：Claude给connector开发者加了仪表板，能跟踪用量和错误，还能直接提交到目录，做MCP集成的省了监控的麻烦，即开即用。

6月8日

21:50

Hugging Face：Blog（RSS）

精选62

开源社区支持 OpenEnv 用于智能体强化学习

今日，Hugging Face 宣布 OpenEnv 项目进一步开放，由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调，并获得 PyTorch Foundation、vLLM、SkyRL（UCB）等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具，定位为训练器与环境间的互操作层，标准化环境的发布、部署和消费，但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API（reset()、step()、state()），支持 HTTP、WebSocket、Docker 打包，并将 MCP 作为一等公民，使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证，以推动开源智能体 RL 基础建设。

智能体 Hugging Face MCP/工具 Meta

推荐理由：开源社区在 agent RL 环境上终于开始合流，Meta、Nvidia、Hugging Face 等联合推动 OpenEnv 成为接口标准，不做奖励框架，只做插线板。搞开源 agent 训练的人，这是少有的统一基础设施的机会。

18:20

IT之家（RSS）

63

消息称京东首批内测接入微信 AI，涵盖电商、外卖、物流等业务

京东作为首批内测团队率先接入微信AI，将围绕电商、外卖、物流等业务接入微信AI Agent。微信开放平台提供自动模式和开发模式两种接入方式：自动模式由平台读取小程序源码并分析页面，无需额外开发；开发模式允许开发者基于业务特性自主开发，通过审核后可被微信AI调用。

智能体 MCP/工具产品更新

17:42

公众号：数字生命卡兹克

同事件精选71

微信AI Agent生态曝光：嵌入小程序调用与手机厂商合作

腾讯正测试嵌入微信的AI Agent，用户右滑唤出对话窗口，通过自然语言指令调用数百万小程序完成点咖啡等任务。微信还与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力，可通过手机语音助理发起微信音视频通话或发送消息。6月8日，微信官方发布《关于开发者接入微信AI生态的指引》，提供自动接入模式，利用微信沙箱全自动改造小程序，使其可被AI直接调用。这一布局被视为Agentic Commerce（代理式交易）的雏形。

智能体 MCP/工具现象/趋势

同一事件，精选展示《微信AI官宣内测：两种接入模式供开发者选择》

推荐理由：微信想用Agent把小程序生态变成操作系统，靠Agentic Commerce抽佣，一旦跑通，想象力比广告大得多。

16:20

IT之家（RSS）

精选73

微信AI官宣内测：两种接入模式供开发者选择

微信开发者官方今日发布指引，确认微信AI正在内测阶段。开放平台提供两种接入模式：自动模式可授权平台读取小程序源码，无需额外开发即可让微信AI直接操作页面；开发模式下开发者可自主开发技能，审核后由微信AI调用。两种模式可同时开启。微信AI是微信内的AI助手，用户通过自然语言对话即可调用、访问和操作小程序。服务条款称“微信AI”可能非最终名称。接入与否不影响现有小程序服务。

智能体 MCP/工具产品更新

关联讨论 1 条IT之家（RSS）

推荐理由：微信终于把AI塞进了自家生态，没做聊天机器人而是直接让AI操作小程序，这个方向比所有独立AI助手都更贴近普通人的真实需求，做小程序的得赶紧看了。

08:12

Simon Willison 博客

62

datasette-agent-edit 0.1a0 发布

datasette-agent-edit 0.1a0 插件发布，为 Datasette Agent 提供智能体编辑文本的核心工具。其设计借鉴 Claude text editor，实现三个工具：view（按行号查看文件片段）、str_replace（精确替换唯一字符串）、insert（在指定行号后插入文本）。该插件作为基础组件，可供其他协作 Markdown 编辑、SQL 查询更新、SVG 编辑等插件复用。

智能体 MCP/工具开源/仓库

6月7日

18:35

The Decoder：AI News（RSS）

59

Perplexity 推出 "Search as Code" 架构，让 AI 模型自行编写搜索管道

Perplexity 的 "Search as Code" 架构放弃固定搜索 API，改为让 AI 模型在 Python 沙箱中自主编写搜索例程，自行完成过滤和去重。该方案在关键基准测试中超越 OpenAI 和 Anthropic 的模型，并将 token 成本削减高达 85%。

智能体 MCP/工具产品更新搜索

08:19

IT之家（RSS）

55

微软警告：Claude Code存在提示词注入漏洞，可致GitHub凭证泄露

微软研究人员发现Anthropic旗下Claude Code的GitHub自动化流程存在漏洞，攻击者可通过提示词注入攻击，劫持CI/CD工作流窃取敏感凭证。漏洞源于Claude Code的读取工具未像Bash工具那样设置沙箱防护，恶意提示词可绕过两层防护读取系统文件中的API密钥等凭证。Anthropic于4月29日收到报告后，在5月5日发布Claude Code 2.1.128修复，通过限制对/proc/目录下敏感文件的访问防止信息窃取。

Anthropic MCP/工具 Microsoft 安全/对齐

6月6日

03:34

Claude：Blog（网页）

同事件精选76

Claude Cowork 产品指南

Anthropic 发布 Claude Cowork，一款运行在 Claude 桌面应用中的知识工作智能体。它可读写本地文件、跨 Slack 和 Google Drive 等应用协作，执行多步骤任务并生成带引用的实际交付物。核心能力包括本地文件访问、子智能体、长时间运行和定时任务。Claude Cowork 区别于对话式 AI 工具，支持用户描述目标与期望结果后自动规划执行。指南还介绍了产品矩阵（对话聊天、Claude Code 编程、Claude Cowork 跨应用知识工作）、设置要求、权限模型、七种常见工作流（如研究简报、会议准备、定期报告）以及营销和产品管理等插件。

智能体 Anthropic MCP/工具教程/实践

同一事件，精选展示《Claude Cowork 入门最佳实践》

推荐理由：把 Claude 从问答工具升级成能读写本地文件、跨应用交付可交付物的知识工作代理，这份官方指南给出了明确上手路径和七个真实工作流，做产品、做调研的都能直接照抄。

02:33

Claude：Blog（网页）

59

Anthropic销售人员用Claude Code重建团队工作流

加入Anthropic前从未写过代码的销售成员Jared Sires，利用Claude Code为销售团队开发自动化工具。他创建了内嵌于Gmail的CLAFTS（Claude Drafts），通过Claude API根据客户邮件草拟回复，每天节省2-3小时。该系统基于约4,300行代码（几乎全由Claude Code编写），从Google Drive和Anthropic公开文档提取上下文，并通过网络搜索获取最新产品信息。他还开发了CLAFTS Tones功能，通过模式匹配模仿不同人际关系下写作风格。这些工具已打包为Claude Cowork插件供整个销售团队使用。

智能体 Anthropic MCP/工具教程/实践

关联讨论 1 条Claude：Blog（网页）

01:12

Google Developers Blog（RSS）

精选75

Google Colab CLI 发布

Google 推出 Colab 命令行界面（CLI），允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时，实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本，并检索工件日志或模型（如微调后的 Gemma 3 适配器）。工具可直接集成到标准终端环境，可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。

Google MCP/工具产品更新部署/工程

关联讨论 1 条MarkTechPost（RSS）

推荐理由：对于习惯在 Colab 上薅免费 GPU 的开发者，这个 CLI 把本地开发、远程跑训练这套流程的摩擦降到了几乎为零，而且直接对接 AI agent，实验自动化往前迈了一大步。

6月5日

23:15

IT之家（RSS）

39

谷歌 Chrome 149 稳定版发布，允许用户删除已下载的端侧 AI 模型

谷歌于 6 月 2 日推送 Chrome 149 稳定版，覆盖 Windows、Mac 和 Linux 平台，含 429 项安全修复。新增端侧 AI 模型管理选项，用户可拒绝下载或移除已下载模型。测试中的“AI 模式”绕过搜索首页，尚未正式上线。DevTools 的 MCP 服务器及 AI 智能体命令行接口稳定，新增自定义 HTTP 头模拟和改版 AI 助手面板；CSS 面板加入 Gemini 驱动的样式自动补全。Chrome 149 正式推出 ARM64 Linux 官方 deb/rpm 构建包。

MCP/工具产品更新端侧

20:30

公众号：卡尔的AI沃茨

48

OpenSquilla：用Meta Skill将多个Skill组织成稳定工作流，成本降至OpenClaw的1/9

OpenSquilla通过Meta Skill将多个Skill按YAML定义步骤、顺序和依赖，在Runtime层预先校验，防止无效调用。在PinchBench 1.2.1上，三模型混用的OpenSquilla与Claude Opus 4.7版OpenClaw得分几乎相同，但Token少一半，成本不到1/9。将Superpowers下14个Skill组合为Meta Skill后，输入Token压缩至67%。支持多模型，用本地小模型分类任务，模型切换仅在新Session生效；子Agent压缩上下文，400K窗口内可保持记忆。同一会话执行8个框架调研报告，仅花费7美分，Token和成本精确到小数点后四位。

智能体 MCP/工具教程/实践

18:52

公众号：百度智能云（文心）

57

FluxA与百度智能云战略合作，为Agent经济搭建基础设施

百度智能云与FluxA建立战略合作，共同为Agent经济搭建基础设施。百度智能云提供可交易商品体系、自雇佣交易机制、能力工具箱及出海分销通道；FluxA作为支付底座，提供低费率高频微交易、Financial Harness安全授权、全球收款与Token Paywall。目前超9万个Agent使用FluxA钱包，超1万个AI Agent资源完成商业化。今年一季度中国两地区OPC新增超6000户，日均Token消耗140万亿。DAA被视为AI时代衡量生态价值的核心指标。

智能体 MCP/工具行业动态

17:54

公众号：通义实验室（千问）

精选70

PawBench：给通用智能体一把可度量的尺

通义实验室推出全新评测基准PawBench v1.0，面向个人助理与通用智能体场景，将底座模型与运行框架Harness纳入同一体系进行交叉评测。评测矩阵包含9个模型与3个Harness（Hermes、OpenClaw、QwenPaw），覆盖150道真实任务共4050个测试单元。结果显示，QwenPaw（76.4分）、OpenClaw（75.4分）、Hermes（70.4分）之间存在显著分差，Harness环境对表现的影响甚至大于模型本身。PawBench还通过切片分析揭示了Harness在产物校验、Skill主动发现和Web搜索默认可用性等方面的关键差距。项目已开源。

智能体 MCP/工具评测/基准

推荐理由：PawBench 把 Harness 从‘看不见的手’变成可诊断的变量，好 Harness 能让弱模型以下克上，这份评测对 Agent 框架开发者是一份必读的校验清单。

08:00

HuggingFace Daily Papers（社区热门论文）

55

VoLo：面向开放词汇长时程操作的物理编排器

VoLoAgent是一个基于VLM的物理编排智能体，将异构机器人能力（VLA/WAM、视觉模型、动作原语）作为可中断工具，实现规划、监控与恢复。同时提出RoboVoLo基准，专为开放词汇长时程操作设计，涵盖常识、记忆/状态跟踪、复杂指代与世界知识，并提供任务级成功率和失败诊断。实验表明VoLoAgent显著优于单VLA/VLM或基于工具的系统，并在真实机器人上验证。

智能体 arXiv MCP/工具具身智能

6月4日

23:42

Hugging Face：Blog（RSS）

精选66

Hugging Face 为编码智能体重塑 hf CLI 输出格式

Hugging Face 重新设计 hf CLI，使其同时服务人类用户和编码智能体（Claude Code、Codex 等）。CLI 通过环境变量自动检测智能体驱动，输出紧凑无截断的 TSV 格式，避免 ANSI 和交互提示，大幅降低 token 消耗。复杂多步任务中，不使用 CLI 的智能体 token 消耗最高达 hf CLI 的 6 倍。2026 年 4 月起，Hugging Face 追踪 Hub 智能体流量，Claude Code 约 4 万用户、近 4900 万次请求，Codex 紧随其后。

Hugging Face MCP/工具产品更新编码

推荐理由：HF CLI 现在会自动检测 agent 并切换输出，复杂任务上 token 消耗比 curl/SDK 节省 2-6 倍。如果你在用 Claude Code 或 Codex 操作 Hugging Face Hub，这是必读的升级指南。

17:26

HuggingFace Daily Papers（社区热门论文）

精选70

RHO：利用过往轨迹优化LLM智能体工具链的自监督方法

Retrospective Harness Optimization (RHO) 是一种自监督方法，仅利用过往轨迹优化LLM智能体的工具链（技能、工具和工作流程集合）。RHO从历史任务中选取多样化的困难任务核心集，并行重新执行；智能体通过自我验证和自我一致性分析回放，生成候选工具链更新，并依据自身成对自我偏好选择最有效更新。在软件工程、技术工作和知识工作三个领域评估中，单轮优化将SWE-Bench Pro通过率从59%提升至78%，无需外部评分。分析表明RHO有效针对先前失败模式，优化后的工具链改变智能体行为模式，在长周期会话中维持更高准确率。

智能体 arXiv MCP/工具编码

推荐理由：不靠人工标注就能让 Agent 自我提升，单轮直接把 SWE-Bench Pro 通过率从 59% 拉到 78%，做自主 Agent 优化的同学应该仔细读一下。

14:18

公众号：千问APP（阿里）

49

肯德基Skill接入千问，点疯狂星期四直接到店取

全国1.3万多家肯德基门店以第三方Skill形式接入千问APP。用户对千问说出“帮我点附近肯德基的疯狂星期四，到店取”即可自动匹配门店与套餐，并显示距离和取餐时间。千问还与肯德基会员权益打通，下单时自动使用大神卡及匹配的优惠券。

MCP/工具产品更新

12:11

IT之家（RSS）

61

Nous Research 发布 Hermes Desktop 桌面端公测版

Nous Research 以公开预览版形式推出 Hermes Desktop，支持 Windows、macOS 和 Linux。桌面端共享 Hermes Agent 的配置、API 密钥、会话、技能和记忆，用户可在桌面、CLI 和 TUI 间无缝切换。Hermes Agent 具备长期记忆，能规划任务、调用工具、观察结果，并通过闭环学习自动写入可复用技能。持久记忆借助 FTS5 会话搜索、LLM 摘要和 Honcho 用户建模加强跨会话召回。安全方面支持 local、Docker、SSH、Singularity 和 Modal 共 5 类沙箱后端，内置网页搜索、浏览器自动化、视觉、图像生成、文本转语音及多模型推理工具，同时支持通过 MCP 接入外部工具。

智能体 MCP/工具产品更新

08:00

HuggingFace Daily Papers（社区热门论文）

69

ToolSense：审计LLM中参数化工具知识的诊断框架

大语言模型作为智能体处理大型工具目录时面临检索瓶颈，参数化工具检索将每个工具编码为虚拟token并两阶段微调（记忆→检索），在标准ToolBench上表现强劲，但无法揭示模型是否真正理解工具。ToolSense是一个开源、LLM驱动的诊断框架，自动生成三个基准：现实检索基准（RRB，含三个模糊层级）、MCQ探测基准和QA探测基准。应用于ToolBench约4.7万工具并评估五种训练配置，发现知识-检索分离：RRB上部分配置性能相比全描述基准下降约50-64个百分点，低于嵌入模型基线；部分模型事实探测得分接近随机。框架和基准已开源。

智能体 arXiv MCP/工具论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

58

ToolMaze：LLM智能体在工具失效时的动态重规划与异常恢复基准测试

ToolMaze是一个评估LLM智能体在工具失效场景下动态路径发现与错误恢复能力的基准测试。其采用双维度设计：DAG拓扑复杂度与2×2工具扰动分类（显式/隐式、瞬时/永久）。评估显示，几乎所有模型在扰动下性能均下降，隐式语义失效导致扰动恢复率（PRR）骤降约37%，复杂拓扑则使智能体陷入无效试错循环。关键发现：智能体容错能力随模型规模提升的速度比基本任务执行慢3.66倍，动态重规划成为模型扩展无法解决的独立瓶颈。数据和代码已公开。

智能体 MCP/工具论文/研究

01:23

Claude：Blog（网页）

精选68

Claude Code技能使用经验：Anthropic内部实践

Anthropic 分享了内部使用 Claude Code 的 Skills（技能）功能的经验。Skills 是指令、脚本和资源的文件夹，智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能，它们可归为九类，包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别，涵盖过多功能会混淆智能体。团队发现，投入时间优化验证类技能对 Claude 输出质量的提升最显著。

智能体 Anthropic MCP/工具教程/实践

推荐理由：这不是产品公告，而是从几百个内部技能中血泪总结出的实战手册。如果你想让Claude Code真正变成你的工程副驾驶，这9类技能和‘gotchas’章节至少省你三个月踩坑。

1 234 5…9