AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 346 条
全部一手资讯X论文
标签「MCP/工具调用」清除
6月12日周五
00:13xAI:News(网页)70精选xAI 推出 Grok Build Plugin Marketplace
6月11日周四
19:30Artificial Intelligence News(RSS)61Visa 与 ChatGPT 集成,AI 智能体可实现零售购买
18:30公众号:火山引擎48银河证券×火山引擎:TRAE嵌入研发全流程,交付周期缩短一半
17:54MarkTechPost(RSS)59Nous Research 发布 Hermes Agent Profile Builder:身份、模型、技能和 MCP 服务器一站式仪表盘流
17:31IT之家(RSS)54WPS 笔记发布:AI 原生多模态,重新定义个人知识管理
10:50公众号:数字生命卡兹克70精选从0到1速通WorkBuddy:国内通用Agent产品教程
08:24Simon Willison 博客66datasette-agent 0.2a0 发布:新增 ask_user 和 save_query 工具
06:22MarkTechPost(RSS)55Microsoft SkillOpt 编码实现:仪表化提示优化、技能演化分析与基线比较
02:10Claude:Blog(网页)75同事件精选智能体表面的演进:使用 Claude Managed Agents 构建同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
6月10日周三
15:28IT之家(RSS)59一句话 P 图发朋友圈?美图秀秀宣布首批接入微信 AI 生态
08:00HuggingFace Daily Papers(社区热门论文)61Evoflux:面向紧凑型智能体的可执行工具工作流的推理时进化
05:06Claude:Blog(网页)75同事件精选Claude Managed Agents 新增定时运行和环境变量存储功能同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
6月9日周二
19:55Hugging Face:Blog(RSS)76精选一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊
14:22IT之家(RSS)52滴滴宣布接入微信 AI 生态,用户可在聊天时直接叫车
07:50公众号:数字生命卡兹克61同事件精选微信正在变成Agent时代的操作系统同一事件,精选展示《微信AI官宣内测:两种接入模式供开发者选择》
06:16Claude Code:GitHub Releases(RSS)61同事件精选Claude Code v2.1.169 发布同一事件,精选展示《Claude Code v2.1.163 发布》
04:48OpenRouter:Announcements(RSS)66精选EU AI Act 合规:面向 AI 智能体的人工监督
02:50Claude:Blog(网页)72精选Claude 为 Connector 开发者推出性能监控仪表盘
6月8日周一
21:50Hugging Face:Blog(RSS)62精选开源社区支持 OpenEnv 用于智能体强化学习
18:20IT之家(RSS)63消息称京东首批内测接入微信 AI,涵盖电商、外卖、物流等业务
17:42公众号:数字生命卡兹克71同事件精选微信AI Agent生态曝光:嵌入小程序调用与手机厂商合作同一事件,精选展示《微信AI官宣内测:两种接入模式供开发者选择》
16:20IT之家(RSS)73精选微信AI官宣内测:两种接入模式供开发者选择
08:12Simon Willison 博客62datasette-agent-edit 0.1a0 发布
6月7日周日
18:35The Decoder:AI News(RSS)59Perplexity 推出 "Search as Code" 架构,让 AI 模型自行编写搜索管道
08:19IT之家(RSS)55微软警告:Claude Code存在提示词注入漏洞,可致GitHub凭证泄露
6月6日周六
03:34Claude:Blog(网页)76同事件精选Claude Cowork 产品指南同一事件,精选展示《Claude Cowork 入门最佳实践》
02:33Claude:Blog(网页)59Anthropic销售人员用Claude Code重建团队工作流
01:12Google Developers Blog(RSS)75精选Google Colab CLI 发布
6月5日周五
23:15IT之家(RSS)39谷歌 Chrome 149 稳定版发布,允许用户删除已下载的端侧 AI 模型
20:30公众号:卡尔的AI沃茨48OpenSquilla:用Meta Skill将多个Skill组织成稳定工作流,成本降至OpenClaw的1/9
18:52公众号:百度智能云(文心)57FluxA与百度智能云战略合作,为Agent经济搭建基础设施
17:54公众号:通义实验室(千问)70精选PawBench:给通用智能体一把可度量的尺
08:00HuggingFace Daily Papers(社区热门论文)55VoLo:面向开放词汇长时程操作的物理编排器
6月4日周四
23:42Hugging Face:Blog(RSS)66精选Hugging Face 为编码智能体重塑 hf CLI 输出格式
17:26HuggingFace Daily Papers(社区热门论文)70精选RHO:利用过往轨迹优化LLM智能体工具链的自监督方法
14:18公众号:千问APP(阿里)49肯德基Skill接入千问,点疯狂星期四直接到店取
12:11IT之家(RSS)61Nous Research 发布 Hermes Desktop 桌面端公测版
08:00HuggingFace Daily Papers(社区热门论文)69ToolSense:审计LLM中参数化工具知识的诊断框架
08:00HuggingFace Daily Papers(社区热门论文)58ToolMaze:LLM智能体在工具失效时的动态重规划与异常恢复基准测试
01:23Claude:Blog(网页)68精选Claude Code技能使用经验:Anthropic内部实践
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
00:13
xAI:News(网页)
精选70
xAI 推出 Grok Build Plugin Marketplace

xAI 今日发布 Grok Build 内置插件市场。插件将技能、斜杠命令、AI 智能体、钩子、MCP 服务器和 LSP 打包为可安装包,用户无需离开终端即可浏览、安装和更新。首发合作伙伴包括 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 和 Superpowers。在 Grok Build 中输入 /marketplace 或使用 CLI 即可安装,每个远程插件均固定到特定 commit SHA 并经过验证。开发者可提交 PR 到 xai-org/plugin-marketplace 发布自己的插件。

MCP/工具xAI产品更新编码
关联讨论 1 条X:xAI (@xai)
推荐理由:Grok Build 这下可以像浏览器装扩展一样装插件了,涵盖数据库、部署、调试,开发者不必离开终端,这类集成对 AI 编程环境的体验影响挺大的。
6月11日
19:30
Artificial Intelligence News(RSS)
61
Visa 与 ChatGPT 集成,AI 智能体可实现零售购买

Visa 将支付基础设施接入 ChatGPT,使 AI 智能体能够推荐零售产品并执行金融交易。该部署去除了零售漏斗最后阶段的人工干预——自主智能体将处理用户提示、评估商家目录,并利用 Visa 支付通道在任何支持商户处完成结账流程。

智能体MCP/工具OpenAI产品更新
18:30
公众号:火山引擎
48
银河证券×火山引擎:TRAE嵌入研发全流程,交付周期缩短一半

银河证券与火山引擎合作,引入TRAE企业版并推进SDD(规格驱动开发)范式,将AI Coding嵌入研发全流程。研发需求交付周期缩短1/3至1/2,AI代码采纳率最高达87%,前端UI还原度稳定在90%以上(H5/Vue页面达98%以上)。子账户与融券系统重构周期从4个月压缩至2个月,Bug率降低25%,单元测试覆盖率提升30%,券池规模扩大10倍,服务客户量扩大20倍。通过MCP集成打通Ones、GitLab、DevOps等工具链,组织级Skill库减少60%手写测试工作量。TRAE企业版已覆盖银河证券100个研发席位,累计培训超130名研发人员。

MCP/工具教程/实践编码
17:54
MarkTechPost(RSS)
59
Nous Research 发布 Hermes Agent Profile Builder:身份、模型、技能和 MCP 服务器一站式仪表盘流

Nous Research 为 Hermes Agent 仪表盘新增 Profile Builder,用户可在单一流程中构建包含身份、模型、技能和 MCP 服务器的完整 Agent 配置文件,替代以往多步 CLI 配置方式。

智能体MCP/工具产品更新
17:31
IT之家(RSS)
54
WPS 笔记发布:AI 原生多模态,重新定义个人知识管理

6月5日,金山办公发布AI原生多模态笔记产品WPS笔记,摒弃传统文件夹,采用多级AI自动标签组织内容。支持语音、图片、文字、网页等录入;语音转写具备AI实时纠正和声纹区分发言人功能,图片可提取公式并支持LaTeX编辑及梯形校正。全域多模态检索可同时搜索文字、图片、音频。内置WPS灵犀助手,能完成整理、摘要、润色、创建任务清单等操作,支持自定义Skill和记忆设置。开放外部MCP接入,允许Cursor、Claude等第三方AI应用直接读取笔记。

MCP/工具多模态教程/实践
10:50
公众号:数字生命卡兹克
精选70
从0到1速通WorkBuddy:国内通用Agent产品教程

WorkBuddy是面向国内用户的通用Agent产品,支持Windows和Mac,提供免费版和58元/月个人专业版,企业版已推出。内置代码开发、日常办公、设计创意三种场景模式及100多个行业领域AI专家。模型集成腾讯混元、DeepSeek(推荐V4 Pro)、GLM、Kimi等国产大模型,也支持接入兼容OpenAI协议的外部API。拥有Skills市场和MCP连接器生态,可打通QQ邮箱、腾讯会议、腾讯文档等服务。教程通过公众号周报生成和功能网页开发两个案例演示实际用法。

智能体MCP/工具教程/实践
关联讨论 1 条公众号:数字生命卡兹克
推荐理由:补上那批「好是好但用不了」的遗憾,WorkBuddy 用微信扫码登录加技能市场把门槛拉到地面,这篇从 0 到 1 的教程能让你半天内把日常办公任务自动化掉。
08:24
Simon Willison 博客
66
datasette-agent 0.2a0 发布:新增 ask_user 和 save_query 工具

datasette-agent 0.2a0 新增两个核心功能。工具可通过 ToolContext 对象的 await context.ask_user(...) 向用户提问,支持 yes/no、多选(options=[...])或自由文本(free_text=True)。问题未回答时 agent 挂起,问题以表单形式渲染在聊天界面并持久化到内部数据库,服务器重启后对话可继续。工具应在执行副作用前调用 ask_user(),回答后从头重放。另一内置工具 save_query 允许 agent 将 SQL 保存为 Datasette 存储查询,但必须经人工批准——显示完整 SQL 及提议的名称、数据库和可见性,用户确认后才会存储。ask_user 功能基于作者昨日用 Claude Fable 5 构建的新 LLM alpha 实现。

智能体MCP/工具产品更新
06:22
MarkTechPost(RSS)
55
Microsoft SkillOpt 编码实现:仪表化提示优化、技能演化分析与基线比较

实现了一个端到端的 Microsoft SkillOpt 仪表化工作流,包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线,运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环,检查训练历史,可视化准确率、编辑预算行为和 token 用量,并将进化后的技能与基线进行比较。

MCP/工具Microsoft教程/实践部署/工程
02:10
Claude:Blog(网页)
同事件精选75
智能体表面的演进:使用 Claude Managed Agents 构建

Anthropic 推出 Claude Managed Agents,一套可组合 API 套件,用于构建和部署生产级智能体。该产品从早期简单 API 演进至 Claude Agent SDK,再到将智能体调度层与代码执行沙箱解耦的 Managed Agents。通过只追加日志的会话机制,Managed Agents 解决了托管伸缩、会话持久化、文件系统管理、执行隔离、凭证安全与可观测性等生产部署挑战。团队借助该方案可在数天内完成从原型到生产环境的转化,无需自建基础设施。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
推荐理由:Claude Managed Agents 把代理部署的复杂基础设施打包成了 API,让团队从原型到上线只需几天而不是几个月,尤其凭证隔离和延迟优化对生产环境很关键,想部署可靠代理的团队可以认真看看。
6月10日
15:28
IT之家(RSS)
59
一句话 P 图发朋友圈?美图秀秀宣布首批接入微信 AI 生态

微信6月8日发布开发者接入微信AI生态指引,开放平台支持开发者授权接入。美图秀秀作为首批内测开发者完成初步适配,将围绕人像美容、拼图、证件照、智能消除、画质修复等核心场景接入微信AI Agent。京东、美团、滴滴、携程、同程、肯德基等也同步宣布作为首批内测团队接入微信AI生态。

MCP/工具图像生成行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
61
Evoflux:面向紧凑型智能体的可执行工具工作流的推理时进化

Evoflux是一种推理时进化搜索方法,通过结构化编辑、执行反馈、自适应强度、元引导重设计和多样性剪枝,将紧凑型语言模型的可执行工具工作流修复为可运行图。在覆盖250个工具和MCP服务器的MCP-Bench任务上,Evoflux将小型规划器的执行可行性从约3%提升至17-24%。相比之下,同一数据上的SFT和SFT+DPO表现持平、不如或崩溃至低于零样本水平;ReAct可达更高峰值但方差和token成本更高。结果表明,在稀缺教师轨迹预算下,基于执行反馈的搜索更可靠。

智能体MCP/工具论文/研究
05:06
Claude:Blog(网页)
同事件精选75
Claude Managed Agents 新增定时运行和环境变量存储功能

Claude Managed Agents 今日在 Claude Platform 公开测试两项新功能:代理可按 cron 计划自动执行周期性任务(如夜间数据同步、周度合规扫描、每日摘要),无需用户自建调度器,支持暂停、恢复、归档或按需触发;vaults 新增环境变量支持,允许代理通过 CLI 进行认证请求,真实密钥仅附加在网络边界,代理无法读取。已集成的 CLI 包括 Browserbase、KERNEL、Notion、Ramp 和 Sentry。Rakuten、Actively AI、Ando、Milana 等团队正在使用这些功能实现自动化数据报表、跨账户搜索、招聘提醒等场景。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《Code w/ Claude 伦敦活动:重塑开发体验》
推荐理由:Claude Managed Agents 现在能定时跑任务和用 vault 安全连接 CLI 了,这基本解决了企业 agent 落地的两个最大痛点——自动化和凭证管理。做 agent 的团队应该仔细读。
6月9日
19:55
Hugging Face:Blog(RSS)
精选76
一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

一个编码Agent调用HuggingFace上的两个Space,从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像,再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点(.ply),自动完成坐标系校正、取景、压缩为.ksplat(体积缩小约3倍),并构建基于Three.js的滚动切换、拖拽旋转查看器,最终部署为静态Space。整个过程无需客户端库,每个Space通过agents.md暴露可调用API。

智能体Hugging FaceMCP/工具多模态

推荐理由:Hugging Face 把 agents.md 做成每个 Space 的标准说明书,agent 能直接读懂并链式调用图像和 3D 模型,这篇用 3D 巴黎画廊 demo 告诉你这事儿已经跑通了,做 AI 工具链的可以立刻照着试。
14:22
IT之家(RSS)
52
滴滴宣布接入微信 AI 生态,用户可在聊天时直接叫车

滴滴作为首批合作伙伴,已将核心网约车服务融入微信 AI Agent。用户通过微信内 AI 交互说出“帮我叫一辆滴滴去机场”等指令,系统可根据行程距离、时效与个人偏好自动推荐最优车型并一键唤起叫车,全程不跳转。滴滴顺风车、滴滴代驾等更多服务也将接入。6月8日,微信发布《关于开发者接入微信 AI 生态的指引》,提供自动模式与开发模式两种接入选项。京东、美团、滴滴、携程、同程和肯德基均宣布作为首批内测团队接入。

智能体MCP/工具行业动态
07:50
公众号:数字生命卡兹克
同事件精选61
微信正在变成Agent时代的操作系统

微信近期密集布局AI Agent:据外媒,用户在主界面右滑可唤出Agent对话窗口,自动调用小程序完成点单等任务;与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力,允许手机语音助理发起微信音视频通话或发送消息;6月8日发布开发者指引,提供自动接入模式,通过GUI Agent帮助数百万小程序实现AI调用。微信试图整合内部小程序生态与外部硬件,成为AI时代的操作系统,并触及Agentic Commerce(代理式交易)模式。

智能体MCP/工具现象/趋势
同一事件,精选展示《微信AI官宣内测:两种接入模式供开发者选择》
推荐理由:微信 Agent 的拼图今天终于凑齐了,自动改造百万小程序这一步,让微信从聊天工具直接跨向 Agent 时代的操作系统,比当年公众号革命还大。
06:16
Claude Code:GitHub Releases(RSS)
同事件精选61
Claude Code v2.1.169 发布

Claude Code v2.1.169 新增 --safe-mode 标志及环境变量,用于禁用所有自定义配置以排查问题;新增 /cd 命令,可在不破坏提示词缓存的情况下切换工作目录;新增 disableBundledSkills 设置隐藏内置技能。修复了企业 MCP 策略在重连、IDE 配置及首次会话中不被强制的问题,以及 macOS 用户每轮约 30–50ms 的 UI 卡顿、Windows 下 claude -p 和 Git 凭证弹窗等多项 bug。改进了任务创建的可靠性,恢复 Vertex/Foundry 默认 5 分钟空闲超时,并降低 CPU 占用。

智能体AnthropicMCP/工具产品更新
同一事件,精选展示《Claude Code v2.1.163 发布》
推荐理由:全是修 bug 的版本里藏了两个实用命令,/cd 换目录不丢缓存和 safe-mode 跳过所有自定义直接排查,重度用户的小痛点被摸到了。
04:48
OpenRouter:Announcements(RSS)
精选66
EU AI Act 合规:面向 AI 智能体的人工监督

使用智能体 SDK 的人机协作(HITL)工具,可满足 EU AI Act、Colorado AI Act 和 NIST AI RMF 对 AI 智能体的合规要求。

MCP/工具安全/对齐教程/实践

推荐理由:虽然讲的是合规,但直接把监管要求翻译成可落地的代码模式,对做高风险Agent的团队来说是一份照着改就能过审的实操手册。
02:50
Claude:Blog(网页)
精选72
Claude 为 Connector 开发者推出性能监控仪表盘

Claude 为目录中已发布的 Connector 新增性能监控仪表盘(公开测试版)。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因;还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号(Admin/Owner 权限或自定义角色)。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录,该目录已有超 300 个第三方 Connector,每日被数百万人使用。

AnthropicMCP/工具产品更新
关联讨论 1 条X:Claude Devs (@ClaudeDevs)
推荐理由:Claude给connector开发者加了仪表板,能跟踪用量和错误,还能直接提交到目录,做MCP集成的省了监控的麻烦,即开即用。
6月8日
21:50
Hugging Face:Blog(RSS)
精选62
开源社区支持 OpenEnv 用于智能体强化学习

今日,Hugging Face 宣布 OpenEnv 项目进一步开放,由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调,并获得 PyTorch Foundation、vLLM、SkyRL(UCB)等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具,定位为训练器与环境间的互操作层,标准化环境的发布、部署和消费,但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API(reset()、step()、state()),支持 HTTP、WebSocket、Docker 打包,并将 MCP 作为一等公民,使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证,以推动开源智能体 RL 基础建设。

智能体Hugging FaceMCP/工具Meta

推荐理由:开源社区在 agent RL 环境上终于开始合流,Meta、Nvidia、Hugging Face 等联合推动 OpenEnv 成为接口标准,不做奖励框架,只做插线板。搞开源 agent 训练的人,这是少有的统一基础设施的机会。
18:20
IT之家(RSS)
63
消息称京东首批内测接入微信 AI,涵盖电商、外卖、物流等业务

京东作为首批内测团队率先接入微信AI,将围绕电商、外卖、物流等业务接入微信AI Agent。微信开放平台提供自动模式和开发模式两种接入方式:自动模式由平台读取小程序源码并分析页面,无需额外开发;开发模式允许开发者基于业务特性自主开发,通过审核后可被微信AI调用。

智能体MCP/工具产品更新
17:42
公众号:数字生命卡兹克
同事件精选71
微信AI Agent生态曝光:嵌入小程序调用与手机厂商合作

腾讯正测试嵌入微信的AI Agent,用户右滑唤出对话窗口,通过自然语言指令调用数百万小程序完成点咖啡等任务。微信还与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力,可通过手机语音助理发起微信音视频通话或发送消息。6月8日,微信官方发布《关于开发者接入微信AI生态的指引》,提供自动接入模式,利用微信沙箱全自动改造小程序,使其可被AI直接调用。这一布局被视为Agentic Commerce(代理式交易)的雏形。

智能体MCP/工具现象/趋势
同一事件,精选展示《微信AI官宣内测:两种接入模式供开发者选择》
推荐理由:微信想用Agent把小程序生态变成操作系统,靠Agentic Commerce抽佣,一旦跑通,想象力比广告大得多。
16:20
IT之家(RSS)
精选73
微信AI官宣内测:两种接入模式供开发者选择

微信开发者官方今日发布指引,确认微信AI正在内测阶段。开放平台提供两种接入模式:自动模式可授权平台读取小程序源码,无需额外开发即可让微信AI直接操作页面;开发模式下开发者可自主开发技能,审核后由微信AI调用。两种模式可同时开启。微信AI是微信内的AI助手,用户通过自然语言对话即可调用、访问和操作小程序。服务条款称“微信AI”可能非最终名称。接入与否不影响现有小程序服务。

智能体MCP/工具产品更新
关联讨论 1 条IT之家(RSS)
推荐理由:微信终于把AI塞进了自家生态,没做聊天机器人而是直接让AI操作小程序,这个方向比所有独立AI助手都更贴近普通人的真实需求,做小程序的得赶紧看了。
08:12
Simon Willison 博客
62
datasette-agent-edit 0.1a0 发布

datasette-agent-edit 0.1a0 插件发布,为 Datasette Agent 提供智能体编辑文本的核心工具。其设计借鉴 Claude text editor,实现三个工具:view(按行号查看文件片段)、str_replace(精确替换唯一字符串)、insert(在指定行号后插入文本)。该插件作为基础组件,可供其他协作 Markdown 编辑、SQL 查询更新、SVG 编辑等插件复用。

智能体MCP/工具开源/仓库
6月7日
18:35
The Decoder:AI News(RSS)
59
Perplexity 推出 "Search as Code" 架构,让 AI 模型自行编写搜索管道

Perplexity 的 "Search as Code" 架构放弃固定搜索 API,改为让 AI 模型在 Python 沙箱中自主编写搜索例程,自行完成过滤和去重。该方案在关键基准测试中超越 OpenAI 和 Anthropic 的模型,并将 token 成本削减高达 85%。

智能体MCP/工具产品更新搜索
08:19
IT之家(RSS)
55
微软警告:Claude Code存在提示词注入漏洞,可致GitHub凭证泄露

微软研究人员发现Anthropic旗下Claude Code的GitHub自动化流程存在漏洞,攻击者可通过提示词注入攻击,劫持CI/CD工作流窃取敏感凭证。漏洞源于Claude Code的读取工具未像Bash工具那样设置沙箱防护,恶意提示词可绕过两层防护读取系统文件中的API密钥等凭证。Anthropic于4月29日收到报告后,在5月5日发布Claude Code 2.1.128修复,通过限制对/proc/目录下敏感文件的访问防止信息窃取。

AnthropicMCP/工具Microsoft安全/对齐
6月6日
03:34
Claude:Blog(网页)
同事件精选76
Claude Cowork 产品指南

Anthropic 发布 Claude Cowork,一款运行在 Claude 桌面应用中的知识工作智能体。它可读写本地文件、跨 Slack 和 Google Drive 等应用协作,执行多步骤任务并生成带引用的实际交付物。核心能力包括本地文件访问、子智能体、长时间运行和定时任务。Claude Cowork 区别于对话式 AI 工具,支持用户描述目标与期望结果后自动规划执行。指南还介绍了产品矩阵(对话聊天、Claude Code 编程、Claude Cowork 跨应用知识工作)、设置要求、权限模型、七种常见工作流(如研究简报、会议准备、定期报告)以及营销和产品管理等插件。

智能体AnthropicMCP/工具教程/实践
同一事件,精选展示《Claude Cowork 入门最佳实践》
推荐理由:把 Claude 从问答工具升级成能读写本地文件、跨应用交付可交付物的知识工作代理,这份官方指南给出了明确上手路径和七个真实工作流,做产品、做调研的都能直接照抄。
02:33
Claude:Blog(网页)
59
Anthropic销售人员用Claude Code重建团队工作流

加入Anthropic前从未写过代码的销售成员Jared Sires,利用Claude Code为销售团队开发自动化工具。他创建了内嵌于Gmail的CLAFTS(Claude Drafts),通过Claude API根据客户邮件草拟回复,每天节省2-3小时。该系统基于约4,300行代码(几乎全由Claude Code编写),从Google Drive和Anthropic公开文档提取上下文,并通过网络搜索获取最新产品信息。他还开发了CLAFTS Tones功能,通过模式匹配模仿不同人际关系下写作风格。这些工具已打包为Claude Cowork插件供整个销售团队使用。

智能体AnthropicMCP/工具教程/实践
关联讨论 1 条Claude:Blog(网页)
01:12
Google Developers Blog(RSS)
精选75
Google Colab CLI 发布

Google 推出 Colab 命令行界面(CLI),允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时,实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本,并检索工件日志或模型(如微调后的 Gemma 3 适配器)。工具可直接集成到标准终端环境,可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。

GoogleMCP/工具产品更新部署/工程
关联讨论 1 条MarkTechPost(RSS)
推荐理由:对于习惯在 Colab 上薅免费 GPU 的开发者,这个 CLI 把本地开发、远程跑训练这套流程的摩擦降到了几乎为零,而且直接对接 AI agent,实验自动化往前迈了一大步。
6月5日
23:15
IT之家(RSS)
39
谷歌 Chrome 149 稳定版发布,允许用户删除已下载的端侧 AI 模型

谷歌于 6 月 2 日推送 Chrome 149 稳定版,覆盖 Windows、Mac 和 Linux 平台,含 429 项安全修复。新增端侧 AI 模型管理选项,用户可拒绝下载或移除已下载模型。测试中的“AI 模式”绕过搜索首页,尚未正式上线。DevTools 的 MCP 服务器及 AI 智能体命令行接口稳定,新增自定义 HTTP 头模拟和改版 AI 助手面板;CSS 面板加入 Gemini 驱动的样式自动补全。Chrome 149 正式推出 ARM64 Linux 官方 deb/rpm 构建包。

MCP/工具产品更新端侧
20:30
公众号:卡尔的AI沃茨
48
OpenSquilla:用Meta Skill将多个Skill组织成稳定工作流,成本降至OpenClaw的1/9

OpenSquilla通过Meta Skill将多个Skill按YAML定义步骤、顺序和依赖,在Runtime层预先校验,防止无效调用。在PinchBench 1.2.1上,三模型混用的OpenSquilla与Claude Opus 4.7版OpenClaw得分几乎相同,但Token少一半,成本不到1/9。将Superpowers下14个Skill组合为Meta Skill后,输入Token压缩至67%。支持多模型,用本地小模型分类任务,模型切换仅在新Session生效;子Agent压缩上下文,400K窗口内可保持记忆。同一会话执行8个框架调研报告,仅花费7美分,Token和成本精确到小数点后四位。

智能体MCP/工具教程/实践
18:52
公众号:百度智能云(文心)
57
FluxA与百度智能云战略合作,为Agent经济搭建基础设施

百度智能云与FluxA建立战略合作,共同为Agent经济搭建基础设施。百度智能云提供可交易商品体系、自雇佣交易机制、能力工具箱及出海分销通道;FluxA作为支付底座,提供低费率高频微交易、Financial Harness安全授权、全球收款与Token Paywall。目前超9万个Agent使用FluxA钱包,超1万个AI Agent资源完成商业化。今年一季度中国两地区OPC新增超6000户,日均Token消耗140万亿。DAA被视为AI时代衡量生态价值的核心指标。

智能体MCP/工具行业动态
17:54
公众号:通义实验室(千问)
精选70
PawBench:给通用智能体一把可度量的尺

通义实验室推出全新评测基准PawBench v1.0,面向个人助理与通用智能体场景,将底座模型与运行框架Harness纳入同一体系进行交叉评测。评测矩阵包含9个模型与3个Harness(Hermes、OpenClaw、QwenPaw),覆盖150道真实任务共4050个测试单元。结果显示,QwenPaw(76.4分)、OpenClaw(75.4分)、Hermes(70.4分)之间存在显著分差,Harness环境对表现的影响甚至大于模型本身。PawBench还通过切片分析揭示了Harness在产物校验、Skill主动发现和Web搜索默认可用性等方面的关键差距。项目已开源。

智能体MCP/工具评测/基准

推荐理由:PawBench 把 Harness 从‘看不见的手’变成可诊断的变量,好 Harness 能让弱模型以下克上,这份评测对 Agent 框架开发者是一份必读的校验清单。
08:00
HuggingFace Daily Papers(社区热门论文)
55
VoLo:面向开放词汇长时程操作的物理编排器

VoLoAgent是一个基于VLM的物理编排智能体,将异构机器人能力(VLA/WAM、视觉模型、动作原语)作为可中断工具,实现规划、监控与恢复。同时提出RoboVoLo基准,专为开放词汇长时程操作设计,涵盖常识、记忆/状态跟踪、复杂指代与世界知识,并提供任务级成功率和失败诊断。实验表明VoLoAgent显著优于单VLA/VLM或基于工具的系统,并在真实机器人上验证。

智能体arXivMCP/工具具身智能
6月4日
23:42
Hugging Face:Blog(RSS)
精选66
Hugging Face 为编码智能体重塑 hf CLI 输出格式

Hugging Face 重新设计 hf CLI,使其同时服务人类用户和编码智能体(Claude Code、Codex 等)。CLI 通过环境变量自动检测智能体驱动,输出紧凑无截断的 TSV 格式,避免 ANSI 和交互提示,大幅降低 token 消耗。复杂多步任务中,不使用 CLI 的智能体 token 消耗最高达 hf CLI 的 6 倍。2026 年 4 月起,Hugging Face 追踪 Hub 智能体流量,Claude Code 约 4 万用户、近 4900 万次请求,Codex 紧随其后。

Hugging FaceMCP/工具产品更新编码

推荐理由:HF CLI 现在会自动检测 agent 并切换输出,复杂任务上 token 消耗比 curl/SDK 节省 2-6 倍。如果你在用 Claude Code 或 Codex 操作 Hugging Face Hub,这是必读的升级指南。
17:26
HuggingFace Daily Papers(社区热门论文)
精选70
RHO:利用过往轨迹优化LLM智能体工具链的自监督方法

Retrospective Harness Optimization (RHO) 是一种自监督方法,仅利用过往轨迹优化LLM智能体的工具链(技能、工具和工作流程集合)。RHO从历史任务中选取多样化的困难任务核心集,并行重新执行;智能体通过自我验证和自我一致性分析回放,生成候选工具链更新,并依据自身成对自我偏好选择最有效更新。在软件工程、技术工作和知识工作三个领域评估中,单轮优化将SWE-Bench Pro通过率从59%提升至78%,无需外部评分。分析表明RHO有效针对先前失败模式,优化后的工具链改变智能体行为模式,在长周期会话中维持更高准确率。

智能体arXivMCP/工具编码

推荐理由:不靠人工标注就能让 Agent 自我提升,单轮直接把 SWE-Bench Pro 通过率从 59% 拉到 78%,做自主 Agent 优化的同学应该仔细读一下。
14:18
公众号:千问APP(阿里)
49
肯德基Skill接入千问,点疯狂星期四直接到店取

全国1.3万多家肯德基门店以第三方Skill形式接入千问APP。用户对千问说出“帮我点附近肯德基的疯狂星期四,到店取”即可自动匹配门店与套餐,并显示距离和取餐时间。千问还与肯德基会员权益打通,下单时自动使用大神卡及匹配的优惠券。

MCP/工具产品更新
12:11
IT之家(RSS)
61
Nous Research 发布 Hermes Desktop 桌面端公测版

Nous Research 以公开预览版形式推出 Hermes Desktop,支持 Windows、macOS 和 Linux。桌面端共享 Hermes Agent 的配置、API 密钥、会话、技能和记忆,用户可在桌面、CLI 和 TUI 间无缝切换。Hermes Agent 具备长期记忆,能规划任务、调用工具、观察结果,并通过闭环学习自动写入可复用技能。持久记忆借助 FTS5 会话搜索、LLM 摘要和 Honcho 用户建模加强跨会话召回。安全方面支持 local、Docker、SSH、Singularity 和 Modal 共 5 类沙箱后端,内置网页搜索、浏览器自动化、视觉、图像生成、文本转语音及多模型推理工具,同时支持通过 MCP 接入外部工具。

智能体MCP/工具产品更新
08:00
HuggingFace Daily Papers(社区热门论文)
69
ToolSense:审计LLM中参数化工具知识的诊断框架

大语言模型作为智能体处理大型工具目录时面临检索瓶颈,参数化工具检索将每个工具编码为虚拟token并两阶段微调(记忆→检索),在标准ToolBench上表现强劲,但无法揭示模型是否真正理解工具。ToolSense是一个开源、LLM驱动的诊断框架,自动生成三个基准:现实检索基准(RRB,含三个模糊层级)、MCQ探测基准和QA探测基准。应用于ToolBench约4.7万工具并评估五种训练配置,发现知识-检索分离:RRB上部分配置性能相比全描述基准下降约50-64个百分点,低于嵌入模型基线;部分模型事实探测得分接近随机。框架和基准已开源。

智能体arXivMCP/工具论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
58
ToolMaze:LLM智能体在工具失效时的动态重规划与异常恢复基准测试

ToolMaze是一个评估LLM智能体在工具失效场景下动态路径发现与错误恢复能力的基准测试。其采用双维度设计:DAG拓扑复杂度与2×2工具扰动分类(显式/隐式、瞬时/永久)。评估显示,几乎所有模型在扰动下性能均下降,隐式语义失效导致扰动恢复率(PRR)骤降约37%,复杂拓扑则使智能体陷入无效试错循环。关键发现:智能体容错能力随模型规模提升的速度比基本任务执行慢3.66倍,动态重规划成为模型扩展无法解决的独立瓶颈。数据和代码已公开。

智能体MCP/工具论文/研究
01:23
Claude:Blog(网页)
精选68
Claude Code技能使用经验:Anthropic内部实践

Anthropic 分享了内部使用 Claude Code 的 Skills(技能)功能的经验。Skills 是指令、脚本和资源的文件夹,智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能,它们可归为九类,包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别,涵盖过多功能会混淆智能体。团队发现,投入时间优化验证类技能对 Claude 输出质量的提升最显著。

智能体AnthropicMCP/工具教程/实践

推荐理由:这不是产品公告,而是从几百个内部技能中血泪总结出的实战手册。如果你想让Claude Code真正变成你的工程副驾驶,这9类技能和‘gotchas’章节至少省你三个月踩坑。
‹ 上一页
12345…9
下一页 ›