6月5日

15:40

Elon Musk@elonmusk

xAI 发布 Grok Build 0.2.20 更新，修复多项 Bug 并新增工具。修复包括：消除 Markdown 表格渲染中的鬼影单元格、使监控对模型可见且可终止、保留计划预览中的软换行、修复 image_edit 中的附件引用、优化 MCP 生命周期通知路由和鼠标滚轮滚动、改进压缩提示与去重子代理提醒、允许回滚时自动降级、修复 Windows 上本地 stdio MCP 服务器问题。新增 image_to_video 和 reference_to_video 工具，捆绑 imagine 技能，支持 ICO 转 PNG，以及 Search 和 ListDir 块按 Enter 打开全屏查看器。

skcd: Bug fixes shipping to Grok Build 0.2.20 (release notes will be available in the TUI and on change-log website) • Elimina...

MCP/工具 xAI 产品更新编码

14:22

Alibaba Cloud@alibaba_cloud

精选76

PolarDB-X Zero 上线了！无需注册。无需配置。只需一次 API 调用。 30 秒内获得一个全分布式数据库。原生 HNSW 向量索引--内置兼容 MySQL 的引擎。关系型 + 语义搜索--一条 SQL 语句。 AI 智能体就绪--MCP 协议、AI IDE 兼容（Cursor、Claude、Qoder、Qodex 等）立即尝试：https://zero.polardbx.com #AlibabaCloud #PolarDB #ApsaraDB

MCP/工具产品更新部署/工程

推荐理由：PolarDB-X Zero 把分布式数据库、向量索引和 MCP 协议打包成一行 API，30 秒就能跑一个 AI Agent 可用的混合搜索后端，做 agent 开发的可以试一下。

08:54

meng shao@shao__meng

OpenAI Codex 新增"Build iOS Apps"插件

OpenAI Codex 推出“Build iOS Apps”官方插件，将 iOS 应用开发闭环引入 Codex 工作流。用户可在 Codex 内直接查看和测试 iOS 应用、打开 SwiftUI previews 并进行代码热重载，无需切换到 Xcode 或模拟器。底层基于 XcodeBuildMCP 构建自动化工作流，支持构建、测试、模拟器运行、UI 检查、日志与调试状态采集。值得关注的两个开源项目：serve-sim（提供 streaming simulator 能力）和 SnapshotPreviews（用于提取 SwiftUI previews 集成工具链）。

OpenAI Developers: More of the iOS app loop, now inside Codex. The Build iOS Apps plugin lets Codex view and test your iOS app in the in-ap...

MCP/工具 OpenAI 产品更新编码

08:00

HuggingFace Daily Papers（社区热门论文）

VoLo：面向开放词汇长时程操作的物理编排器

VoLoAgent是一个基于VLM的物理编排智能体，将异构机器人能力（VLA/WAM、视觉模型、动作原语）作为可中断工具，实现规划、监控与恢复。同时提出RoboVoLo基准，专为开放词汇长时程操作设计，涵盖常识、记忆/状态跟踪、复杂指代与世界知识，并提供任务级成功率和失败诊断。实验表明VoLoAgent显著优于单VLA/VLM或基于工具的系统，并在真实机器人上验证。

智能体 arXiv MCP/工具具身智能

6月4日

23:42

Hugging Face：Blog（RSS）

精选66

Hugging Face 为编码智能体重塑 hf CLI 输出格式

Hugging Face 重新设计 hf CLI，使其同时服务人类用户和编码智能体（Claude Code、Codex 等）。CLI 通过环境变量自动检测智能体驱动，输出紧凑无截断的 TSV 格式，避免 ANSI 和交互提示，大幅降低 token 消耗。复杂多步任务中，不使用 CLI 的智能体 token 消耗最高达 hf CLI 的 6 倍。2026 年 4 月起，Hugging Face 追踪 Hub 智能体流量，Claude Code 约 4 万用户、近 4900 万次请求，Codex 紧随其后。

Hugging Face MCP/工具产品更新编码

推荐理由：HF CLI 现在会自动检测 agent 并切换输出，复杂任务上 token 消耗比 curl/SDK 节省 2-6 倍。如果你在用 Claude Code 或 Codex 操作 Hugging Face Hub，这是必读的升级指南。

23:22

elvis@omarsar0

DAIR.AI 创始人 Elvis Saravia 分享动态工作流实践

Elvis Saravia 逆向工程了动态工作流（Dynamic Workflows）并集成到自研智能体编排器中，同时构建 HTML 监控仪表盘跟踪任务、指标和报告。该工作流可在 Claude Code、Codex、Pi 等编码智能体及自研 @dair_ai agent 上运行。成功用例包括分支深度研究、并行深度研究、会话挖掘、Bug 定位、分类、事实核查、LLM 委员会、AI 模拟、数据合成和评测生成等。他认为动态工作流与 agent 技能一样，是实现复杂长期任务的关键原语，不仅限于编码，还可扩展至商业、科学等领域。

智能体 MCP/工具大佬观点

20:52

Rohan Paul@rohanpaul_ai

Anuma：跨模型统一记忆的私人AI工作空间

Rohan Paul 介绍 Anuma，一个私人 AI 工作空间，核心功能是跨模型统一记忆——用户在 ChatGPT、Claude、Gemini、Grok、DeepSeek、Kimi 等模型间切换时，上下文、偏好、目标和历史工作自动跟随。额外功能包括设备端加密记忆、默认隐私模式、无日志无训练、支持完整记忆导出、Council Mode（多模型并列回复对比）、单聊内模型切换，以及通过 iMessage 或 SMS 的 AI 文本能力。Paul 分享研究论文分析用例：上传多篇论文，利用多模态和多模型并行工作流，对比不同模型对同一主题的阅读、总结和关联能力，避免重复解释上下文。

MCP/工具多模态教程/实践

20:32

Orange AI@oran_ge

今天 ListenHub 的AI 视频功能正式上线啦，人类用户和 Agent 现在都可以调用 ListenHub 的服务生成视频。目前已支持 HappyHorse、Seedance 2.0 等视频模型。输入一个想法，或使用参考图、参考视频，即可一键生成视频。人类使用： ListenHub 官网： https://listenhub.ai/zh/app/ai-video Agent 使用： listenhub-cli：https://github.com/marswaveai/listenhub-cli skills： https://github.com/marswaveai/skills openapi： https://listenhub.ai/docs/zh/openapi/api-reference/ai-video

智能体 MCP/工具产品更新视频

17:42

X.PIN@thexpin

你将能够使用 Qwen（阿里巴巴的 AI 助手）在中国点肯德基！只需说"从最近的肯德基帮我点一份套餐"，Qwen 就会匹配你的优惠券并下单。

智能体 MCP/工具产品更新

17:26

HuggingFace Daily Papers（社区热门论文）

精选70

RHO：利用过往轨迹优化LLM智能体工具链的自监督方法

Retrospective Harness Optimization (RHO) 是一种自监督方法，仅利用过往轨迹优化LLM智能体的工具链（技能、工具和工作流程集合）。RHO从历史任务中选取多样化的困难任务核心集，并行重新执行；智能体通过自我验证和自我一致性分析回放，生成候选工具链更新，并依据自身成对自我偏好选择最有效更新。在软件工程、技术工作和知识工作三个领域评估中，单轮优化将SWE-Bench Pro通过率从59%提升至78%，无需外部评分。分析表明RHO有效针对先前失败模式，优化后的工具链改变智能体行为模式，在长周期会话中维持更高准确率。

智能体 arXiv MCP/工具编码

推荐理由：不靠人工标注就能让 Agent 自我提升，单轮直接把 SWE-Bench Pro 通过率从 59% 拉到 78%，做自主 Agent 优化的同学应该仔细读一下。

16:17

AYi@AYi_AInotes

Codex 额度重置：省着用反亏，建议本地兜底

OpenAI Codex 负责人 Tibo 因 24 小时内 3 次可靠性事故，重置所有付费计划额度。Codex 按推理时间计费：Plus 下 GPT-5.4 约 40 分钟耗尽 5 小时窗口，GPT-5.3 约 60 分钟。重置常将下个计费周期提前，导致精打细算攒的额度被覆盖，立即消耗者反而获得更多推理时间。作者认为系统奖励即刻消耗，建议本地模型兜底、云端冲峰值，夺回生产力控制权。

Tibo: Hi. Over the last 24 hours we had three separate small incidents that affected Codex reliability. Those are three too ma...

MCP/工具 OpenAI 大佬观点编码

15:18

meng shao@shao__meng

吐槽国内开发者平台：文档难搜，Skills化或改善

主推文批评国内面向开发者的平台文档结构混乱、搜索功能几近无效、智能助手输出空洞，用户常常只能找售前要链接。作者将这一现状与“全民龙虾化之后的Skills化”趋势关联，期待平台能借此机会规范文档体验。

MCP/工具其他

14:18

公众号：千问APP（阿里）

肯德基Skill接入千问，点疯狂星期四直接到店取

全国1.3万多家肯德基门店以第三方Skill形式接入千问APP。用户对千问说出“帮我点附近肯德基的疯狂星期四，到店取”即可自动匹配门店与套餐，并显示距离和取餐时间。千问还与肯德基会员权益打通，下单时自动使用大神卡及匹配的优惠券。

MCP/工具产品更新

12:11

IT之家（RSS）

Nous Research 发布 Hermes Desktop 桌面端公测版

Nous Research 以公开预览版形式推出 Hermes Desktop，支持 Windows、macOS 和 Linux。桌面端共享 Hermes Agent 的配置、API 密钥、会话、技能和记忆，用户可在桌面、CLI 和 TUI 间无缝切换。Hermes Agent 具备长期记忆，能规划任务、调用工具、观察结果，并通过闭环学习自动写入可复用技能。持久记忆借助 FTS5 会话搜索、LLM 摘要和 Honcho 用户建模加强跨会话召回。安全方面支持 local、Docker、SSH、Singularity 和 Modal 共 5 类沙箱后端，内置网页搜索、浏览器自动化、视觉、图像生成、文本转语音及多模型推理工具，同时支持通过 MCP 接入外部工具。

智能体 MCP/工具产品更新

11:09

宝玉@dotey

AI Agent 与 PC、手机的关系：不是完全取代

AI Agent 不会完全取代手机和 PC，但用户无需打开多个 App，直接给 Agent 下指令即可。通用 Agent 将成未来操作系统，App 有三种结局：消亡、转为 CLI/MCP、保留为 GUI 插件。SaaS 应尽快推出 CLI 与 Skill 以适配 Agent。

宝玉: 通用 Agent 就是未来的操作系统了,就像现在我们操作电脑需要借助操作系统,以后我们跟 AI 通信会通过 Agent OS。 App 会有几种结局: - 消亡:Agent 自己就有能力,不需要独立的 App - 变成 CLI 或者 MCP...

智能体 MCP/工具大佬观点

08:48

meng shao@shao__meng

OpenClaw Skill Workshop

OpenClaw 推出 Skill Workshop，将 Agent 的 Skill 定位为可复用工作流。机制为先提案后生效：Agent 生成提案，用户可修改措辞、补充步骤、调整支持文件，确认后才写入正式 Skill，避免错误固化。提供 Board 视图（按 pending/applied/rejected/stale 分栏管理）和 Today 视图（快速过审）。Tweak 微调功能允许围绕同一提案反复修订。Skill 可捆绑 assets、scripts 等支持文件，路径规则严格禁止绝对路径和目录穿越。引用 OpenClaw：Agent 应学习重复工作，但非静默改写未来运行；Skill Workshop 将可复用经验变成可审查提案。

OpenClaw🦞: Agents should learn repeated work, but not by silently rewriting future runs. Skill Workshop turns reusable agent lesson...

智能体 MCP/工具产品更新

08:00

HuggingFace Daily Papers（社区热门论文）

ToolSense：审计LLM中参数化工具知识的诊断框架

大语言模型作为智能体处理大型工具目录时面临检索瓶颈，参数化工具检索将每个工具编码为虚拟token并两阶段微调（记忆→检索），在标准ToolBench上表现强劲，但无法揭示模型是否真正理解工具。ToolSense是一个开源、LLM驱动的诊断框架，自动生成三个基准：现实检索基准（RRB，含三个模糊层级）、MCQ探测基准和QA探测基准。应用于ToolBench约4.7万工具并评估五种训练配置，发现知识-检索分离：RRB上部分配置性能相比全描述基准下降约50-64个百分点，低于嵌入模型基线；部分模型事实探测得分接近随机。框架和基准已开源。

智能体 arXiv MCP/工具论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

ToolMaze：LLM智能体在工具失效时的动态重规划与异常恢复基准测试

ToolMaze是一个评估LLM智能体在工具失效场景下动态路径发现与错误恢复能力的基准测试。其采用双维度设计：DAG拓扑复杂度与2×2工具扰动分类（显式/隐式、瞬时/永久）。评估显示，几乎所有模型在扰动下性能均下降，隐式语义失效导致扰动恢复率（PRR）骤降约37%，复杂拓扑则使智能体陷入无效试错循环。关键发现：智能体容错能力随模型规模提升的速度比基本任务执行慢3.66倍，动态重规划成为模型扩展无法解决的独立瓶颈。数据和代码已公开。

智能体 MCP/工具论文/研究

05:58

MiniMax (official)@MiniMax_AI

同事件精选78

Mem0 是 MiniMax M3 的官方启动合作伙伴！ M3 的 1M token 上下文窗口 + @mem0ai 的记忆层 = 真正记住的 AI 应用。构建具有持久记忆的个性化 AI 智能体，现在启动周内 M3 享五折优惠。开始使用 Minimax → https://platform.minimax.io/docs/guides/models-intro 注册 mem0 → http://app.mem0.ai/?utm_source=minimax_x_post

智能体 MCP/工具模型发布

同一事件，精选展示《MiniMax M3：前沿编码、100万token上下文与原生多模态一体模型》

推荐理由：MiniMax 把 1M 上下文和 Mem0 记忆层绑在一起，不是单纯秀参数，是给 Agent 装了个硬盘，做长期记忆产品的该关注一下。

04:28

MiniMax (official)@MiniMax_AI

@mem0ai 是 MiniMax M3 的官方发布合作伙伴！ M3 的百万 token 上下文窗口 + @mem0ai 的记忆层 = 真正能记住的 AI 应用。构建带有持久记忆的个性化 AI 智能体，发布周期间 M3 可享 5 折优惠。开始使用 Minimax → https://platform.minimax.io/docs/guides/models-intro 注册 mem0 → http://app.mem0.ai/?utm_source=minimax_x_post

智能体 MCP/工具模型发布

01:36

Perplexity@perplexity_ai

Perplexity Computer 适用于成长型企业。它可连接超过400种工具，涵盖各类公司需求，包括Intuit QuickBooks、Vercel、Shopify、Canva等。了解更多关于企业如何使用Computer进行业务操作： https://www.perplexity.ai/enterprise/use-cases/growing-businesses

智能体 MCP/工具产品更新

01:23

Claude：Blog（网页）

精选68

Claude Code技能使用经验：Anthropic内部实践

Anthropic 分享了内部使用 Claude Code 的 Skills（技能）功能的经验。Skills 是指令、脚本和资源的文件夹，智能体可发现并调用它们以提升准确性和效率。Anthropic 内部已有数百个活跃使用的技能，它们可归为九类，包括库和 API 参考、产品验证、数据获取与分析、业务流程与团队自动化、代码脚手架与模板、代码质量与审查等。最佳技能专注于单一类别，涵盖过多功能会混淆智能体。团队发现，投入时间优化验证类技能对 Claude 输出质量的提升最显著。

智能体 Anthropic MCP/工具教程/实践

推荐理由：这不是产品公告，而是从几百个内部技能中血泪总结出的实战手册。如果你想让Claude Code真正变成你的工程副驾驶，这9类技能和‘gotchas’章节至少省你三个月踩坑。

01:18

Rohan Paul@rohanpaul_ai

Nitrosend 发布 AI 邮件平台，Claude 单提示词控制全流程

Nitrosend 推出 AI 原生邮件平台，通过 MCP 协议与 Claude 连接。用户只需一条提示词，Claude 即可完成构建、设计、受众分组和发送完整邮件活动，而非仅生成草稿。该平台无传统仪表盘，Claude 直接控制系统工作流，包括设计、逻辑、目标定位和投递。引用推文显示，已有用户通过一条提示词成功向 10,000 人发送发布公告。

George Hartley ☄️: I just sent our launch announcement to 10,000 people. It took one prompt in Claude. Today we're launching @nitrosendx - ...

智能体 Anthropic MCP/工具产品更新

6月3日

23:32

Google Gemini@GeminiApp

同事件精选67

参加 @GoogleDeepMind 首席工程师 @__apf__ 的演示，了解 Gemini Spark 如何帮助简化您的日常工作流程。由 Gemini 3.5 Flash 驱动，Spark 建立在 Gemini 与 @GoogleWorkspace 应用（如 Docs 和 Gmail）连接的能力之上，以执行复杂任务。

智能体 Google MCP/工具产品更新

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：这是 Gemini 把 Agent 能力真正嵌入日常工作流的一步，跟 Workspace 的深度集成会让很多不会编程的人也能用上自动化，值得关注。

22:41

Hugging Face：Blog（RSS）

为 Reachy Mini 添加 MCP 工具

Reachy Mini 对话应用现在可通过 MCP 协议添加远程工具。执行 reachy-mini-conversation-app tool-spaces add 命令即可从 Hugging Face Spaces 安装远程工具（如搜索、天气），并自动启用至当前 profile 的 tools.txt 中。内置工具（头部动作、跳舞、表情、摄像头等）仍为本地 Python 代码，远程工具则通过 MCP 端点调用。profiles 通过 tools.txt 控制哪些工具可用，不在文件中的工具模型无法调用。用户也可编写自定义本地工具。远程工具适合无状态能力，便于发布、共享和迭代，无需修改应用本身。支持 install、list、remove 等子命令。

Hugging Face MCP/工具产品更新具身智能

21:30

公众号：月之暗面（Kimi）

精选67

Kimi Work Beta版发布：面向知识工作者的本地Agent

Kimi Work Beta版随Kimi最新Mac和Windows客户端推出，是基于Kimi Code的通用型本地Agent。它内置Kimi WebBridge浏览器操作方案，支持安装和使用Skill、运行定时任务，并能根据任务复杂度自主创建最多300个子Agent的团队。开发中使用的Kimi K2.6模型支持13小时连续编码、4000余次工具调用，累计产出超5万行有效代码，其中92%由AI自主生成。用户可用自然语言描述目标，Kimi Work即可拆解任务、并行执行、调用工具、操作浏览器，交付文档、表格、PPT等工作产物。

智能体 MCP/工具产品更新

关联讨论 4 条

推荐理由：Kimi 把代码 Agent 的本地能力包装成了面向普通人的工作 Agent，300 个子 Agent 集群让繁琐的任务并行处理成为可能，对天天跟文档表格打交道的人是真提效。

20:48

Rohan Paul@rohanpaul_ai

EvoMap AI：将AI智能体经验转化为可复用基础设施

EvoMap AI致力于解决AI智能体每个新会话都要重复学习上下文的问题。其核心概念是Gene（可复用的问题解决策略）和Capsule（验证过的执行记录）。智能体遇到相似任务时，查询EvoMap网络获取匹配的Gene/Capsule，应用已有策略，再将结果反馈改进模式。这使每次成功运行成为可复用资产，而非一次性推理。适用于编码迁移、安全修复、SIEM分类等场景，可减少重试、降低token消耗、提升执行一致性，并提供审计溯源。用户可访问evomap.ai/onboarding/agent连接智能体（如Cursor、Claude Code、Codex），发布工作流并赚取积分。

智能体 MCP/工具产品更新

20:24

🚨 AI News | TestingCatalog@testingcatalog

错过必看 👀：Claude Code CLI 现在可以操作 Claude 平台，包括 Messages API 和 Claude Managed Agents。一个 CLI 统管一切 🤖

ClaudeDevs: For interactive login, the CLI supports "ant auth login". This runs a browser OAuth flow, scopes the token to a workspac...

智能体 Anthropic MCP/工具产品更新

19:54

🚨 AI News | TestingCatalog@testingcatalog

Airtap 推出 AI 智能体云手机，自动执行日常移动任务

Airtap 发布了一款云手机，围绕重复性移动日常任务构建，按每日计划由 AI 智能体自动执行。支持用例包括：早间简报、午夜预订、优惠券扫描、降价机票改签，以及跨聊天、通知、新闻和邮件的聚合摘要。通过一个 SKILLS.md 文件即可将 Claude Code、Codex 或 OpenClaw 连接到专属云端 Android 实例，让智能体在真实应用上按计划自动点击、滑动、输入和导航。

智能体 MCP/工具产品更新

18:08

小互@xiaohu

开源项目OpenSquilla用Python重写"小龙虾"，大幅节省Token与成本

国内团队开源项目OpenSquilla用Python重写“小龙虾”，解决费token、不按规则执行及安全问题。它集成小模型对请求实时分类：简单任务走便宜模型，复杂任务走顶级模型。测试25个任务，纯Claude Opus 4.7成本6.2美金，OpenSquilla混跑Opus 4.7、GLM5.1、DS4 Flash成本仅0.68美金，分数几乎一样。同时，它根据对话语义只注入匹配度最高的Skill（原90+个），每轮省约9000 Token，100次对话累计省100万Token。

智能体 MCP/工具开源/仓库端侧