AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 346 条
全部一手资讯X论文
标签「MCP/工具调用」清除
5月8日周五
10:22HuggingFace Daily Papers(社区热门论文)63SkillOS:面向自进化智能体的技能管理学习方法
08:30Claude Code:GitHub Releases(RSS)69精选Claude v2.1.133 版本更新
07:30GitHub Blog72精选提升 GitHub Agentic Workflows 的 Token 使用效率
05:43OpenRouter:Announcements(RSS)73精选为所有模型提供一致的网络搜索与抓取能力
5月7日周四
20:00OpenRouter:Announcements(RSS)56同事件精选OpenRouter 为每个模型提供一致网络搜索与抓取功能同一事件,精选展示《OpenRouter 通过 API 引入网页搜索功能》
20:00OpenRouter:Announcements(RSS)55同事件精选OpenRouter 为所有工具调用模型提供统一的网页搜索与抓取功能同一事件,精选展示《OpenRouter 通过 API 引入网页搜索功能》
08:00HuggingFace Daily Papers(社区热门论文)59Conformal Agent Error Attribution
06:10xAI:News(网页)83精选Grok Web 正式推出 Connectors 功能,实现与日常应用深度集成
5月6日周三
11:01Hacker News 热门(buzzing.cc 中文翻译)66Show HN: Airbyte 代理--跨多个数据源的代理上下文
5月5日周二
23:19Anthropic:Newsroom(网页)77精选金融与保险智能体解决方案
08:00HuggingFace Daily Papers(社区热门论文)57反思推理密集型检索:在智能体搜索系统中评估与提升检索器
5月4日周一
23:56Hacker News 热门(buzzing.cc 中文翻译)72精选Show HN: Ableton Live MCP
08:00HuggingFace Daily Papers(社区热门论文)61ARIS:通过对抗性多智能体协作实现自主研究
5月1日周五
10:14Claude Code:GitHub Releases(RSS)55精选Claude Desktop v2.1.126 版本更新
08:00Apple Machine Learning Research(RSS)64精选强化智能体:面向工具调用智能体的推理时反馈机制
02:15Claude:Blog(网页)64精选Claude Code 构建经验:提示缓存的优化实践
4月30日周四
03:34Simon Willison 博客68LLM 0.32a0 发布重大向后兼容重构
02:11Claude:Blog(网页)64精选Claude API技能现已集成至CodeRabbit、JetBrains、Resolve AI及Warp
4月29日周三
23:40Claude:Blog(网页)58精选智能体时代的产品开发:Claude Managed Agents 如何解放产品经理
15:33IT之家(RSS)43蚂蚁数科亮相 2026 数字中国建设峰会,推出 DataX 智能体数据生态平台
15:33IT之家(RSS)60我用 AI 搭了个"催稿机器人":WPS 多维表格深度体验
15:33IT之家(RSS)53科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文
07:33IT之家(RSS)54加速你的创意落地:Claude AI 接入 Adobe、Blender 等创意软件生态
06:35Claude Code:GitHub Releases(RSS)52版本v2.1.122更新摘要
00:36Claude:Blog(网页)72精选像培训新开发者一样引导Claude Code:来自17年开发的经验教训
4月28日周二
23:10Anthropic:Newsroom(网页)70精选Claude创意工作套件
17:33IT之家(RSS)59一键调用专业领域经验:阿里 QoderWorker 桌面 Agent 上线金融、法律、营销等专家套件
4月27日周一
17:24Hacker News 热门(buzzing.cc 中文翻译)68Prompt API
13:18IT之家(RSS)46腾讯 QClaw 宣布升级 v0.2.14 版本:率先支持 Hermes,接入 DeepSeek-V4-Pro 与混元 Hy3 preview 模型
08:00HuggingFace Daily Papers(社区热门论文)48从技能文本到技能结构:智能体技能的调度-结构-逻辑表示法
4月26日周日
14:20IT之家(RSS)29斑马智能联合东风首发淘宝闪购 Agent 上车,支持一句话点餐
08:00HuggingFace Daily Papers(社区热门论文)48PageGuide:辅助用户在网页中导航与定位信息的浏览器扩展
4月25日周六
18:17Hacker News:AI 热帖60展示 HN:一个由智能体维护的 Karpathy 风格 LLM 维基(基于 Markdown 和 Git)
17:42Hacker News 热门(buzzing.cc 中文翻译)58Show HN: 浏览器框架--赋予大型语言模型(LLM)自由完成任何浏览器任务的能力
4月24日周五
20:00OpenRouter:Announcements(RSS)57同事件精选OpenRouter Agent SDK:构建多轮智能体工作流同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
20:00OpenRouter:Announcements(RSS)55精选Agent SDK:在 OpenRouter 上构建多轮智能体工作流
14:08IT之家(RSS)47小米支付服务 Skill 上线:开发者三步可完成接入,支持微信支付、支付宝等
11:17HuggingFace Daily Papers(社区热门论文)63VLAA-GUI:何时停止、恢复与搜索--一个用于 GUI 自动化的模块化框架
10:08IT之家(RSS)51长安、东风、北汽、比亚迪等接入阿里千问,一句话完成订餐、购物等
4月22日周三
17:08IT之家(RSS)51澎湃 OS 3 Beta 版向小米 17 系列手机推送"龙虾"智能体 Xiaomi miclaw
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月8日
10:22
HuggingFace Daily Papers(社区热门论文)
63
SkillOS:面向自进化智能体的技能管理学习方法

SkillOS提出一种经验驱动的强化学习框架,用于训练自进化智能体学习长期技能管理。该系统由一个固定的智能体执行器和一个可训练的技能管理器组成,后者依据累积经验更新外部技能库。通过设计复合奖励并在基于技能相关性的分组任务流上训练,该方法解决了从间接、延迟反馈中学习复杂管理策略的挑战。实验表明,在多轮智能体任务和单轮推理任务中,SkillOS在效果与效率上均优于无记忆及强记忆基线,且所学技能管理器能泛化至不同执行器与任务领域。分析显示,管理器能实现更精准的技能调用,技能库中的技能会逐渐演化为结构更丰富、编码高层元技能的Markdown文件。

智能体MCP/工具论文/研究
08:30
Claude Code:GitHub Releases(RSS)
精选69
Claude v2.1.133 版本更新

Claude 发布 v2.1.133 版本,新增多项配置与优化。主要新增 worktree.baseRef 设置以选择工作树分支基础,引入 sandbox.bwrapPath 等设置允许指定自定义二进制路径,并添加 parentSettingsBehavior 键供管理员控制设置合并策略。功能上,钩子现在可接收活动努力级别信息,Bash 工具命令可读取相应环境变量。此外,改进了焦点模式行为,并在内存压力下优化了后台工作进程的释放。本次更新修复了大量问题,包括并行会话死锁、权限规则误匹配、代理设置不生效、网络驱动器访问被拒、远程控制中断不彻底、努力级别跨会话更改以及子代理技能发现失败等。claude --help 现已列出远程控制选项,VSCode 扩展也修复了相关错误。

智能体AnthropicMCP/工具产品更新

推荐理由:Claude Code 这个版本修了一堆让人抓狂的 bug,并行会话掉认证、网络驱动器权限、子代理找不到 skill 都解决了,重度用户应该尽快升级。
07:30
GitHub Blog
精选72
提升 GitHub Agentic Workflows 的 Token 使用效率

GitHub 发现运行于每个拉取请求的智能体工作流会累积高昂的 API 成本。团队通过监测自身生产工作流,定位了效率低下的环节,并构建了专门的智能体进行优化。这一举措旨在显著降低由大语言模型调用产生的 Token 消耗与相关费用,直接提升了工作流的经济性与运行效率。

智能体GitHubMCP/工具教程/实践

推荐理由:GitHub 把自己生产环境的 agentic workflow 扒了一遍,从 token 消耗里找浪费,再让 agent 自动修。不是 paper,是真踩过的坑,做 Copilot 集成的团队可以抄作业。
05:43
OpenRouter:Announcements(RSS)
精选73
为所有模型提供一致的网络搜索与抓取能力

该工具赋予任何具备工具调用能力的模型自主进行网络搜索和抓取网页内容的功能。它支持多种搜索引擎和抓取引擎供用户选择,实现了跨模型的一致操作体验。这意味着开发者可以便捷地为不同的大语言模型(如GPT、Claude、LLaMA等)集成实时、可靠的网络信息获取能力,无需为每个模型单独适配。

智能体MCP/工具产品更新

推荐理由:让任何模型都能用统一接口做联网搜索和抓取,做 agent 的同学不用再为每个模型单独配工具了,在 OpenRouter 上搭产品的实用性直接拉高。
5月7日
20:00
OpenRouter:Announcements(RSS)
同事件精选56
OpenRouter 为每个模型提供一致网络搜索与抓取功能

OpenRouter 向所有支持工具调用的模型开放自主网络搜索与页面内容抓取能力,并允许用户从多个搜索引擎和抓取引擎中自行选择。

智能体MCP/工具产品更新搜索
同一事件,精选展示《OpenRouter 通过 API 引入网页搜索功能》
推荐理由:OpenRouter把网络搜索和抓取做成统一的工具接口,任何工具调用模型都能用,做agent的开发者不用再自己拼搜索层了。
20:00
OpenRouter:Announcements(RSS)
同事件精选55
OpenRouter 为所有工具调用模型提供统一的网页搜索与抓取功能

OpenRouter 推出新功能,允许任何工具调用模型自主进行网页搜索并抓取页面内容,支持多种搜索引擎和抓取引擎供选择。

MCP/工具产品更新搜索
同一事件,精选展示《OpenRouter 通过 API 引入网页搜索功能》
推荐理由:OpenRouter 给所有工具调用模型配上了统一的网络搜索和抓取能力,开发者不用再为每个模型单独对接搜索 API,适配成本直线下降。
08:00
HuggingFace Daily Papers(社区热门论文)
59
Conformal Agent Error Attribution

针对基于大语言模型的多智能体系统因交互轨迹长而难以定位错误的问题,研究者提出一个基于保形预测的误差归因框架。该框架提供有限样本且与分布无关的覆盖保证,并引入了专为序列数据设计的新算法,能预测出连续的序列集合以支持高效的系统回滚与调试。方法具有模型无关性,经多种智能体和数据集验证,可精确隔离错误并利用预测集使多智能体系统回滚至早期状态以自行修正错误。相关代码已开源。

智能体MCP/工具开源/仓库论文/研究
06:10
xAI:News(网页)
精选83
Grok Web 正式推出 Connectors 功能,实现与日常应用深度集成

xAI 正式在 Grok Web 上线 Connectors 功能,提供与多种日常应用工具的深度集成。该功能允许 Grok 端到端处理任务,如阅读总结邮件、更新幻灯片、管理日历和编辑电子表格,无需频繁切换和复制粘贴。首批支持的连接器包括 SharePoint、Outlook、OneDrive、Google Workspace、Notion、GitHub 和 Linear,涵盖文件搜索读写、代码审查与任务管理等操作。同时推出的“自带 MCP”功能支持连接自定义模型上下文协议服务器。完整的 Connectors 支持也即将登陆 Grok iOS 和 Android 应用。

MCP/工具xAI产品更新

推荐理由:Grok这波连接器把 Office、GitHub 和 Notion 全打通了,不是演示级挂接,是能直接读写编辑的真集成,外加开放自建 MCP,产品经理和开发者都该立刻上手试试。
5月6日
11:01
Hacker News 热门(buzzing.cc 中文翻译)
66
Show HN: Airbyte 代理--跨多个数据源的代理上下文

Airbyte 代理发布,为跨多个数据源的智能体提供上下文支持。该工具允许开发者和数据团队将不同来源的数据(如数据库、API、文件)统一接入,并转化为可供AI代理或自动化流程使用的结构化上下文。其在Hacker News上获得102点关注,显示社区关注度较高。这一方案旨在简化多源数据集成流程,提升智能体处理复杂任务的效率。

智能体MCP/工具产品更新
5月5日
23:19
Anthropic:Newsroom(网页)
精选77
金融与保险智能体解决方案

Anthropic发布了十个针对金融服务耗时任务的预置智能体模板,涵盖制作推介书、撰写信贷备忘录、KYC文件筛查及月末关账等。这些模板可作为Claude Cowork和Claude Code的插件,或作为Claude托管智能体的配置指南,帮助团队在数天内部署应用。Claude现通过Microsoft 365插件支持在Excel、PowerPoint等Office应用间无缝工作,并扩展了合作伙伴生态,新增数据连接器和MCP应用,使智能体能直接调用实时金融数据。这些更新与Claude Opus 4.7模型搭配效果最佳,该模型在金融任务上达到先进水平。

AnthropicMCP/工具产品更新部署/工程

推荐理由:Anthropic 一口气放出十个金融模板,从 pitchbook 到月底关账全包,加上 Excel、PPT、Word 的深度集成,做金融的可以少写很多重复性胶水代码,直接套模板干活去了。
08:00
HuggingFace Daily Papers(社区热门论文)
57
反思推理密集型检索:在智能体搜索系统中评估与提升检索器

推理密集型检索旨在为下游推理提供证据支持,而非仅匹配主题相似性,这对需要迭代搜索与证据合成的智能体搜索系统至关重要。针对现有评估与训练的不足,研究发布了BRIGHT-Pro专家标注基准,为每个查询扩展了多维度黄金证据,并在静态与智能体搜索两种协议下评估检索器。同时,研究构建了RTriever-Synth合成语料库,通过生成互补正例和正例条件硬负例,对Qwen3-Embedding-4B进行LoRA微调得到RTriever-4B。实验表明,维度感知与智能体评估能揭示标准指标所掩盖的检索行为,而RTriever-4B相比其基础模型取得了显著提升。

arXivMCP/工具检索增强推理
5月4日
23:56
Hacker News 热门(buzzing.cc 中文翻译)
精选72
Show HN: Ableton Live MCP

这是一个名为 Ableton Live MCP 的开源项目,它通过模型上下文协议(MCP)将 Ableton Live 音乐制作软件与大型语言模型(如 GPT、Claude)连接起来。该项目在 Hacker News 上获得了 100 点热度,其核心功能是让 LLM 能够读取和控制 Ableton Live 的会话数据,从而可能实现基于自然语言指令的音乐创作与自动化流程。

MCP/工具开源/仓库

推荐理由:给 Ableton Live 接上了 LLM 的大脑,让 AI 能直接操作 DAW,虽然还只是原型,但已经能看到未来音乐制作的人机协作模式。做音频 Agent 的可以拿来玩。
08:00
HuggingFace Daily Papers(社区热门论文)
61
ARIS:通过对抗性多智能体协作实现自主研究

ARIS是一个开源自主研究框架,旨在通过对抗性多智能体协作机制提升长周期研究工作的可靠性。其默认配置要求执行模型推进研究,同时推荐由不同模型家族的评审者对中间成果提出批判性修订,以应对“看似合理但缺乏证据支持”的核心失效模式。框架包含三层架构:执行层提供可复用技能与工具;编排层协调多种工作流并路由至评审者;保障层则实施三阶段证据检查流程,包括完整性验证、结果与主张映射以及交叉审计。原型系统还包含一个需经评审批准的自改进循环。

智能体arXivMCP/工具开源/仓库
5月1日
10:14
Claude Code:GitHub Releases(RSS)
精选55
Claude Desktop v2.1.126 版本更新

本次更新增强了模型网关集成,当配置指向兼容网关时,可直接在模型选择器中列出可用模型。新增了 claude project purge 命令,用于彻底清理项目状态数据。OAuth登录流程得到优化,支持在浏览器回调失败时手动粘贴授权码,并修复了多种网络环境下的登录问题。安全方面,修复了 allowManagedDomainsOnly 等设置可能被忽略的漏洞。此外,还解决了图像粘贴过大导致会话中断、远程会话误报“流空闲超时”、Windows系统下特定文本渲染乱码以及多项工具在特定场景下不可用等数十项错误。

AnthropicMCP/工具产品更新编码

推荐理由:这是 Claude Code 一次‘生活质量’大更新,OAuth、Windows 权限、流超时等痛点都被修了,如果你在用 Claude Code,今天就该升级。
08:00
Apple Machine Learning Research(RSS)
精选64
强化智能体:面向工具调用智能体的推理时反馈机制

本文提出一种将评估机制嵌入工具调用智能体实时执行循环的新方法。通过引入一个专门的评审员智能体,在推理时对主智能体的中间决策轨迹进行即时评估,并生成结构化反馈。这使得主智能体能在单次运行中动态调整其工具选择与参数调用,无需依赖传统的提示调整或模型重训练。该实时干预机制旨在直接纠正错误,提升了工具使用的准确性与可靠性,突破了传统后验评估无法在运行中修正行为的局限。本工作已被ACL 2026的自然语言生成、评估与指标研讨会接收。

智能体MCP/工具论文/研究

推荐理由:Apple 把评估嵌进 agent 执行循环,不是事后分锅,而是让 reviewer 实时纠错,这对 tool-calling 类应用是个真方向,做 agent 架构的值得细读。
02:15
Claude:Blog(网页)
精选64
Claude Code 构建经验:提示缓存的优化实践

Claude Code 团队分享了大规模优化提示缓存的核心策略。提示缓存基于前缀匹配工作,能显著降低延迟与成本,高命中率还能支持更宽松的订阅速率限制。关键实践包括:将静态系统提示和工具定义置于提示词前端以最大化共享前缀;通过消息而非修改提示词来传递更新信息,避免缓存失效;在会话中不切换模型、不增删工具,以维持缓存前缀稳定。此外,针对工具过多或“计划模式”等场景,可通过发送轻量存根或设计专用工具来规避缓存失效,从而在复杂功能中持续利用缓存优势。

智能体AnthropicMCP/工具教程/实践

推荐理由:Claude Code团队把提示缓存的坑和优化方法全盘托出,从提示顺序、工具加载到压缩技巧,每一个经验都是钱和延迟换来的,做agent的同行可以直接拿去做架构参考。
4月30日
03:34
Simon Willison 博客
68
LLM 0.32a0 发布重大向后兼容重构

LLM Python库和CLI工具发布0.32a0 alpha版本,进行了两项核心架构升级。首先,模型输入现支持表示为消息序列,能直接处理包含多轮对话历史的完整上下文,解决了此前难以载入已有对话的局限。其次,模型响应升级为支持由不同类型部分组成的流式输出,以更好地适配现代前沿模型处理多样化输入(如图像、音频)和输出(如结构化JSON、工具调用)的能力。此次重构旨在让该库的抽象层跟上LLM技术自2023年以来的快速演进。

GitHubMCP/工具开源/仓库部署/工程
02:11
Claude:Blog(网页)
精选64
Claude API技能现已集成至CodeRabbit、JetBrains、Resolve AI及Warp

Claude API技能现已扩展集成至CodeRabbit、JetBrains、Resolve AI和Warp四款开发工具中,使开发者能在其常用环境中直接获得生产就绪的Claude API代码支持。该技能能自动捕获API最佳实践细节,如适配的智能体模式、参数变更与提示缓存规则,从而减少错误并简化模型迁移。开发者可在工具内直接指示Claude执行“提高缓存命中率”或“升级至最新Claude模型”等任务。此开源技能会随SDK更新自动同步,帮助团队更快采用新功能,避免因API知识过时导致的生产问题。

AnthropicMCP/工具产品更新编码

推荐理由:Anthropic 把 claude-api skill 从自家 IDE 扩散到 JetBrains、Warp 等主流开发工具,本质是用「内置专家知识」抢开发者心智,做 Claude API 集成的产品人值得看看它覆盖了哪些坑。
4月29日
23:40
Claude:Blog(网页)
精选58
智能体时代的产品开发:Claude Managed Agents 如何解放产品经理

Claude产品经理Jess Yan分享了处于测试版的Claude Managed Agents如何改变其工作流程。这套可组合的API能大规模构建和部署云端智能体,使她能在短时间内将想法转化为可运行的原型。她的日常工作由此分流:使用Claude进行开放式探索,然后利用Claude Code基于Managed Agents编写定制智能体来自动化特定任务,如采用分析和舆情监控。这些智能体接管了以往难以规模化的操作性工作,让她能将更多时间投入到与团队和用户的创造性合作中。

智能体AnthropicMCP/工具教程/实践

推荐理由:Anthropic PM公开用Claude Managed Agents搭建数据分析、舆情监控和演示生成agent的真实流程,对于想要用agent重构产品开发节奏的团队有实际参考价值,但不算爆炸性更新。
15:33
IT之家(RSS)
43
蚂蚁数科亮相 2026 数字中国建设峰会,推出 DataX 智能体数据生态平台

蚂蚁数科在2026数字中国建设峰会上发布DataX智能体数据生态平台。该平台通过接入模型上下文协议(MCP)和专用智能体DTClaw,旨在降低数据使用门槛、缩短数据价值转化周期。DataX汇聚隐私计算、数据加工等Skills库,将传统数据服务转化为标准MCP协议以提升AI接入效率。DTClaw可将复杂的数据处理逻辑封装为即用型Skill与Agent,实现“开箱即用”。平台还构建了基于数据的图谱知识库,支持通过自然语言进行智能编排与高效检索,帮助企业快速构建专业智能体。

智能体MCP/工具产品更新数据/训练
15:33
IT之家(RSS)
60
我用 AI 搭了个"催稿机器人":WPS 多维表格深度体验

新一代WPS多维表格通过AI能力升级,实现了零代码搭建办公管理系统。用户可用一句话描述需求(如“搭建编辑部稿件管理系统”),AI即可自动生成包含字段、视图和仪表盘的完整表格,大幅提升效率。系统还支持AI字段总结内容、自动生成社交媒体脚本,并能设置自动化工作流,例如在稿件截止前自动发送催稿提醒,实现智能管理。该产品基于海量办公场景洞察,深度贴合实际工作流程。

MCP/工具教程/实践
15:33
IT之家(RSS)
53
科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文

科大讯飞正式发布星火 X2-Flash 模型并开放API。该模型采用MoE架构,总参数300亿,支持256K上下文,基于华为昇腾910B集群训练。其在智能体、代码等能力上大幅提升,在深度研究报告、Skill管理等多项任务上效果接近业界万亿参数模型,而整体token消耗不到主流大尺寸模型的三分之一。通过结合DSA与MTP技术,模型在国产芯片上的训练效率从同规模A800集群的20%提升至90%,并解决了长交互场景采样效率低的问题,为大规模强化学习训练扫清障碍。AstronClaw、Loomy等已率先接入。

MCP/工具推理模型发布
07:33
IT之家(RSS)
54
加速你的创意落地:Claude AI 接入 Adobe、Blender 等创意软件生态

Anthropic于4月29日宣布升级Claude AI,新增专属连接器,全面接入Adobe、Blender等八大主流创意软件生态。此次更新将AI能力深度整合至专业工作流,用户可直接在Adobe系列软件中调用50多项工具,在Autodesk Fusion中通过对话创建修改3D工业模型,在Blender中生成脚本与调试场景。此外,音频软件Ableton和Splice用户也能快速查询文档与检索采样库。Claude旨在充当智能助手,自动化处理重复任务,让创作者更专注于核心创意。

AnthropicMCP/工具产品更新多模态
06:35
Claude Code:GitHub Releases(RSS)
52
版本v2.1.122更新摘要

本次更新主要新增了通过环境变量选择Bedrock服务层级的功能,并支持在/resume搜索框粘贴PR链接以定位创建该PR的原始会话。同时修复了多项关键问题:修正了源会话含时间线回退条目时,/branch命令可能创建失败分支的问题;解决了发送给新版模型的图像被错误调整为2576px(应为2000px上限)的问题;增强了OpenTelemetry日志记录,确保数字属性以数值类型输出;并修复了Vertex AI/Bedrock在生成会话标题等场景下可能返回无效请求错误的问题。此外,还包含对MCP工具显示、CLI命令退出行为等多项细节的优化与修正。

AnthropicMCP/工具产品更新部署/工程
00:36
Claude:Blog(网页)
精选72
像培训新开发者一样引导Claude Code:来自17年开发的经验教训

华盛顿大学MacCoss实验室的Brendan MacLean将培训新开发者的方法论应用于Claude Code,以管理拥有70万行C#代码、持续开发17年的开源蛋白质分析软件Skyline。他通过创建独立的AI上下文仓库、编写CLAUDE.md引导文件以及设计“技能”模块(如调试技能),为Claude Code建立项目认知。该方法显著提升了开发效率:搁置一年的文件视图面板功能在两周内完成;CSS布局更新从依赖设计师变为不到一天实现。此外,Claude Code还自动化了2000多张教程图片的截图比对和每日测试报告生成,团队现在主要依靠它生成代码和脚本。

AnthropicMCP/工具教程/实践编码

推荐理由:这不是又一篇 Claude Code 安利文,而是一个维护了 17 年 70 万行 C# 代码库的人,把带新人的方法论原封不动搬给了 AI,结果真管用。做 legacy 项目的人应该认真看他的 context 管理和 skill 库设计。
4月28日
23:10
Anthropic:Newsroom(网页)
精选70
Claude创意工作套件

Anthropic推出Claude for Creative Work,这是一套连接器工具,可实现Claude与Blender、Autodesk、Adobe等主流创意软件的直接集成。这些连接器允许Claude访问各平台功能,例如在Adobe系列中调用50多款应用,在Autodesk Fusion中通过对话创建3D模型,或在Blender中通过自然语言操作Python API。创意工作者可利用Claude加速软件学习、编写脚本插件、桥接多工具工作流以及自动化批量处理等重复任务。该系列工具基于MCP标准,并已与多所艺术设计院校合作,旨在推动创意计算教育。

AnthropicMCP/工具产品更新

推荐理由:Anthropic 把 Claude 塞进 Blender、Adobe、Ableton 这些创意工具里,不是又一个聊天框,而是用 MCP 让 AI 真正操作软件。做设计、做音乐、做 3D 的人第一次有了一个能跨工具干活的 AI 助手,值得试试。
17:33
IT之家(RSS)
59
一键调用专业领域经验:阿里 QoderWorker 桌面 Agent 上线金融、法律、营销等专家套件

阿里云QoderWorker推出专家套件功能,首批上线金融、法律、营销等六大领域10个套件。这些套件将专业知识、工作流程和数据连接器预先封装,用户无需编写代码即可一键调用,直接获取专业经验。例如,法律套件可全流程处理合同审查、文书起草,金融研究套件能快速基于公告生成分析报告。平台还支持企业自建专属套件,实现“配置”与“使用”分离,懂业务的员工封装一次后,其他员工可一键安装使用。

智能体MCP/工具产品更新
4月27日
17:24
Hacker News 热门(buzzing.cc 中文翻译)
68
Prompt API

Chrome 开发者文档推出了 Prompt API,这是一个用于 AI 提示管理的应用程序编程接口,帮助开发者以编程方式处理提示词,提升开发效率。该 API 的发布信息在 Hacker News 上获得102点积分,反映出技术社区对此工具的关注和积极评价。开发者可通过官方文档进一步了解其功能和应用场景。

MCP/工具产品更新部署/工程
13:18
IT之家(RSS)
46
腾讯 QClaw 宣布升级 v0.2.14 版本:率先支持 Hermes,接入 DeepSeek-V4-Pro 与混元 Hy3 preview 模型

腾讯云QClaw发布v0.2.14版本,迎来最大规模更新。新版本率先支持Hermes框架,允许单一应用同时运行两种Agent内核。核心功能“灵感广场”升级为“专家广场”,内置超100个行业场景AI专家,用户通过自然语言交互即可直接生成文档、代码等结果。底层模型支持自由切换,新增接入腾讯混元Hy3 preview和DeepSeek-V4 Pro等大模型。微信小程序新增语音交互、文件共享及云端Agent远程管理功能。同时,平台新增百度网盘、携程等四个连接器,并上线了基于腾讯文档的Agent团队协作功能。

智能体MCP/工具产品更新
08:00
HuggingFace Daily Papers(社区热门论文)
48
从技能文本到技能结构:智能体技能的调度-结构-逻辑表示法

当前LLM智能体技能多以文本描述,导致机器难以解析利用。本研究基于经典知识表示理论,首次提出结构化技能表示法——调度-结构-逻辑表示法,将技能解耦为调度信号、执行结构和逻辑证据。通过基于LLM的标准化器实现该方法,并在技能发现与风险评估任务上评估。结果显示,该方法显著优于纯文本基线:技能发现的MRR从0.573提升至0.707,风险评估的宏观F1分数从0.744提升至0.787。这表明显式、基于来源的结构化表示能提升技能的可搜索性与可审查性,是迈向更可检查、可重用、可操作技能表示的重要实践步骤。

智能体MCP/工具论文/研究
4月26日
14:20
IT之家(RSS)
29
斑马智能联合东风首发淘宝闪购 Agent 上车,支持一句话点餐

在2026北京国际车展上,斑马智能与东风研发总院宣布,基于元神AI的淘宝闪购Agent将首次搭载于东风天元智舱。该功能允许用户仅通过自然语音完成全流程点餐,能精准识别模糊意图、自动匹配门店并推荐餐品,支持自由对话与订单中途修改。服务覆盖全品类美食,原生集成于座舱系统,可实现优惠自动叠加、配送时间智能联动导航。未来双方还计划在影音娱乐、出行游玩等场景推出更多原生Agent服务。

智能体MCP/工具行业动态
08:00
HuggingFace Daily Papers(社区热门论文)
48
PageGuide:辅助用户在网页中导航与定位信息的浏览器扩展

PageGuide是一款浏览器扩展,通过视觉叠加将大语言模型的回答直接锚定在网页中,以解决用户在杂乱页面中定位信息、完成多步骤任务和对抗干扰内容三大需求。它提供三种模式:Find模式原位高亮答案来源以供验证;Guide模式分步显示操作指南引导用户执行;Hide模式帮助隐藏干扰内容。一项涉及94名用户的研究表明,该工具在所有模式下均显著优于无辅助浏览,例如Hide模式使任务准确率大幅提升、完成时间缩短70%,Guide模式提高任务完成率,Find模式则减少80%的Ctrl+F使用并缩短任务时间。代码与演示已开源。

智能体MCP/工具论文/研究
4月25日
18:17
Hacker News:AI 热帖
60
展示 HN:一个由智能体维护的 Karpathy 风格 LLM 维基(基于 Markdown 和 Git)

WUPHF 是一个为 AI 员工设计的协作办公平台,通过一个命令即可启动,在本地提供 Web 界面。它将不同角色的 AI 智能体置于一个共享的虚拟办公室中,使其可见、可争论并协作完成任务。平台为每个智能体提供私人笔记,团队共享一个基于 Markdown 和 Git 的本地维基,智能体可自主将可靠信息同步至团队知识库。项目目前处于 1.0 版本前的预发布阶段,默认使用 Claude Code,支持通过命令行参数灵活配置。

智能体MCP/工具产品更新开源/仓库
17:42
Hacker News 热门(buzzing.cc 中文翻译)
58
Show HN: 浏览器框架--赋予大型语言模型(LLM)自由完成任何浏览器任务的能力

开源项目“Browser Harness”发布,旨在赋予大型语言模型(LLM)在浏览器中自主完成任意任务的能力。该工具通过提供一个可编程的浏览器控制框架,使LLM能够像人类一样操作网页,执行点击、输入、导航等复杂交互。此举有望突破当前AI代理在自动化网络操作方面的限制,扩展LLM的实际应用场景。该项目已在GitHub开源,并在Hacker News社区获得100点热度关注。

智能体MCP/工具开源/仓库
4月24日
20:00
OpenRouter:Announcements(RSS)
同事件精选57
OpenRouter Agent SDK:构建多轮智能体工作流

OpenRouter Agent SDK 提供 callModel 函数,能将聊天补全转换为支持工具调用、停止条件和成本追踪的多步智能体,覆盖 300 多个模型。

智能体MCP/工具产品更新
同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
推荐理由:OpenRouter把agent构建压缩进一个callModel函数,内置工具调用、停止条件和成本追踪,对已在它生态里的开发者省下不少样板代码,可惜时效过了。
20:00
OpenRouter:Announcements(RSS)
精选55
Agent SDK:在 OpenRouter 上构建多轮智能体工作流

OpenRouter 发布 Agent SDK,其核心是 callModel 函数。该函数可将一次聊天完成转化为具备工具调用、停止条件与成本追踪功能的多步骤智能体工作流。这一工具兼容平台上的 300 多个模型,使开发者能够便捷地构建复杂的多轮交互智能体应用。

智能体MCP/工具产品更新

推荐理由:OpenRouter 把多轮 agent 编排封装成一个 callModel 函数,300+ 模型统一调用,做 agent 产品的人可以少写不少胶水代码,但本质上是工程封装而非技术突破。
14:08
IT之家(RSS)
47
小米支付服务 Skill 上线:开发者三步可完成接入,支持微信支付、支付宝等

小米澎湃OS开发者平台正式推出支付服务Skill能力,支持主流AI开发工具。该服务通过标准化接口,帮助商户快速对接收银台及支付功能,内置完整流程与适配方案,大幅简化开发周期。开发者仅需下载安装Skill、通过自然语言交互接入支付能力、自动联调测试三步即可完成接入,一次性支持小米支付、微信支付、支付宝等多种支付方式,并覆盖App/H5/小程序支付、拆单、退款等多项功能。

MCP/工具产品更新部署/工程
11:17
HuggingFace Daily Papers(社区热门论文)
63
VLAA-GUI:何时停止、恢复与搜索--一个用于 GUI 自动化的模块化框架

VLAA-GUI 是一个模块化 GUI 智能体框架,围绕停止、恢复与搜索三个核心组件构建。其强制性完整性验证器要求每一步完成时都必须提供可观察的 UI 成功证据,并通过决策规则交叉审查完成声明。强制性循环中断器提供多层过滤机制,在重复失败时切换交互模式,在屏幕状态持续重现时强制改变策略。按需调用的搜索代理可直接向具备搜索能力的大语言模型查询陌生工作流程。框架还集成了按需调用的编码代理与接地代理。在包含 Linux 和 Windows 任务的 OSWorld 与 WindowsAgentArena 基准测试中,VLAA-GUI 在五个顶级骨干模型上均取得最佳性能,分别达到 77.5% 和 61.0% 的成功率。其中三个骨干模型在 OSWorld 上单次通过即超越人类表现。消融实验表明所有三个组件均能持续提升强骨干模型性能,而循环中断器几乎将易循环模型浪费的步骤减半。

智能体MCP/工具论文/研究
10:08
IT之家(RSS)
51
长安、东风、北汽、比亚迪等接入阿里千问,一句话完成订餐、购物等

在2026北京车展上,长安、东风、北汽、比亚迪、吉利、长城、理想、上汽大众、上汽智己等多家车企宣布接入阿里千问大模型。接入后,部分车型将能通过一句话指令完成复杂路径规划、闲聊、查新闻、订酒店、买门票、点外卖、查快递等全场景服务。阿里云提供了“端+云”协同架构:端侧部署Qwen-Omni模型负责感知与快速响应,云端千问则链接数字世界并调用阿里巴巴生态服务。此前,一汽红旗已于3月26日率先接入千问。

智能体MCP/工具行业动态
4月22日
17:08
IT之家(RSS)
51
澎湃 OS 3 Beta 版向小米 17 系列手机推送"龙虾"智能体 Xiaomi miclaw

小米澎湃OS 3 Beta版已向小米17系列、Redmi K90 Pro Max等机型推送“龙虾”智能体Xiaomi miclaw。该智能体基于小米MiMo大模型,能让手机成为AI工具,理解用户意图后调用应用与系统工具完成任务。主要更新包括新增人格与技能体系、支持自然语言创建定时任务、可使用80多项系统工具,并预置了日程、沟通、办公等多场景一方助手。它还支持跨设备同步记忆和文件搜索传输,并可通过助手商店扩展能力。目前该产品仍属前沿探索,在稳定性与复杂场景处理方面持续优化。

智能体MCP/工具产品更新
‹ 上一页
1…56789
下一页 ›