AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态一手 · 143 条
全部一手资讯X论文
标签「MCP/工具调用」清除
5月7日周四
06:10xAI:News(网页)83精选Grok Web 正式推出 Connectors 功能,实现与日常应用深度集成
5月5日周二
23:19Anthropic:Newsroom(网页)77精选金融与保险智能体解决方案
5月1日周五
10:14Claude Code:GitHub Releases(RSS)55精选Claude Desktop v2.1.126 版本更新
08:00Apple Machine Learning Research(RSS)64精选强化智能体:面向工具调用智能体的推理时反馈机制
02:15Claude:Blog(网页)64精选Claude Code 构建经验:提示缓存的优化实践
4月30日周四
02:11Claude:Blog(网页)64精选Claude API技能现已集成至CodeRabbit、JetBrains、Resolve AI及Warp
4月29日周三
23:40Claude:Blog(网页)58精选智能体时代的产品开发:Claude Managed Agents 如何解放产品经理
06:35Claude Code:GitHub Releases(RSS)52版本v2.1.122更新摘要
00:36Claude:Blog(网页)72精选像培训新开发者一样引导Claude Code:来自17年开发的经验教训
4月28日周二
23:10Anthropic:Newsroom(网页)70精选Claude创意工作套件
4月24日周五
20:00OpenRouter:Announcements(RSS)57同事件精选OpenRouter Agent SDK:构建多轮智能体工作流同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
20:00OpenRouter:Announcements(RSS)55精选Agent SDK:在 OpenRouter 上构建多轮智能体工作流
4月21日周二
17:22公众号:通义实验室(千问)37AgentScope Tuner:让 Agent 越用越聪明
4月16日周四
06:40Claude Code:GitHub Releases(RSS)Claude Code CLI v2.1.110 发布
4月9日周四
10:58公众号:MiniMax(稀宇科技)57MiniMax 发布 MMX-CLI:为 Agent 设计的全模态命令行工具
4月8日周三
05:18Claude Code:GitHub Releases(RSS)v2.1.94
4月3日周五
07:45Claude Code:GitHub Releases(RSS)Claude Code v2.1.91 版本更新
4月2日周四
08:00Cursor Blog精选Cursor 3.0 发布:以 Agent 为核心的统一开发空间
3月31日周二
00:00Mistral AI:News(网页)59Spaces:为人类与AI智能体共同工作而构建的命令行工具
3月30日周一
08:00Google Developers Blog(RSS)81精选Google 发布 Java 智能体开发套件 (ADK) 1.0.0 版本
3月24日周二
09:06公众号:阶跃星辰(Step)44StepClaw 现已支持飞书、企微一键唤起
3月22日周日
10:56公众号:MiniMax(稀宇科技)48Skills精选开源,MaxClaw支持多龙虾部署!
3月18日周三
08:00Google Developers Blog(RSS)81精选开发者AI代理协议指南
3月16日周一
23:00公众号:月之暗面(Kimi)60精选推荐:10万人亲测好用的原版OpenClaw安装器
3月12日周四
08:00OpenRouter:Announcements(RSS)37OpenRouter 推出 Auto Exacto:自适应质量路由,默认开启
08:00OpenRouter:Announcements(RSS)38Auto Exacto:自适应质量路由,默认开启
08:00OpenRouter:Announcements(RSS)54Auto Exacto: 自适应质量路由,现已默认开启
3月11日周三
19:00OpenAI:官网动态(RSS · 排除企业/客户案例)精选从模型到智能体:为 Responses API 配备计算机环境
3月9日周一
22:25公众号:月之暗面(Kimi)48Kimi Claw 现已支持微博和企业微信遥控
3月3日周二
00:00Berkeley RDI:Blog(AI 安全与评测)MalTool:针对 LLM Agent 的恶意工具攻击
2月12日周四
08:00Hugging Face:Blog(RSS)83精选实践中的OpenEnv:在真实环境中评估工具使用智能体
1月16日周五
18:00公众号:蚂蚁百灵(Ling)36百灵大模型Ling Studio正式发布,支持Ling-1T、Ring-1T及Ming-flash-omni-Preview多模态能力
1月9日周五
08:00OpenRouter:Announcements(RSS)50January Release Spotlight
12月16日周二
00:01Hugging Face:Blog(RSS)83精选CUGA 登陆 Hugging Face:普及可配置的通用 AI 智能体
12月8日周一
00:00智谱:研究(网页内嵌数据)精选GLM-4.6V:支持原生工具调用的开源多模态模型
11月24日周一
00:00Anthropic:Engineering(事故复盘 + 工程实践 · 网页)77精选Claude开发者平台推出高级工具使用功能,提升AI代理效率
11月19日周三
08:00xAI:News(网页)精选xAI发布Grok 4.1 Fast与Agent Tools API
11月4日周二
00:00Anthropic:Engineering(事故复盘 + 工程实践 · 网页)74精选通过代码执行提升MCP智能体效率
10月21日周二
08:00OpenRouter:Announcements(RSS)40Provider Variance:OpenRouter 推出 Exacto
10月16日周四
00:00Anthropic:Engineering(事故复盘 + 工程实践 · 网页)73精选为智能体配备现实世界技能:Agent Skills 开放标准
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月7日
06:10
xAI:News(网页)
精选83
Grok Web 正式推出 Connectors 功能,实现与日常应用深度集成

xAI 正式在 Grok Web 上线 Connectors 功能,提供与多种日常应用工具的深度集成。该功能允许 Grok 端到端处理任务,如阅读总结邮件、更新幻灯片、管理日历和编辑电子表格,无需频繁切换和复制粘贴。首批支持的连接器包括 SharePoint、Outlook、OneDrive、Google Workspace、Notion、GitHub 和 Linear,涵盖文件搜索读写、代码审查与任务管理等操作。同时推出的“自带 MCP”功能支持连接自定义模型上下文协议服务器。完整的 Connectors 支持也即将登陆 Grok iOS 和 Android 应用。

MCP/工具xAI产品更新

推荐理由:Grok这波连接器把 Office、GitHub 和 Notion 全打通了,不是演示级挂接,是能直接读写编辑的真集成,外加开放自建 MCP,产品经理和开发者都该立刻上手试试。
5月5日
23:19
Anthropic:Newsroom(网页)
精选77
金融与保险智能体解决方案

Anthropic发布了十个针对金融服务耗时任务的预置智能体模板,涵盖制作推介书、撰写信贷备忘录、KYC文件筛查及月末关账等。这些模板可作为Claude Cowork和Claude Code的插件,或作为Claude托管智能体的配置指南,帮助团队在数天内部署应用。Claude现通过Microsoft 365插件支持在Excel、PowerPoint等Office应用间无缝工作,并扩展了合作伙伴生态,新增数据连接器和MCP应用,使智能体能直接调用实时金融数据。这些更新与Claude Opus 4.7模型搭配效果最佳,该模型在金融任务上达到先进水平。

AnthropicMCP/工具产品更新部署/工程

推荐理由:Anthropic 一口气放出十个金融模板,从 pitchbook 到月底关账全包,加上 Excel、PPT、Word 的深度集成,做金融的可以少写很多重复性胶水代码,直接套模板干活去了。
5月1日
10:14
Claude Code:GitHub Releases(RSS)
精选55
Claude Desktop v2.1.126 版本更新

本次更新增强了模型网关集成,当配置指向兼容网关时,可直接在模型选择器中列出可用模型。新增了 claude project purge 命令,用于彻底清理项目状态数据。OAuth登录流程得到优化,支持在浏览器回调失败时手动粘贴授权码,并修复了多种网络环境下的登录问题。安全方面,修复了 allowManagedDomainsOnly 等设置可能被忽略的漏洞。此外,还解决了图像粘贴过大导致会话中断、远程会话误报“流空闲超时”、Windows系统下特定文本渲染乱码以及多项工具在特定场景下不可用等数十项错误。

AnthropicMCP/工具产品更新编码

推荐理由:这是 Claude Code 一次‘生活质量’大更新,OAuth、Windows 权限、流超时等痛点都被修了,如果你在用 Claude Code,今天就该升级。
08:00
Apple Machine Learning Research(RSS)
精选64
强化智能体:面向工具调用智能体的推理时反馈机制

本文提出一种将评估机制嵌入工具调用智能体实时执行循环的新方法。通过引入一个专门的评审员智能体,在推理时对主智能体的中间决策轨迹进行即时评估,并生成结构化反馈。这使得主智能体能在单次运行中动态调整其工具选择与参数调用,无需依赖传统的提示调整或模型重训练。该实时干预机制旨在直接纠正错误,提升了工具使用的准确性与可靠性,突破了传统后验评估无法在运行中修正行为的局限。本工作已被ACL 2026的自然语言生成、评估与指标研讨会接收。

智能体MCP/工具论文/研究

推荐理由:Apple 把评估嵌进 agent 执行循环,不是事后分锅,而是让 reviewer 实时纠错,这对 tool-calling 类应用是个真方向,做 agent 架构的值得细读。
02:15
Claude:Blog(网页)
精选64
Claude Code 构建经验:提示缓存的优化实践

Claude Code 团队分享了大规模优化提示缓存的核心策略。提示缓存基于前缀匹配工作,能显著降低延迟与成本,高命中率还能支持更宽松的订阅速率限制。关键实践包括:将静态系统提示和工具定义置于提示词前端以最大化共享前缀;通过消息而非修改提示词来传递更新信息,避免缓存失效;在会话中不切换模型、不增删工具,以维持缓存前缀稳定。此外,针对工具过多或“计划模式”等场景,可通过发送轻量存根或设计专用工具来规避缓存失效,从而在复杂功能中持续利用缓存优势。

智能体AnthropicMCP/工具教程/实践

推荐理由:Claude Code团队把提示缓存的坑和优化方法全盘托出,从提示顺序、工具加载到压缩技巧,每一个经验都是钱和延迟换来的,做agent的同行可以直接拿去做架构参考。
4月30日
02:11
Claude:Blog(网页)
精选64
Claude API技能现已集成至CodeRabbit、JetBrains、Resolve AI及Warp

Claude API技能现已扩展集成至CodeRabbit、JetBrains、Resolve AI和Warp四款开发工具中,使开发者能在其常用环境中直接获得生产就绪的Claude API代码支持。该技能能自动捕获API最佳实践细节,如适配的智能体模式、参数变更与提示缓存规则,从而减少错误并简化模型迁移。开发者可在工具内直接指示Claude执行“提高缓存命中率”或“升级至最新Claude模型”等任务。此开源技能会随SDK更新自动同步,帮助团队更快采用新功能,避免因API知识过时导致的生产问题。

AnthropicMCP/工具产品更新编码

推荐理由:Anthropic 把 claude-api skill 从自家 IDE 扩散到 JetBrains、Warp 等主流开发工具,本质是用「内置专家知识」抢开发者心智,做 Claude API 集成的产品人值得看看它覆盖了哪些坑。
4月29日
23:40
Claude:Blog(网页)
精选58
智能体时代的产品开发:Claude Managed Agents 如何解放产品经理

Claude产品经理Jess Yan分享了处于测试版的Claude Managed Agents如何改变其工作流程。这套可组合的API能大规模构建和部署云端智能体,使她能在短时间内将想法转化为可运行的原型。她的日常工作由此分流:使用Claude进行开放式探索,然后利用Claude Code基于Managed Agents编写定制智能体来自动化特定任务,如采用分析和舆情监控。这些智能体接管了以往难以规模化的操作性工作,让她能将更多时间投入到与团队和用户的创造性合作中。

智能体AnthropicMCP/工具教程/实践

推荐理由:Anthropic PM公开用Claude Managed Agents搭建数据分析、舆情监控和演示生成agent的真实流程,对于想要用agent重构产品开发节奏的团队有实际参考价值,但不算爆炸性更新。
06:35
Claude Code:GitHub Releases(RSS)
52
版本v2.1.122更新摘要

本次更新主要新增了通过环境变量选择Bedrock服务层级的功能,并支持在/resume搜索框粘贴PR链接以定位创建该PR的原始会话。同时修复了多项关键问题:修正了源会话含时间线回退条目时,/branch命令可能创建失败分支的问题;解决了发送给新版模型的图像被错误调整为2576px(应为2000px上限)的问题;增强了OpenTelemetry日志记录,确保数字属性以数值类型输出;并修复了Vertex AI/Bedrock在生成会话标题等场景下可能返回无效请求错误的问题。此外,还包含对MCP工具显示、CLI命令退出行为等多项细节的优化与修正。

AnthropicMCP/工具产品更新部署/工程
00:36
Claude:Blog(网页)
精选72
像培训新开发者一样引导Claude Code:来自17年开发的经验教训

华盛顿大学MacCoss实验室的Brendan MacLean将培训新开发者的方法论应用于Claude Code,以管理拥有70万行C#代码、持续开发17年的开源蛋白质分析软件Skyline。他通过创建独立的AI上下文仓库、编写CLAUDE.md引导文件以及设计“技能”模块(如调试技能),为Claude Code建立项目认知。该方法显著提升了开发效率:搁置一年的文件视图面板功能在两周内完成;CSS布局更新从依赖设计师变为不到一天实现。此外,Claude Code还自动化了2000多张教程图片的截图比对和每日测试报告生成,团队现在主要依靠它生成代码和脚本。

AnthropicMCP/工具教程/实践编码

推荐理由:这不是又一篇 Claude Code 安利文,而是一个维护了 17 年 70 万行 C# 代码库的人,把带新人的方法论原封不动搬给了 AI,结果真管用。做 legacy 项目的人应该认真看他的 context 管理和 skill 库设计。
4月28日
23:10
Anthropic:Newsroom(网页)
精选70
Claude创意工作套件

Anthropic推出Claude for Creative Work,这是一套连接器工具,可实现Claude与Blender、Autodesk、Adobe等主流创意软件的直接集成。这些连接器允许Claude访问各平台功能,例如在Adobe系列中调用50多款应用,在Autodesk Fusion中通过对话创建3D模型,或在Blender中通过自然语言操作Python API。创意工作者可利用Claude加速软件学习、编写脚本插件、桥接多工具工作流以及自动化批量处理等重复任务。该系列工具基于MCP标准,并已与多所艺术设计院校合作,旨在推动创意计算教育。

AnthropicMCP/工具产品更新

推荐理由:Anthropic 把 Claude 塞进 Blender、Adobe、Ableton 这些创意工具里,不是又一个聊天框,而是用 MCP 让 AI 真正操作软件。做设计、做音乐、做 3D 的人第一次有了一个能跨工具干活的 AI 助手,值得试试。
4月24日
20:00
OpenRouter:Announcements(RSS)
同事件精选57
OpenRouter Agent SDK:构建多轮智能体工作流

OpenRouter Agent SDK 提供 callModel 函数,能将聊天补全转换为支持工具调用、停止条件和成本追踪的多步智能体,覆盖 300 多个模型。

智能体MCP/工具产品更新
同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
推荐理由:OpenRouter把agent构建压缩进一个callModel函数,内置工具调用、停止条件和成本追踪,对已在它生态里的开发者省下不少样板代码,可惜时效过了。
20:00
OpenRouter:Announcements(RSS)
精选55
Agent SDK:在 OpenRouter 上构建多轮智能体工作流

OpenRouter 发布 Agent SDK,其核心是 callModel 函数。该函数可将一次聊天完成转化为具备工具调用、停止条件与成本追踪功能的多步骤智能体工作流。这一工具兼容平台上的 300 多个模型,使开发者能够便捷地构建复杂的多轮交互智能体应用。

智能体MCP/工具产品更新

推荐理由:OpenRouter 把多轮 agent 编排封装成一个 callModel 函数,300+ 模型统一调用,做 agent 产品的人可以少写不少胶水代码,但本质上是工程封装而非技术突破。
4月21日
17:22
公众号:通义实验室(千问)
37
AgentScope Tuner:让 Agent 越用越聪明

AgentScope Tuner 让 AI 智能体在工具调用中越用越聪明,持续优化行为,减少误调问题。

智能体MCP/工具产品更新
4月16日
06:40
Claude Code:GitHub Releases(RSS)
Claude Code CLI v2.1.110 发布

新增 /tui 命令实现全屏无闪烁渲染,Ctrl+O 改为切换详细转录模式,焦点视图由 /focus 独立控制。强化插件管理界面,新增 MCP 服务器配置冲突警告,扩展远程控制客户端对多条斜杠命令的支持。修复 30 余项问题,包括 MCP 工具调用挂起、全屏高 CPU 占用、非受信文件名命令注入漏洞等,并优化内存分配与会话管理。

智能体AnthropicMCP/工具产品更新
4月9日
10:58
公众号:MiniMax(稀宇科技)
57
MiniMax 发布 MMX-CLI:为 Agent 设计的全模态命令行工具

MiniMax 发布 MMX-CLI,一款面向 AI 智能体(Agent)的全模态命令行工具,通过命令行界面为 Agent 提供全模态能力。

智能体MCP/工具产品更新
4月8日
05:18
Claude Code:GitHub Releases(RSS)
v2.1.94

新版本新增对 Amazon Bedrock(由 Mantle 驱动)的支持,并将 API-key、Bedrock/Vertex/Foundry、Team 及 Enterprise 用户的默认 effort level 从 medium 提升至 high。修复了 429 速率限制后代理卡死、macOS 控制台登录失败、插件 hooks 被忽略、长会话滚动回显重复、CJK 字符损坏等关键问题。VSCode 扩展优化了冷启动性能并新增设置解析失败警告。

智能体AnthropicMCP/工具产品更新
4月3日
07:45
Claude Code:GitHub Releases(RSS)
Claude Code v2.1.91 版本更新

Claude Code v2.1.91 发布,支持 MCP 工具结果最大 500K 字符不截断,新增禁用技能内联 shell 执行选项,插件可打包 bin/ 目录可执行文件。修复了 --resume 转录链断裂、远程会话计划模式丢失、cmd+delete 快捷键等 bug,并优化了 ANSI 剥离性能。

智能体AnthropicMCP/工具产品更新
4月2日
08:00
Cursor Blog
精选
Cursor 3.0 发布:以 Agent 为核心的统一开发空间

Cursor 3.0 正式发布,重构为以 Agent 为核心的统一工作空间。新界面原生支持多仓库协作,可并行运行本地与云端 Agent(覆盖移动端、Slack、GitHub 等入口),支持会话在环境间无缝迁移以便离线运行或本地迭代。完整保留 IDE 能力:文件编辑、LSP、内置浏览器及插件市场。基于自研 Composer 2 模型,目标是通过多 Agent 自主协作实现"代码库自动驾驶"。

智能体MCP/工具产品更新编码

推荐理由:Cursor 3 重磅发布:原生 Agent 工作流、云地无缝切换与多仓库管理
3月31日
00:00
Mistral AI:News(网页)
59
Spaces:为人类与AI智能体共同工作而构建的命令行工具

Mistral AI 于2026年3月31日发布了其命令行工具 Spaces,专为人类用户与 AI 智能体共同工作设计。此次发布是其完整产品矩阵的一部分,该矩阵包括用于构建应用的 Studio、用于训练模型的 Forge、用于长周期任务的 AI 智能体 Vibe 及其代码版本 Vibe for Code,以及用于前沿规模训练与推理的 Compute 基础设施。同时,Mistral 更新了模型产品线,发布了最新的 Mistral Medium 3.5 和 Mistral Small 4 模型。

智能体MCP/工具产品更新
3月30日
08:00
Google Developers Blog(RSS)
精选81
Google 发布 Java 智能体开发套件 (ADK) 1.0.0 版本

Google 正式发布了 Java 版智能体开发套件 (ADK) 的 1.0.0 版本。该版本引入了多项关键功能:支持接入 Google Maps 数据、内置 URL 抓取工具,以及用于跨框架协作的标准化 Agent2Agent 协议。其全新的“App”和“Plugin”架构增强了控制能力,实现了全局日志记录、通过事件压缩自动管理上下文窗口,以及需要人工确认的“Human-in-the-Loop”工作流。此外,该版本深度集成 Google Cloud 服务(如 Firestore 和 Vertex AI),提供了强大的会话与记忆管理功能,以处理长期状态和大型数据工件,助力开发者构建更复杂的 AI 智能体应用。

智能体GoogleMCP/工具产品更新

推荐理由:Java开发者可利用官方工具快速构建集成Google服务的AI代理。
3月24日
09:06
公众号:阶跃星辰(Step)
44
StepClaw 现已支持飞书、企微一键唤起

StepClaw 新增通过飞书和企业微信远程唤起功能。用户只需在手机飞书或企微对话框发送指令,即可驱动本地 StepClaw 即刻执行。接入方式:企业微信可通过阶跃AI Web端点击「一键部署企业微信机器人」扫码授权,或桌面伙伴发送「连接企微」获取凭证配置;飞书可通过阶跃AI APP创建机器人并发送凭证绑定,Web端一键部署并发送配置指令,或桌面伙伴生成二维码完成授权。配置后即可实现远程操控。

智能体MCP/工具产品更新
3月22日
10:56
公众号:MiniMax(稀宇科技)
48
Skills精选开源,MaxClaw支持多龙虾部署!

本周MiniMax Skills社区上线,精选上百种覆盖开发、学习、办公及内容创作的Skill,包括基于M2.7模型创建的PPT制作、PDF编辑等Skill已开源,用户可在MaxClaw或MiniMax Agent中一键添加。MaxClaw新增支持同时部署多个Claw,可自定义命名与设定,支持工作流拆分和多角色协作。通过MiniMax Agent桌面端部署本地OpenClaw时,预置多款安全诊断Skill以降低高危操作风险,并能自主诊断修复。MaxClaw沙箱升级,新环境支持root权限,用户可自由安装依赖库与浏览器,OpenClaw框架也可自行升级。

MCP/工具产品更新开源/仓库
3月18日
08:00
Google Developers Blog(RSS)
精选81
开发者AI代理协议指南

一套包含MCP、A2A等六种协议的新工具集正式发布,旨在通过标准化AI代理的数据访问与通信方式,消除定制集成代码的需求。以“厨房管理员”代理为例,这些协议能实时核查库存、通过UCP进行批发交易,并借助AP2完成安全支付授权。开发者使用Agent开发套件(ADK)还可实现A2UI与AG-UI,为用户提供交互式仪表板与无缝流式界面。

智能体GoogleMCP/工具教程/实践

推荐理由:开发者能快速掌握AI代理通信标准,提升集成效率。
3月16日
23:00
公众号:月之暗面(Kimi)
精选60
推荐:10万人亲测好用的原版OpenClaw安装器

Kimi支持的个人开发者开源项目OneClaw下载量突破10万,提供一键安装包,1分钟即可在本地部署原版OpenClaw,无需命令行或环境配置。功能包括纯净卸载、自由切换模型、远程控制,支持连接飞书、企微、钉钉、QQ、Kimi Claw;内置2万+技能的技能商店,可无损迁移记忆和Skills。Kimi提供包月方案和API按需购买。使用地址:oneclaw.cn。

MCP/工具开源/仓库编码

推荐理由:如果你曾被 OpenClaw 的部署门槛劝退,OneClaw 可以让你两分钟跑起来,适合在备用机尝尝鲜,但别在生产环境乱搞。
3月12日
08:00
OpenRouter:Announcements(RSS)
37
OpenRouter 推出 Auto Exacto:自适应质量路由,默认开启

Auto Exacto 每隔 5 分钟基于吞吐量、工具调用遥测和基准分数重新评估各提供商。对于包含工具的请求,该功能默认处于开启状态。

智能体MCP/工具产品更新部署/工程
08:00
OpenRouter:Announcements(RSS)
38
Auto Exacto:自适应质量路由,默认开启

Auto Exacto 每隔5分钟根据吞吐量、工具调用遥测数据和基准分数重新评估提供商。对于包含工具的请求,该功能默认开启。

智能体MCP/工具产品更新部署/工程
08:00
OpenRouter:Announcements(RSS)
54
Auto Exacto: 自适应质量路由,现已默认开启

Auto Exacto 功能现已默认开启,尤其适用于包含工具调用的请求。该系统每 5 分钟对服务提供商进行一次全面重评估,评估维度包括吞吐量、工具调用遥测数据和基准测试分数。这一自适应路由机制旨在根据实时性能数据,自动将请求导向当前最优的模型提供商。

MCP/工具产品更新部署/工程
3月11日
19:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选
从模型到智能体:为 Responses API 配备计算机环境

OpenAI 基于 Responses API、shell 工具与托管容器构建 agent runtime,支持文件处理、工具调用及状态管理,实现安全可扩展的智能体计算机环境部署。

智能体MCP/工具OpenAI产品更新

推荐理由:OpenAI为Responses API增加Agent运行时与容器化执行环境
3月9日
22:25
公众号:月之暗面(Kimi)
48
Kimi Claw 现已支持微博和企业微信遥控

Kimi Claw 今天起内置「微博」和「企业微信」官方插件,新用户经简单设置即可通过这两个 APP 遥控 Kimi Claw 干活。同时支持连接飞书(飞书机器人)。内置 ClawHub 5000+ 社区插件,涵盖开发代码、浏览器、办公工作流、专家角色等;提供 40GB 免费云盘、实时专业财经数据搜索。该功能处于早期实验阶段,首批开放给 Allegretto 及以上会员计划的用户。

智能体MCP/工具产品更新
3月3日
00:00
Berkeley RDI:Blog(AI 安全与评测)
MalTool:针对 LLM Agent 的恶意工具攻击

研究团队发布 MalTool 框架,揭示 LLM Agent 面临的新型恶意工具攻击威胁。该框架利用编码 LLM 自动生成多样化恶意工具,构建首个包含 1,200 个独立恶意工具和 5,287 个木马工具的大规模数据集。测试显示,现有安全对齐技术和商业检测系统均无法有效阻止或识别此类攻击,而攻击成功率达 100% 且成本极低——GPT-5.2 仅需约 20 美元即可生成约 1,200 个验证恶意工具,单个成本不足 0.02 美元。这种基于代码实现的攻击可窃取数据、删除文件或劫持计算资源,威胁远超传统的描述操纵手段。

智能体MCP/工具安全/对齐
2月12日
08:00
Hugging Face:Blog(RSS)
精选83
实践中的OpenEnv:在真实环境中评估工具使用智能体

Meta与Hugging Face联合推出开源评估框架OpenEnv,旨在标准化智能体与真实系统的交互。Turing公司贡献了生产级“Calendar Gym”环境,用于在权限控制、时间推理等现实约束下研究工具使用智能体。该框架采用类似Gymnasium的API,通过标准接口连接真实工具,将评估重点从受控演示转向真实世界可靠性。日历系统因涉及多用户、多步骤工作流等复杂性,成为评估智能体实际能力的强大测试平台。

智能体Hugging FaceMCP/工具Meta

推荐理由:提供生产级基准测试,帮助开发者评估和改进 AI 代理在复杂环境中的表现。
1月16日
18:00
公众号:蚂蚁百灵(Ling)
36
百灵大模型Ling Studio正式发布,支持Ling-1T、Ring-1T及Ming-flash-omni-Preview多模态能力

蚂蚁百灵推出Ling Studio,这是用户与百灵大模型交互的全新官方Web平台。目前可体验Ling-1T(高速首字响应与快速回答)、Ring-1T(高效稳定的复杂推理)以及Ming-flash-omni-Preview(图片识别与音频识别等多模态能力)。平台支持灵活配置模型参数与系统提示词、原生工具调用(含联网搜索)及API即用即接。即将上线文件对话、图片生成和一系列模型Skills。

MCP/工具产品更新多模态推理
1月9日
08:00
OpenRouter:Announcements(RSS)
50
January Release Spotlight

本次发布聚焦于提升大型语言模型(LLM)的速度与性能。核心更新包括优先支持快速LLM、探索更多模型提供商选项,以及允许用户自定义自动路由。软件开发工具包(SDK)现已支持加载技能,同时系统实现了显著的性能改进。这些更新旨在优化开发者的使用体验与模型运行效率。

MCP/工具产品更新部署/工程
12月16日
00:01
Hugging Face:Blog(RSS)
精选83
CUGA 登陆 Hugging Face:普及可配置的通用 AI 智能体

开源可配置通用智能体 CUGA 现已集成至 Hugging Face Spaces,便于开发者便捷实验。该智能体在复杂任务基准测试中表现卓越,在包含 457 个 API、750 个真实任务的 AppWorld 基准排名第一,在 WebArena 基准也位居前列。其核心提供可配置的推理模式以平衡性能与成本,支持计算机使用与多工具无缝集成,并能与 Langflow 结合进行低代码工作流设计。采用 Apache 2.0 许可的 CUGA 支持多种开源模型,在高性能推理平台(如 Groq)上运行能显著提升效率。

智能体Hugging FaceMCP/工具开源/仓库

推荐理由:开源AI代理框架性能领先,集成Hugging Face和Langflow,开发者可快速构建复杂任务。
12月8日
00:00
智谱:研究(网页内嵌数据)
精选
GLM-4.6V:支持原生工具调用的开源多模态模型

智谱开源GLM-4.6V系列多模态模型,含106B-A12B基础版与9B轻量版Flash,支持128k tokens上下文。首次原生集成Function Call能力,支持图像、截图直接作为工具参数,并能理解工具返回的视觉内容。具备复杂文档理解、视觉网页搜索、前端代码生成及交互式编辑能力,适用于构建多模态Agent。已上架GitHub、Hugging Face及魔搭社区。

智能体MCP/工具多模态模型发布

推荐理由:智谱开源 GLM-4.6V,原生支持工具调用的多模态 Agent 底座
11月24日
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选77
Claude开发者平台推出高级工具使用功能,提升AI代理效率

Anthropic在Claude开发者平台发布三项新功能,以解决传统工具调用消耗大量上下文、易出错的问题。工具搜索工具允许按需加载工具,内部测试中将上下文消耗从约7.7万令牌降至8700令牌,降幅达85%,并将准确率从49%提升至74%。程序化工具调用支持在代码环境中调用工具,减少对上下文窗口的影响,例如Claude for Excel可借此处理数千行数据。工具使用示例则提供了展示工具有效使用方法的通用标准。这些功能共同提升了AI代理处理大规模工具库的能力。

智能体AnthropicMCP/工具产品更新

推荐理由:做 Agent 的人都卡在工具一多上下文就爆、调用就错这两个坑上,Anthropic 这三个功能直接把工具管理从「全塞进去」变成「按需加载+代码编排+示例纠错」,是目前最工程化的解法。
11月19日
08:00
xAI:News(网页)
精选
xAI发布Grok 4.1 Fast与Agent Tools API

xAI发布Grok 4.1 Fast模型及Agent Tools API。Grok 4.1 Fast支持200万token上下文,在τ²-bench Telecom基准测试中获100%得分且成本仅105美元,函数调用准确率72%。Agent Tools API集成实时X数据、网页搜索与代码执行功能。该模型在深度研究基准测试中超越GPT-5等竞品,成本更低且幻觉率较上代降低一半。

智能体MCP/工具xAI模型发布
关联讨论 1 条xAI:News(网页)
推荐理由:xAI 发布 Grok 4.1 Fast 及 Agent Tools API,支持 2M 上下文与原生工具调用,剑指企业级 Agent 应用。
11月4日
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选74
通过代码执行提升MCP智能体效率

随着AI智能体通过模型上下文协议(MCP)连接的工具数量激增,传统预先加载所有工具定义并通过上下文传递中间结果的方法,导致处理速度变慢、成本增加。问题核心在于工具定义占用大量上下文空间,且中间结果(如完整会议记录)在多次工具调用间重复传递,额外消耗数万令牌。文章提出解决方案:将MCP服务器呈现为代码API,使智能体能按需加载工具,并在执行环境中处理数据,仅将精简结果传回模型,从而显著减少令牌消耗、提升效率并降低成本。

智能体AnthropicMCP/工具教程/实践

推荐理由:Anthropic 官方把 MCP 从「能连」推进到「连多了怎么办」,用代码执行替代直接工具调用,token 省 98.7% 这个数字不是吹的。做 Agent 工程的人如果还在暴力塞 tool definition,这篇是必读的架构升级指南。
10月21日
08:00
OpenRouter:Announcements(RSS)
40
Provider Variance:OpenRouter 推出 Exacto

OpenRouter 推出 Exacto,旨在回答同一个大语言模型在不同 AI 服务供应商上是否表现不同的问题。该工具帮助用户量化供应商间的性能差异,为模型部署选择提供参考。

MCP/工具产品更新部署/工程
10月16日
00:00
Anthropic:Engineering(事故复盘 + 工程实践 · 网页)
精选73
为智能体配备现实世界技能:Agent Skills 开放标准

Anthropic 推出了“Agent Skills”开放标准,旨在为通用智能体(如Claude)提供可组合、可扩展且可移植的领域专业知识。一个Skill是一个包含指令、脚本和资源的文件夹,其核心SKILL.md文件采用渐进式披露设计,智能体可根据任务动态加载所需信息,从而最小化上下文占用。例如,PDF技能赋予了Claude直接操作PDF表单的新能力。该框架允许用户通过封装和共享程序性知识来定制智能体,无需为每个用例构建碎片化的定制代理。

智能体AnthropicMCP/工具产品更新

推荐理由:Agent Skills 把「给 Agent 喂知识」从手写 prompt 变成了可复用的文件夹协议,做 Claude Code 或 Agent 产品的人现在就该动手试,这比 MCP 更轻量也更贴近日常开发。
‹ 上一页
1234
下一页 ›