AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「MCP/工具调用」清除
5月15日周五
00:38🚨 AI News | TestingCatalog76精选Kimi发布支持多款AI编程助手的浏览器扩展
00:26向阳乔木68Raycast Beta版集成AI模型,支持Agent与Skill功能
5月14日周四
23:51Berryxia.AI32企业AI协作工具应构建"记忆图谱",而非堆叠上下文
22:51Berryxia.AI79Kimi推出Web Bridge扩展,AI Agent实现类人浏览器操作
22:51Berryxia.AI68腾讯AI团队开源Agent记忆系统,攻克长会话上下文丢失难题
22:45meng shao78Kimi 发布浏览器扩展 Kimi Web Bridge,为AI Agent赋予真实网页操作能力
22:26小互70开源工具html-anything助力Agent生成高质量HTML
19:40AYi64Notion开发者平台以Agent为核心,旨在成为AI时代的操作系统
17:38🚨 AI News | TestingCatalog70OpenSquilla发布开源AI代理,主打高性价比长时任务
16:51Berryxia.AI75宝玉基于wx-cli开发微信群聊总结工具
15:40IT之家(RSS)74精选"让 Token 消耗降低 61%":腾讯开源 Agent Memory
12:37宝玉65Anthropic推出Claude for Small Business,将AI集成至小企业常用工具
12:26向阳乔木68宝玉老师开发微信群聊总结Skill
11:56向阳乔木64Get笔记会员超值,支持多平台链接解读与集成
11:40AYi66全网都在薅Claude今天的50%编程福利,但90%的人都没看懂背后的时间差
08:51ginobefun65从头构建多智能体系统学到的经验
08:51歸藏(guizang.ai)54Claude Code 的每周限额将增加 50%,持续到 7 月 13 号。
07:55Claude Code:GitHub Releases(RSS)67精选Claude 工具 v2.1.141 版本更新
01:34Ethan Mollick41谷歌Gemini何时加入本地应用竞赛
5月13日周三
17:39IT之家(RSS)66Anthropic Claude Code 缔造者:数千个 AI 智能体夜间自动为我写代码
14:04Peter Steinberger 🦞68微软助力OpenClaw企业级适配
13:50歸藏(guizang.ai)70AI技能更新地图组件,支持交互与标记
13:34Peter Steinberger 🦞48计算机自主完成Telegram令牌获取
12:50Berryxia.AI76精选oMLX更新强化苹果端侧AI,本地能力直逼云端
12:39IT之家(RSS)66腾讯元宝 App 官宣支持总结微信聊天记录:可提炼要点、汇总清单、整理攻略等
10:36宝玉57Claude自动化架构解析:Skill、Agent、Connector与Plugin如何协同工作
09:49ginobefun76OpenAI Codex新增Computer Use能力,AI助手操作桌面软件
08:49ginobefun57AI Agent 落地三问:代码本质、长流程状态、GUI 操控
08:49Berryxia.AI61Claude Code推出/goal功能,实现任务自动化
08:00HuggingFace Daily Papers(社区热门论文)55模型自适应工具必要性揭示LLM工具使用中的知行差距
08:00HuggingFace Daily Papers(社区热门论文)56SPIN:基于迭代导航的工业任务结构LLM规划
07:27Hacker News:AI 热帖76精选展示 HN:Statewright--通过可视化状态机提升AI智能体可靠性
07:06宝玉65Anthropic开源"Claude for Legal"项目,为法律行业推出定制化AI工具集
05:02Elon Musk39Grok新增技能功能
04:56Hacker News 热门(buzzing.cc 中文翻译)65Show HN: Needle:我们将"双子座工具召唤"浓缩为一个26M模型
04:33OpenAI Developers70精选Codex实现跨应用无感多任务处理
01:54Claude:Blog(网页)73精选Claude进军法律行业
00:24Claude:Blog(网页)58精选Code w/ Claude SF 2026开发者大会:基于AI指数级增长的构建
00:04凡人小北68飞书CLI新增百项能力,AI Agent重塑工作流
5月12日周二
23:54Xiaomi MiMo58重要提示:使用小米MiMo思考模式时需注意reasoning_content字段完整性
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月15日
00:38
🚨 AI News | TestingCatalog@testingcatalog
精选76
Kimi发布了Kimi Web Bridge,这是一款可与多种代理协同工作的新浏览器扩展,包括Claude Code、Hermes、Codex、Kimi Code CLI等。 一浏览器通用于所有 👀 试用地址:http://kimi.com/features/webbridge 及Chrome网上应用店。

Kimi.ai: Supports Kimi Code CLI, Claude Code, Cursor, Codex, Hermes, and more. Try it at: http://kimi.com/features/webbridge and ...

智能体MCP/工具产品更新编码

推荐理由:Kimi这个浏览器扩展把Claude Code、Cursor等各路Agent的网页交互统一了,如果真能无缝衔接,做开发的和做自动化的人可以省下大把调试时间。
00:26
向阳乔木@vista8
68
Raycast Beta版集成AI模型,支持Agent与Skill功能

Raycast Beta版本新增了对Agent和Skill的支持,用户可通过该版本免费使用多种顶级AI模型。然而,当前版本存在较多Bug,且暂不支持Cloud同步功能,这意味着用户的快捷键设置和自定义Prompt等个人化配置无法云端备份,需要在新安装时重新手动设置。

智能体MCP/工具产品更新
5月14日
23:51
Berryxia.AI@berryxia
32
企业AI协作工具应构建"记忆图谱",而非堆叠上下文

本文通过教师离职导致知识断层的事件,批判当前企业AI工具过度聚焦堆叠上下文长度。作者指出,Tanka创新地采用“记忆图谱”架构,将人、决策等作为实体并以关系连接,能直接展示复杂决策背后的完整关系子图。其采用稀疏注意力机制降低成本,推行固定月费模式,并提供免费试用。

Berryxia.AI: http://x.com/i/article/2054904722663133186

MCP/工具产品更新
22:51
Berryxia.AI@berryxia
79
Kimi推出Web Bridge扩展,AI Agent实现类人浏览器操作

Kimi近日发布Web Bridge浏览器扩展,标志着AI Agent能力实现从“只能对话”到“像人一样操作浏览器”的实质性跨越。通过该扩展,Agent可自主执行搜索、滚动、点击、输入等操作,完成跨平台信息搜集整理、网页结构分析与复制、自动创建表单等复杂任务。它原生支持Kimi Code CLI、Claude Code、Cursor等多种开发工具,极大提升了AI助手的工作流自动化水平与生产力维度。该扩展已在Chrome应用商店正式上线。

Kimi.ai: Meet Kimi Web Bridge - Kimi's browser extension. Agent can now interact with websites like a human: search, scroll, clic...

智能体MCP/工具产品更新
22:51
Berryxia.AI@berryxia
68
腾讯AI团队开源Agent记忆系统,攻克长会话上下文丢失难题

腾讯AI团队耗时6个月,针对AI agent在长会话中频繁丢失上下文的问题,开发并开源了一套记忆系统。该系统通过三大核心操作提升性能:实时压缩过期上下文,将token消耗降低61%;利用mermaid语法生成结构化任务地图,使agent在30多步复杂工作流中不易迷失;建立专用Persona记忆,将人格一致性从48%提升至76%。方案基于实际踩坑经验,强调agent记忆的难点在于在正确时间以正确方式回忆正确信息,而非单纯堆叠token。项目已在GitHub开源,为AI agent发展提供实用解决方案。

Tencent AI: We spent 6 months on one problem: agents losing context in long sessions. Ended up building and open-sourcing an agent m...

智能体MCP/工具开源/仓库
22:45
meng shao@shao__meng
78
Kimi 发布浏览器扩展 Kimi Web Bridge,为AI Agent赋予真实网页操作能力

Kimi 近日推出了名为 Kimi Web Bridge 的浏览器扩展。该扩展能将现有的编码型或通用型 AI Agent 接入用户本地的 Chrome 或 Edge 浏览器,使其获得如点击、滚动、输入、抓取和截图等真实的网页交互能力。其设计核心在于复用用户真实浏览器环境、完全本地化执行,并采用开放接入模式。官方展示了跨平台搜索制表、网站复刻等应用案例。目前,该扩展已支持 Kimi Code CLI、Claude Code、Cursor 等多种 Agent 工具,用户可通过官网和 Chrome 应用商店获取。

Kimi.ai: Meet Kimi Web Bridge - Kimi's browser extension. Agent can now interact with websites like a human: search, scroll, clic...

智能体MCP/工具产品更新
22:26
小互@xiaohu
70
用户分享了对开源项目html-anything的积极体验。该项目旨在让AI Agent能将任何数据转换为具有世界级设计水准的HTML代码。该项目历时三天开发,包含约一万五千行代码,支持75套Skills和9种导出格式,并能兼容包括Claude Code、Codex、OpenClaw、Hermes在内的多种代码生成Agent。

Tom Huang: 正式开源 html-anything 🚀 1:1 让你感受全网爆火 Claude code 作者提的 HTML 效果! 你的 Agent 现在可以将任何数据转为世界级设计水准的 HTML 🔥 历时 3 天,1万五千行代码!支持 75 套...

智能体MCP/工具产品更新
19:40
AYi@AYi_AInotes
64
Notion开发者平台以Agent为核心,旨在成为AI时代的操作系统

Notion发布开发者平台,其战略并非简单追逐AI Agent风口,而是让Agent成为平台的核心用户。其CLI工具设计精简、自描述且token占用低,专为Agent优化。平台提供包括数据同步、工具调用和托管沙盒在内的完整基础设施,并允许第三方Agent(如Claude)通过API无缝接入,统一工作空间以解决上下文碎片化和工具调用不稳定等痛点。Notion整合了CLI、Workers、数据库同步等组件,旨在成为Agent时代的操作系统,未来可能由Agent替代人类进行构建。早期采用者与观望者之间的差距或将迅速拉大。

Notion: BIG one for devs today. Introducing the Notion Developer Platform: - Notion CLI, ntn (Notion in your terminal) - Workers...

智能体MCP/工具产品更新
17:38
🚨 AI News | TestingCatalog@testingcatalog
70
OpenSquilla近日推出了一款开源Python AI代理,专为执行成本效益高的长时任务而设计。其核心创新是内容感知模型路由技术,能自动将简单任务分配给廉价模型,复杂任务分配给高性能模型,基准测试显示相比单一模型方案可节省60%-80%的token成本。该代理还集成四层持久化记忆系统,支持本地嵌入以提升效率,并提供不依赖Docker的系统调用级沙箱隔离,确保运行安全。项目采用Apache-2.0许可证开源,强调本地优先和Python基础。为验证成本节省效果,OpenSquilla启动了"1000万Token账单挑战",邀请用户对比账单,设立奖项包括忠实复现、最佳节省案例和质量错误报告三类,共30名获奖者各获得1000万OpenRouter积分,旨在推动高效AI代理的实践应用。

OpenSquilla: Long-running agents shouldn't pay frontier-model prices for every turn. We've been quietly building our agent with conte...

智能体MCP/工具开源/仓库
16:51
Berryxia.AI@berryxia
75
宝玉基于卡比开发的wx-cli命令行工具,编写了一个微信群聊总结Skill。该工具通过解密本地微信数据库工作,安装简便,仅需几步命令即可自动总结指定群聊(如"AI产品蝗虫")的当日消息。其优势在于无需关闭系统完整性保护(SIP),若运行报错,可将错误信息发送给AI代码助手寻求解决方案。相关项目源码已在GitHub开源。

向阳乔木: 宝玉老师基于卡比的wx-cli写了一个微信群聊总结Skill。 安装成功,正在总结下AI产品蝗虫今天的消息。 wx-cli不错啊,解密本地的微信数据库,甚至连SIP都不用关,如果报错,可以发给Codex或Claude Code解就行。 卡比...

GitHubMCP/工具教程/实践
15:40
IT之家(RSS)
精选74
"让 Token 消耗降低 61%":腾讯开源 Agent Memory

腾讯云开源了TencentDB Agent Memory,旨在解决Agent长任务中上下文窗口易满、Token成本高的问题。该方案采用“上下文卸载”与“Mermaid任务画布”两项核心技术,将完整信息卸载至外部存储,同时用结构化任务图保留关键状态与执行路径。实验显示,该方案在多任务连续会话中最高可降低61%的Token消耗,并提升任务成功率。项目已适配OpenClaw等主流框架,支持一键集成与本地SQLite存储。

智能体MCP/工具开源/仓库

推荐理由:腾讯开源的这个 Agent Memory,用 Mermaid 画布加上下文卸载,把长任务 Token 省了 61%,而且所有中间信息都可追溯,做复杂 Agent 的开发者可以直接抄作业了。
12:37
宝玉@dotey
65
Anthropic推出Claude for Small Business,将AI集成至小企业常用工具

Anthropic发布Claude for Small Business,将AI直接集成到QuickBooks、PayPal、HubSpot、Canva、DocuSign等小企业日常工具中。用户可通过Claude桌面端一键启动15项预设技能,覆盖工资核算、现金流预测、营销素材制作、合同签署及新员工入职等流程。收费仅为Claude订阅费加原有SaaS工具费用,无额外加价。工作流需人工启动审批,数据安全有保障。Anthropic瞄准占美国GDP44%的小企业市场,将提供免费线下培训及线上课程。此举可能冲击传统SaaS厂商,因其将工具变为后台,用户无需打开原界面。

AnthropicMCP/工具产品更新
12:26
向阳乔木@vista8
68
宝玉老师开发微信群聊总结Skill

宝玉老师基于卡比开发的wx-cli工具,编写了一个自动总结微信群聊消息的Skill。该工具通过解密本地微信数据库获取聊天记录,无需关闭系统完整性保护。用户可对指定群聊当天的消息进行内容总结,若遇报错可借助AI编程助手解决。相关工具源代码已在GitHub开源。

GitHubMCP/工具教程/实践
11:56
向阳乔木@vista8
64
Get笔记会员超值,支持多平台链接解读与集成

Get笔记的价值被严重低估,其会员年费仅99元,性价比极高。核心功能在于用户只需提供链接,即可解读来自小宇宙、B站、抖音、YouTube、TikTok等多个平台的内容,并能获取原始转写文本。此外,它还通过提供Skill和Cli工具,允许用户将Codex分析功能接入自己的网站,实现了服务的深度集成与扩展。

MCP/工具多模态评测/基准
11:40
AYi@AYi_AInotes
66
全网都在薅Claude今天的50%编程福利,但90%的人都没看懂背后的时间差

Anthropic近期调整了Claude的计费策略,自6月15日起将自动化使用从订阅额度剥离,改为独立信用额度,导致重度用户成本激增。随后,官方宣布为Claude Code提供截至7月13日的周限额50%临时提升,并与前期福利叠加。分析认为,此举旨在通过短期福利缓解开发者情绪,同时引导高消耗的自动化用户转向高付费API模式,而普通交互式编程用户则被临时福利留住,以适应新的计费规则。

ClaudeDevs: Claude Code weekly limits are increasing 50%, now through July 13. Live now for all Pro, Max, Team, and seat-based Enter...

AnthropicMCP/工具现象/趋势编码
08:51
ginobefun@hongming731
65
从头构建多智能体系统学到的经验

Shopify工程师Paulo Arruda分享构建多Agent系统的实战经验。最初为应对AI生成代码导致的PR质量问题,尝试用AI补充测试,但依赖图等方案成本过高。Claude Code预览版的推出带来转机,其基于Grep的代码搜索无需维护索引,使Agent能直接操作任意代码库。核心教训是:专才Agent(任务拆分)效果远优于通才Agent;为领域专家适配现有工作流的AI工具,比组建全能AI小队更高效、更易获得信任。

智能体MCP/工具现象/趋势
08:51
歸藏(guizang.ai)@op7418
54
Claude Code 的每周限额将增加 50%,持续到 7 月 13 号。

Anthropic 宣布 Claude Code 每周限额临时增加 50%,持续至 7 月 13 日。但从 6 月 15 日起,配额系统改为双轨制:在 Claude Code 官方界面内,Max 和 Pro 账户可享受原有订阅额度;若通过 Agent SDK 构建的第三方应用(如 OpenClaw、Codepilot)使用服务,额度将按 API 费率折算成等值金额,导致实际可用额度骤降。例如,Max 账户的 200 美元 API 额度在密集使用时可能半天耗尽。官方澄清月费不变,但额度分为“交互使用”和“程序化使用”两个独立池,后者按 API 速率计费。

Lydia Hallie ✨: To add some clarity: you don't pay extra. It's the same subscription, same price per month. What's new our sub now cover...

智能体AnthropicMCP/工具大佬观点
07:55
Claude Code:GitHub Releases(RSS)
精选67
Claude 工具 v2.1.141 版本更新

Claude 工具发布 v2.1.141 版本,带来多项功能新增与优化。主要更新包括:为钩子输出添加 terminalSequence 字段以支持无控制终端的桌面通知;新增 CLAUDE_CODE_PLUGIN_PREFER_HTTPS 环境变量,便于通过 HTTPS 克隆插件源码;引入 ANTHROPIC_WORKSPACE_ID 变量以在多工作区联盟中限定令牌范围。会话管理方面,claude agents 命令新增 --cwd 参数用于按目录筛选,并优化后台代理的状态归类。用户体验改进包括:在倒带菜单添加“总结至此”选项以压缩早期上下文;长思考超时后旋转指示器变色提供更明确反馈;此外,还修复了 Markdown 表格渲染异常、权限提示逻辑、历史记录管理等超过 30 项问题。

智能体AnthropicMCP/工具产品更新

推荐理由:Claude Code 的小版本但修得扎实,MCP 连接、/bg 权限继承、VSCode 语音等一堆边角都补了,Agent 模式稳定性明显提升,强烈建议升级。
01:34
Ethan Mollick@emollick
41
很好奇Gemini何时会加入Cowork & Codex的竞赛,开发一款不仅面向开发者的本地应用。Antigravity已经一个月没在X上发布更新,且仍非常专注于软件。与此同时我们看到OpenAI和Anthropic正在加速更新和发布。
AnthropicGoogleMCP/工具OpenAI
5月13日
17:39
IT之家(RSS)
66
Anthropic Claude Code 缔造者:数千个 AI 智能体夜间自动为我写代码

Anthropic工程师鲍里斯・切尔尼透露,他利用Claude Code的循环指令和例行任务功能,在夜间自动运行数千个AI智能体进行编程开发。他通常同时开启5至10个会话,每个会话包含多个智能体,并通过手机应用管理这些任务。这种模式标志着工程师将AI从聊天机器人转变为全天候自主助手。切尔尼此前在社交平台分享的智能体配置方案已获得超10.4万次收藏和810万次浏览。

智能体AnthropicMCP/工具教程/实践
14:04
Peter Steinberger 🦞@steipete
68
感谢微软,他们正助力OpenClaw做好企业级准备。

Omar Shahine: New in @openclaw beta: one path scheme to rule them all. `openclaw path read|write|append` works the same across md, jso...

GitHubMCP/工具Microsoft开源/仓库
13:50
歸藏(guizang.ai)@op7418
70
Skills功能已更新,新增了带地图的版式和地图组件。用户可让各自的AI更新此技能。更新后的地图支持缩放、拖动等基本交互操作,并且AI能够在地图上进行任意标记。这增强了AI在空间信息处理和可视化方面的能力。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

MCP/工具教程/实践
13:34
Peter Steinberger 🦞@steipete
48
Codex在调试Telegram问题时需要新令牌,于是使用Peekaboo打开Telegram Mac应用,联系botfather并完成了操作。 计算机应用令人惊叹。https://peekaboo.sh
智能体MCP/工具OpenAI教程/实践
12:50
Berryxia.AI@berryxia
精选76
oMLX更新强化苹果端侧AI,本地能力直逼云端

oMLX项目更新至0.3.9.dev2版本,集成了Gemma 4的MTP视觉路径、DFlash引擎和ParoQuant技术,显著提升了图文处理速度。新增一键启动copilot功能,可便捷接入Claude等工具,并通过oQ自动代理解决显存瓶颈。这些改进大幅增强了本地AI在速度、集成与易用性上的表现,正推动AI能力从云端向个人电脑回归。

GitHubMCP/工具多模态开源/仓库

推荐理由:oMLX 这个更新把 Gemma 4 的视觉能力塞进本地,加一键接入 Claude 的工具链,端侧 AI 从差点意思到真可用,值得每个 Mac 开发者立刻试一下。
12:39
IT之家(RSS)
66
腾讯元宝 App 官宣支持总结微信聊天记录:可提炼要点、汇总清单、整理攻略等

腾讯元宝App宣布新增支持总结微信聊天记录功能。用户将微信和元宝升级至最新版本后,可通过转发聊天记录至元宝,由AI自动提炼对话要点、生成清单或表单,并能整理成攻略,例如报销发票表格、旅行方案等。该消费者端AI助手于2024年5月正式发布,今年3月更新了更拟人化的Logo设计。

MCP/工具产品更新
10:36
宝玉@dotey
57
Claude自动化架构解析:Skill、Agent、Connector与Plugin如何协同工作

Claude通过四大组件实现自动化任务:Skill是领域工作流指南(如nda-review),指导操作但不执行;Agent是执行主体,Subagent用于并行处理子任务,Scheduled agent则定时自动运行(如合同到期监控);MCP connector连接外部数据源(如合同库),使Agent能访问真实数据;Plugin将上述组件打包,提供完整功能集(如commercial-legal plugin实现企业合同审查)。这些组件共同协作,使Claude能高效处理复杂工作流。

changbo: @dotey 大佬能否解释一下,这个 Claude 一会插件的,一会 Skills 的,一会这个 Agent 的,它他到底想干什么呀?

智能体AnthropicMCP/工具教程/实践
09:49
ginobefun@hongming731
76
OpenAI Codex新增Computer Use能力,AI助手操作桌面软件

OpenAI为Codex引入Computer Use能力,使其从操作代码扩展到本地GUI应用。Codex拥有独立光标,不接管用户输入,允许用户并行工作。技术架构混合视觉模态截图和无障碍框架API,Spark模型依赖无障碍数据加速任务执行。安全层面采用逐应用权限授权,在用户允许前无法访问任何应用,保护隐私。目前该功能已在Mac上可用,Windows支持即将推出。

智能体MCP/工具OpenAI产品更新
08:49
ginobefun@hongming731
57
AI Agent 落地三问:代码本质、长流程状态、GUI 操控

本期探讨AI Agent从演示走向生产环境的核心挑战。首先,在LLM时代,工程师的核心竞争力转向为问题域构建精准的概念模型与通用语言。其次,构建可靠的长流程Agent需进行关键架构转变:用持久化状态机替代对话历史来管理状态,采用事件驱动机制处理空闲等待,并通过多Agent委托实现职责分离。最后,GUI操控Agent的实践表明,执行自动化仅解决一半问题,对业务逻辑的深度理解才是关键。此外,基础设施需应对大规模并发访问的挑战。

智能体MCP/工具安全/对齐开源生态
08:49
Berryxia.AI@berryxia
61
Claude Code推出/goal功能,实现任务自动化

Claude Code推出/goal功能,允许用户通过一行命令让Claude持续工作直至任务完成,无需额外指令。该功能旨在实现开发任务的自动化,减少人工干预,提高工作效率。

AnthropicMCP/工具产品更新编码
08:00
HuggingFace Daily Papers(社区热门论文)
55
模型自适应工具必要性揭示LLM工具使用中的知行差距

研究发现大语言模型在工具使用上存在系统性“知行差距”——模型认知判断需要工具与实际调用工具的行为存在显著不匹配。基于模型自适应定义评估显示,算术与事实问答场景下不匹配率分别达26.5%-54.0%和30.8%-41.8%。通过对模型内部表征的探测分析发现,不匹配主要发生在从认知判断到动作执行的转换环节,而非认知判断本身。这表明提升工具使用可靠性需同步优化认知识别和行动执行两个层面。

智能体MCP/工具论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
56
SPIN:基于迭代导航的工业任务结构LLM规划

工业LLM代理系统常将规划与执行分离,但LLM规划器易产生结构无效或过长的流程,导致脆弱失败和额外成本。SPIN是一种规划封装器,结合验证有向无环图(DAG)规划和基于前缀的执行控制。它通过验证与修复提示强制执行严格的DAG契约,在下游执行前生成可执行计划,并增量评估DAG前缀以在满足查询时提前停止。在AssetOpsBench的261个场景中,SPIN将执行任务数从1061降至623,任务完成率从0.638提升至0.706,每次运行的工具调用数从11.81减少至6.82。在MCP Bench上,该封装器同样提升了GPT OSS1和Llama 4 Maverick在规划、落地和依赖关系方面的评分。

智能体MCP/工具论文/研究
07:27
Hacker News:AI 热帖
精选76
展示 HN:Statewright--通过可视化状态机提升AI智能体可靠性

Statewright 是一个通过状态机为AI智能体提供约束的系统,能控制其在各阶段可使用的工具,从而聚焦推理并提升可靠性。它将工作流定义为规划、实施、测试等多个阶段,自动执行工具限制与状态转换。在本地模型测试中,两个模型在5项SWE-bench子任务上应用约束后,正确率从2/10显著提升至10/10。该系统已集成到Claude Code等平台,一个修复测试失败的典型工作流可在46秒内完成。

智能体MCP/工具产品更新编码

推荐理由:Statewright用状态机给AI代理上“紧箍咒”,让13B小模型也能搞定SWE-bench任务,做coding agent的应该立刻装上试试。
07:06
宝玉@dotey
65
Anthropic开源"Claude for Legal"项目,为法律行业推出定制化AI工具集

Anthropic正式开源“Claude for Legal”项目,针对法律行业推出12个具体岗位的AI插件和超过20个连接行业常用软件的MCP连接器。用户通过简短的“冷启动访谈”定制本地CLAUDE.md文件,使插件能遵循团队特定的风格与标准,解决AI法律工具输出内容过于通用的问题。插件功能覆盖合同审阅、NDA分级、专利侵权对比表生成等重复性工作,并深度集成Thomson Reuters CoCounsel、iManage、DocuSign等主流平台。项目基于Claude Opus 4.7模型,但强调所有输出仅为律师审阅的草稿,不能替代专业法律判断。

AnthropicMCP/工具产品更新
05:02
Elon Musk@elonmusk
39
Grok现已具备技能 【引用 @techdevnotes】:在Grok Web中可通过输入/使用技能

Tech Dev Notes: Skills in Grok Web can be used by typing /

MCP/工具xAI产品更新
04:56
Hacker News 热门(buzzing.cc 中文翻译)
65
Show HN: Needle:我们将"双子座工具召唤"浓缩为一个26M模型

研究团队发布了名为Needle的轻量级模型,它将谷歌Gemini的工具调用能力浓缩至仅2600万参数。该模型在保持核心功能的同时,体积显著缩小,旨在实现更高效的部署与应用。项目代码已在GitHub开源,并在Hacker News社区获得了超过100点的关注度。

智能体MCP/工具开源生态模型发布
04:33
OpenAI Developers@OpenAIDevs
精选70
计算机使用让Codex能在你的应用间工作而不占用你的Mac。 @AriX与@romainhuet探讨当代理程序能点击、输入并在后台持续工作时将带来哪些改变。
智能体MCP/工具OpenAI产品更新

推荐理由:Codex 这个「computer use」不接管整台 Mac,只在后台帮你点、帮你打字,对用过 Cursor 接管全屏后心里发毛的开发者来说,是个更让人放心的设计,但有没有宣传的那么顺还得等实测。
01:54
Claude:Blog(网页)
精选73
Claude进军法律行业

Anthropic公司为法律行业发布20多个新的MCP连接器及12个专用插件,将Claude深度集成至合同管理、文档处理等法律核心软件栈。Claude现可直接在Microsoft Word、Outlook等办公应用中无缝工作,具备起草、修订、条款比对等可复用技能,并能自动化处理日常法律事务。公司同时宣布与多个司法公益组织合作,以扩大法律服务的可及性。

智能体AnthropicMCP/工具产品更新

推荐理由:Claude 这次在法律行业的布局很大,20+ 连接器和 12 个插件意味着它不是做表面集成,而是把律师的整套工具链都拉了进来——对律所是效率革命,对做垂直 AI 产品的团队则是教科书级的行业解决方案示范。
00:24
Claude:Blog(网页)
精选58
Code w/ Claude SF 2026开发者大会:基于AI指数级增长的构建

在Code w/ Claude SF 2026开发者大会上,Anthropic宣布提升开发者工具能力。Claude Code的速率限制翻倍,Claude Opus的API限制提高,以支持大规模可靠开发。同时,Claude平台上的托管智能体新增四项功能:“梦想”功能通过回顾会话优化记忆;多智能体编排支持主智能体并行委派子任务;“成果”功能通过定义输出标准提升任务成功率,内部测试显示最难问题成功率最多提升10%;Webhooks提供任务完成通知。大会主题演讲和分组会议录像已上线,并计划在伦敦和东京举办后续活动。

智能体AnthropicMCP/工具产品更新

推荐理由:虽然已是旧闻,但Dreaming和Outcomes这两个功能让agent能自我改进,是构建生产级AI团队的真信号,做Claude开发的值得补课。
00:04
凡人小北@frxiaobei
68
飞书CLI新增百项能力,AI Agent重塑工作流

飞书CLI近期悄然更新了100多项能力,允许用户通过AI Agent自动化编排飞书内的多项功能,如Bot、画板、妙记、审批和知识库。这旨在将AI能力从开发层延伸至日常协作层,解决工作碎片化问题。引用推文指出,管理者可为下属配置专属Agent,实现Agent间的自动化沟通与任务处理,从而让人专注于核心决策,提升个人与团队效率。官方提供了能力清单和使用案例以供参考。

凡人小北: 我给每个下属都配了一个专属 Agent,跑在飞书上。现在是他们的 Agent 在跟我的 Agent 对话,我在旁边看着。 带团队这些年,我最大的感受不是累,是碎。 各种项目要跟,各种进展要盯,各种需求要确认。AI 让每个程序员的产出翻了好几...

智能体MCP/工具教程/实践
5月12日
23:54
Xiaomi MiMo@XiaomiMiMo
58
重要提示:使用小米MiMo思考模式时需注意reasoning_content字段完整性

当在多轮代理会话中启用小米MiMo思考模式,且对话历史包含工具调用时,后续用户回合中传回的助手消息必须保留完整的reasoning_content字段,否则API将返回400错误。缺失该字段会导致模型上下文不完整,进而削弱指令跟随能力、增加幻觉并显著降低用户体验。受影响的框架包括TRAE、Cursor、Roo Code等,受影响模型涵盖MiMo-V2.5-Pro、MiMo-V2.5等多个系列。开发团队正与相关维护者合作推送兼容性更新以解决此问题。更多详情请参阅官方文档。

智能体MCP/工具教程/实践
‹ 上一页
1…1516171819…26
下一页 ›