AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「MCP/工具调用」清除
4月26日周日
16:21阿绎 AYi55Clicky:常驻光标的AI助手,语音操控自动执行任务
14:20IT之家(RSS)29斑马智能联合东风首发淘宝闪购 Agent 上车,支持一句话点餐
12:21Peter Steinberger 🦞46CodexBar 0.23发布 新增多项AI工具支持
11:21阿绎 AYi53用AI让X平台为你打工,告别无效信息刷屏
08:00HuggingFace Daily Papers(社区热门论文)48PageGuide:辅助用户在网页中导航与定位信息的浏览器扩展
04:22宝玉69AI Agent时代的产品设计范式变革
4月25日周六
23:58阿绎 AYi37Seedance 2.0与Rita平台复刻经典AI视频,创作重心转向创意
23:26meng shao60Claude Managed Agents 中的 Memory 设计方案
18:17Hacker News:AI 热帖60展示 HN:一个由智能体维护的 Karpathy 风格 LLM 维基(基于 Markdown 和 Git)
17:42Hacker News 热门(buzzing.cc 中文翻译)58Show HN: 浏览器框架--赋予大型语言模型(LLM)自由完成任何浏览器任务的能力
17:40阿绎 AYi42Rita平台直连原版Seedance 2.0,性价比之选
14:13阿绎 AYi65开源工具25秒深度克隆网站设计系统,设计或从"手艺"变为"数据"
10:32歸藏(guizang.ai)53修复问题并新增Skill.sh安装方式
4月24日周五
20:00OpenRouter:Announcements(RSS)57同事件精选OpenRouter Agent SDK:构建多轮智能体工作流同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
20:00OpenRouter:Announcements(RSS)55精选Agent SDK:在 OpenRouter 上构建多轮智能体工作流
14:08IT之家(RSS)47小米支付服务 Skill 上线:开发者三步可完成接入,支持微信支付、支付宝等
11:17HuggingFace Daily Papers(社区热门论文)63VLAA-GUI:何时停止、恢复与搜索--一个用于 GUI 自动化的模块化框架
10:08IT之家(RSS)51长安、东风、北汽、比亚迪等接入阿里千问,一句话完成订餐、购物等
02:54Claude51Claude新增多款生活应用连接功能
4月22日周三
17:08IT之家(RSS)51澎湃 OS 3 Beta 版向小米 17 系列手机推送"龙虾"智能体 Xiaomi miclaw
11:08IT之家(RSS)承诺"你敢付我敢赔",支付宝 AI 付支持 OpenClaw 龙虾类智能体
08:00HuggingFace Daily Papers(社区热门论文)62告别繁琐工程:实现AI智能体工具套件全自动设计与优化的两级框架
4月21日周二
17:48TestingCatalog News 🗞Anthropic Conway重大升级:Always-on Agent将支持可共享的自定义UI
17:22公众号:通义实验室(千问)37AgentScope Tuner:让 Agent 越用越聪明
17:11IT之家(RSS)中国信通院启动可信技能(Skills)治理首批测试评估工作,最终结果 7 月公布
16:34HuggingFace Daily Papers(社区热门论文)面向跨会话个性化工具调用的潜在偏好建模
15:11IT之家(RSS)我国自主量子计算机"本源悟空"形成搭载人工智能运算能力,上线量子知识大模型等
12:34HuggingFace Daily Papers(社区热门论文)WebCompass:面向代码语言模型的多模态网页编程评估基准
11:34HuggingFace Daily Papers(社区热门论文)Agent-World:面向通用智能体演化的真实世界环境合成扩展
4月20日周一
19:44Peter Steinberger 🦞MCPorter 🧳 0.9.0 发布了。 通过 TypeScript 或 CLI 调用 MCP。 - 按服务器工具过滤 - 更稳定的 stdio 关闭 - Windows OAuth URL 引号修复 - OAuth 配置文档 - 工具调用的 schema 声明字符串强制转换 https://github.com/steipete/mcporter/releases/tag/v0.9.0
4月19日周日
15:07宝玉57GitHub Copilot Agent权限跳过设置技巧
08:37宝玉51Hermes集成baoyu-infographic技能生成信息图
4月18日周六
03:58Claude49Claude for Word上线Pro与Max套餐
4月17日周五
08:00HuggingFace Daily Papers(社区热门论文)GTA-2:从原子级工具使用到开放式工作流的通用工具智能体基准测试
07:47TestingCatalog News 🗞xAI 也在为 Grok iOS 版准备 Skills 的推出。 > 此前,Skills 功能已在网页版(隐藏)中被发现 > 目前尚不清楚 Grok Skills 将由 Skills 标准提供支持,还是采用定制实现(如 Chrome 上的 Gemini) > iOS 应用支持 Skills 将非常独特,因为 ChatGPT 和 Claude 的移动应用均不支持该功能 > 测试一些能帮助 Grok 处理 X 数据的 Skills 会很酷 h/t @M1Astra
03:52OpenAI Developers我们正在为 Codex 添加更多插件,让它有更多方式收集上下文并在你的技术栈中执行操作。 新插件包括 @coderabbitai、@Remotion、@CircleCI 等。
00:52OpenAI Developers"人们不再只是为人类构建产品了。他们在为智能体构建。" @Cloudflare 分享了 Cloudflare Sandbox SDK 如何与 OpenAI Agents SDK 协同工作,帮助智能体在安全环境中运行代码,同时将敏感数据与执行过程分离。
4月16日周四
08:11宝玉74精选使用 Claude Code:会话管理与 100 万上下文【译】
06:40Claude Code:GitHub Releases(RSS)Claude Code CLI v2.1.110 发布
02:43OpenAI Developers借助 Agents SDK 和 @Vercel Sandbox,agents 可以在隔离环境中执行工作,同时将凭证与 harness 分离。
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月26日
16:21
阿绎 AYi@AYi_AInotes
55
Clicky:常驻光标的AI助手,语音操控自动执行任务

前_buildspace创始人Farza发布了Mac端AI助手Clicky。它常驻光标旁,用户无需打开应用或打字,直接对屏幕说话即可触发。AI能理解指令并自动执行任务,例如整理桌面截图、创建提醒事项、搜索整理网红列表生成CSV文件,甚至能在几分钟内根据描述编译并运行一个功能完整的原生Mac App。其核心突破在于从“用户主动寻找并操作AI”转变为“AI常驻感知屏幕,听令即执行”,直接完成而非仅提供操作路径,类似于数字员工而非聊天机器人。目前该产品已可免费下载。

智能体MCP/工具产品更新
14:20
IT之家(RSS)
29
斑马智能联合东风首发淘宝闪购 Agent 上车,支持一句话点餐

在2026北京国际车展上,斑马智能与东风研发总院宣布,基于元神AI的淘宝闪购Agent将首次搭载于东风天元智舱。该功能允许用户仅通过自然语音完成全流程点餐,能精准识别模糊意图、自动匹配门店并推荐餐品,支持自由对话与订单中途修改。服务覆盖全品类美食,原生集成于座舱系统,可实现优惠自动叠加、配送时间智能联动导航。未来双方还计划在影音娱乐、出行游玩等场景推出更多原生Agent服务。

智能体MCP/工具行业动态
12:21
Peter Steinberger 🦞@steipete
46
CodexBar 🎚️ 0.23 已发布: 新增 Mistral 支持、Claude Designs/Daily Routines 使用情况、Cursor Extra 使用情况、GPT-5.5 定价、更简洁的小部件/菜单,以及一系列可靠性修复。https://github.com/steipete/CodexBar/releases/tag/v0.23
MCP/工具产品更新编码
11:21
阿绎 AYi@AYi_AInotes
53
用AI让X平台为你打工,告别无效信息刷屏

作者指出,每天刷X平台实质是在为其免费提供内容劳动。通过利用OpenClaw等工具连接X的API,可以逆转这一关系:让AI 24小时自动扫描平台,将指定领域(如AI创业)的潜在爆款内容及分析推送到Telegram,并过滤垃圾信息。其中,“Reply Guy”策略能捕捉爆款帖子发布初期的机会,通过抢先发布高质量评论获取巨大曝光。此外,工具提供的全局仪表盘有助于洞察各国信息差,发现机会。作者亲测该方法成本极低,能将每日信息获取时间从一小时压缩至五分钟,认为AI能将人从无意义的信息劳动中解放,专注于思考与创造。未来的竞争力在于精准过滤垃圾信息并抓住核心的1%。

智能体MCP/工具教程/实践
08:00
HuggingFace Daily Papers(社区热门论文)
48
PageGuide:辅助用户在网页中导航与定位信息的浏览器扩展

PageGuide是一款浏览器扩展,通过视觉叠加将大语言模型的回答直接锚定在网页中,以解决用户在杂乱页面中定位信息、完成多步骤任务和对抗干扰内容三大需求。它提供三种模式:Find模式原位高亮答案来源以供验证;Guide模式分步显示操作指南引导用户执行;Hide模式帮助隐藏干扰内容。一项涉及94名用户的研究表明,该工具在所有模式下均显著优于无辅助浏览,例如Hide模式使任务准确率大幅提升、完成时间缩短70%,Guide模式提高任务完成率,Find模式则减少80%的Ctrl+F使用并缩短任务时间。代码与演示已开源。

智能体MCP/工具论文/研究
04:22
宝玉@dotey
69
AI Agent时代的产品设计范式变革

文章指出,AI Agent正成为用户与软件交互的主要中间层,未来80%的人机交互将通过Agent完成。这要求产品设计范式从面向人类用户界面转向优先为AI Agent服务。核心转变包括:软件需通过API、MCP、CLI等方式向Agent开放能力,Salesforce的“Headless 360”计划是典型案例;产品需主动向Agent提供成功所需的关键规范与上下文,如Notion MCP的做法;需建立有效的反馈循环机制,利用Agent的调用理由和反馈工具来驱动产品迭代。设计者需明确系统与调用方Agent各自的上下文优势,并填补信息缺口。传统图形界面不会消失,但产品必须为Agent优先使用而构建。

智能体MCP/工具产品更新大佬观点
4月25日
23:58
阿绎 AYi@AYi_AInotes
37
Seedance 2.0与Rita平台复刻经典AI视频,创作重心转向创意

用户通过Seedance 2.0和Rita平台制作AI视频,复刻了潘金莲与西门庆等经典场景,并分享提示词技巧。Rita平台直接接入原版Seedance 2.0,模型无降智,支持高并发分钟级出片,月费11.99美元可跑30条4秒视频。工具门槛降低后,创作瓶颈从工具操作转向创意打磨,更多时间用于优化prompt和画面分镜。推荐提示词已放在评论区供取用。

阿绎 AYi: 兄弟们,挖到一个好东西,必须分享出来,直接说结论: 目前能跑原版Seedance 2.0、不排队、不降智、 还能传真人照片生成真人视频的平台, 性价比最高的就是Rita, 总之强烈推荐,冲就完了! 有好多兄弟私信问我,怎么好久没发AIGC内...

MCP/工具教程/实践视频
23:26
meng shao@shao__meng
60
Claude Managed Agents 中的 Memory 设计方案

该方案主张让AI自主使用文件系统等通用工具管理记忆,比专用架构更有效,且此能力随模型智能提升而自然涌现。技术上将记忆实现为工作区内持久化、可多智能体同步的明文文件存储,挂载于/mnt/memory/。上下文管理采用双轨模型:Session Log处理会话工作记忆,Memory Store负责跨会话长期记忆。设计理念从“为AI安装记忆”转变为“提供通用工具”,使记忆成为可审计、可迁移的开放文件资产,体现了智能扩展在工具使用中的重要性。

Lance Martin: http://x.com/i/article/2047708413208219649

智能体MCP/工具大佬观点
18:17
Hacker News:AI 热帖
60
展示 HN:一个由智能体维护的 Karpathy 风格 LLM 维基(基于 Markdown 和 Git)

WUPHF 是一个为 AI 员工设计的协作办公平台,通过一个命令即可启动,在本地提供 Web 界面。它将不同角色的 AI 智能体置于一个共享的虚拟办公室中,使其可见、可争论并协作完成任务。平台为每个智能体提供私人笔记,团队共享一个基于 Markdown 和 Git 的本地维基,智能体可自主将可靠信息同步至团队知识库。项目目前处于 1.0 版本前的预发布阶段,默认使用 Claude Code,支持通过命令行参数灵活配置。

智能体MCP/工具产品更新开源/仓库
17:42
Hacker News 热门(buzzing.cc 中文翻译)
58
Show HN: 浏览器框架--赋予大型语言模型(LLM)自由完成任何浏览器任务的能力

开源项目“Browser Harness”发布,旨在赋予大型语言模型(LLM)在浏览器中自主完成任意任务的能力。该工具通过提供一个可编程的浏览器控制框架,使LLM能够像人类一样操作网页,执行点击、输入、导航等复杂交互。此举有望突破当前AI代理在自动化网络操作方面的限制,扩展LLM的实际应用场景。该项目已在GitHub开源,并在Hacker News社区获得100点热度关注。

智能体MCP/工具开源/仓库
17:40
阿绎 AYi@AYi_AInotes
42
Rita平台直连原版Seedance 2.0,性价比之选

博主推荐Rita作为目前性价比最高的AI视频生成平台。该平台是GamsGo旗下产品,与字节官方合作,直接接入未经降配的原版Seedance 2.0模型,无需排队且生成速度快。其Mega套餐月费为11.99美元,可生成30条4秒视频,新用户注册赠送积分。博主通过生成“潘金莲与西门庆重逢”等视频测试,确认其画面细节与官方效果一致,认为该平台降低了工具门槛,使创作者能将更多精力集中于创意与提示词打磨。

MCP/工具教程/实践视频
14:13
阿绎 AYi@AYi_AInotes
65
开源工具25秒深度克隆网站设计系统,设计或从"手艺"变为"数据"

开源工具Hyperbrowser能在约25秒内深度解析并克隆网站(如Anthropic官网)的完整设计系统,自动提取颜色、字体、间距等样式,并总结设计语言,生成结构化文档。这标志着设计正从依赖手艺的“像素级模仿”转变为可快速解析、复制的结构化数据,大幅降低了借鉴成熟设计系统的门槛,未来竞争焦点可能转向对设计DNA的快速吸收与再创造。

MCP/工具开源/仓库教程/实践
10:32
歸藏(guizang.ai)@op7418
53
修复了一些问题,增加了 Skill .sh 的安装方式

歸藏(guizang.ai): http://x.com/i/article/2047484171258634240

智能体MCP/工具教程/实践
4月24日
20:00
OpenRouter:Announcements(RSS)
同事件精选57
OpenRouter Agent SDK:构建多轮智能体工作流

OpenRouter Agent SDK 提供 callModel 函数,能将聊天补全转换为支持工具调用、停止条件和成本追踪的多步智能体,覆盖 300 多个模型。

智能体MCP/工具产品更新
同一事件,精选展示《OpenRouter Agent SDK 发布 `create-agent-tui` 与 `create-headless-agent` 技能,可快速搭建个性化编码智能体》
推荐理由:OpenRouter把agent构建压缩进一个callModel函数,内置工具调用、停止条件和成本追踪,对已在它生态里的开发者省下不少样板代码,可惜时效过了。
20:00
OpenRouter:Announcements(RSS)
精选55
Agent SDK:在 OpenRouter 上构建多轮智能体工作流

OpenRouter 发布 Agent SDK,其核心是 callModel 函数。该函数可将一次聊天完成转化为具备工具调用、停止条件与成本追踪功能的多步骤智能体工作流。这一工具兼容平台上的 300 多个模型,使开发者能够便捷地构建复杂的多轮交互智能体应用。

智能体MCP/工具产品更新

推荐理由:OpenRouter 把多轮 agent 编排封装成一个 callModel 函数,300+ 模型统一调用,做 agent 产品的人可以少写不少胶水代码,但本质上是工程封装而非技术突破。
14:08
IT之家(RSS)
47
小米支付服务 Skill 上线:开发者三步可完成接入,支持微信支付、支付宝等

小米澎湃OS开发者平台正式推出支付服务Skill能力,支持主流AI开发工具。该服务通过标准化接口,帮助商户快速对接收银台及支付功能,内置完整流程与适配方案,大幅简化开发周期。开发者仅需下载安装Skill、通过自然语言交互接入支付能力、自动联调测试三步即可完成接入,一次性支持小米支付、微信支付、支付宝等多种支付方式,并覆盖App/H5/小程序支付、拆单、退款等多项功能。

MCP/工具产品更新部署/工程
11:17
HuggingFace Daily Papers(社区热门论文)
63
VLAA-GUI:何时停止、恢复与搜索--一个用于 GUI 自动化的模块化框架

VLAA-GUI 是一个模块化 GUI 智能体框架,围绕停止、恢复与搜索三个核心组件构建。其强制性完整性验证器要求每一步完成时都必须提供可观察的 UI 成功证据,并通过决策规则交叉审查完成声明。强制性循环中断器提供多层过滤机制,在重复失败时切换交互模式,在屏幕状态持续重现时强制改变策略。按需调用的搜索代理可直接向具备搜索能力的大语言模型查询陌生工作流程。框架还集成了按需调用的编码代理与接地代理。在包含 Linux 和 Windows 任务的 OSWorld 与 WindowsAgentArena 基准测试中,VLAA-GUI 在五个顶级骨干模型上均取得最佳性能,分别达到 77.5% 和 61.0% 的成功率。其中三个骨干模型在 OSWorld 上单次通过即超越人类表现。消融实验表明所有三个组件均能持续提升强骨干模型性能,而循环中断器几乎将易循环模型浪费的步骤减半。

智能体MCP/工具论文/研究
10:08
IT之家(RSS)
51
长安、东风、北汽、比亚迪等接入阿里千问,一句话完成订餐、购物等

在2026北京车展上,长安、东风、北汽、比亚迪、吉利、长城、理想、上汽大众、上汽智己等多家车企宣布接入阿里千问大模型。接入后,部分车型将能通过一句话指令完成复杂路径规划、闲聊、查新闻、订酒店、买门票、点外卖、查快递等全场景服务。阿里云提供了“端+云”协同架构:端侧部署Qwen-Omni模型负责感知与快速响应,云端千问则链接数字世界并调用阿里巴巴生态服务。此前,一汽红旗已于3月26日率先接入千问。

智能体MCP/工具行业动态
02:54
Claude@claudeai
51
Claude 现在可以连接更多您在工作之外使用的应用程序,包括 @Tripadvisor、@bookingcom、@resy、@Instacart、@Spotify、@audible_com、@AllTrails、@thumbtack、Intuit @turbotax 等。
AnthropicMCP/工具产品更新
4月22日
17:08
IT之家(RSS)
51
澎湃 OS 3 Beta 版向小米 17 系列手机推送"龙虾"智能体 Xiaomi miclaw

小米澎湃OS 3 Beta版已向小米17系列、Redmi K90 Pro Max等机型推送“龙虾”智能体Xiaomi miclaw。该智能体基于小米MiMo大模型,能让手机成为AI工具,理解用户意图后调用应用与系统工具完成任务。主要更新包括新增人格与技能体系、支持自然语言创建定时任务、可使用80多项系统工具,并预置了日程、沟通、办公等多场景一方助手。它还支持跨设备同步记忆和文件搜索传输,并可通过助手商店扩展能力。目前该产品仍属前沿探索,在稳定性与复杂场景处理方面持续优化。

智能体MCP/工具产品更新
11:08
IT之家(RSS)
承诺"你敢付我敢赔",支付宝 AI 付支持 OpenClaw 龙虾类智能体

支付宝AI付正式发布对OpenClaw(龙虾)类AI智能体的支持,用户可在JVS Claw、DTClaw、Claude Code等智能体中通过语音指令开通支付功能,完成缴费、购Token、购物等操作。服务采用7×24小时智能风控,需手动身份核验及本人授权确认,支付宝承诺"你敢付我敢赔"保障交易安全。

智能体MCP/工具产品更新
08:00
HuggingFace Daily Papers(社区热门论文)
62
告别繁琐工程:实现AI智能体工具套件全自动设计与优化的两级框架

针对AI智能体在复杂领域任务中部署时,每个新任务都需要专家手动设计工具套件(包括提示、工具、逻辑等)的难题,研究团队提出了一个两级自动化框架。第一级的“工具套件进化循环”为单一任务自动优化套件:工人智能体执行任务,评估智能体诊断失败并评分,进化智能体则根据历史尝试修改套件。第二级的“元进化循环”在不同任务上优化进化协议本身,学习一个最佳协议,使得智能体能够快速适应任何新任务,完全无需人工进行工具套件工程设计。该框架将手动工程转变为自动化工程,并进一步实现了自动化设计本身的自动化。

智能体MCP/工具论文/研究
4月21日
17:48
TestingCatalog News 🗞@testingcatalog
Anthropic Conway重大升级:Always-on Agent将支持可共享的自定义UI

Anthropic正升级其always-on Agent项目Conway。新系统将支持用户创建、分享和重用自定义UI标签页(如任务控制、工作流管理等),并由Anthropic顶级模型驱动。目前iOS应用已隐藏新增设置界面,网页端也引入Built-in与Installed分类组件。这一扩展功能标志着Agent交互向模块化、可共享方向演进,允许用户构建个性化工作流界面。

智能体AnthropicMCP/工具产品更新
17:22
公众号:通义实验室(千问)
37
AgentScope Tuner:让 Agent 越用越聪明

AgentScope Tuner 让 AI 智能体在工具调用中越用越聪明,持续优化行为,减少误调问题。

智能体MCP/工具产品更新
17:11
IT之家(RSS)
中国信通院启动可信技能(Skills)治理首批测试评估工作,最终结果 7 月公布

中国信息通信研究院4月21日启动可信技能(Skills)治理首批测试评估,针对智能体技能模块存在的执行偏差、调度失序、安全隐患等可信度问题,设置"执行可信""调度可控""合规可靠"三大类共15个指标70余个细分项,覆盖Skills治理、Skills库治理等方向。评估工作将于2026年5-6月开展材料审核与技术测试,最终结果在2026年7月相关产业大会发布。

智能体MCP/工具政策/监管
16:34
HuggingFace Daily Papers(社区热门论文)
面向跨会话个性化工具调用的潜在偏好建模

针对用户请求常省略关键细节导致工具调用输入不完整的问题,研究者推出MPT基准测试与PRefine方法。MPT包含265个多会话对话,涵盖偏好回忆、归纳与迁移三大挑战。PRefine通过生成-验证-精炼循环将用户偏好建模为动态假设,从历史提取可复用约束,在仅消耗全历史提示1.24% token的情况下提升工具调用准确率。研究表明,有效的个性化需捕获用户选择背后的原因而非仅记录选择本身。

智能体arXivMCP/工具论文/研究
15:11
IT之家(RSS)
我国自主量子计算机"本源悟空"形成搭载人工智能运算能力,上线量子知识大模型等

本源量子宣布,我国第三代自主超导量子计算机"本源悟空"首次系统性搭载人工智能运算能力,实现量子算力与AI应用生态融合。该计算机搭载72位自主超导量子芯片"悟空芯",于2024年1月上线运行。此次同步推出量子知识大模型Origin Brain及QPanda3 Runtime MCP服务,用户可通过自然语言交互提交量子计算任务,无需编程即可调用真实量子算力,显著降低使用门槛。

智能体MCP/工具产品更新
12:34
HuggingFace Daily Papers(社区热门论文)
WebCompass:面向代码语言模型的多模态网页编程评估基准

研究团队发布WebCompass基准,首次对代码语言模型进行全生命周期多模态网页开发能力评估。该基准涵盖文本、图像、视频三种输入模态,设置生成、编辑、修复三类共七项任务,覆盖15个生成领域、16种编辑操作及11种缺陷类型,难度分三级。评估采用LLM-as-a-Judge与Agent-as-a-Judge(基于MCP在真实浏览器中自动测试)相结合的方法。实测显示:闭源模型综合能力显著领先;美学表现是开源模型的最大瓶颈;Vue框架难度最高,React和Vanilla/HTML表现更稳定。

MCP/工具多模态编码论文/研究
11:34
HuggingFace Daily Papers(社区热门论文)
Agent-World:面向通用智能体演化的真实世界环境合成扩展

研究团队推出Agent-World,一个用于提升通用智能体能力的自演化训练平台。该系统包含两大核心:自主环境任务发现机制,从数千真实世界主题中探索数据库与工具生态并合成可验证任务;以及持续自演化训练框架,结合多环境强化学习与动态任务合成,自动识别能力缺口并驱动针对性学习。Agent-World-8B和14B模型在23项智能体基准测试中持续超越主流专有模型,研究还揭示了环境多样性与自演化轮次对智能体性能的提升规律。

智能体MCP/工具论文/研究
4月20日
19:44
Peter Steinberger 🦞@steipete
MCPorter 🧳 0.9.0 发布了。 通过 TypeScript 或 CLI 调用 MCP。 - 按服务器工具过滤 - 更稳定的 stdio 关闭 - Windows OAuth URL 引号修复 - OAuth 配置文档 - 工具调用的 schema 声明字符串强制转换 https://github.com/steipete/mcporter/releases/tag/v0.9.0
MCP/工具开源/仓库
4月19日
15:07
宝玉@dotey
57
小技巧,如何在 GitHub Copilot 的 Agent 中避免老是确认权限,类似于 claude --dangerously-skip-permissions 在 Settings -> Claude Agent: Allow Dangerously Skip Permissions 中勾选 Allow bypass permissions mode. Recommended only for sandboxes with no internet access. 然后在对话框下面的 Permission 中选择 Bypass Approvals https://code.visualstudio.com/docs/copilot/agents/agent-tools#_permission-levels
MCP/工具教程/实践编码
08:37
宝玉@dotey
51
在 Hermes 里面用 baoyu-infographic skill 生成的信息图👍 > /baoyu-infographic + <URL> 直接生成一张高质量信息图

Marco Rodrigues: Just tried the new infographic skill from @dotey in my Hermes Agent from @NousResearch. I gave it the URL of my new arti...

智能体MCP/工具教程/实践
4月18日
03:58
Claude@claudeai
49
Claude for Word 现已面向 Pro 和 Max 计划推出,可与 Opus 4.7 一同使用:https://claude.com/claude-for-word
AnthropicMCP/工具产品更新
4月17日
08:00
HuggingFace Daily Papers(社区热门论文)
GTA-2:从原子级工具使用到开放式工作流的通用工具智能体基准测试

研究团队发布GTA-2基准测试,用于评估通用工具智能体从原子级操作到开放式工作流的综合能力。该基准包含GTA-Atomic(短期封闭任务)和GTA-Workflow(长期开放任务),采用递归检查点机制分解目标并评估端到端完成度。实验显示,前沿模型在原子任务上成功率不足50%,在工作流任务中仅达14.39%。分析表明,检查点反馈及Manus、OpenClaw等执行框架可显著提升性能,凸显执行架构设计比底层模型能力更为关键。

智能体MCP/工具论文/研究
07:47
TestingCatalog News 🗞@testingcatalog
xAI 也在为 Grok iOS 版准备 Skills 的推出。 > 此前,Skills 功能已在网页版(隐藏)中被发现 > 目前尚不清楚 Grok Skills 将由 Skills 标准提供支持,还是采用定制实现(如 Chrome 上的 Gemini) > iOS 应用支持 Skills 将非常独特,因为 ChatGPT 和 Claude 的移动应用均不支持该功能 > 测试一些能帮助 Grok 处理 X 数据的 Skills 会很酷 h/t @M1Astra
MCP/工具xAI产品更新
03:52
OpenAI Developers@OpenAIDevs
我们正在为 Codex 添加更多插件,让它有更多方式收集上下文并在你的技术栈中执行操作。 新插件包括 @coderabbitai、@Remotion、@CircleCI 等。
智能体MCP/工具OpenAI产品更新
00:52
OpenAI Developers@OpenAIDevs
"人们不再只是为人类构建产品了。他们在为智能体构建。" @Cloudflare 分享了 Cloudflare Sandbox SDK 如何与 OpenAI Agents SDK 协同工作,帮助智能体在安全环境中运行代码,同时将敏感数据与执行过程分离。
智能体MCP/工具OpenAI产品更新
4月16日
08:11
宝玉@dotey
精选74
使用 Claude Code:会话管理与 100 万上下文【译】

Anthropic 为 Claude Code 推出 /usage 更新,核心在于管理 100 万词元上下文窗口以避免性能衰减。文章介绍了关键策略:开启新会话适用于新任务;使用“回溯”功能从历史节点重启以高效纠错;“压缩”功能自动总结历史,“清空”则需手动提炼要点;当工作产生大量中间结果时,使用“子智能体”在独立上下文中执行并仅返回结论更佳。目前,掌握这些决策是引导 Claude 产出高质量结果的关键。

AnthropicMCP/工具教程/实践编码

推荐理由:这是 Anthropic 官方写的 Claude Code 上下文管理手册,100 万窗口不是让你一股脑塞进去就行,回溯、压缩、子智能体这些操作的使用时机才是真正的生产力分水岭,用 Claude Code 的人应该打印出来贴在显示器旁边。
06:40
Claude Code:GitHub Releases(RSS)
Claude Code CLI v2.1.110 发布

新增 /tui 命令实现全屏无闪烁渲染,Ctrl+O 改为切换详细转录模式,焦点视图由 /focus 独立控制。强化插件管理界面,新增 MCP 服务器配置冲突警告,扩展远程控制客户端对多条斜杠命令的支持。修复 30 余项问题,包括 MCP 工具调用挂起、全屏高 CPU 占用、非受信文件名命令注入漏洞等,并优化内存分配与会话管理。

智能体AnthropicMCP/工具产品更新
02:43
OpenAI Developers@OpenAIDevs
借助 Agents SDK 和 @Vercel Sandbox,agents 可以在隔离环境中执行工作,同时将凭证与 harness 分离。
智能体MCP/工具OpenAI产品更新
‹ 上一页
1…212223242526
下一页 ›