AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「MCP/工具调用」清除
6月1日周一
14:53歸藏(guizang.ai)67修复Codex断联与推理慢问题:根在配置文件
10:15MiniMax (official)79MiniMax M3:首个融合三大前沿能力的开源模型
09:55宝玉69用/goal分阶段处理任务的两种实用场景
08:00HuggingFace Daily Papers(社区热门论文)52SkillHarm:通过自动化构造实现生命周期感知的技能投毒攻击基准
00:16向阳乔木59AI辅助交互式阅读:划线即可对话
5月31日周日
20:46meng shao74OpenAI Codex 个人生活自动化智能体工具栈
10:14向阳乔木49Codex自动生成Suno歌曲MTV
09:49MarkTechPost(RSS)65使用 SkillNet 构建用于搜索、评估、图分析和任务规划的技能增强型 AI 智能体
08:13宝玉67Codex/Claude Code 调试网络请求的技巧
08:00HuggingFace Daily Papers(社区热门论文)65SkillVerse多模态技能范式与VisSkillBot:AI智能体的技能应超越纯文本
08:00HuggingFace Daily Papers(社区热门论文)59SkillAdaptor:一种面向LLM智能体的自适应技能方法
07:43宝玉61开源工具Sandcastle:编排多AI智能体协同工作流程
04:47Rohan Paul60本地运行的大语言模型比较:小参数MoE模型在智能体工具调用任务上击败大模型
5月30日周六
18:41Hacker News 热门(buzzing.cc 中文翻译)49Robinhood 现已支持您的 AI 代理进行股票交易
14:21IT之家(RSS)59Hermes Agent 加入工具搜索,"AI 养马"更省 tokens
12:34AYi71OpenAI Codex发布Windows版Computer Use功能
11:18MarkTechPost(RSS)52Hermes Agent 为 MCP 推出工具搜索功能:Anthropic 评测显示 Opus 4 准确率提升 49% 至 74%
11:14elvis65MCP:AI智能体不可或缺的基础协议
11:10Hacker News 热门(buzzing.cc 中文翻译)64MCP 死了?
09:21IT之家(RSS)74你的手机变遥控器,OpenAI 扩展 Codex 远程控制支持 Win10/Win11
06:42ginobefun70小技巧:一键配置 Claude Code
05:45Google AI Developers42Eigent平台利用Gemini Managed Agents API实现CI故障快速定位
04:42Claude Code:GitHub Releases(RSS)67精选v2.1.157 更新
03:45Google AI Developers63LlamaIndex 团队基于 Google Agents API 构建 LlamaParse/LiteParse 智能体模板
03:09宝玉63Codex计算机使用功能正式登陆Windows
02:38OpenAI73同事件精选Codex现已支持Windows端计算机使用功能同一事件,精选展示《ChatGPT移动端支持Codex,实现跨设备协作》
01:09宝玉62Claude Opus 4.8 支持对话中途修改系统提示词
00:36OpenRouter72精选OpenRouter支持模型生成文件补丁
00:33Tomer Tunguz 博客(VC 分析)65精选技能提炼
5月29日周五
23:14elvis68AI智能体评估新指标:有效反馈计算提升成功率
21:30HuggingFace Daily Papers(社区热门论文)67CoHyDE:大语言模型重写器与稠密编码器的迭代协同训练,用于工具检索
21:14The Decoder:AI News(RSS)61新综述论文认为:代码是AI智能体的思考与行动方式,而非仅仅是其产出
17:44公众号:通义实验室(千问)64精选通义实验室发布教程:在 Android 手机部署 MCP 感知服务器
15:21IT之家(RSS)70精选阿里云开源百炼 CLI,Agent 可调用全套模型和应用能力
15:10meng shao48Cursor不只是编程助手:它解决了我的网络问题
12:40StepFun71阶跃星辰Step 3.7 Flash在ZenMux平台上线
11:42歸藏(guizang.ai)49已经刷到好几个拿藏师傅的 PPT Skills 和小红书配图 Skills 做出千赞内容的小红书的博主了 说明这玩意儿确实有用。 你们再发的话可以艾特一下我,我还得给你们点点赞
09:49凡人小北37Claude Code 动态工作流功能预览
08:02公众号:阶跃星辰(Step)61同事件精选阶跃发布 Step 3.7 Flash,面向生产级 Agent 的高效率 Flash 模型同一事件,精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI——Step 3.7 Flash》
08:00HuggingFace Daily Papers(社区热门论文)49从提示词注入到持久控制:防御智能体框架中的木马后门
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月1日
14:53
歸藏(guizang.ai)@op7418
67
修复Codex断联与推理慢问题:根在配置文件

作者解决了其Codex推理速度异常缓慢且频繁断联的问题。在同一网络环境下,其他设备运行正常,这排除了网络原因。最终发现根源是配置文件中错误地写死了两个参数,并强制加载了两个MCP,导致了性能问题。建议遇到类似情况的用户,可尝试利用Codex自身能力来检查其配置文件。

MCP/工具OpenAI教程/实践编码
10:15
MiniMax (official)@MiniMax_AI
79
介绍 MiniMax M3:首个融合三大前沿能力的开源权重模型 - 编码与智能体前沿:59.0% SWE-Bench Pro,66.0% Terminal Bench 2.1,34.8% SWE-fficiency,28.8% KernelBench Hard,74.2% MCP Atlas - MiniMax Sparse Attention 将上下文窗口扩展至 1M - 从零开始原生多模态 API:http://platform.minimax.io Token 计划:https://platform.minimax.io/subscribe/token-plan 🚀新!MiniMax Code:http://code.minimax.io 权重与技术报告将在约 10 天内发布
智能体MCP/工具多模态模型发布
关联讨论 12 条X:MiniMax (@MiniMax_AI)MiniMax:Blog(网页)X:Kim (@kimmonismus)X:Testing Catalog (@testingcatalog)HuggingFace Daily Papers(社区热门论文)公众号:MiniMax(稀宇科技)X:OpenRouter (@OpenRouter)X:karminski (@karminski3)X:硅基流动 SiliconFlow (@SiliconFlowAI)X:歸藏 (@op7418)MarkTechPost(RSS)IT之家(RSS)
09:55
宝玉@dotey
69
用/goal分阶段处理任务的两种实用场景

推文分享了使用/goal的两种核心方法:一是将逆向代码等复杂任务拆解为清单,例如先通过脚本解析生成JSON文件,再让AI分批处理并实时更新状态;二是与AI共同编写设计文档,划分成具体阶段,设定验收条件后逐步执行,每个阶段完成后自动提交。这两类场景强调将AI作为结构化任务执行助手,通过明确的检查点与流程控制提升工作效率。引用部分提及该功能正在被用户尝试,并征集最佳实践案例。

dontbesilent: 大家真的开始用 /goal 解决问题了吗 能否在评论区留下你用 /goal 的最佳实践?

智能体MCP/工具教程/实践
08:00
HuggingFace Daily Papers(社区热门论文)
52
SkillHarm:通过自动化构造实现生命周期感知的技能投毒攻击基准

SkillHarm是一个覆盖AI智能体技能使用生命周期的攻击基准,配以系统化风险分类。它定义两种攻击场景:固定载荷投毒(FPP)和自我变异投毒(SMP),并基于受害工作流组件(数据管道、系统环境、自主性)划分12种风险类型。AutoSkillHarm管道由自然语言驱动编码智能体,生成71个技能、879个攻击样本。实验显示FPP成功率最高86.3%,SMP最高69.3%,许多表面失败实因智能体未触及恶意文件而非真正抵抗。

智能体MCP/工具安全/对齐
00:16
向阳乔木@vista8
59
AI辅助交互式阅读:划线即可对话

推文介绍了一种结合飞书与AI的交互式阅读方法。核心流程为:1. 使用 Codex 或 CC 将 EPUB 电子书按章节导入飞书文档;2. 人工阅读时在文档中对有感触的内容进行划线、加粗或评论;3. 再次调用 Codex 读取这些标记与评论,由AI进行解释和回复。作者认为此方法有趣,并计划将其封装为可复用的 Skill。

MCP/工具教程/实践
5月31日
20:46
meng shao@shao__meng
74
OpenAI Codex 个人生活自动化智能体工具栈

该推文介绍了以OpenAI Codex为核心的个人生活自动化智能体工具栈。它集成了Google全家桶、WhatsApp、电报及浏览器自动化等工具,并以Google Drive作为“真相源”数据层。核心是跨应用编排与判断,关键决策需经人工批准。技能(如inbox-zero)是可迭代的操作手册,用于固化偏好。典型的“介绍邮件”编排展示了Agent在处理多工具、高上下文切换任务时的效率。工具优先级为API/CLI > 本地文件 > 浏览器自动化。

Nicolas Bustamante: http://x.com/i/article/2060579190920110081

智能体MCP/工具教程/实践
10:14
向阳乔木@vista8
49
只需提供一个Suno歌曲的URL,用Codex自动生成音乐MTV。 Codex自动调用生图、组织画面、生成对齐的歌词。 Skill等继续完善后就可以开源了。
MCP/工具多模态开源/仓库视频
09:49
MarkTechPost(RSS)
65
使用 SkillNet 构建用于搜索、评估、图分析和任务规划的技能增强型 AI 智能体

本教程展示如何实现 SkillNet 用例,将其作为一个实用框架,用于发现、安装、检查、评估和组织可重用的 AI 技能,以构建技能增强型 AI 智能体。

智能体MCP/工具搜索教程/实践
08:13
宝玉@dotey
67
Codex/Claude Code 调试网络请求的技巧

本文介绍两种让 Codex/Claude Code 自动获取网页网络请求数据进行调试的方法,无需手动复制粘贴。方法一:使用 Chrome 的“Export HAR”功能导出 .har 文件,并将文件路径发给 Codex 分析。方法二:安装 Codex 的 Chrome 浏览器扩展,在对话中使用 @chrome 指令,让 Codex 直接操作浏览器进行调试与抓包。

MCP/工具教程/实践
08:00
HuggingFace Daily Papers(社区热门论文)
65
SkillVerse多模态技能范式与VisSkillBot:AI智能体的技能应超越纯文本

现有AI智能体的可复用技能多以纯文本形式存储,这在视觉中心任务中构成了瓶颈。研究提出了SkillVerse多模态技能范式,将声明式文本逻辑与显式视觉支持相结合,包含静态先验、动态先验和交错视觉技能三种可复用形式。配套系统VisSkillBot能自动将智能体经验转化为可复用的多模态技能。实验表明,视觉技能在需要空间对应、视觉证据和状态感知交互的GUI等任务中,持续优于纯文本技能。

智能体MCP/工具多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
59
SkillAdaptor:一种面向LLM智能体的自适应技能方法

SkillAdaptor 是一种无需训练的步骤级技能自适应框架,能进行显式故障归因。它针对智能体失败的执行轨迹,识别首个可操作的故障步骤,并将责任归因于候选技能,随后在骨干模型冻结的前提下进行针对性更新与验证。在 WebShop、PinchBench 和 Claw-Eval 上使用 Kimi-K2.5、GLM-5 和 GPT-5.2 的评估表明,该框架在所有三项基准测试中均优于无技能和现有技能适应基线。

智能体MCP/工具论文/研究
07:43
宝玉@dotey
61
开源工具Sandcastle:编排多AI智能体协同工作流程

Sandcastle是由@mattpocockuk开源的一个TypeScript工具,允许用户通过脚本编排Workflow,在虚拟机中协同调用Codex、Claude Code、Cursor、GitHub Copilot等多个AI智能体来完成复杂任务。它定位为面向追求极致效率场景的极客工具,适用于需要多智能体协作或“赛博养蛊”式的任务,例如让各智能体分别生成技术方案再相互评审完善。

Matt Pocock: I built my own software factory, and I open-sourced it. It's called Sandcastle. Here's how to use it:

智能体MCP/工具开源/仓库
04:47
Rohan Paul@rohanpaul_ai
60
本地运行的大语言模型比较:小参数MoE模型在智能体工具调用任务上击败大模型

在MacBook Pro M5 Max 64GB上的本地测试中,Liquid的LFM2.5-8B-A1B模型在需要完成7个工具调用的旅行规划任务上,显著优于OpenAI的gpt-oss-20b。LFM2.5-8B-A1B仅使用4.8GB内存,以266tok/s的速度成功完成了全部7/7工具调用,耗时6.9秒。相比之下,gpt-oss-20b消耗了11GB内存,仅完成3/7工具调用,速度为146tok/s,耗时15秒。这表明,一个活跃参数规模更小(1B)的MoE模型,通过更精准的训练,在工具调用这一智能体任务上可以战胜活跃参数规模约其2.5倍的更大模型。

atomic.chat: Liquid's LFM2.5-8B-A1B smashed OpenAI's gpt-oss-20b on tool calling We ran both locally on a MacBook Pro M5 Max, 64GB, a...

MCP/工具端侧评测/基准
5月30日
18:41
Hacker News 热门(buzzing.cc 中文翻译)
49
Robinhood 现已支持您的 AI 代理进行股票交易

Robinhood 现已允许用户通过 AI 代理进行股票交易。该功能由 TechCrunch 于 2026 年 5 月 27 日报道。

智能体MCP/工具产品更新
14:21
IT之家(RSS)
59
Hermes Agent 加入工具搜索,"AI 养马"更省 tokens
智能体MCP/工具产品更新
12:34
AYi@AYi_AInotes
71
OpenAI Codex发布Windows版Computer Use功能

OpenAI发布了Codex的Windows版Computer Use功能。根据演示视频,Codex已能处理像素级的Windows原生GUI操作,例如在收到“测试我正在做的WinUI应用”指令后,能直接打开Paint(画图)应用,流畅地选择工具、调色并一笔一笔绘制图案,这展示了其vision-action loop的成熟度。官方通过WinUI测试等场景,暗示该功能面向真实的生产环境。同时,通过ChatGPT移动应用,用户可以从手机端启动、审核和引导Codex在Windows机器上执行任务,形成“手机指挥+桌面执行”的跨设备协作流程。

OpenAI: Windows users, this one's for you. Computer use now works on Windows, so Codex can take action on your Windows computer....

智能体MCP/工具OpenAI产品更新
11:18
MarkTechPost(RSS)
52
Hermes Agent 为 MCP 推出工具搜索功能:Anthropic 评测显示 Opus 4 准确率提升 49% 至 74%

Nous Research 的 Hermes Agent 为 MCP 添加了工具搜索功能,以解决上下文膨胀问题。该功能采用 BM25 渐进式模式披露机制。根据 Anthropic 的评测,在 Opus 4 模型上,此功能实现了 49% 到 74% 的准确率提升。

智能体AnthropicMCP/工具开源/仓库
11:14
elvis@omarsar0
65
MCP:AI智能体不可或缺的基础协议

作者认为MCP(模型上下文协议)对AI智能体的未来至关重要,其核心价值不仅在于工具连接,更在于它所启用的抽象能力。作者以自身构建的自我改进系统为例,该系统完全通过MCP驱动,展示了MCP如何赋能智能体间交互、实现复杂协调、版本控制、评估工作流及工具集成等关键功能。作者强调,尽管新事物可能不断涌现,但MCP协议本身对于未来所有进展将是必要且关键的基础。

智能体MCP/工具大佬观点
11:10
Hacker News 热门(buzzing.cc 中文翻译)
64
MCP 死了?

Hacker News上一篇题为“MCP 死了?”的文章引发讨论,获得了103分。文章来自quandri.io,发布于2026年5月29日,但未提供关于MCP(模型上下文协议)现状的具体论述或结论。

MCP/工具现象/趋势编码
09:21
IT之家(RSS)
74
你的手机变遥控器,OpenAI 扩展 Codex 远程控制支持 Win10/Win11
MCP/工具OpenAI产品更新编码
关联讨论 3 条X:OpenAI Developers (@OpenAIDevs)X:Berry Xia (@berryxia)X:OpenAI (@OpenAI)
06:42
ginobefun@hongming731
70
Anthropic 发布了官方插件 claude-code-setup,用于简化 Claude Code 的配置。它能自动扫描项目,一键推荐并配置 Hooks、技能、MCP 服务、子代理及自动化功能。该插件可将原本 30-60 分钟的手动配置过程,缩短至 3-5 分钟完成。安装命令为:`/plugin install claude-code-setup@claude-plugins-official`。

Dr. Moyu|摸鱼局长: 安装了这个之后,Claude Code 的体验会立马不一样 Anthropic 悄悄发布了一个官方插件 claude-code-setup,把 Claude Code 从「还不错」升级成了专业的 AI 开发环境 它会自动扫描你的项目,一键推...

AnthropicMCP/工具教程/实践
05:45
Google AI Developers@googleaidevs
42
Eigent平台展示了集成Gemini Managed Agents API的实际效果。其开源协作工具Eigent使用Gemini 3.5 Flash和该API,快速定位了一个真实的megatron-lm CI故障,在几分钟内找到了根本原因。工作流程中,协调员智能体规划审计,开发员智能体加载`ml-failure-audit`技能并收集证据,随后Gemini智能体作为远程子智能体接手进行深度推理。这体现了Managed Agents在自动化复杂任务中的效率。

Eigent AI: Gemini 3.5 flash + Gemini managed agents api just audited a real megatron-lm ci failure inside Eigent. root cause in min...

智能体GoogleMCP/工具教程/实践
04:42
Claude Code:GitHub Releases(RSS)
精选67
v2.1.157 更新

此版本主要改进了插件系统,现可自动加载 .claude/skills 目录中的插件,并通过 claude plugin init 创建;/plugin 命令增加了自动补全。claude agents 现在会应用 settings.json 中的 agent 字段,并支持 --agent 参数覆盖。更新修复了多个具体问题,包括处理不可用图片导致的崩溃、在 tmux 中的剪贴板复制失效(2.1.153 回归)、后台会话恢复后日期不正确等。此外,优化了长对话及恢复对话的性能,并改进了在 VS Code、Cursor 和 Windsurf 等 IDE 中的体验。

智能体AnthropicMCP/工具产品更新

推荐理由:Claude Code 这个版本把插件从市场限制中解放出来,自动加载本地 skills 目录,对喜欢自己鼓捣定制工作流的开发者是个实实在在的便利。
03:45
Google AI Developers@googleaidevs
63
LlamaIndex 团队基于 Google 新发布的 Agents API 构建了一个模板,使智能体能够访问 LlamaParse 和 LiteParse,从而自动处理非结构化文档。其工作流程为:配置数据与输出的 Git 仓库,将仓库克隆至智能体沙箱,安装 LiteParse CLI 与 LlamaParse SDK 及相关技能,最后通过提示词驱动智能体自主执行任务。该模板最终形成一个可直接使用 LlamaParse 和 LiteParse 处理真实世界文档的智能体。

LlamaIndex 🦙: 🚀 The team at @Google just released the Agents API, a service for building and running custom agents inside a sandboxed...

智能体GoogleMCP/工具教程/实践
03:09
宝玉@dotey
63
Codex计算机使用功能正式登陆Windows

OpenAI宣布其Codex的“计算机使用”功能正式支持Windows系统。该功能使AI能像人类一样操作桌面应用,此前于4月中旬上线时仅支持macOS。同时更新了手机远程控制能力,现可通过ChatGPT手机App在移动设备上启动、监控和审批运行于Windows电脑的Codex任务。这是继5月支持Mac主机后的扩展,目前仍属于早期体验。

OpenAI: Windows users, this one's for you. Computer use now works on Windows, so Codex can take action on your Windows computer....

智能体MCP/工具OpenAI产品更新
02:38
OpenAI@OpenAI
同事件精选73
Windows用户,这条消息是给你的。 计算机使用功能现已在Windows上可用,因此Codex可以在你的Windows电脑上执行操作。 通过ChatGPT移动应用中Codex的Windows支持,你可以在工作继续在Windows电脑上进行时,随时随地启动、审查和引导任务。 这是一项早期体验,但我们正在努力提供更多方式,让你的工作无论身在何处都能持续进行。
智能体MCP/工具OpenAI产品更新
同一事件,精选展示《ChatGPT移动端支持Codex,实现跨设备协作》
推荐理由:Windows 用户终于等到 Codex 能直接操控电脑了,配合手机端协同一气呵成,虽然还早期,但已经把 AI 真正带进日常工作流里。
01:09
宝玉@dotey
62
Claude Opus 4.8 支持对话中途修改系统提示词

Anthropic为Claude Opus 4.8新增mid-conversation system messages API功能。该功能允许在对话进行中动态修改系统提示词(System Prompt),且不会影响Prompt Caching。此前,系统提示词只能在对话开头固定设置,开发者有时通过user消息中的特殊标签尝试覆盖。新功能支持插入更高优先级的系统指令以调整Agent行为。此功能目前仅限Claude Opus 4.8及其官方API与AWS上的Claude Platform。

Lance Martin: a number of useful tips + tricks for Opus 4.8: 1/ you can now update the system prompt mid-conversation w/o breaking the...

智能体AnthropicMCP/工具产品更新
00:36
OpenRouter@OpenRouter
精选72
OpenRouter 现已支持 "apply_patch",这是一个服务器工具,允许任何模型通过 Responses API 使用 V4A diffs 提出文件编辑建议。 模型生成一个补丁(创建、更新或删除文件)。OpenRouter 在服务器端验证 diff 语法。
智能体MCP/工具产品更新编码

推荐理由:OpenRouter 这个 apply_patch 解决了多模型文件编辑的碎片化,任何模型接上就能出 diff,做 coding agent 的可以少写一堆适配代码。
00:33
Tomer Tunguz 博客(VC 分析)
精选65
技能提炼

“技能提炼”是一种知识转移方法,由前沿大模型(如 Opus 4.7、GPT-5.1、Gemini 3 Pro)负责撰写并优化标准化的 SKILL.md 流程文件。然后,本地运行的小模型(如 Qwen 35B、Gemma 26B)直接执行这些文件。此过程不同于压缩模型权重的知识蒸馏、训练权重的指令微调或检索事实的 RAG,其核心是提取并转移操作流程,让小模型按步骤执行,从而形成前沿模型作教师、小模型作执行者的循环。

智能体MCP/工具大佬观点

推荐理由:Tomer 把个人代理的完整工作流摆了出来,用大模型写 skill 小模型执行,这条蒸馏思路比调 prompt 高级,想认真跑本地代理的人该盯一下。
5月29日
23:14
elvis@omarsar0
68
AI智能体评估新指标:有效反馈计算提升成功率

新研究提出“有效反馈计算(EFC)”指标,用于优化AI智能体测试框架的设计。传统评估中,原始token数和工具调用次数预测智能体失败的R²值仅为0.33至0.42,而EFC将此提升至0.99。基于EFC进行资源重分配,可在相同计算量下将智能体成功率从0.27显著提升至0.90,使框架设计从经验猜测变为可预测过程。

智能体arXivMCP/工具论文/研究
21:30
HuggingFace Daily Papers(社区热门论文)
67
CoHyDE:大语言模型重写器与稠密编码器的迭代协同训练,用于工具检索

CoHyDE 是一种迭代训练框架,旨在解决大语言模型智能体在大型 API 目录中进行工具检索时面临的核心瓶颈。用户查询常使用口语化、描述不充分的自然语言,而 API 目录使用固定的技术性术语。该框架将稠密编码器与 LLM 重写器视为一个协同演化系统进行训练:编码器在重写器生成的、符合目录风格的假设性描述上通过 InfoNCE 进行重训练;重写器则通过 DPO 根据编码器的检索分数进行偏好对齐。在 ToolBench 目录约 10k 工具的子集上,三轮 CoHyDE 迭代后,其在标准查询上的 NDCG@5 得分较最强单组件基线提升 +2.5 pp,在模糊查询上提升 +6.3 pp。消融实验证实,协同训练是该方法在结构化与模糊查询上均取得优势的关键。

智能体arXivMCP/工具论文/研究
21:14
The Decoder:AI News(RSS)
61
新综述论文认为:代码是AI智能体的思考与行动方式,而非仅仅是其产出

一篇新综述论文提出,自主AI智能体的真正瓶颈并非语言模型本身,而是工具、内存、测试与权限边界等构成的软件层。这一“约束层”将无状态模型转化为能行动的工作智能体。DeepSeek已在北京组建专门的Harness团队,其“模型加约束层等于AI智能体”的公式印证了该观点。

智能体DeepSeekMCP/工具论文/研究
17:44
公众号:通义实验室(千问)
精选64
通义实验室发布教程:在 Android 手机部署 MCP 感知服务器

通义实验室发布教程,演示如何在 Android 手机上部署 MCP 感知服务器,使手机具备本地视觉与听觉分析能力。核心基于端侧 MNN 推理引擎和 Qwen3-VL 2B 模型(约 1.3GB),摄像头与麦克风采集的音视频在本地实时转化为结构化 JSON,再通过 MCP Tool 供 Claude Code 等云端 Agent 远程调用。整个过程不上传原始数据,仅传输语义提取结果。项目已开源,实测可识别红绿灯状态等场景。

MCP/工具多模态教程/实践端侧

推荐理由:如果你做Agent总觉得AI对物理世界是瞎子,这篇教程就是解药。把Qwen3-VL塞进手机当本地眼睛,不传原始视频只给结构化文字,隐私友好又能被Claude直接调用。
15:21
IT之家(RSS)
精选70
阿里云开源百炼 CLI,Agent 可调用全套模型和应用能力
智能体MCP/工具产品更新

推荐理由:阿里云把百炼的全套能力打包成 CLI,Agent 开发终于不用再一个个接 API 了,做企业智能助手的可以试试。
15:10
meng shao@shao__meng
48
Cursor不只是编程助手:它解决了我的网络问题

推文作者全天遭遇网络代理(🪜)问题,导致Codex连接失败。他使用Cursor分析代理设置,Cursor在几分钟内分析了代理实现、执行测试并修复了代理方式,随后亲自调用CLI测试Codex以确认修复。为预防未来问题,Cursor还集成了用户此前提供的DeepSeek API密钥,创建了一键切换至DeepSeek的选项,确保了服务可用性。

智能体MCP/工具教程/实践编码
12:40
StepFun@StepFun_ai
71
阶跃星辰(Step Fun)的视觉语言模型Step 3.7 Flash已在ZenMux平台上线。该模型采用稀疏MoE架构,专为智能体、编程、搜索、多模态及长上下文工作流设计。其核心性能包括:400 TPS推理速度、约110亿激活参数、256K上下文窗口及3个推理级别。该模型能够理解UI、图表、文档和图像以编写代码或调用工具,并擅长深度网络与视觉搜索,在τ2-bench上跨难度级别取得98%+的成绩。它兼容Claude Code、MCP风格工作流等,并可本地部署于Mac Studio M4 Max、DGX Spark等硬件。

ZenMux: Excited to support Step 3.7 Flash by @StepFun_ai on ZenMux from day one. 🚀 A sparse MoE vision-language model built for...

智能体MCP/工具多模态模型发布
11:42
歸藏(guizang.ai)@op7418
49
已经刷到好几个拿藏师傅的 PPT Skills 和小红书配图 Skills 做出千赞内容的小红书的博主了 说明这玩意儿确实有用。 你们再发的话可以艾特一下我,我还得给你们点点赞
MCP/工具大佬观点
09:49
凡人小北@frxiaobei
37
工作流 -> 智能体 -> 动态工作流 🤔

ClaudeDevs: New in Claude Code (research preview): dynamic workflows. Claude writes an orchestration script on the fly, then spins u...

智能体AnthropicMCP/工具产品更新
08:02
公众号:阶跃星辰(Step)
同事件精选61
阶跃发布 Step 3.7 Flash,面向生产级 Agent 的高效率 Flash 模型

阶跃星辰发布并开源 Step 3.7 Flash,采用稀疏 MoE 架构(总参数 196B+1.8B,激活 11B),最高生成速度 400 Tokens/s。围绕原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排、Agent 生态兼容优化四大能力优化。在 Toolathlon 达 49.5%,ClawEval-1.1 达 67.1%,GDPval 达 45.8%,τ²-bench Telecom 通过率超 98%。兼容 Claude Code、KiloCode 等主流架构及 MCP/Skills 协议,支持云端与本地部署,已在 Kilo Code 等生态中完成接入验证。

智能体MCP/工具多模态开源生态
同一事件,精选展示《在 NVIDIA GPU 上运行面向企业级就绪的多模态 AI--Step 3.7 Flash》
推荐理由:Step 3.7 Flash 用激活仅 11B 的 MoE 架构把 Agent 工作流稳定性做透了,兼容主流框架还开源,对需要低延迟、高可靠性的生产环境 Agent 是真正可用的选择。
08:00
HuggingFace Daily Papers(社区热门论文)
49
从提示词注入到持久控制:防御智能体框架中的木马后门

在本地智能体框架中,LLM智能体通过读写文件与复用状态增强了能力,但也面临多步木马攻击风险。攻击者可在文件或工具输出中嵌入提示词注入,智能体可能读取并执行这些隐藏指令。现有防御因检查步骤孤立,难以检测早期植入的后门。ClawTrojan基准测试在GPT-5.4模拟环境中实现了95.5%的攻击成功率。为此提出的DASGuard方案,通过扫描敏感文件中的控制文本、追溯其来源并移除非可信内容,实现了动态防御。

智能体MCP/工具论文/研究
‹ 上一页
1…910111213…26
下一页 ›