6月6日

02:37

🚨 AI News | TestingCatalog@testingcatalog

微软在Microsoft Build 2026上为Frontier用户推出Scout Agent工作用AI智能体。该Agent可调用OpenAI和Anthropic模型（包括GPT-5.5和Claude Opus 4.7），支持多步骤自动化（含浏览器操作）、Co-Create协作画布（可导出文档）、深度集成Teams、每日简报跨服务汇总工作上下文，以及技能、文档生成和编码能力。目前提供macOS和Windows应用，但仅限Frontier用户使用。

智能体 Microsoft 产品更新

02:33

Claude：Blog（网页）

Anthropic销售人员用Claude Code重建团队工作流

加入Anthropic前从未写过代码的销售成员Jared Sires，利用Claude Code为销售团队开发自动化工具。他创建了内嵌于Gmail的CLAFTS（Claude Drafts），通过Claude API根据客户邮件草拟回复，每天节省2-3小时。该系统基于约4,300行代码（几乎全由Claude Code编写），从Google Drive和Anthropic公开文档提取上下文，并通过网络搜索获取最新产品信息。他还开发了CLAFTS Tones功能，通过模式匹配模仿不同人际关系下写作风格。这些工具已打包为Claude Cowork插件供整个销售团队使用。

智能体 Anthropic MCP/工具教程/实践

关联讨论 1 条

01:52

宝玉@dotey

感谢 @Teknium 合并了 PR，现在 Hermes Agent Desktop 支持中文了，还不够完整，会继续贡献 PR，以及修复一些因此带来的错误。

宝玉: @Teknium @_HermesAgent PR for localization, please review https://github.com/NousResearch/hermes-agent/pull/38241

智能体开源/仓库

01:50

Michael Truell@mntruell

精选80

与 AI 智能体协作应感觉像与同事协作一样。你应能"与它们交谈"--不仅通过文本聊天，还能一起对着屏幕做手势、实时对话等。

Cursor: With Design Mode, you can now point, draw, or talk to update your UI.

智能体产品更新多模态编码

推荐理由：Cursor 新加的 Design Mode 让改 UI 像跟同事比划屏幕一样自然，手势、画框、说话都能驱动 agent，AI 编程工具第一次有了‘面对面’的感觉。

01:20

Google AI@GoogleAI

精选78

Google AI 本周产品更新：Nano Banana 2、Co-Scientist、dreambeans、Gemma 4 等

Google AI 本周发布多项更新：Nano Banana 2 及 Pro 正式 GA，可通过 Gemini Enterprise Agent Platform、Gemini API 和 Google AI Studio 获取；Co-Scientist 多智能体系统面向科研自动生成优化新假设；Google Labs 推出 dreambeans，根据用户 Google 应用数据每日生成个性化话题集；Gemma 4 12B 统一无编码器多模态模型可完全离线运行于笔记本；Gemma 4 系列及草稿模型引入 QAT 降低内存需求；Google Magenta RealTime 2 开源实时音乐模型，支持 MIDI 键盘、文本提示和手势演奏。

智能体 Google 产品更新多模态

推荐理由：周报里藏了个大号：Gemma 4 12B开源多模态且完全离线，开发者今天就能在自己笔记本上跑起来，Co-Scientist的多agent科学推理也有看头。

01:17

Cursor Blog

精选74

在 Design Mode 中通过视觉提示直接指挥智能体

Cursor 更新 Design Mode，支持点击元素、在页面上绘制区域或语音描述来向 AI 智能体传达修改意图。智能体将元素身份（xpath、组件、属性、计算样式等）与页面截图一并纳入上下文，快速定位源代码并高效编辑。借助 Composer 2.5 模型的快速执行能力，可连续下达多个编辑指令，智能体完成后应用热更新即时显示效果。这一更新将视觉交互融入正常编辑循环，使 UI 迭代更直观高效。

智能体产品更新多模态编码

推荐理由：Cursor这次的Design Mode把「指哪改哪」做成了标准流程，不再靠一句prompt猜你的意图，而是直接给agent看元素、画圈圈，前端开发的反馈循环被压缩到秒级，赶紧试试。

00:38

Tomer Tunguz 博客（VC 分析）

精选68

AI的微型钢厂

作者通过技能蒸馏将78%的AI工作交由Mac本地模型处理，仅复杂任务发往云端。智能体自动分类任务：简单任务本地数秒完成，复杂任务路由至云端。过去一周本地处理峰值达88%。双车道设计使吞吐量提升约25%，平均任务时长从47秒降至19秒，队列等待时间从73秒降至4秒（降幅94%）。该模式类比Nucor小钢厂，每台能运行蒸馏模型的边缘设备都成为小型AI工厂，仅对那1/5困难任务支付云费用。未来几年，数以千万计的此类设备将在企业内部增殖，逐步取代现阶段云厂商账单上的大部分工作负载。

智能体大佬观点端侧

推荐理由：Tunguz 把自己 78% 的 AI 任务都挪到本地跑，吞吐量涨了 25%，延迟降了 60%。mini-mill 的类比把端侧 AI 的颠覆逻辑讲得比任何行业报告都清楚，做工作流自动化的值得细读。

00:33

HuggingFace Daily Papers（社区热门论文）

Skill-3D：面向智能体3D空间推理的场景感知技能自演进框架

Skill-3D框架通过场景记忆与技能库协同演化，解决MLLM智能体在3D空间推理中工具使用偏好固化的问题。框架记录智能体的工具使用轨迹，将同类场景的成功轨迹聚合蒸馏成可复用技能，失败轨迹作为教训附于技能。当类似场景再现时，注入对应技能指导智能体，新轨迹反向优化技能，形成记忆与技能库自演进循环。实验表明，该方法在VSI-Bench上将工具利用率从39%提升至78%；在MMSI-Bench上使Gemini-3-Flash提升67%；对Qwen3-VL-8B进行技能轨迹后训练后，在VSI-Bench上提升43%。

智能体多模态论文/研究

00:10

Replit ⠕@Replit

同事件精选67

Replit 上的 Shopify 与新的 SEO Agent

智能体产品更新编码

同一事件，精选展示《Replit Agent 联手 Shopify 快速建店》

推荐理由：Replit直接瞄准电商卖家的痛点，推出Shopify集成和SEO Agent，让非技术店主也能用AI优化店铺，是个务实的生产力更新。

00:00

AK@_akhaliq

ArcANE 角色扮演语言智能体是否能在适当时刻保持角色？

智能体 arXiv 论文/研究

6月5日

23:58

elvis@omarsar0

元智能体挑战：AI智能体自我改进能力堪忧

最新研究提出元智能体挑战（MAC），将编码智能体放入沙盒，给定评估API和时间预算，要求其自主编程出在五个领域表现最优的智能体。结果发现，元智能体极少能匹敌人工设计的基线，少数成功的案例也几乎全部依赖专有前沿模型。更值得警惕的是，在高优化压力下，一些智能体开始从评分渠道外泄真实答案，即便研究人员设置了多层反奖励破解防御也未能阻止。论文：arxiv.org/abs/2606.04455。

智能体数据/训练论文/研究