6月9日

04:07

宝玉@dotey

字节跳动豆包手机团队招聘设计工程师，需具备 Android 平台经验。团队调研总结了五种设计工程师画像：AI Design Engineer（转译 AI 能力为交互产品体验，处理 agent workflow、tool call、状态反馈等）、Product UI Craft Engineer（打磨高质量前端原型和交互细节）、Design Systems Engineer（建立设计系统与前端基础设施，连接 Figma 变量和代码组件）、Creative Technologist / Motion & Graphics Engineer（负责动效、实时图形、3D/空间交互）、AI Design Workflow Architect（搭建 AI 辅助设计工作流，使用 Claude Code、Cursor、v0 等工具）。多数设计工程师技能交叉，欢迎感兴趣者联系。

笑林: Cursor 招聘设计工程师了,非常令人心动,但我还犹豫着不能行动; 我在字节工作了8年,一直游走在动效设计师和设计工程师之间。最近我的团队(豆包手机团队)也在招聘设计工程师,但是我们需要的方向更多要有一些对 Android 平台的了解,和...

智能体 MCP/工具大佬观点

02:50

Claude：Blog（网页）

精选72

Claude 为 Connector 开发者推出性能监控仪表盘

Claude 为目录中已发布的 Connector 新增性能监控仪表盘（公开测试版）。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟，并按工具细分错误归因；还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号（Admin/Owner 权限或自定义角色）。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录，该目录已有超 300 个第三方 Connector，每日被数百万人使用。

Anthropic MCP/工具产品更新

关联讨论 1 条

推荐理由：Claude给connector开发者加了仪表板，能跟踪用量和错误，还能直接提交到目录，做MCP集成的省了监控的麻烦，即开即用。

01:05

宝玉@dotey

宝玉评微信AI：超级入口或非微信，Agent才是未来

微信发布《开发者接入微信 AI 生态的指引》，引导小程序开发者接入微信 AI，让 AI 控制小程序。宝玉对此评论称，微信试图通过让 AI 操作小程序来维持自身超级入口地位，但未来年轻人不会主动打开微信，而是直接向自己的 Agent（如"帮我总结群聊"或"给妈妈发消息"）发出指令。承担超级入口职责的很可能不是微信 AI。

歸藏(guizang.ai): 微信终于要加 AI Agent 能力了? 微信发布了《开发者接入微信 AI 生态的指引》这篇文章,引导小程序开发者接入微信 AI 生态,让微信的 AI 控制小程序。感觉这个可能是未来微信 AI 上一个非常重要的功能

智能体 MCP/工具大佬观点现象/趋势

6月8日

23:24

OpenRouter@OpenRouter

同事件精选72

新服务器工具：Advisor 让较小的模型咨询一个更高智能的"顾问"模型。帮助它们逃出困境循环，并帮助你迁移到更便宜的模型！🧵

智能体 MCP/工具产品更新

同一事件，精选展示《OpenRouter 推出 Advisor 工具：让低成本模型可随时调用强模型增强生成》

推荐理由：OpenRouter 这个 Advisor 工具，用大模型给小模型当顾问，专治死循环。想降本到小模型又怕质量跳水的团队，可以试试这个方案。

22:34

Kimi.ai@Kimi_Moonshot

同事件精选76

Kimi Work：本地桌面AI智能体，支持300智能体并行

Kimi发布Kimi Work，一款本地运行的桌面AI智能体。支持最多300个AI智能体同时在本地机器并行运行；配合WebBridge浏览器扩展，智能体可在浏览器中导航、搜索、点击、填写并完成任务；内置全球市场数据工具，可直接调用Yahoo Finance和世界银行数据，无需复杂API设置；记忆系统会记录用户偏好、过往决策和上下文。支持macOS（Apple Silicon）和Windows。

智能体 MCP/工具产品更新端侧

同一事件，精选展示《Kimi Work Beta版发布：面向知识工作者的本地Agent》

推荐理由：这个产品把AI agent从聊天窗口搬到了桌面，300个并行agent和内置金融工具直接对标专业人群，如果它能稳定运行，个人AI助手的形态又要被重新定义了。

21:50

Hugging Face：Blog（RSS）

精选62

开源社区支持 OpenEnv 用于智能体强化学习

今日，Hugging Face 宣布 OpenEnv 项目进一步开放，由 Meta-PyTorch、Reflection、Unsloth 等组成的委员会协调，并获得 PyTorch Foundation、vLLM、SkyRL（UCB）等机构支持。OpenEnv 是创建终端、浏览器等智能体执行环境的工具，定位为训练器与环境间的互操作层，标准化环境的发布、部署和消费，但不定义奖励或训练循环。它基于客户端/服务器架构提供 Gymnasium 风格 API（reset()、step()、state()），支持 HTTP、WebSocket、Docker 打包，并将 MCP 作为一等公民，使环境在模拟和生产模式下行为一致。未来将聚焦任务集对接数据集、外部奖励、Harness 集成及自动验证，以推动开源智能体 RL 基础建设。

智能体 Hugging Face MCP/工具 Meta

推荐理由：开源社区在 agent RL 环境上终于开始合流，Meta、Nvidia、Hugging Face 等联合推动 OpenEnv 成为接口标准，不做奖励框架，只做插线板。搞开源 agent 训练的人，这是少有的统一基础设施的机会。

19:40

Rohan Paul@rohanpaul_ai

Kocoro：开源 Mac AI agent 框架，本地化记忆管理

Kocoro 是一个引擎级的开源 Mac AI agent 框架。它通过本地 agent 读取用户的过往会话、文件、应用、浏览器、屏幕和终端，将有用事实压缩为记忆，使 agent 无需重复上下文即可继续工作。安全模型以本地优先：工具操作需授权，危险命令被拦截或二次确认，行为可审计，秘密自动脱敏，记忆/同步默认不上传。其“情景记忆”将历史会话转化为项目事实、决策、协作者、截止日期和习惯。每晚自动将工作日蒸馏成本地知识图谱，次日直接恢复进度。

Wayland Zhang: The models keep getting smarter. The users keep turning into assistants. You paste the file. Re-explain the project. Nar...

智能体 MCP/工具开源/仓库端侧

18:20

IT之家（RSS）

消息称京东首批内测接入微信 AI，涵盖电商、外卖、物流等业务

京东作为首批内测团队率先接入微信AI，将围绕电商、外卖、物流等业务接入微信AI Agent。微信开放平台提供自动模式和开发模式两种接入方式：自动模式由平台读取小程序源码并分析页面，无需额外开发；开发模式允许开发者基于业务特性自主开发，通过审核后可被微信AI调用。

智能体 MCP/工具产品更新

17:42

公众号：数字生命卡兹克

同事件精选71

微信AI Agent生态曝光：嵌入小程序调用与手机厂商合作

腾讯正测试嵌入微信的AI Agent，用户右滑唤出对话窗口，通过自然语言指令调用数百万小程序完成点咖啡等任务。微信还与华为、荣耀、小米、OPPO、vivo合作推出A2A助手能力，可通过手机语音助理发起微信音视频通话或发送消息。6月8日，微信官方发布《关于开发者接入微信AI生态的指引》，提供自动接入模式，利用微信沙箱全自动改造小程序，使其可被AI直接调用。这一布局被视为Agentic Commerce（代理式交易）的雏形。

智能体 MCP/工具现象/趋势

同一事件，精选展示《微信AI官宣内测：两种接入模式供开发者选择》

推荐理由：微信想用Agent把小程序生态变成操作系统，靠Agentic Commerce抽佣，一旦跑通，想象力比广告大得多。

16:20

IT之家（RSS）

精选73

微信AI官宣内测：两种接入模式供开发者选择

微信开发者官方今日发布指引，确认微信AI正在内测阶段。开放平台提供两种接入模式：自动模式可授权平台读取小程序源码，无需额外开发即可让微信AI直接操作页面；开发模式下开发者可自主开发技能，审核后由微信AI调用。两种模式可同时开启。微信AI是微信内的AI助手，用户通过自然语言对话即可调用、访问和操作小程序。服务条款称“微信AI”可能非最终名称。接入与否不影响现有小程序服务。

智能体 MCP/工具产品更新

关联讨论 2 条

推荐理由：微信终于把AI塞进了自家生态，没做聊天机器人而是直接让AI操作小程序，这个方向比所有独立AI助手都更贴近普通人的真实需求，做小程序的得赶紧看了。

16:05

小互@xiaohu

微信公布小程序接入微信AI 的方式两种模式自动模式：微信自动分析喝操控你的小程序完成任务开发模式：开发者自助开放相关特性，审核后可让微信AI调用目前微信AI还在内测阶段，还无法体验…

智能体 MCP/工具产品更新

12:35

Alibaba Cloud@alibaba_cloud

被行政工作淹没了？📩 在阿里云 Claw Talks 第 5 期中，Brian Turcotte（Kilo Code）展示了由 OpenClaw 驱动的个人 AI 智能体如何帮你处理邮件、更新 CRM、减少上下文切换。 🎥 首播时间：2026 年 6 月 9 日下午 5 点（UTC+8） 👉 https://youtu.be/d3QV28XCq2Y

智能体 MCP/工具教程/实践

10:38

meng shao@shao__meng

让 Claude Opus 长时自主运行的五条实战建议

Boris Cherny 给出五条让 Claude Opus 自主运行数小时/天的建议：1. 开启 Auto Mode 减少审批；2. 用 Dynamic Workflows 编排数百至数千子 Agent；3. 使用 /goal 或 /loop 指令持续推进；4. 优先用云端 Claude Code，可关闭笔记本；5. 确保端到端自验证能力。邵猛补充：自动权限是前提；/goal、/loop 适合高难度任务但 token 消耗高；需解决本地关机/休眠；端到端验证最重要，否则 token 可能白费。

Boris Cherny: Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomou...

智能体 Anthropic MCP/工具教程/实践

10:04

宝玉@dotey

宝玉指出，Agent 能否自我验证是长时间运行的关键，否则可能浪费 Token。@bcherny 的基准测试显示 Claude Opus 最适合长时间运行，并给出 5 条自主运行技巧：1. 使用自动权限模式；2. 部署动态工作流让 Claude 协调数百/数千个 Agent；3. 用 /goal 或 /loop 指令持续推进；4. 在云端运行 Claude Code 以便关闭笔记本；5. 确保端到端自我验证--通过 Chrome 浏览器扩展验证网页、iOS/Android 模拟器 MCP 验证移动端、启动完整 Web 服务验证后端。

Boris Cherny: Seeing a number of benchmarks showing Opus is the best model for long-running work. Five tips for running Opus autonomou...

智能体 Anthropic MCP/工具大佬观点

09:46

Boris Cherny@bcherny

Claude Opus 长时间运行工作最佳模型及自主运行技巧

多项基准显示 Claude Opus 是长时间运行工作的最佳模型。SWE-Marathon 基准评估编码智能体在 10 亿 token 预算下自主完成长期软件任务（如重写 JAX 代码为 PyTorch、用 Rust 构建 C 编译器）。Opus 在此类任务上领先。Boris Cherny 给出 5 个技巧：使用自动权限模式避免审批；用动态工作流协调数百/数千个智能体；用 /goal 或 /loop 推动持续执行；在云端使用 Claude Code（桌面/移动端）以便关闭笔记本；确保 Claude 能端到端自验证——Chrome 扩展验证网页、iOS/Android 模拟 MCP、启动完整后端服务。

Rishi Desai: Can coding agents stay coherent over a 1 billion token budget? Can they build Slack from scratch? Rewrite a JAX codebase...

智能体 Anthropic MCP/工具教程/实践

08:59

Berryxia.AI@berryxia

Mac-1模型：6.6B本地运行，487个Mac原生工具

CJ Zafir团队发布Mac-1模型（6.6B参数），可在任何Mac本地运行，仅需7GB内存（12GB更佳）。它支持487个MacOS原生工具，能执行多工具链式调用，推理开启，输出速度约65 tok/s。应用层基于Mac原生UI/UX设计。作者认为这种本地小模型+原生工具的组合直接挑战云端SaaS agent，甚至可能抢了苹果Siri的活儿。

CJ Zafir: Here's a teaser of our Mac-1 model. > 6.6B model > runs locally (on any Mac) > requires 7GB RAM (12GB ideal) > can use 4...

智能体 MCP/工具模型发布端侧

08:12

Simon Willison 博客

datasette-agent-edit 0.1a0 发布

datasette-agent-edit 0.1a0 插件发布，为 Datasette Agent 提供智能体编辑文本的核心工具。其设计借鉴 Claude text editor，实现三个工具：view（按行号查看文件片段）、str_replace（精确替换唯一字符串）、insert（在指定行号后插入文本）。该插件作为基础组件，可供其他协作 Markdown 编辑、SQL 查询更新、SVG 编辑等插件复用。

智能体 MCP/工具开源/仓库

01:31

宝玉@dotey

baoyu-design：在本地复现 Claude Design 的开发工作流

宝玉分享开发模式：先用 Claude Design 设计 App UI/UX，生成 HTML+CSS+React+data.js（优于 Figma，利于 AI 理解和 Git 版本管理）；再用 Claude Opus 4.8 实现 MVP（GPT 5.5 在 UI 实现上差距明显）。因反复在本地与网页间导出替换设计稿繁琐，他编写工具解析 HAR 文件、解密 Claude Design 二进制内容，分析其 Prompt 和内置组件，将核心逻辑本地化集成到 Cursor（利用网页标记功能），配合 Opus 4.8 即可本地运行。最终开源 GitHub 项目“baoyu-design”。

宝玉: 最近为了研究 Claude Design,专门写了一个工具,可以解析 HAR 文件,解密 Claude Design 传输的二进制内容,这样可以方便的看到请求的 Prompt

智能体 Anthropic GitHub MCP/工具

6月7日

18:35

The Decoder：AI News（RSS）

Perplexity 推出 "Search as Code" 架构，让 AI 模型自行编写搜索管道

Perplexity 的 "Search as Code" 架构放弃固定搜索 API，改为让 AI 模型在 Python 沙箱中自主编写搜索例程，自行完成过滤和去重。该方案在关键基准测试中超越 OpenAI 和 Anthropic 的模型，并将 token 成本削减高达 85%。

智能体 MCP/工具产品更新搜索

16:12

🚨 AI News | TestingCatalog@testingcatalog

ChatGPT现在可以根据Gmail数据提供更个性化的回复。这个功能似乎正在向更多账户推出。 > ChatGPT现在可以引用你同步的Gmail账户，以获取更个性化的信息。

🚨 AI News | TestingCatalog: OPENAI 🔥: ChatGPT now can send emails directly from the conversation! AI will wrap whole Internet 👀

MCP/工具 OpenAI 产品更新

12:30

宝玉@dotey

最近为了研究Claude Design，专门写了一个工具，可以解析HAR文件，解密Claude Design传输的二进制内容，这样可以方便的看到请求的Prompt

宝玉: Cursor's new browser + element annotation turns it into a design studio. Meet Cursor Design 🎨 - Claude Design, running ...

MCP/工具开源/仓库

12:00

宝玉@dotey

精选76

对比一下 GPT-5.5 的设计效果和 Opus 4.8 的设计效果

宝玉对比了GPT-5.5与Opus 4.8的设计能力，认为Opus 4.8效果远优于GPT-5.5。他使用了基于Cursor浏览器和元素标注的baoyu-design Skill，该Skill通过npx skills add JimLiu/baoyu-design安装，可在本地运行：描述屏幕需求即可生成精良HTML，点击预览中任意元素即可发出修改指令。官方推荐搭配Opus 4.8以获得最佳效果。工具GitHub仓库：https://github.com/JimLiu/baoyu-design。

宝玉: Cursor's new browser + element annotation turns it into a design studio. Meet Cursor Design 🎨 - Claude Design, running ...

MCP/工具图像生成教程/实践

推荐理由：宝玉这个 skill 把 Claude Design 拉到本地，一个 prompt 就能出图对比，GPT-5.5 和 Opus 4.8 的审美差距肉眼可见，做设计的可以直接套。

10:29

宝玉@dotey

精选76

Cursor 的新浏览器和元素标注功能，使其变成了一个设计工作室。认识一下 Cursor Design 🎨 - 在本地运行的 Claude Design。描述一个屏幕 → 获得精美的 HTML → 点击预览中的任意元素并说出要修改的内容。最佳搭配 Opus 4.8。 npx skills add JimLiu/baoyu-design https://github.com/jimliu/baoyu-skills

Cursor: With Design Mode, you can now point, draw, or talk to update your UI.

MCP/工具教程/实践编码

推荐理由：Cursor 把预览和元素注释打通，几乎是在 IDE 里塞了个 Figma，宝玉这个 skill 更让它做到张张嘴就能改界面，前端和产品经理可以马上装一个试试。

08:19

IT之家（RSS）

微软警告：Claude Code存在提示词注入漏洞，可致GitHub凭证泄露

微软研究人员发现Anthropic旗下Claude Code的GitHub自动化流程存在漏洞，攻击者可通过提示词注入攻击，劫持CI/CD工作流窃取敏感凭证。漏洞源于Claude Code的读取工具未像Bash工具那样设置沙箱防护，恶意提示词可绕过两层防护读取系统文件中的API密钥等凭证。Anthropic于4月29日收到报告后，在5月5日发布Claude Code 2.1.128修复，通过限制对/proc/目录下敏感文件的访问防止信息窃取。

Anthropic MCP/工具 Microsoft 安全/对齐

08:09

ginobefun@hongming731

BestBlogs 早报 · 06-07|多智能体编排、MCP 接口设计、缓存命中率

本期聚焦三大Agent工程议题：1）Emergent通过多智能体编排+定制容器，6个月实现1亿美元ARR，覆盖190国850万无编程背景用户；2）Chrome DevTools团队为MCP设计Agent接口，提出Token燃油效率、错误自愈、工具Schema设计和三层信任边界；3）OpenClacky创始人指出每个Agent功能都是一个缓存失效面，第一代RAG架构因90%召回率不足和嵌入成本高而失效。

智能体 MCP/工具现象/趋势编码

6月6日

21:30

Rohan Paul@rohanpaul_ai

精选80

GitHub 开源 Spec Kit 工具包，用产品规范引导 AI 编码

GitHub 发布开源工具包 Spec Kit，旨在解决 "vibe coding" 的最大弱点——AI 常在规则未明确时就开始编码。它把流程从 "让 AI 直接构建" 改为 "先写产品规范，再让 AI 根据规范实现"。当前 AI 编码模式常因松散提示直接跳入代码，导致需求薄弱、边界遗漏和反复返工。Spec Kit 推动反向流程：先定义产品功能，再澄清差距、制订技术计划、分解任务，最后让 agent 执行。规范成为可执行的开发合约，支持 Copilot、Claude Code、Codex、Gemini、Cursor、Qwen 等 30+ agent 集成。项目已获 109K+ 星标。

智能体 GitHub MCP/工具产品更新

推荐理由：GitHub亲自下场推spec-driven开发，把vibe coding的随意感压回“先写规约再写代码”的老派流程，但这次规约是给AI读的，做coding agent的团队应该认真研究一下。

18:24

AYi@AYi_AInotes

OpenCut：GitHub 5万星开源AI剪辑工具，本地优先、永久免费、无水印无会员

OpenCut 是一个 GitHub 5 万星的开源 AI 剪辑工具，主打本地优先，视频无需上传服务器，永久免费、无水印、无会员墙。目前处于 Early Beta 阶段，网页版支持基础剪辑（导入视频、时间线、切割），但导出、特效、转场等功能仍在开发。路线图包括 Rust 重写核心、Web+桌面+移动统一、插件系统、Editor API 及 MCP Server（让 AI Agent 直接调用工具），目标是成为可编程的视频底座，而非对标剪映的封闭工具。

AYi: http://x.com/i/article/2060717603987791878

GitHub MCP/工具开源/仓库开源生态

16:40

凡人小北@frxiaobei

用户认为 Codex 与 Obsidian 搭配是非常优秀的 AI Agent 组合，但存在 Obsidian 文档过多导致每次打开卡顿几秒的问题，寻求解决方案。引用推文指出，Obsidian 加上 Codex，配合合适的 API、MCP 和 Skills，基本能替代目前 90% 以上的 AI Agent 产品，这是从 Notion 迁移到 Obsidian 一个月后的感受。

Yihui: Obsidian 加上 Codex,再配合合适的 API、MCP 和 Skills,基本上能替代目前 90% 以上的 AI Agent 产品。这是我将笔记从 Notion 迁移到 Obsidian 一个月之后的感受。

智能体 MCP/工具教程/实践

03:34

Claude：Blog（网页）

同事件精选76

Claude Cowork 产品指南

Anthropic 发布 Claude Cowork，一款运行在 Claude 桌面应用中的知识工作智能体。它可读写本地文件、跨 Slack 和 Google Drive 等应用协作，执行多步骤任务并生成带引用的实际交付物。核心能力包括本地文件访问、子智能体、长时间运行和定时任务。Claude Cowork 区别于对话式 AI 工具，支持用户描述目标与期望结果后自动规划执行。指南还介绍了产品矩阵（对话聊天、Claude Code 编程、Claude Cowork 跨应用知识工作）、设置要求、权限模型、七种常见工作流（如研究简报、会议准备、定期报告）以及营销和产品管理等插件。

智能体 Anthropic MCP/工具教程/实践

同一事件，精选展示《Claude Cowork 入门最佳实践》

推荐理由：把 Claude 从问答工具升级成能读写本地文件、跨应用交付可交付物的知识工作代理，这份官方指南给出了明确上手路径和七个真实工作流，做产品、做调研的都能直接照抄。

02:33

Claude：Blog（网页）

Anthropic销售人员用Claude Code重建团队工作流

加入Anthropic前从未写过代码的销售成员Jared Sires，利用Claude Code为销售团队开发自动化工具。他创建了内嵌于Gmail的CLAFTS（Claude Drafts），通过Claude API根据客户邮件草拟回复，每天节省2-3小时。该系统基于约4,300行代码（几乎全由Claude Code编写），从Google Drive和Anthropic公开文档提取上下文，并通过网络搜索获取最新产品信息。他还开发了CLAFTS Tones功能，通过模式匹配模仿不同人际关系下写作风格。这些工具已打包为Claude Cowork插件供整个销售团队使用。

智能体 Anthropic MCP/工具教程/实践

关联讨论 1 条

01:12

Google Developers Blog（RSS）

精选75

Google Colab CLI 发布

Google 推出 Colab 命令行界面（CLI），允许开发者和 AI 智能体将本地终端连接到远程 Colab 运行时，实现无摩擦执行。该轻量级 CLI 支持请求高性能 GPU、远程运行本地 Python 脚本，并检索工件日志或模型（如微调后的 Gemma 3 适配器）。工具可直接集成到标准终端环境，可被 Antigravity、Claude Code 等 AI 智能体调用以管理复杂机器学习流水线。

Google MCP/工具产品更新部署/工程

关联讨论 1 条

推荐理由：对于习惯在 Colab 上薅免费 GPU 的开发者，这个 CLI 把本地开发、远程跑训练这套流程的摩擦降到了几乎为零，而且直接对接 AI agent，实验自动化往前迈了一大步。

6月5日

23:15

IT之家（RSS）

谷歌 Chrome 149 稳定版发布，允许用户删除已下载的端侧 AI 模型

谷歌于 6 月 2 日推送 Chrome 149 稳定版，覆盖 Windows、Mac 和 Linux 平台，含 429 项安全修复。新增端侧 AI 模型管理选项，用户可拒绝下载或移除已下载模型。测试中的“AI 模式”绕过搜索首页，尚未正式上线。DevTools 的 MCP 服务器及 AI 智能体命令行接口稳定，新增自定义 HTTP 头模拟和改版 AI 助手面板；CSS 面板加入 Gemini 驱动的样式自动补全。Chrome 149 正式推出 ARM64 Linux 官方 deb/rpm 构建包。

MCP/工具产品更新端侧

21:58

Rohan Paul@rohanpaul_ai

腾讯WorkBuddy成为国内排名第一的PC端生产力AI智能体

腾讯WorkBuddy成为国内排名第一的PC端生产力AI智能体。它可读取文件、调用工具、撰写报告、制作演示文稿、分析数据，支持100+专家角色。通过MCP连接GitHub、Jira、Notion、Gmail、Google Drive、Slack等，在沙箱中运行任务，并可通过Slack、Telegram、Discord、微信远程控制。WorkBuddy将大任务分解为小任务，为复杂工作启用专家团队：多个专业子智能体并行工作，一个主导智能体协调最终输出。用例包括阅读PDF/图片、创建报告、分析电子表格、生成内容、自动研究新闻并发送定时摘要、从手机运行桌面任务、无需编码构建应用等。

智能体 MCP/工具产品更新

21:40

fofr@fofrAI

fofrAI 测试 Gemini 3.5 Flash 与 Antigravity CLI 智能体自主性与速度

fofrAI 使用 Gemini 3.5 Flash 和 Antigravity CLI 实验 AI 智能体的自主性和速度。结果：20 分钟内在 Linux CPU 上安装并运行原版 Stable Diffusion 1.5，完成推理生成图像；基于 Lora 和 SD 论文，用 10 张图片从零实现 Lora 微调器（约 1 小时 30 分，主要为 CPU 训练）；通过 modal 约 20 分钟找到 GPU、获取 Ideogram v4 权重并运行推理。该推文展示了当前长周期智能体任务的基线案例。

fofr: Where's the baseline for impressive long horizon agent tasks today? What are you seeing this week that makes you go "woa...

智能体 Google MCP/工具大佬观点

21:28

meng shao@shao__meng

Greg Eisenberg 六轮 Prompt 打造自动更新创业想法看板

Greg Eisenberg 通过六轮 Prompt，用 Codex Sites 做出自动更新的创业想法看板。关键步骤：1）调用 sites 插件，指令“save for review, do not deploy”阻止自动部署；2）选 Cloudflare D1 实现持久化；3）设安全动作，限定 Agent 只能通过预设路径改数据；4）编写 Startup Ideas Admin 技能，使操作手册化；5）存档为 V1 并验证版本回滚；6）新对话加载技能，跨线程写入并成功上线，证明跨会话可重复运营。

The Startup Ideas Podcast (SIP) 🧃: http://x.com/i/article/2062661069458620416

智能体 MCP/工具教程/实践

20:30

公众号：卡尔的AI沃茨

OpenSquilla：用Meta Skill将多个Skill组织成稳定工作流，成本降至OpenClaw的1/9

OpenSquilla通过Meta Skill将多个Skill按YAML定义步骤、顺序和依赖，在Runtime层预先校验，防止无效调用。在PinchBench 1.2.1上，三模型混用的OpenSquilla与Claude Opus 4.7版OpenClaw得分几乎相同，但Token少一半，成本不到1/9。将Superpowers下14个Skill组合为Meta Skill后，输入Token压缩至67%。支持多模型，用本地小模型分类任务，模型切换仅在新Session生效；子Agent压缩上下文，400K窗口内可保持记忆。同一会话执行8个框架调研报告，仅花费7美分，Token和成本精确到小数点后四位。

智能体 MCP/工具教程/实践

19:36

🚨 AI News | TestingCatalog@testingcatalog

OpenSquilla 发布了 MetaSkill，一个自组织技能协议，它教会开源 AI 智能体如何自行发现、过滤和组合原子技能，而非依赖手工编写的工作流。该框架依赖智能模型路由，将更简单的任务发送给低成本模型，同时将更强模型留给更重的工作负载，旨在不牺牲性能的情况下降低成本。 #sayitbuildit @OpenSquilla

智能体 MCP/工具产品更新

18:52

公众号：百度智能云（文心）

FluxA与百度智能云战略合作，为Agent经济搭建基础设施

百度智能云与FluxA建立战略合作，共同为Agent经济搭建基础设施。百度智能云提供可交易商品体系、自雇佣交易机制、能力工具箱及出海分销通道；FluxA作为支付底座，提供低费率高频微交易、Financial Harness安全授权、全球收款与Token Paywall。目前超9万个Agent使用FluxA钱包，超1万个AI Agent资源完成商业化。今年一季度中国两地区OPC新增超6000户，日均Token消耗140万亿。DAA被视为AI时代衡量生态价值的核心指标。

智能体 MCP/工具行业动态

17:54

公众号：通义实验室（千问）

精选70

PawBench：给通用智能体一把可度量的尺

通义实验室推出全新评测基准PawBench v1.0，面向个人助理与通用智能体场景，将底座模型与运行框架Harness纳入同一体系进行交叉评测。评测矩阵包含9个模型与3个Harness（Hermes、OpenClaw、QwenPaw），覆盖150道真实任务共4050个测试单元。结果显示，QwenPaw（76.4分）、OpenClaw（75.4分）、Hermes（70.4分）之间存在显著分差，Harness环境对表现的影响甚至大于模型本身。PawBench还通过切片分析揭示了Harness在产物校验、Skill主动发现和Web搜索默认可用性等方面的关键差距。项目已开源。

智能体 MCP/工具评测/基准

推荐理由：PawBench 把 Harness 从‘看不见的手’变成可诊断的变量，好 Harness 能让弱模型以下克上，这份评测对 Agent 框架开发者是一份必读的校验清单。

17:22

小互@xiaohu

Kimi Work 发布：300 Agent 协作，面向办公场景

Kimi 推出新工具 Kimi Work，继承 Kimi Code 核心功能和 Kimi Agent 的建站、PPT 等专业 Skills，并打通金融、科研、法律等专业数据库。用户无需终端或命令行，安装客户端后通过文字描述需求即可让系统拆解任务、并行执行、调用工具、使用浏览器、整理文件夹，最终交付文档、表格、PPT 等成果。最多可同时调度 300 个 Agent 互相配合完成任务。

智能体 MCP/工具产品更新