5月6日

22:08

小互@xiaohu

Petdex是一个专为Codex设计的宠物商店项目，允许用户更换终端小宠物。用户可预览、下载和提交各种动态宠物，通过命令行工具如'npx petdex install <宠物名>'快速安装。在Codex中，可通过Settings → Appearance → Pets界面选择宠物，或使用/pet命令唤出或收起宠物，实现个性化终端体验。

MCP/工具开源/仓库编码

19:34

meng shao@shao__meng

meng shao: 写了一篇 OpenAI Codex App 入门指南本来想把 Markdown 编辑为 X Article 格式分享,不过 X Article 的编辑体验还是太费时间了,明天先发公众号,再整理 X Article 格式(朋友们如果有好的 ...

MCP/工具 OpenAI 教程/实践编码

19:06

Tencent Hy@TencentHunyuan

精选76

发布两周后，Hy3预览版以3.66T处理量在@OpenRouter周榜位列第一，周环比增长298%。在总使用量、工具调用和编程领域均排名第一。全平台市场占有率达15.4%。🏆 运行Hy3预览版的热门应用：Hermes Agent， Claude Code， Kilo Code， OpenClaw， Cline。@NousResearch @claudeai @kilocodehq @openclaw @cline 衷心感谢所有基于此开发的开发者。🙏 请在OpenRouter上试用：https://openrouter.ai/tencent/hy3-preview:free

MCP/工具编码行业动态

推荐理由：腾讯混元3不是靠宣传，而是靠数据跑到了OpenRouter第一，工具调用和编码双双登顶，国产模型在海外开发者的真实接受度比想象中高得多。

18:20

Berryxia.AI@berryxia

一位中国开发者基于Claude Sonnet 4.6创建了由7个智能体组成的全自动化系统，专为小城镇无网站的小微企业提供落地页服务。系统通过Claude Code Router协调，每日扫描约220家企业并筛选30个潜在客户，自动生成诊断报告、制作落地页与宣传视频，并通过多渠道发送个性化营销信息。整个过程无需人工干预，仅在单笔交易超3000美元或回复率低于12%时通知开发者。该系统每月可服务约47家企业，每单收费400美元，显著降低了传统网页设计的成本与人力投入。

Blaze: This Chinese guy created agents in Claude Code for landing pages and single-handedly serves 47 small businesses a month,...

智能体 Anthropic MCP/工具教程/实践

14:04

Peter Steinberger 🦞@steipete

我和codex正忙着。 🔊 http://sonoscli.sh - Sonos 🗃️ http://wacli.sh - WhatsApp 🪶 http://birdclaw.sh - X存档 🧰 http://gitcrawl.sh - GitHub存档 🛰️ http://discrawl.sh - Discord存档 🎧 http://spogo.sh - Spotify 💬 http://imsg.sh - iMessage 🧳 http://mcporter.sh - MCP转CLI 🗣️ http://sag.sh - ElevenLabs语音 🧿 http://askoracle.sh - 第二意见升级🦞 OpenClaw大军。

MCP/工具开源/仓库编码

11:34

meng shao@shao__meng

精选80

Warp团队开源15个内部工作流加速工具"Oz Skills"

Warp团队在开源终端和文档工具后，进一步开源了内部使用的15个“Oz Skills”工作流加速工具集。这些工具覆盖五大领域：Git/GitHub协作（如自动创建PR、修复CI问题）、数据分析与标准化、Web质量审计（性能、无障碍访问、SEO/AEO）、基础设施规范（如Terraform风格检查）以及通用生产力（如文档更新、本地定时提醒）。团队强调其设计哲学是构建“工作流工具”而非简单API覆盖，并提供了便捷安装命令，旨在将提升内部效率的实践分享给开源社区。

Warp: The Warp team uses a lot of Skills to speed up our workflow, so we open-sourced them. > npx skills add warpdotdev/oz-ski...

智能体 MCP/工具开源/仓库

推荐理由：Warp把自己团队日常用的15个Skills全开源了，从Git协作到性能审计，一条命令就能装。搞AI工具链的可以直接抄作业，不用从零写。

11:06

小互@xiaohu

OpenAI推出Migrate to Codex功能，一键迁移编程工具配置

OpenAI发布“Migrate to Codex”功能，允许用户将其他编程工具（如Claude Code、Cursor）的配置一键导入到Codex。该功能会扫描用户级和项目级配置，自动映射并迁移编程Agent的配置、规则、技能、MCP、hooks、子代理以及最近30天的所有会话等内容。对于无法自动迁移的部分，Codex会启动一个新线程，让Agent继续协助处理剩余迁移任务。

智能体 MCP/工具 OpenAI 产品更新

10:04

meng shao@shao__meng

精选77

OpenAI Codex 官方迁移指南：一键迁移 Agent 资产

OpenAI 为 Codex 发布官方迁移方案，支持从其他 AI Coding Agents 一键导入指令、配置、技能、近30天会话等资产。迁移采用“自动迁移+残留兜底”设计：通过用户级和项目级双层扫描，执行检测、迁移、回检的四步循环；自动处理可识别配置后，对剩余部分使用 migrate-to-codex skill 手动处理。需注意 Slash commands 被归入 Skills 体系，且会话历史仅限30天。迁移完成后，必须人工复核工具权限、MCP服务器认证、Hooks行为差异等五类内容，因平台间语义或实现差异可能影响功能。

jason liu: https://developers.openai.com/codex/migrate

智能体 MCP/工具 OpenAI 教程/实践

推荐理由：OpenAI 这次迁移工具不玩虚的，自动扫描两层级配置还能手动兜底，不过 slash commands 被吞进 Skills 的设计值得注意，切换前先把这条看清楚。

10:04

meng shao@shao__meng

2026 年 Subagent 的四种管理模式

Philipp Schmid 将主代理管理子代理的模式按控制力分为四档。模式一为内联工具调用，子代理如同函数，适用于独立任务。模式二为派发后收集，主代理可并行处理其他工作。模式三为代理池，子代理持久化并通过消息通信，支持多步协作。模式四为团队模式，代理间直接对话，主代理仅负责初始组建。核心建议是从简单模式开始，逐级升级需谨慎，因为每升一级对模型能力要求陡增，且许多任务用模式一即可解决。

Philipp Schmid: http://x.com/i/article/2051654332727037955

智能体 MCP/工具现象/趋势

05:28

Rohan Paul@rohanpaul_ai

AI工作范式转变：从聊天框到可操作计算机的智能体

AI工作正从聊天交互转向能直接操作计算机的智能体。Sai推出的新产品提供了一个由AI代理控制的远程计算机（通常是虚拟机），用户可通过手机或电脑与之交互。AI在私有远程桌面中自主操作真实应用程序，执行完整工作流。其核心突破在于手机成为真实软件工作的“遥控器”，繁重任务由后台持续运行的计算机完成。实际用例中，团队成员通过iMessage报告问题，Sai能在其虚拟机中复现问题、截图并交由Claude Code修改代码和提交PR，全程无需打开笔记本电脑，实现了在移动端发起并完成复杂工作。

Sai: Been dogfooding Sai with Claude Code lately and the part that's actually stuck for us isn't just the responsiveness. It'...

智能体 MCP/工具产品更新

02:56

Google AI Developers@googleaidevs

精选68

Gemini API 文件搜索工具推出三项新更新，助力多模态 RAG 系统开发

Gemini API 文件搜索工具近日扩展三项功能更新，旨在帮助开发者更轻松地构建高精度多模态检索增强生成系统。更新包括：多模态支持，通过Gemini Embedding 2模型实现对图像和文本的同步推理；自定义元数据过滤，允许为文件添加键值标签以结构化非结构化数据，从而提升搜索速度；精确引用功能，能够捕获并返回每条索引信息的精确来源，如页码。开发者可通过Google AI Studio的示例应用体验这些功能，与图像和文档库交互，提问并追溯答案来源。

Google MCP/工具检索增强产品更新

推荐理由：如果你在用 Gemini 搭 RAG 系统，这三项更新能直接改善搜索精度和可解释性，多模态搜索终于把图片和文档打通了，值得马上试试。

5月5日

23:59

TestingCatalog News 🗞@testingcatalog

Anthropic 发布了适用于金融服务的新开箱即用 Claude 智能体模板。这些工具可作为 Claude Code、Cowork 的插件使用，或通过托管式智能体进行部署。

Claude: Each agent ships with the connectors, skills, and subagents the task needs, ready to use as-is or adapt to your firm's o...

智能体 Anthropic MCP/工具产品更新

23:14

Berryxia.AI@berryxia

Unsloth打通本地开源模型运行Claude Code工作流

Unsloth发布指南，演示如何利用Gemma 4和Qwen3.6的GGUF模型，在仅需24GB RAM的本地机器上运行完整的agentic coding工作流。该方案通过Unsloth API端点和llama.cpp驱动，支持自愈式tool calls、代码执行和网页搜索。此举打破了以往必须在Claude Code等高端界面的性能与本地部署的隐私/成本之间二选一的困境，使得开发者能以近乎零成本在本地享受顶级交互体验，标志着开源模型开始无缝接管复杂的AI智能体工作流。

Unsloth AI: We made a guide on how to run open LLMs in Claude Code, Codex and OpenClaw. Use Gemma 4 and Qwen3.6 GGUFs for local agen...

智能体 MCP/工具教程/实践编码

22:14

Berryxia.AI@berryxia

精选78

Ollama一键整合Claude Desktop，开源模型获豪华桌面体验

Ollama通过命令ollama launch claude-desktop，将Ollama Cloud中的开源模型（如Kimi、DeepSeek、Qwen）无缝接入Claude Desktop应用。用户可在Claude Cowork和Claude Code中直接使用这些模型，享受完整的本地文件读写、应用交互及代码智能体等桌面级功能，打破了以往在本地开源模型与Claude高端界面间必须二选一的限制。通过--restore参数可轻松切换回Anthropic原生模型。此举消除了AI工具链的关键壁垒，标志着AI竞争重点正转向工作流的无缝融合。

ollama: 🤯 Ollama now supports Claude Desktop via Claude's built-in third party inference. ollama launch claude-desktop This all...

智能体 MCP/工具产品更新开源生态

推荐理由：Ollama一条命令把开源模型塞进Claude Desktop，以后在Claude Cowork和Code里直接用Kimi、DeepSeek，这是工具链壁垒最彻底的一次打通，开发者现在就能试。

16:26

Peter Steinberger 🦞@steipete

gog 0.16 版本现已发布。面向人类与智能体的 Google Workspace 命令行工具。无损原始 API 输出、净化的 Gmail 读取功能、更安全的命令配置、Drive 库存管理、Docs 标签页、Sheets 表格处理、Gmail 过滤器导出，以及官方 Docker 镜像。https://gogcli.sh

MCP/工具产品更新开源/仓库

15:14

Berryxia.AI@berryxia

精选75

Tom 开源 open claude design 项目，高还原度复刻 Claude Design

开发者 Tom 开源了 open claude design 项目，宣称对 Claude Design 的还原度超过 95%。该项目历时 72 小时开发，包含超过 18700 行代码和 30 多种设计技能，支持 71 套以上设计系统，并能兼容多种主流代码代理工具。项目旨在成为 Claude Design 的开源替代品，后续将持续更新，代码已托管于 GitHub。

Tom Huang: 正式开源 open claude design 🚀 超 95% 以上的还原度! 浓缩和逆向所有 claude design 最先进的设计,最好看的模板💥 历时 72 小时,18700+ 行代码,30+ 设计 Skills,支持超过 71...

MCP/工具开源/仓库部署/工程

推荐理由：Tom总用72小时逆向出Claude Design开源版，30+设计Skills、71套设计系统，直接塞进Claude Code或Codex就能用，前端开发者省下大量造轮子时间。

15:14

Berryxia.AI@berryxia

兄弟们，这套手册赶紧下载下来！ A社官方发布的Claude Skills指导手册，包含啊完整的 33页！掌握Claude技能完整指南，下载完整PDF 地址如下👇 https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf

Anthropic MCP/工具教程/实践

10:26

meng shao@shao__meng

精选74

Cursor团队分享Agent Harness持续改进的实战方法论

Cursor团队认为，模型能力决定上限，而Harness（模型控制框架）决定其实际表现。他们采用愿景驱动与实验闭环的方法，通过线上A/B测试和离线评估持续优化。随着模型能力提升，Harness设计正从“守卫式”转向“动态获取式”，即减少静态信息注入，赋予模型更多动态获取上下文的权力。衡量体系结合离线基准、在线A/B测试及留存率、LLM判读等质量指标。Harness需为不同模型重度定制，贴合其工具格式与Prompt风格。团队判断AI编程的未来是多Agent协作，其成功关键取决于能协调任务分配与工作流缝合的Harness工程。

智能体 MCP/工具教程/实践编码

推荐理由：Cursor 团队把 agent harness 的衡量与定制方法全盘托出，从上下文范式演进到错误分类告警，做 AI 编程工具的必读，这种坦诚的实战分享太稀缺了。

09:14

Berryxia.AI@berryxia

Claude Code创始人详解高级工程化用法，释放工具90%潜力

Claude Code创始人Boris Cherny通过30分钟视频，系统讲解了该工具的高级工程化用法。核心观点是：为Claude提供越多上下文，它就越智能。视频详细演示了如何通过CLAUDE.md文件在企业、项目、本地层级注入上下文规则，如何将内部工具集成到Agent工作流，并优化了数十个终端设置与权限管理等细节。他指出，多数用户仅发挥其10%潜力，仅用于简单对话，而未能将其作为驱动整个工程团队的生产力基础设施。

Anthropic MCP/工具教程/实践编码

07:58

TestingCatalog News 🗞@testingcatalog

Anthropic将为Claude Cowork推出主动式AI助手"Orbit"

Anthropic计划为其Claude Cowork平台推出名为“Orbit”的主动式AI助手。该助手能够主动分析用户来自Gmail、Slack、GitHub、日历、Drive、Figma等多个应用的数据，并生成个性化洞察。用户还可以部署“Orbit apps”并置顶常用功能以便快速访问。这一动向标志着AI助手正从被动响应转向主动服务模式，OpenAI的ChatGPT Pulse、Google及Perplexity也都在开发类似功能。据悉，Orbit很可能作为一项高级功能，仅向Claude Max订阅用户开放。

智能体 Anthropic MCP/工具产品更新

01:18

Chubby♨️@kimmonismus

精选72

KroWork是一款创新的桌面AI智能体，其核心在于"应用固化"能力，能将对话直接转化为持久可用的本地软件。它不止于生成代码建议，而是端到端自主执行任务，并将完整工作流保存为名为"Kro App"的独立应用。用户一键安装后，该应用即可像常规软件一样运行，无需重复消耗tokens或重建流程。所有操作均在本地设备完成，无需编程背景，且数据完全脱离云端。这标志着AI从对话助手向能构建并交付实体软件的工具转变。

KroWork: Your AI chatbot can't ship. It answers. It suggests. It generates code you still have to wire up yourself. Close the tab...

智能体 MCP/工具产品更新端侧

推荐理由：当别人还在帮你写代码，KroWork 直接把对话冻成 App 放在你桌面上。不建仓库不费 token，跟用 Excel 一样打开，这种 chat-to-software 的思路比所有 coding agent 都更接近普通人想要的 AI。

01:14

Berryxia.AI@berryxia

Anthropic发布《Agent Stack》蓝图：构建全AI员工公司的"操作系统"

Anthropic联合Google Cloud正式发布《Agent Stack》指南，提供了一套完整的“AI企业操作系统”蓝图。该系统允许人类仅设定目标，由AI员工自主分配任务、决策并推进项目。其核心包括ADK开源框架、MCP工具调用协议、Vertex AI生产部署引擎及A2A智能体协作协议，支持串行、并行等工作流，并具备记忆功能。实际应用表明，AI能在几秒到几分钟内完成以往需数小时的任务，将“AI建公司”从概念转化为可复制的工程模板，推动工作模式向人类指挥AI团队转型。

智能体 Anthropic Google MCP/工具

00:14

阿绎 AYi@AYi_AInotes

精选71

一个100行的文件，干翻了所有LLM编码prompt

一个名为CLAUDE.md的百行文件在GitHub上迅速走红，一周内获得超4.4万星。它没有依赖和配置，仅将Andrej Karpathy总结的LLM编码坏习惯浓缩为四条核心规则：先思考再编码、简约至上、手术式修改、目标驱动执行。开发者只需将其置于项目根目录，Claude Code等工具便能自动读取并遵循，从而显著提升代码质量，减少返工和token浪费。此举被视为对当前需要反复纠正AI模型的开发体验的集体反叛，以零成本方案为AI编码设定明确规范。

MCP/工具教程/实践编码

推荐理由：一个100行文件干翻一堆Agent框架，本质是开发者受够了哄模型，不如直接定规矩。如果你也用Claude Code，花一分钟扔进去，Token浪费砍半不是夸张。

5月4日

22:54

elvis@omarsar0

Sakana AI提出新型7B"指挥者"模型，通过协同多个智能体实现性能突破

Sakana AI在ICLR 2026上发表研究，提出一个仅70亿参数的“指挥者”模型。该模型不直接解决问题，而是通过强化学习训练，专注于为混合开源与闭源模型的工作者智能体设计通信拓扑结构，并为每个工作者生成精准指令以发挥其特长。经随机化智能体池训练后，它能在推理时适应任意智能体组合。其关键创新在于，当允许指挥模型将自己也选为工作者时，系统会形成递归拓扑，实现动态测试时扩展。该模型在GPQA-Diamond和LiveCodeBench上达到SOTA水平，在AIME25和GPQA-D上的性能比最佳单体工作者提升约3%，这相当于前沿模型一个代际的改进幅度，且增益完全来源于协同优化。

智能体 arXiv MCP/工具推理

22:22

向阳乔木@vista8

躺平神器开源！Xbox手柄秒变Mac万能遥控器~

一款名为“xbox-mac-ctrl”的开源工具，可将Xbox手柄转变为Mac电脑的通用遥控器。用户能通过手柄控制YouTube、B站等视频播放（全屏、快进、音量调节），并操作微信读书、浏览器及任意Mac软件（如Tab切换、滚动翻页）。该项目由开发者借助DeepSeek v4 Pro通过几轮对话编程实现，旨在满足躺卧时遥控刷小说、看视频的需求，并鼓励开发者fork以适配Switch手柄等其他硬件。

向阳乔木: DeepSeek v4 Pro还是可以的。几轮对话,实现一个工具,用xbox手柄控制电脑应用和浏览器。当遥控器,躺床上刷小说和看视频。

MCP/工具开源/仓库教程/实践

17:23

TestingCatalog News 🗞@testingcatalog

xAI 正在为 Grok 推出连接器 🔥 GitHub、Notion、Linear、Google 和 Microsoft 套件现已可用，自定义 MCP 连接器也已就绪！

MCP/工具 xAI 产品更新

16:14

阿绎 AYi@AYi_AInotes

精选77

Claude通过第三方平台补足视频分析能力，开启AI应用新生态

借助Algrow的MCP平台，Claude现已能直接分析YouTube等平台的视频内容，自动生成包含数据表格、爆款拆解与留存曲线的深度报告。这标志着大模型竞争重点转向生态建设，第三方开发者通过工具链迅速弥补了Claude的原生视频短板。该功能为内容创作者提供了高效分析竞品、提炼爆款公式的生产力工具，并预示视频研究Agent时代的开启。目前处于免费试用阶段，未来订阅定价亲民。

Anthropic MCP/工具产品更新视频

推荐理由：第三方MCP插件让Claude终于能分析视频，做视频的一键生成爆款拆解和帧级留存分析，比手动刷三天视频强多了。

09:13

Berryxia.AI@berryxia

AI agent专属幻灯片框架open-slide发布

open-slide是一款专为AI agent设计的幻灯片框架，能将自然语言提示直接转化为精美的完整演示文稿。其核心在于将每页幻灯片构建为React组件，并在固定画布上工作，而非简单生成Markdown。框架内置多项agent技能：通过/create-slide指令一句话生成整套幻灯片；支持在浏览器中对元素添加评论，并由agent通过/apply-comments一键应用所有修改；同时集成演示模式、演讲者笔记和定时器，并可一键导出HTML或PDF。它兼容Claude Code、Cursor等多种编码agent，其意义在于将AI agent的能力从“生成文字”升级为“输出可直接呈现的最终成品”，填补了AI代理与真实生产应用之间的关键空白。

Yiwei Ho: Introducing open-slide - The slide framework built for agents. Prompt your agent, get a polished deck. $ npx @open-slide...

智能体 GitHub MCP/工具开源/仓库

08:19

meng shao@shao__meng

精选70

OpenAI Codex 新模式 Auto-review：在"频繁打扰人类"和"完全放权"之间，引入第三种治理范式：用一个独立 AI Agent 替代人类，来审批越界行为。

OpenAI Codex推出Auto-review新模式，解决传统人工审批与完全放权两种治理范式的缺陷。该模式在智能体越界时，由独立AI代理审批，评估用户意图、运行环境、安全策略和动作影响。拒绝时提供理由，超一半情况主智能体能自行找到更安全替代方案。效果上，自动批准率达99.1%，将打扰人类频率降低约200倍，有效拦截多数攻击。但团队坦承局限：非确定性安全保证，不能防御策略性欺骗，是安全与速度的折中。

Maja Trebacz: Clicking the "Approve permission" button is difficult. We show that agents can do that for you. Check out our alignment ...

智能体 MCP/工具 OpenAI 产品更新

推荐理由：OpenAI 难得公开了 agent 安全机制的内部设计，不是靠人肉审批也不是完全撒手，用独立 Agent 审批越界行为，数据惊人（干扰降低 200 倍）。做 Agent 产品的该读，因为给出了治理范式的第三种选择。

5月3日

18:12

Rohan Paul@rohanpaul_ai

World2Agent开源W2A协议，为AI代理构建标准化感知层

World2Agent开源了W2A协议，旨在为AI代理建立标准化的世界感知层。该协议采用“世界→传感器→代理”架构，传感器从GitHub、X帖子、日志等多种数据源中提取信息，并生成包含事件内容、来源及背景的结构化实时信号。这使得AI代理能主动感知外部变化并自主响应，无需等待人类提示。传感器可重复使用，避免了为每个新数据源重复开发轮询、去重等逻辑。与侧重代理能力的MCP不同，W2A主要解决代理“何时应被唤醒”的问题。目前该协议已支持多种主流代理，并邀请开发者共同构建传感器生态。

LeahW: The future belongs to proactive agents. But without real-time perception, they're stuck reacting. "World2Agent" isn't a ...

智能体 MCP/工具开源/仓库

14:12

阿绎 AYi@AYi_AInotes

报告揭示AI代理遭遇互联网可用性困境，99%网站不兼容

Ora发布的《The State of Agent Readiness》报告指出，当前99%的互联网网站对AI代理基本不可用，中位数得分仅36分。代理在登录、交易等关键功能上失败率高，因互联网基础设施仍为人类设计，导致其操作成本高昂、效率低下。目前仅约1%的公司真正为AI代理优化，包括部分原生公司与基础设施巨头。报告预测，“Agent Readiness”得分将成为产品能否被AI代理推荐的关键指标，低分企业可能丧失竞争力。尽管许多公司声称支持相关标准，但实际符合规范者极少。

智能体 MCP/工具大佬观点

5月2日