23:05

Microsoft Research@MSFTResearch

微软研究院的新工具、模型、代码库和论文现已发布。使用AI和智能体？值得关注： • MSR AI Frontiers的MagenticLite • 智能体化GitHub工作流 • 验证优先型智能体 • 意义匹配微调 • AI转型与经济发展

智能体 MCP/工具 Microsoft 产品更新

22:57

小互@xiaohu

开源项目OpenSquilla：智能路由降低AI成本近十倍，兼容多平台与模型

开源项目OpenSquilla通过智能路由架构，在保持与OpenClaw相近性能（0.9251分）的同时，将复杂AI任务处理成本从6美元大幅降至0.68美元。其核心是将简单任务分配给廉价模型，仅复杂任务调用Opus等顶级模型。系统具备四层记忆结构模拟人脑认知，支持按需加载16种工具，并设有三档代码沙箱安全防护。项目提供统一后端，支持网页、命令行及Slack、飞书等平台接入，兼容OpenAI、Claude、Gemini、DeepSeek等20余家主流模型。

智能体 MCP/工具开源/仓库

22:04

Greg Brockman@gdb

开发者发布了一款开源的Codex技能，旨在将本地搜索转化为潜在客户线索。该工具能自动搜索附近的各类本地商户，并分析其是否拥有独立网站或仅依赖社交媒体页面，以此判断其建站需求。核心功能包括潜在客户挖掘、网站与纯社交媒体状态检查、线索评分、提取联系方式，并支持聊天或CSV格式输出。用户可通过一条命令快速安装使用。

Kappaemme: CODEX SKILL THAT TURNS LOCAL SEARCH INTO CLIENT LEADS! I made a Codex skill that helps find local businesses that may ne...

智能体 MCP/工具开源/仓库

22:00

Baidu Inc.@Baidu_Inc

李彦宏提出智能体时代核心指标DAA与进化理论

在Baidu Create 2026上，李彦宏阐述了智能体时代的关键议题。他提出了“日活跃智能体”（DAA）作为衡量价值的新核心指标，并探讨了“AI进化理论”，该理论涵盖智能体、个人与组织三个层面的协同演进。同时，百度展示了为大规模支持智能体而构建的全栈基础设施。这些观点共同勾勒出智能体时代发展初期的基本框架与方向。

智能体大佬观点

21:54

Berryxia.AI@berryxia

Google Gemini Spark泄露截图：工具能力进阶，但功能开放谨慎

泄露的Gemini Spark内部截图显示，新模型整合了Agent与Chat模式，重点提升高级工具使用和Skills创建流程。然而，当前Skills仅支持复制粘贴MD文件创建，缺乏直接导入选项，且未见Browser或Computer Use功能。这表明Google在推进AI工具能力时采取了渐进策略，优先打磨核心流程，而非一步到位开放激进功能。

🚨 AI News | TestingCatalog: GOOGLE 🔥: New Gemini Spark screenshots featuring advanced tool use and Skills creation flow. It seems like there won't ...

智能体 Google MCP/工具产品更新

20:42

AYi@AYi_AInotes

精选76

飞书开源CLI工具45天获万星，AI操作可见可控引关注

飞书开源命令行工具lark-cli在45天内获得超过1万GitHub star，成为国内首个破万星的办公套件开源项目。该工具允许AI通过命令行直接操作飞书，执行建群、建文档等任务，且每一步操作都可预览、可审查，与云端不可见的MCP模式形成对比。其主干代码已合并10位外部开发者的贡献，而同类产品钉钉和企业微信则为零。这种可见、可控的特性被视为开发者放心将任务交给AI Agent的前提，预示着一句话指令驱动完整项目流程成为可能。

智能体 MCP/工具开源生态教程/实践

推荐理由：飞书CLI把AI操作办公套件的每一步都摊在终端里，这种透明感是MCP黑箱给不了的，加上1万星和10个外部PR，这组数字比任何PR稿都诚实。

20:32

Chubby♨️@kimmonismus

Codex 的"锁定使用"即将到来。可能解释了 OpenAI 昨天的图片。 "让 Codex 在你的 Mac 锁定时使用它"

🚨 AI News | TestingCatalog: OpenAI is working on a dedicated setting for Codex to allow users to enable "Locked use." > Let Codex use your Mac while...

智能体 OpenAI 产品更新端侧

20:21

meng shao@shao__meng

最近跟几位朋友沟通中多次提及 Lovart，真的很好奇，Lovart 过去的一年发生了特么的什么？好像从那个横空出世的 Design Agent，变成了…

智能体大佬观点

20:11

🚨 AI News | TestingCatalog@testingcatalog

OpenAI正在为Codex开发专用设置，允许用户启用"锁定使用"。 &gt；让Codex在Mac锁定时继续使用无需再随身携带半开状态的笔记本电脑？

智能体 OpenAI 产品更新编码

19:37

MiniMax (official)@MiniMax_AI

与@zocomputer在新加坡直播！看看我们如何用MiniMax模型演示Zo❤️🔥

Zo Computer: Kill your SaaS with Zo Computer - Live from Singapore 🇸🇬 https://x.com/i/broadcasts/1qKVmQBbkOZxB

智能体行业动态

17:41

🚨 AI News | TestingCatalog@testingcatalog

GOOGLE 🔥：Gemini Spark新截图展示高级工具使用和技能创建流程。目前看来除了复制粘贴外，似乎没有导入SKILL MD文件的选项。目前也没有浏览器或计算机使用功能的迹象。

Just a dragon: The new Gemini Spark model will have Agent mode / Chat mode. New advanced use of tools.

智能体 Google MCP/工具模型发布

16:57

向阳乔木@vista8

Vercel报告揭示AI模型使用趋势：Anthropic费用领先，Google用量占优

Vercel基于十万亿token消耗的分析显示，Anthropic在费用上占61%居首，而Google以38%的token量领先。Claude Opus用于关键任务，Gemini Flash则以低成本大用量见长。B2B业务贡献40.7%的费用却仅产生29.7%的token。Agent请求占比激增至58.9%，其token消耗是普通聊天的2.6倍。

智能体 Anthropic Google 现象/趋势

16:54

ginobefun@hongming731

Agent 工程化的全面落地

近期AI领域焦点从模型能力转向Agent工程化落地。Anthropic发布Claude Code实践，强调放弃RAG索引，采用Agentic Search导航大型代码库，并推出管理并行会话的Agent View及Computer Use最佳实践。OpenAI的Codex推出独立光标的Computer Use功能，解决了Windows平台沙箱安全问题，其负责人指出Codex正演变为可执行长期自主任务的本地Agent。国内厂商如阿里、腾讯等也在同步推进Multi-Agent实战，标志着AI Agent进入全面工程化应用阶段。

智能体 Anthropic OpenAI 开源生态

16:54

ginobefun@hongming731

Agent工程化进程加速，多家巨头披露关键细节与标准

本周科技领域聚焦Agent工程化落地。Anthropic与OpenAI分别将Claude Code和Codex集成至IDE，并详细披露了Computer Use、Windows沙箱等关键实施细节。行业同时推出了包含12项指标的Agent评估体系及开放的Agent Skill标准。国内TiDB、腾讯云Harness、AgentScope Java也相继发布相关产品，共同推动Agent技术进入实际生产环境。

ginobefun: http://x.com/i/article/2055195078931709952

智能体 Anthropic OpenAI 现象/趋势

16:39

Peter Steinberger 🦞@steipete

为discrawl（存储媒体）构建了一个新功能， codex说它已完成，然后我使用了我的codex审查技能… https://github.com/steipete/agent-scripts/blob/main/skills/codex-review/SKILL.md

智能体 GitHub 教程/实践编码

16:32

Chubby♨️@kimmonismus

Dario最新文章重申：强大的AI（"AGI"）将于2028年到来

Dario在其最新文章中重申，强大的AI（或称AGI）将在2028年到来。他定义的“强大AI”并非仅在单一任务上超越人类，而是在大多数重要领域比顶尖专家更聪明，具备自主推理、创造、编码、研究和通过数字界面行动的能力。他进一步用“数据中心里的天才国度”来比喻，即数百万个这样的高能力AI代理可以并行运行，其工作速度远超人类，并能像压缩在计算基础设施中的整个诺贝尔奖专家群体一样协作。其最新博文预测，到2028年，美国前沿实验室将发布能力实现阶跃式提升的新模型。

智能体 Anthropic 大佬观点现象/趋势

15:54

歸藏(guizang.ai)@op7418

GPT的Codex功能现已支持通过手机ChatGPT进行远程控制。用户可将移动设备与桌面端Codex绑定，实现对话自动同步，并可直接从手机发送指令、审批权限及监控进度。设置需在Mac版Codex客户端启用"设置Codex移动版"，过程中建议使用Google Authenticator完成多重因素验证，而非短信。目前该功能仅支持Mac，Windows版本仍在开发中。

歸藏(guizang.ai): Codex 终于支持手机上的 ChatGPT 远程控制了! 可以自动同步你绑定的 Codex 设备上的所有对话,而且可以直接发送指令、审批权限、监控进度。我写一下设置的教程: 1. 点击桌面端 Codex 客户端左侧的"设置 Codex ...

智能体 MCP/工具 OpenAI 教程/实践

15:37

MiniMax (official)@MiniMax_AI

MiniMax AI已作为原生适配器集成至open-multi-agent框架，旨在解决多智能体系统在生产环境部署的核心成本难题。该框架能自动将目标分解为DAG任务并并行执行，但传统多智能体方案的token成本会随智能体数量、交互轮次和工具调用次数快速复合增长，这常导致实际生产部署受阻。此次集成使得由目标驱动的智能体团队不仅能高效运行，更能保持可负担的生产成本，从而推动其从演示场景走向实际应用。

JackChen: Multi-agent's quiet problem: token cost scales with agents × turns × tool calls. It compounds fast , and that's the bill...

智能体开源生态行业动态

15:33

Alibaba Cloud@alibaba_cloud

一支主要由AI代理执导的K-POP MV？🎤✨ 使用Wan2.7和HappyHorse构建SPECTRA。代理负责生成、迭代和剪辑--由阿里巴巴云MVP Shun Fujiyoshi @GhostyAIpp监督质量把控并处理重制。尚未实现零接触。但已非常接近。 🎞️ 观看MV：https://youtu.be/CwDxsTWy1Ak 📖 完整开发博客：https://int.alibabacloud.com/m/1000412982/ 🚀 HappyHorse八折优惠：https://int.alibabacloud.com/m/1000412936/

智能体多模态教程/实践

15:09

Peter Steinberger 🦞@steipete

精选79

这改变了游戏规则。通过codex自动审查和crabbox，我现在几乎可以全自动化地从问题定位到修复。（是的，这会消耗大量token）【引用 @steipete】：编写了一个循环运行codex/review的技能，直到不再出现错误为止。注意事项：它不会为你修复系统架构，所以你仍然需要以BRAIN作为主模型。https://github.com/steipete/agent-scripts/blob/main/skills/codex-review/SKILL.md

Peter Steinberger 🦞: Wrote a skill that runs codex /review in a loop until there's no booboos anymore. Caveat: It won't fix system architectu...

智能体教程/实践编码

推荐理由：Peter Steinberger 这个 skill 把 codex review 做成自动循环，虽然烧 token 但真的省事，开发者可以直接抄作业，不过它不碰架构，该动脑还得动。

14:54

歸藏(guizang.ai)@op7418

飞书CLI获市场认可，展现AI时代SaaS竞争新方向

飞书CLI工具发布一个多月即获10000 Star，显示市场对其方向的认可。在AI时代，SaaS软件的竞争正从传统UI转向对Agent的适配。飞书通过开放全部能力的CLI，允许用户和Agent完全绕过复杂UI进行操作，大幅降低了使用门槛。其CLI设计采用分层结构，并配套大量Skills作为“说明书”，便于Agent调用。同时，CLI在命令包装上注重对Agent友好，内置Dry Run、结构化输出等功能，方便AI调试。这为创业或构建Agent提供了新路径，可依托飞书CLI和Agent框架，直接利用其聊天界面、多维表格及组织成员作为基础设施。

智能体开源生态现象/趋势

14:42

AYi@AYi_AInotes

Google即将发布Gemini Spark，AI Agent时代或将真正到来

Google即将发布的Gemini Spark标志着AI Agent时代的实质性进展。它并非单纯的聊天机器人或模型升级，而是演变为一个能24/7持续运行、拥有持久化记忆的个人操作系统级代理。其核心在于能主动处理邮件、预约会议、跟进任务，并持续从用户操作中学习。Google的独特优势在于整合了用户的搜索历史、位置、日历、邮件等全生态数据，构成了强大的护城河。尽管存在数据与隐私风险，但该产品有望彻底重构重度Google用户的工作与生活流程，使5月的Google I/O成为Agentic AI发展的关键节点。

智能体 Google 大佬观点

13:54

歸藏(guizang.ai)@op7418

Codepilot 新版预览，即将支持 Codex 作为 Agent 引擎

智能体 OpenAI 产品更新

12:54

歸藏(guizang.ai)@op7418

Codex支持手机ChatGPT远程控制桌面设备

Codex现已支持通过手机上的ChatGPT应用远程控制绑定的桌面设备。该功能可实现对话自动同步，并允许用户直接发送指令、审批权限及监控进度。设置需在桌面端Codex客户端内启动，并建议使用Google Authenticator完成多重因素验证。绑定后，手机ChatGPT应用将出现Codex侧边栏，用于访问和控制桌面端对话。目前该功能仅支持Mac版Codex，Windows版本仍在开发中。

智能体 MCP/工具 OpenAI 产品更新

12:54

Berryxia.AI@berryxia

蚂蚁集团开源万亿参数思考模型Ring-2.6-1T，推动企业级AI本地部署

蚂蚁集团AGI团队开源了万亿参数旗舰思考模型Ring-2.6-1T。该模型专为处理Agent工作流、代码工程、长时序执行等复杂任务设计，具备上下文理解、规划与工具调用能力，并提供高效与极致两种推理模式。其采用IcePop算法稳定训练，并借助MoE架构降低部署门槛。完全开源允许企业将模型部署于本地或端侧，确保数据不出域，有效解决了金融、政务等敏感领域对数据安全与合规的迫切需求。模型已在Hugging Face和ModelScope平台发布。

智能体开源生态推理模型发布

12:42

宝玉@dotey

飞书CLI获万星认可，开源项目评估四准则

飞书CLI在GitHub上的star数已过万，作者认为这印证了飞书是国内对Agent最友好的平台。作者提出评估开源项目是否靠谱的四项关键标准：star数量反映项目热度；活跃的commit历史表明项目持续维护；issues的数量与关闭速度体现用户活跃度和问题处理效率；社区PR被合并的记录则显示项目对社区参与的重视。飞书CLI在这些方面均表现良好。

数字生命卡兹克: 我靠!刚看到GitHub上,飞书CLI的star数过万了hhh 牛啊。。。感觉那个周末一起床,发现飞书开源CLI才过去没几天==。

智能体大佬观点开源生态

12:42

宝玉@dotey

精选79

微信群聊总结Skill"毒舌版"提示词详解

该提示词要求Claude基于普通版总结骨架，以毒舌、尖锐但不恶毒的风格重写微信群聊总结。具体包括扮演专业评论员，为发言排行添加毒舌备注、将群友画像改为“不留情面版”，并用戏谑口吻撰写概览。同时设定了创作红线，如不涉及人身攻击、私人信息或医学诊断，仅针对群内公开行为进行调侃。技术实现依赖于wx-cli，推荐使用Claude Code和Claude Opus 4.6模型以达到最佳效果。

宝玉: baoyu-skills 新加了一个 Skill: 微信群聊总结 Skill:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary 依赖于 ...

智能体 Anthropic GitHub 教程/实践

推荐理由：宝玉这个毒舌版 prompt 把群聊总结从工具变成了社交玩具，红线设计和「先放飞再审查」的写作顺序值得所有写 prompt 的人抄一遍。

12:39

Elon Musk@elonmusk

Grok Build早期测试版已向SuperGrok Heavy用户开放，初期开发者反馈极为积极。用户认为它感觉比其他编码智能体领先十倍，能原生处理完整智能体工作流、并行运行多个智能体、进行实时代码重构，并拥有支持vim模式和鼠标的精致终端界面。该工具速度快，可清晰管理大上下文，让用户体验类似与自主编码伙伴协作，而非仅获取建议。若测试版保持此发展势头，Grok Build有望成为高级用户的强大工具。

Myrhex: Grok Build is amazing. The early beta just dropped for SuperGrok Heavy users and the first real feedback from developers...

智能体 xAI 产品更新编码

12:16

ChatGPT@ChatGPTapp

放下电脑接触自然--Codex现已登陆手机。现已在ChatGPT移动应用开启预览。

智能体 OpenAI 产品更新编码

12:06

Orange AI@oran_ge

开源一个月的时间，飞书 CLI 在 Github 破万星了。相比同期的一些 CLI，飞书这个确实是群里口碑最好的。为 Agent 做软件这件事，飞书践行得很好。

智能体开源/仓库部署/工程

11:54

歸藏(guizang.ai)@op7418

藏师傅的 PPT Skills，感觉 GitHub star 马上就要破万了呀！没点 star 的朋友点点 star 吧，谢谢了。顺便让 Codex 分析了一下安装的数据，还挺有意思的。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

智能体开源/仓库

11:54

歸藏(guizang.ai)@op7418

Codex CLI 设置 ChatGPT 远程控制

bailey: @op7418 @jimail0218 支持,修改~/.codex/config.toml,添加[features]remote-control = true,然后终端运行codex remote-control,然后手机端就能看到了,好用...

智能体 OpenAI 教程/实践

10:54

歸藏(guizang.ai)@op7418

ChatGPT手机端现可远程控制Codex

Codex现已支持通过手机上的ChatGPT应用进行远程控制，实现了跨设备对话同步与指令操作。用户需在桌面端Codex客户端内启动设置，并完成多重因素验证（推荐使用Google Authenticator）。绑定后，手机ChatGPT App将出现Codex侧边栏，可查看并控制已绑定桌面设备的所有对话，直接发送命令。目前该功能仅支持Mac版Codex，Windows版本仍在开发中。

智能体 OpenAI 教程/实践部署/工程

10:41

AYi@AYi_AInotes

xAI发布Grok Build：AI代理时代到来的明确信号

xAI推出Grok Build早期beta版，这是一个面向SuperGrok Heavy订阅者的代理CLI工具。其核心突破在于并行子代理机制，主代理可指挥多个子代理协同执行编码、研究等任务，实现结构化效率革命。战略上选择CLI界面，以支持脚本化、版本控制及与开发现有工具链集成。高价订阅旨在筛选重度开发者，获取真实项目中的高质量训练数据，加速产品迭代。此举标志着AI代理时代正式开启，未来开发者角色将向指挥AI代理军团协作转变。

xAI: An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for Sup...

智能体 xAI 产品更新编码

09:16

meng shao@shao__meng

Codex 进入 ChatGPT 移动应用，支持远程操控本地机器进行移动办公

OpenAI 在 ChatGPT 移动应用中推出 Codex 预览功能，用户可远程连接运行 Codex 的本地机器（如笔记本或 Mac mini）。通过安全中继层架构，系统能实时同步工作线程、审批请求与项目上下文，并回传截图、终端输出等结果，而所有文件与凭证均保留在本地，不上传云端。用户可在移动中启动任务、审阅输出或决策分叉，实现“云端中继+本地执行”的混合办公模式。目前该功能暂未支持 Windows 端。

OpenAI: You've been asking for this one... Now in preview: Codex in the ChatGPT mobile app. Start new work, review outputs, stee...

智能体 OpenAI 产品更新编码

08:51

Berryxia.AI@berryxia

开发者Yetone将一篇关于桌面应用开发"最佳实践"的文章转化为一个名为"native-feel-skill"的Agent Skill。该Skill旨在帮助开发者利用Coding Agent，轻松地重构或开发跨平台桌面应用，并使其获得极其接近Native原生应用的性能体验。项目代码已开源在GitHub上。

yetone: 由于这篇文章太伟大了,所以我把它变成了一个 Agent Skill。大家可以使用自己的 Coding Agent 安装一下这个 Skill,这样就可以用「最佳实践」来轻松地重构或者开发一个既容易跨平台、又极其接近 Native 性能的桌面...

智能体 GitHub 开源/仓库编码

08:51

Berryxia.AI@berryxia

AI自主研究实现突破：智能体在nanoGPT优化赛道上超越人类基准

Prime Intellect 近期在AI研究自动化领域取得重要进展。他们让Claude Code与Codex智能体完全自主运行于nanoGPT速度挑战的优化器赛道，利用闲置算力完成了近万次实验，消耗约1.4万H200小时。最终，Claude Code将记录提升至2930步，超越了2990步的人类基准。实验显示，智能体在系统整合社区主流优化方法、进行超参数扫描和策略组合方面效率极高，但在要求真正创新的“新颖性检查”环节未能突破基线。该项目将所有实验记录、日志和代码开源，使得AI自主研究从概念转化为可复现的现实。

Prime Intellect: Automating AI research is the next major step in AI We let Claude Code (Opus 4.7) and Codex (GPT 5.5) run autonomously o...

智能体开源生态论文/研究

08:46

meng shao@shao__meng

xAI 发布 Grok Build CLI（测试版）

xAI 面向 SuperGrok Heavy 订阅用户推出了 Grok Build CLI 测试版，这是一个用于编码、应用构建与工作流自动化的智能体命令行工具。其发布旨在通过用户反馈迭代产品。该工具核心特性包括优化的终端渲染性能、用于审阅复杂任务的可视化计划视图、支持并行执行最多8个角色的子智能体系统、可装载团队规范与知识的技能模块，以及支持团队共享的插件市场。其底层模型 grok-code-fast-1 在 SWE-Bench Verified 基准测试中成绩为70.8%，上下文窗口为256K。

xAI: An early beta of Grok Build, an agentic CLI for coding, building apps, and automating workflows is now available for Sup...

智能体 xAI 产品更新编码

08:40

🚨 AI News | TestingCatalog@testingcatalog

Manus: 2/ Go deeper with more metrics and analyze: • Keyword demand, difficulty, CPC, and intent • Branded vs. unbranded search...

智能体产品更新数据/训练

07:51

ginobefun@hongming731

Claude Code最佳实践与GPT-Realtime-2解析：AI工具迈向体系化

Anthropic发布Claude Code大型代码库实践指南，强调Harness配置（如CLAUDE.md、Hooks）与模型能力同等重要，是决定实际体验的关键，并指出RAG在高速迭代代码库中存在时效性局限。同时，OpenAI通过Build Hour解析GPT-Realtime-2，展示语音Agent正从聊天机器人演进为“语音→行动”的自主工作流。此外，当AI将开发周期从月压缩到小时，效率提升正引发协作方式与组织结构的重构难题。

智能体 Anthropic OpenAI 现象/趋势