5月23日

09:30

ginobefun@hongming731

#BestBlogs 早报 05-23 今日主题： - Agent 架构在生产端形成长时程与实时两类分化（LangChain Interrupt 2027）； - Notion 以爵士乐队模式和哑铃型人才重新创业（Ivan Zhao × Sequoia） - GLM-5.1 高速版 400 tokens/s 打破「快必然小」惯例（智谱 × TileRT）

智能体推理行业动态

09:30

ginobefun@hongming731

AI应用新趋势：架构分化、组织重构与性能突破

LangChain在演讲中指出，Agent生产架构已明确分化为长时程知识型与低延迟响应型两类，工程路径各异。Notion CEO分享了公司转向更灵活的“爵士乐队”模式，并采用“哑铃型”人才结构以适应AI开发。智谱同期发布GLM-5.1高速版，在保持旗舰能力的同时实现400 tokens/s的输出速度。三者共同揭示了AI应用在底层架构、组织形态与基础性能上的演进方向。

智能体 Anthropic OpenAI 推理

08:14

Google Gemini@GeminiApp

Gemini升级：用户超9亿，推出智能代理功能

谷歌宣布Gemini应用月活用户已突破9亿。在此次更新中，Gemini正从工具演变为更主动的个人AI代理。主要更新包括新一代模型Gemini 3.5 Flash、全新的“Neural Expressive”设计语言，以及能将提示转化为高质量视频的Gemini Omni模型。核心亮点是两项代理功能：“Daily Brief”提供个性化每日简报，“Gemini Spark”则作为24/7的个人代理，在用户授权下主动管理任务与数字生活。这些更新标志着AI助手向更主动、更整合的方向发展。

智能体 Google 产品更新多模态

关联讨论 19 条

06:57

Rohan Paul@rohanpaul_ai

每个智能体都需要人类。智能体离实际操作的人类越远，表现就越差。尽管AI能完成专家级的人类工作，但它实际上增加了对人类专家的需求。

智能体大佬观点

06:37

ClaudeDevs@ClaudeDevs

精选69

自动模式的两项更新： · 现已在Pro计划中提供 · 现已支持Sonnet 4.6，以及Opus 4.7 按下Shift+tab，让Claude运行。

智能体 Anthropic 产品更新编码

关联讨论 1 条

推荐理由：Claude Code的auto mode从专属功能下放至Pro计划，并且首次支持Sonnet 4.6，这意味着更多开发者能用更低的成本尝试自动代理编程，Sonnet 4.6的编码能力在实战中究竟如何，现在可以直接测试了。

04:05

Artificial Analysis@ArtificialAnlys

Cursor Composer 2.5在成本与效率上实现突破性优势

基准测试显示，Cursor Composer 2.5在编程任务中展现出卓越的成本与效率优势。其单任务成本仅为Claude Opus 4.7的1/3至1/18，更是GPT-5.5的1/5至1/32。这一低成本源于其极高的token使用效率：完成全部测试仅消耗1.6M token，远低于同类模型的5.7M。效率方面，其平均任务完成时间约9分钟，比行业平均水平快约1.3倍，其快速版本更可将时间缩短至约7分钟。

智能体编码评测/基准

03:49

小互@xiaohu

一种轻量化的Codex远程服务器配置方案。无需安装完整版应用，仅需在远程服务器上安装并运行CLI版Codex。执行`codex remote-control`命令后，手机端ChatGPT应用内的Codex功能即可发现并连接该服务器，远程体验与完整版无异。两种配置在应用内通过不同图标（"终端"与"电脑"）进行区分。

Oasis Feng: 其实远程服务器上并不需要安装一个完整版的 Codex app,只需要安装 CLI 版的 Codex,并运行: codex remote-control 这样手机上 ChatGPT 应用里的 Codex 就会显示出一个有「终端」图标的服务器名...

智能体 OpenAI 教程/实践编码

01:50

elvis@omarsar0

学习AI的最佳方式是通过构建智能体来实践。为此，我们推出了实践实验室和关于智能体工程的新系列。首个主题：智能体技能。后续计划：规划、上下文工程、多智能体系统、长期运行智能体等。开始构建吧！

智能体教程/实践

01:20

elvis@omarsar0

这才是正道。价格仅为原价的四分之一！用 DeepSeek-V4-Pro 构建的智能体功能已经令人印象深刻，所以这简直是开发者的最佳消息。

DeepSeek: We are making our discount permanent! 🎉 Enjoy building with DeepSeek-V4-Pro and bring your innovative ideas to life! 🚀

智能体 DeepSeek 行业动态

01:15

Google AI@GoogleAI

同事件精选70

谷歌I/O大会发布AI代理全套开发工具链

谷歌在I/O开发者大会宣布，系统性构建面向AI代理（Agent）的开发与部署工具链。核心更新包括：独立桌面应用Antigravity 2.0及其命令行工具、SDK面世；Google AI Studio新增Kotlin支持，可一键开发安卓应用并发布，同时推出移动端App。此外，Gemini API推出托管代理服务，实现一键部署；WebMCP作为开放标准在Chrome 149中推出，允许网页向代理暴露工具；Chrome DevTools也开放给AI代理以自动化调试。企业级客户可直接连接Google Cloud项目，而DeepMind的科学技能包则加速特定领域研究。此举标志着谷歌正全面打造从开发、接口到部署的完整AI代理生态系统。

智能体 Google 产品更新编码

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Google把今年I/O的Agent相关更新打包放出，Antigravity 2.0从IDE变桌面应用、AI Studio能直接做Android App，对Google生态开发者是必读速览。

01:05

SemiAnalysis@SemiAnalysis_

精选82

智能体工作负载正在悄然重塑推理经济学。我们从SemiAnalysis的43.2万个真实编码智能体请求中提取数据，发现中位数并非3.2万或6.4万，而是9.6万输入token。作为参考，这意味着在你输入问题之前，模型已处理了超过《了不起的盖茨比》全文长度的文本。（1/3）🧵

智能体推理现象/趋势编码

推荐理由：SemiAnalysis 用 43 万次真实编码请求数据揭开了 Agent 推理经济学的真面目，中位输入 9.6 万 token 这个数字足够反直觉，所有做推理服务和模型定价的人都得重新算了。

00:07

Replit ⠕@Replit

大多数氛围编码应用会忘记每个打开它们的用户。用一条提示让 Replit Agent 修复它！💻 今天就尝试为你的应用添加认证功能吧！

智能体产品更新编码

5月22日

23:56

Chubby♨️@kimmonismus

AI平台Polsia在创始人Ben主导下完成3000万美元融资，估值达2.5亿美元。该公司采用"创始人+AI"模式，无需雇员即可自主运营商业实体，目前年化营收已近1000万美元，服务超7600家企业。Polsia甚至自主完成了本次融资流程，创始人仅需签署文件。这种完全由AI驱动的商业运营模式展现了快速增长的态势。

Ben Cera: Polsia just raised $30M at a $250M valuation. Approaching $10M annual run rate. One Founder + AI. Zero employees. Polsia...

智能体行业动态

23:37

🚨 AI News | TestingCatalog@testingcatalog

错过了吗？Imagine Agent现已登陆Grok iOS版！你试过了吗？👀

智能体 xAI 产品更新多模态

22:56

Chubby♨️@kimmonismus

让数据库变得简单的团队现在为AI智能体做了同样的事情

Airtable团队推出Hyperagent平台，为每个会话提供完整云端环境，包括浏览器、Shell和代码执行能力，支持用户无本地设置即可快速构建AI智能体，并可部署到Slack等工作平台实现自动化工作流。Airtable资金超10亿美元，已服务80%的财富100强企业。其“创始500”计划为500位创始人提供2万美元推理信用额度，总投入1000万美元，旨在推动“智能体优先”创业趋势，押注自主、主动的AI智能体将成为未来企业核心驱动力。

Howie Liu: We're giving away $10,000,000 to founders building agent-first businesses. Autonomous, proactive agents will run tomorro...

智能体产品更新

19:30

歸藏(guizang.ai)@op7418

开源一个 Skill，让 AI 接管你屏幕边那张便签纸

AI Desk Card 是一款 4.7 寸磁吸墨水屏，结合 AI Agent（如 Claude Code），通过预置模板与数据填充，动态显示日历、待办、GitHub PR 队列、天气等内容。它解决了传统便签纸的静态限制，实现内容自适应和场景切换（如夜间变为电子名片）。核心理念是将硬件从固定功能中解放，使显示能力由 AI 可获取的信息动态定义，从而提升效率并减少手动配置。

智能体开源/仓库教程/实践端侧

19:16

AYi@AYi_AInotes

2026或成长周期智能体元年，AI效率为何难累加？

红杉AI Ascent 2026闭门峰会提出，“长周期智能体”将成为2026年的商业定义。但这引发了“AI生产力悖论”：尽管Cursor、Claude、NotebookLM等AI工具显著提升了个人效率，但这些工具的“记忆”绑定于个人账号和设备，无法迁移、共享或在团队间累积。因此，个体效率的提升难以转化为组织层面的生产力增益，每个员工都像一座座彼此孤立的“信息孤岛”。

AYi: http://x.com/i/article/2057668634579714048

智能体大佬观点

18:50

Alibaba Cloud@alibaba_cloud

Qwen3.7-Max现已登陆Model Studio，限时五折（5月22日至6月22日）！旗舰级编程智能体性能。专为可靠、多步骤的软件执行而设计，最大限度减少人工干预。 🚀 立即体验：https://int.alibabacloud.com/m/1000413314/

智能体模型发布编码

关联讨论 9 条

18:19

Qwen@Alibaba_Qwen

近期一项针对前沿AI模型在真实智能体任务上的测试显示，Qwen 3.7-Max在效果与成本方面全面领先。该任务要求模型自主编写并迭代优化一个能自我训练的Tetris机器人程序。在10轮自我改进中，Qwen 3.7-Max仅花费1.32美元，便将机器人性能提升了56%。相比之下，Claude Opus 4.7花费12.15美元提升了28%，GPT-5.5花费2.85美元提升了7%。结果表明，在需要长时间自主推理、代码阅读与迭代的复杂智能体循环场景中，Qwen Max具备极强的成本效益比与自我改进能力。

atomic.chat: Qwen 3.7-max beats Opus 4.7 and GPT-5.5 We tested three frontier models on a real agentic task: write a Tetris bot that ...

智能体推理评测/基准

关联讨论 9 条

18:19

Qwen@Alibaba_Qwen

⚡️⚡️ 【引用 @OpenRouter】：来自 @Alibaba_Qwen 的全新 Qwen3.7-Max 已在 OpenRouter 上线。作为 Qwen3.7 系列的旗舰模型，专为以智能体为中心的工作而构建：编程、办公与生产力任务，以及长周期自主执行。在编程和智能体基准测试中较 Qwen3.6 有显著提升，并支持显式的提示缓存以处理重复上下文。

OpenRouter: The new Qwen3.7-Max from @Alibaba_Qwen is live on OpenRouter. The flagship of the Qwen3.7 series, built for agent-centri...

智能体模型发布编码

关联讨论 9 条

18:16

Berryxia.AI@berryxia

SenseNova AI Agent实测：自动跑报告，免费薅羊毛

用户实测SenseNova 6.7 Skills Agent，称其为“牛马人套装”。该AI agent能够自主执行长时间、重复性的数据处理任务，例如爬取网站、整理数据并生成结构化文件（如MD格式），以完成一份市场调研报告。由于任务复杂，执行耗时较长，但因产品处于公测阶段，目前免费使用。用户后续还将测试其自动生成报告PPT的功能，并提醒大家抓紧机会体验其免费的CodingPlan。

智能体 MCP/工具教程/实践

17:19

向阳乔木@vista8

飞书开源工具接入Claude Code，移动端AI助理体验升级

前字节员工推荐飞书作为连接AI工具的平台。通过Zara开源的lark-channel-bridge工具，可将本地Claude Code变为飞书机器人，实现手机端随时进行复杂任务对话。该工具能将飞书消息转给Claude Code处理，支持可交互卡片和文件图片的直接显示，并结合飞书的全量搜索功能，提供流畅、可控的“AI工作助理”体验，被作者强烈推荐。

智能体 MCP/工具开源/仓库

17:16

Berryxia.AI@berryxia

万能提示词太麻烦？他做了个对话式海报生成Agent

一位创作者分享了其开发的通用AI海报提示词，适用于产品、人文、科技、展会等多个领域，但因使用复杂，部分用户难以驾驭。为此，他在Bloome平台将这套方法封装成一个海报设计Agent。用户现在可通过自然对话快速生成高质量海报，无需复杂提示词操作。工具设置了1美元的付费门槛以过滤免费滥用，该费用可解锁约100次生成额度，且该优惠可能限时一周。

智能体产品更新图像生成

15:50

Alibaba Cloud@alibaba_cloud

Agent-Native Infra Forum | Qwen Conference 2026 为自主智能重构云技术栈。加入在新加坡金沙会展中心举办的会议，探索专为智能体打造的硬件、内存与扩展基础设施。 👉 立即预约席位：https://click.qwencloud.com/m/20000000190/

智能体行业动态

15:46

meng shao@shao__meng

VSCode Agent-First Development五大支柱解析

VSCode团队提出Agent-First Development框架，核心理念是开发主体从“人+编辑器”转向“人+Agent+编辑器”，人的角色转变为选择模型、提供上下文、定义意图和设定边界。五大支柱为：模型（匹配任务深度，按需选择思考档位）、执行边界（从问答到自主规划的渐进信任模式）、上下文（显式提供关键信息以避免错误）、提示（需清晰包含目标、范围与约束）与工具（能力需可控、可审计）。该框架旨在系统化指导人与AI代理高效协作开发。

Microsoft Developer: The @code team released a new Introduction to Agent-First Development series. It breaks down these 5 pillars behind grea...

智能体 Microsoft 教程/实践编码

15:44

Elon Musk@elonmusk

精选73

Grok 进展 Grok Imagine Agent Mode 现已在 Grok iOS 应用上推出。借助 Agent Mode，你可以生成： • 跨代际一致的角色 • 同一角色的多场景画面 • 不同的镜头角度和环境 • 更具电影感和连贯性的叙事视觉效果这是角色一致性和 AI 生成叙事方面的一次重大升级。现在就在 Grok iOS 应用中尝试吧。

X Freeze: Grok Imagine Agent Mode is now available on Grok iOS app With Agent Mode, you can generate: • Consistent characters acro...

智能体 xAI 产品更新图像生成

推荐理由：Grok Imagine Agent Mode把角色一致性从「抽卡」变成可控流程，做故事板、漫画创作的可以立刻上手，虽然目前仅限iOS，但这一步方向很对。

15:30

歸藏(guizang.ai)@op7418

小红书可以直接上传 Skill 了，这个太屌了，感觉是个很大的事件。

智能体 MCP/工具产品更新

15:14

AYi@AYi_AInotes

8套价值上万的神级Prompt模板开源分享

本次分享开源了8套被称作“神级”的Prompt模板，宣称总价值超过万元。这些模板覆盖了工作、生活、学习、副业等多领域场景，包括KERNEL-X、AI工作流专家、深度研究等具体系统，旨在帮助用户提升效率、解决实际问题，实现从焦虑到豁然开朗的状态转变。

AYi: http://x.com/i/article/2057300084354670592

智能体教程/实践编码

14:14

AYi@AYi_AInotes

AI生产力悖论：个体在飞，组织在塌

本文指出当前AI应用存在一个“生产力悖论”：个人使用AI工具效率大幅提升，但组织整体效能却未同步增长。核心原因在于，组织普遍缺乏有效的“记忆系统”，导致大量时间（据MIT报告超30%）被消耗在重复构建上下文中，使个体提升的效率无法在组织层面累加与沉淀。MIT报告显示，高达95%的企业AI投入未产生可衡量回报。作者认为，未来竞争的关键不在于使用最强的AI模型，而在于构建最深厚的“组织记忆”，将对话、决策等资产系统化沉淀，这比单纯追求工具本身更为重要。

智能体其他大佬观点

12:30

歸藏(guizang.ai)@op7418

Codex 昨晚发布史诗级更新，体验爆炸提升！

Codex发布重要更新，核心提升在于上下文获取与任务自动化。新推出的“Appshots”功能，通过同时按住左右Command键，即可截取当前窗口并将屏幕内外的可见与不可见文本一并自动填入对话，极大简化背景提供流程。已正式上线的“/goal”功能支持设定长期目标，Codex可持续自主执行数小时至数天，且允许中途调整与暂停。此外，应用内浏览器速度提升，并新增可直接编辑页面元素的高级注释模式。团队版本则新增了批量安装插件的功能，提升了协作效率。

OpenAI Developers: It's Codex Thursday, and yes, we have updates for you. First up: Appshots, a new way to bring the context of what you're...

智能体 OpenAI 产品更新编码

12:13

宝玉@dotey

精选76

OpenAI Codex /goal功能正式发布及使用指南

OpenAI宣布Codex的/goal模式已结束实验，成为稳定功能。用户可在Codex应用、IDE扩展或CLI中使用，通过设定具体里程碑，让AI持续工作直至完成，任务可运行数小时甚至数天。过程中支持随时检查、调整方向及暂停。使用前需升级应用并启用该功能（可通过命令行指令或手动修改配置文件实现）。开启后，可在输入框管理任务，并利用侧边对话查看进度而不中断主任务。该功能旨在高效处理各类复杂任务。

OpenAI Developers: 🥅 /goal has graduated from an experiment-for tasks big and small, Codex gets your work done. Use goal mode in the Codex...

智能体 OpenAI 教程/实践编码

推荐理由：Codex的goal模式从实验毕业，意味着你可以真的放手让AI去跑长时间任务，做开发的不用再守在电脑前，这是agent落地的真信号。

10:49

Alibaba Cloud@alibaba_cloud

阿里云与Novita AI达成合作，在Novita AI平台首发推出Qwen3.7-Max模型，标志着双方共同推进Agent时代的发展。该模型专为智能体时代设计，强调从"回答"到"执行"的能力跃升。核心优势包括：强大的代码生成与软件工程工作流能力；可靠的智能体编排与多智能体系统协作能力；支持长周期、自主化的复杂任务执行；且具备框架与技术栈无关的兼容性，可适配多种主流开发环境。

Novita AI: 🚀 We're launching Qwen3.7-Max from @AlibabaGroup on Novita AI as a Day-0 launch partner. Built for the Agent Era - wher...

智能体模型发布

关联讨论 9 条

10:43

宝玉@dotey

一条科技推文探讨了AI任务执行中的中断恢复问题。核心疑问是：当执行/goal类任务时遇到5小时的运行时间限制，等待限额恢复后，任务是否会自动继续，还是需要用户手动输入指令（如"continue"）来重新激活。引用部分显示，此前已有其他用户就同一场景（针对/goal任务）向开发者提问"限额到了能恢复吗"，表明该问题受到持续关注。讨论聚焦于AI任务连续性机制及用户交互方式。

benny: @dotey 这个goal对于5h限额到了, 能恢复吗

智能体其他

10:35

Greg Brockman@gdb

Codex让你通过手机使用电脑上的所有应用【引用 @AriX】：又一个：今天我们发布了Codex中的远程计算机使用功能！这意味着你可以通过Codex Mobile使用Mac上的所有应用，即使你的电脑在家且处于锁定状态。这有点神奇。

Ari Weinstein: Another one: today we released Remote Computer Use in Codex! This means you can use all the apps on your Mac from Codex ...

智能体 OpenAI 产品更新

10:13

meng shao@shao__meng

Codex周四更新：可远程控制锁屏Mac，支持长期自主执行

OpenAI Codex推出周四常规更新，本次重点功能是远程Mac控制：用户可通过手机安全操作处于锁屏状态的Mac，实现“无人值守”执行任务。同时新增Appshots功能，可直接捕捉屏幕上下文注入对话。新增的Goal Mode支持数小时至数天的长期自主执行，标志着Codex从即时响应工具向长期智能体的转变。此外，高级标注模式提升了前端协作的直观性。

OpenAI: Highlights from today's Codex Thursday launches: 1️⃣ Codex can now securely use apps on your Mac from your phone, even w...

智能体 OpenAI 产品更新

09:38

Huawei Cloud@HuaweiCloud1

华为展示AI驱动金融变革新图景

华为于上海举办智能金融峰会2026（HiFS 2026），与全球金融业领袖探讨AI驱动的数字化转型。华为基于全栈云化的计算、存储与网络能力，通过软硬件系统级协同，构建了坚实的金融基础设施。在此之上，华为正打造一个支持多种模型与场景的金融级AI Agent赋能平台，旨在推动金融业向智能化阶段跃迁。

智能体行业动态部署/工程

08:42

meng shao@shao__meng

一起看看 Cursor 团队内部最常用的 Skills

Cursor 团队内部广泛使用的代码审查技能“thermo-nuclear-code-quality-review”，其核心目标是在代码合并前，拦截那些“能运行但会使代码库变糟”的提交。它基于四条硬性原则：强制实现复杂度净简化而非转移、限制单文件不超过1000行、标记无用的封装与散落的逻辑、坚持维护性与功能同等重要。该技能采用父子Agent两阶段协作机制：父Agent并行收集结构化差异与文件内容，再交由审计Agent进行单次、聚焦的严格评判。即使插件未安装，也会触发一套对齐上述原则的可维护性降级审计。

eric zakariasson: the most used skill internally at cursor right now /thermo-nuclear-code-quality-review - deletes complexity instead of m...

智能体教程/实践编码

08:38

OpenAI@OpenAI

今日Codex周四发布亮点： 1️⃣ Codex现可通过手机安全使用Mac上的应用，即使Mac处于锁屏且屏幕关闭状态。

智能体 OpenAI 产品更新

关联讨论 4 条

08:13

Berryxia.AI@berryxia

Gemini推出Daily Brief，早间一键梳理今日重点

Google Gemini上线Daily Brief功能，能在早晨主动扫描用户的邮件、日历与最新动态，提炼出当日需优先处理的事项，生成一份简洁的待办清单，帮助用户快速把握全天重点。该功能目前面向Google AI Plus、Pro和Ultra用户在美国地区开放。

Google Gemini: Get a head start on your day with Daily Brief. Gemini can now proactively flag what matters most in an easily digestible...

智能体 Google 产品更新

08:13

Berryxia.AI@berryxia

首款人类与AI Agent共处的群聊应用上线

Bloome正式上线，定位为首款将人类与AI Agent置于同一群聊的消息应用。其核心设计是Multi-Agent One Room，即多个AI Agent与人类用户共同在同一个“房间”内协作，如同添加同事一样将不同职能的Agent拉入对话。产品强调AI Agent作为队友而非工具，能共同处理任务（如协作修复Bug、完成写作流程），显著提升协作效率。目前仅开放1000个邀请码，产品迭代更新速度快。

Bloome: Bloome is officially live. The first messaging app where humans and AI agents share the same group chat - as teammates, ...

智能体 MCP/工具产品更新