5月20日

02:09

Google AI@GoogleAI

三年前，Gemini从理解世界开始。随着Gemini 2，模型学会了思考和推理。去年底，Gemini 3将任何想法变为现实。今天，我们继续这段旅程，推出Gemini 3.5系列，首先发布Gemini 3.5 Flash，为智能体和编程提供前沿性能。

智能体 Google 推理模型发布

02:08

Google Gemini@GeminiApp

精选74

Gemini Spark 是你的新全天候个人AI代理。给它一个任务，它会在后台自主工作，即使你的手机和笔记本电脑已关机。你选择启用它，它被设计为在执行重大操作前会先征询你的意见。#GoogleIO

智能体 Google 产品更新

推荐理由：Google把AI代理做成了24/7在线的背景进程，手机关机也不停，这是从对话助手到自主执行的一步大跨越，对普通人来说，真正的虚拟助理可能要来了。

02:06

🚨 AI News | TestingCatalog@testingcatalog

谷歌在I/O大会上发布了名为Gemini Spark的24/7个人AI代理。该产品基于Gemini 3.5模型与Antigravity平台构建，运行在Google Cloud专用虚拟机上，可无需用户保持设备开机而在后台自主执行长时间任务。Gemini Spark旨在作为用户的数字助手，依据指令采取行动，并计划通过MCP协议与Google现有工具及第三方应用集成。目前该产品已向部分测试者开放，下周将面向美国Ultra用户推出。

Google: Introducing Gemini Spark ✨ It's your 24/7 personal AI agent that helps you navigate your digital life, taking action on ...

智能体 Google MCP/工具产品更新

02:03

Artificial Analysis@ArtificialAnlys

速度智能兼得的新一代AI：谷歌Gemini 3.5 Flash发布

谷歌发布新模型Gemini 3.5 Flash，其在智能指数上提升9分至55分，超越Grok 4.3和Claude Sonnet 4.6，尤其在代理任务和知识真实性（大幅减少幻觉）方面进步显著。输出速度超280 tokens/s，使其位于速度与智能的领先前沿。然而，模型运行成本相比前代增加5.5倍，主要由于输入令牌用量及定价上涨。此外，它在多模态评估MMMU-Pro中取得最高分，支持多模态输入，展现了谷歌的综合优势。

智能体 DeepMind Google 多模态

01:59

Jeff Dean@JeffDean

谷歌发布Gemini 3.5 Flash，专为复杂代理工作流设计

在Google I/O大会上，谷歌正式推出Gemini 3.5系列模型，首个发布的Gemini 3.5 Flash专为执行复杂、长周期的代理工作流而设计。该模型在Terminal-Bench和MCP Atlas等编程与代理基准测试中得分超越3.1 Pro，且运行速度可达其他前沿模型的4倍。若在Google Antigravity环境中使用，速度提升可高达12倍。它能高效部署协同工作的子代理，通过高频迭代循环来解决现实世界的大规模问题。

智能体 Google 模型发布编码

01:59

elvis@omarsar0

人们和公司越早认识到这一点，就越能更好地利用AI。这很有道理。我们训练当前的AI系统，是为了在与人类专业知识结合时达到最佳效果。未来可能会有变化。更自主的智能体即将到来。但即便如此，人类的验证和创造力仍将至关重要。【引用 @balajis】：每个AI智能体最终都有一个人类委托人。

Balaji: Every AI agent ultimately has a human principal.

智能体大佬观点

01:41

Google DeepMind@GoogleDeepMind

智能体 Google 模型发布编码

01:36

🚨 AI News | TestingCatalog@testingcatalog

谷歌在I/O大会宣布推出Antigravity 2.0平台，面向全球用户开放。该平台集成了新的智能体系统和自然语音交互体验，Gemini 3.5 Flash模型在Antigravity上的运行速度提升了12倍。谷歌展示了其智能体在该平台上仅用12小时，通过93个并行子智能体、超过1.5万次模型调用和处理26亿个token，成功从零构建出一个可运行的操作系统，API调用成本不到1000美元。

Google: We asked our agents to build a working operating system from scratch using @Antigravity 2.0 and Gemini 3.5 Flash. It too...

智能体 Google 产品更新语音

00:59

François Chollet@fchollet

大多数人类任务并非马尔可夫过程，最优的下一步行动无法仅凭当前状态决定。它很大程度上取决于过去的轨迹、原始意图和上下文约束。一个无法以绝对保真度压缩和追踪其过去轨迹的智能体，其效用可能只有能做到这一点的智能体的20%。

智能体大佬观点

5月19日

23:58

elvis@omarsar0

代码或成AI代理框架的关键路径

推文聚焦于一篇探讨AI代理（Agent）开发框架的百页报告，其核心主张是“代码作为代理框架”具有重要潜力。报告总结了相关方法与应用，并论证该路径可能推动更广泛的科学框架工程。论文进一步提出，未来的智能系统必须具备四项关键特性：可执行、可检查、有状态以及受控。报告旨在为构建有效AI代理提供参考，并推荐相关学习资源。

智能体 arXiv MCP/工具论文/研究

23:31

OpenRouter@OpenRouter

精选68

OpenRouter上的任何工具调用模型现在都可以自主调用网络搜索和网页抓取功能。模型可以自行决定何时搜索、搜索什么以及搜索次数。我们新增了@p0作为新的网络搜索提供商。了解更多：https://openrouter.ai/announcements/agentic-web-tools

智能体产品更新搜索

推荐理由：OpenRouter 把 agentic web search 变成了开关，模型决定何时搜索。对于还在自己搭搜索管道的开发者，这是官方偷懒答案。

23:31

凡人小北@frxiaobei

本次更新亮点在于展现了"操作系统级感知力"的交互新方向。其核心优势并非单一模型，而是Gmail、Drive等服务的深度生态整合，这为重度用户构建了高迁移成本的壁垒。桌面端AI竞争已进入新阶段，谁先实现顺畅的系统级感知体验，谁将占据先机。

听澜: 可以!Google这次是认真了, 结合前一段的goolebook看这个消息,光标停在哪个窗口、哪个界面,它就直接读懂那里在干嘛。这个交互逻辑如果做顺了, 体验会比"点击分享屏幕"自然一个量级。再加上Spark模式跑本地Agent, 浮窗...

智能体 Google 大佬观点端侧

23:04

🚨 AI News | TestingCatalog@testingcatalog

GOOGLE I/O 🔥：Google Flow即将接入Gemini Omni和全新的Flow Agent体验！ > 您的代理已激活！可让Gemini进行创意构思、生成图像变体、重命名资源或回答关于Flow的问题。在下方开始输入，或点击右上角的展开图标开启聊天模式。自定义风格工具现已推出。

智能体 Google 产品更新

23:01

Berryxia.AI@berryxia

Lucius AI获300万美元融资，构建企业"上下文层"提升协作效率

Lucius AI完成300万美元融资，旨在构建组织的“上下文层”以解决企业协作中的核心痛点：尽管个人借助AI效率大幅提升，但组织仍困于重复构建信息上下文的循环。其产品通过分析历史对话、自动化用户访谈、构建自学习支持系统及生成自然语言规则，将团队内的交流与决策转化为持续积累的“组织记忆”，目标是减少超过30%被浪费在重复确认已有信息上的时间，让团队能真正以AI时代的速度运转。

Lucius: We raised $3M to build Lucius AI - the Context Layer for Your Organization. Backed by Future Capital Discovery Fund, we'...

智能体行业动态

22:56

向阳乔木@vista8

坚果云多场景同步方案实测与成本优势

坚果云同步功能可用于跨设备同步本地.agents目录、替代Obsidian官方同步服务，以及通过Webdav支持CC Switch等工具的API配置。其共享功能便于文件协作。个人用户年费199元，在价格上相比各类AI工具订阅更具性价比。

智能体教程/实践

22:26

Baidu Inc.@Baidu_Inc

这里快速补充一个指标新词：DAA。全称 Daily Active Agents（每日活跃智能体），相当于智能体时代的 DAU。如果说代币经济学追踪成本，那么 DAA 追踪产出--智能体实际完成了多少工作。完整对比见下文 ↓

智能体现象/趋势

22:01

Berryxia.AI@berryxia

用户调侃AI助手HappyCapy可能产生的巨额Token消耗成本。推文核心是指出通过HappyCapy控制Mac等操作，虽然功能强大，但背后运行所需的Token资源可能远超预期，导致高昂的运营费用。引用内容展示了HappyCapy能通过一条命令连接并控制用户Mac电脑的具体方法，印证了其功能的实现依赖于大量后台计算与交互，从而引发了主推文中对其运营成本（即Token消耗）的调侃。

Happycapy: I can control my Mac with hapoycapy! Connect Your Mac in 3 Steps Step 1: Open Terminal on your Mac Press `Cmd + Space`, ...

智能体其他

22:01

Berryxia.AI@berryxia

在X 上大家可以习以为常的使用Claude、Codex 都是稀松平常的事儿，可在现实生活中周围同事和朋友还是停留在豆包的ChatBot模式。

科技圈用户熟练使用Claude、Codex等AI工具，但普通用户多停留在基础聊天机器人阶段。AI Agent如Hermes向大众扩散时，上手难度高：需自行编写提示词、配置工作流、选择模型，导致许多安装后闲置。因此，普通用户需要开箱即用的产品。360安全龙虾云端版针对此痛点，内置100多个预训练专家模型，适配各类场景，集成语言、图像、视频生成模型，支持工作流串联。全平台可用，接入微信、飞书等，并提供“龙虾教练”功能辅助定制Agent，有效降低使用门槛。

向阳乔木: 小龙虾和Hermes的热度在AI科技圈终于降了。按扩散发展规律看,民间热度估计刚刚开始。但对于普通用户来说,各种龙虾类Agent产品上手难度还是有点高。如提示词怎么写、工作流怎么配、模型怎么选,全靠自己摸索。不少大厂提供了 Open...

智能体产品更新

21:57

Chubby♨️@kimmonismus

Viktor获Accel领投7500万美元A轮融资，创波兰公司纪录，Slack创始人参投。

Viktor是一个AI员工产品，获得由Accel领投的7500万美元A轮融资，创下波兰创始公司史上最大额。投资亮点在于Slack联合创始人Stewart Butterfield和Cal Henderson作为天使投资人参与，这为产品提供了关键信任背书。Viktor能自主按计划运行，连接3000多种工具并直接交付完整工作成果。目前已有12,000多个团队使用，年化收入达1500万美元，在企业效率提升方面展现显著价值，如节省成本、增加收入与恢复团队时间。

Fryd Wiatrowski: Today, we're announcing Viktor's $75M Series A, led by @Accel . @viktor__com was supposed to be a small experiment. It b...

智能体行业动态

21:29

Rohan Paul@rohanpaul_ai

精选78

AI代理在实际应用中需为每个外部服务重复构建集成逻辑，成为其发展的主要瓶颈。针对此问题，Membrane推出了一种通用"技能"解决方案。通过该单一技能，Claude Code、ChatGPT、Cursor等主流AI代理能够用一条指令调用超过10万个不同的API，涵盖从Stripe支付服务到NASA火星车数据等各类服务。这极大简化了开发流程，将定制化集成转变为通用的连接能力，降低了使用门槛。同时，Membrane正发起社区挑战，鼓励用户提交小众API以获得演示和免费额度激励，旨在持续扩展其连接生态。

Membrane: We built one skill that connects any agent to any API. Stripe. NASA Mars Rover. The ISS tracker. The Evil Insult Generat...

智能体 MCP/工具开源/仓库

推荐理由：Membrane 把十万个 API 集成压缩成一行命令，做 agent 的人不用再写胶水代码，直接拿来用就行，省心。

21:26

向阳乔木@vista8

小龙虾和Hermes热度向民间扩散，360推出云端版

AI Agent如“龙虾”工具热度从专业圈向民间扩散，但普通用户面临提示词编写、工作流配置等上手难题。360推出“安全龙虾云端版”，内置预训练专家模型，提供“龙虾教练”引导，实现开箱即用，支持全平台接入，降低使用门槛。

智能体产品更新

20:01

Berryxia.AI@berryxia

AI Agent开发效率惊人：两小时复刻149美元系统

开发者利用Cursor与Claude组合，仅用两小时就复刻了一套海外售价149美元的Three.js热带海洋实时交互系统，并实现了80%以上的功能还原与额外增强。此案例直观体现了“AI Agent开发工具”对复杂应用开发时间和成本的极致压缩。Cursor Auto模式提供了无需特殊网络的技术便利，使这种高效的开发思路具备广泛扩展至天气、生态、教育等场景的潜力。

Berryxia.AI: 我靠!不是,我是最后一个知道的吗??? 你们的嘴可真严啊,Cursor选择Auto模式下。居然不需要魔法网络就可以使用啊!

智能体教程/实践编码

19:03

🚨 AI News | TestingCatalog@testingcatalog

ClickUp的AI大脑将很快能够从单个提示词构建完全交互式的应用程序，并实现实时数据集成。一些示例 👀 > 冲刺追踪器 - 将您的团队运营重塑为面向利益相关者的分析仪表板。 > CRM工具 - 在现有数据之上，拥有一个带有可自定义控件的自定义仪表板。 > 实时OKR仪表板 - 拥有一个可以自动拉取最新更新的动态视图。

智能体产品更新

19:01

Berryxia.AI@berryxia

10分钟训出AI健身教练，黄仁勋的预言正在照进现实

NVIDIA CEO 黄仁勋指出，AI已成为每份工作的基本工具。推文作者以自身实践为例，为应对健康与效率焦虑，利用360“龙虾教练”平台在10分钟内训练出个性化AI健身助手“小B”。该AI能记录训练数据、生成专业日报周报，甚至调用其他AI绘制动作示意图，无需用户编写代码或配置复杂工作流。案例展示了AI工具正从概念讨论快速落地为普通人可用的日常助手，也提醒在追赶技术浪潮时，不应牺牲身心健康。

智能体多模态教程/实践

18:33

🚨 AI News | TestingCatalog@testingcatalog

Anthropic 在伦敦举办的"Code with Claude"活动上宣布，为 Claude 托管代理推出两项新功能：自托管沙盒（公测版）和 MCP 隧道（研究预览版）。自托管沙盒允许用户在自己的基础设施或托管沙盒提供商中运行代理，从而将敏感文件、软件包和服务保留在私有环境中，确保数据安全。MCP 隧道使代理能够安全访问用户私有网络内的 MCP 服务器，无需将其暴露于公共互联网，增强了访问控制。这两项功能共同支持代理在用户自有的安全边界内执行任务，并默认应用用户的安全策略，有效提升了隐私保护和操作灵活性。

Claude: Live from Code with Claude London: we're launching self-hosted sandboxes (public beta) and MCP tunnels (research preview...

智能体 Anthropic MCP/工具产品更新

14:51

AYi@AYi_AInotes

AI时代内容交付的真正终点是HTML

开源项目html-anything上线7天即获3.3k星，其核心主张是AI时代的内容交付应终结于HTML而非Markdown。项目通过75个预设设计模板（如网格、字体、对比度规范），为本地AI Agent设定明确的“设计纪律”，使其能一键将各类内容转化为生产级HTML并直接发布。文章提出三个反直觉判断：HTML凭借Web原生与响应式特性在AI时代更先进；本地零API调用通过极致自由与零边际成本提升效率；交付介质的轻量化（数百KB的HTML）直接决定用户打开率。该工具正重新定义Agent时代的内容生产工作流。

AYi: http://x.com/i/article/2053129966217277440

智能体开源/仓库现象/趋势

13:50

AYi@AYi_AInotes

为什么这个GitHub项目全网爆火并拿下10万star？

summary_zh

AYi: Damn,这个GitHub项目,直接给你发了一整个AI公司,都给我收藏拿走! 10万 GitHub star🌟,被称为2026年增长最快的AI项目, 146个专业AI专家,12个完整部门。一条命令,全部装进你的Claude Code, ...

智能体 Anthropic GitHub MCP/工具

12:12

Alibaba Cloud@alibaba_cloud

🎨 介绍QoderWork的Design Desk。一个将语言转化为可运行代码的无限画布AI工作区。 💡 用自然语言描述你的需求--即可在无限画布上获得可运行的React + Vite项目。设计师迭代，开发者交付相同文件。无缝交接。 ⏬立即下载QoderWork https://www.qoderwork.ai #AI #Qoder #QoderWork #DesignDesk

智能体产品更新编码

11:59

歸藏(guizang.ai)@op7418

藏师傅前端视频生成Skill完成与优化分析

“藏师傅”前端视频生成技能已完成，当前重点在于提升工程化水平与降低Token消耗。对一段40秒视频案例的分析显示，总消耗达145万Token，其中视频组合部分占比极高，但得益于92%的缓存率成本可控。该方案由PPT Skill（美学动效）、HyperFrames（时间线渲染）、Listenhub Skill（配音）及即梦CLI（生成演示镜头）协同完成。

歸藏(guizang.ai): 让 Codex 自己做了一条视频介绍了一下这个视频生成方案藏师傅的 PPT Skill 负责美学、版式、动效 HyperFrames 负责时间线和渲染、字幕 Listenhub Skill 负责配音即梦 CLI 负责前端无法生成的演示...

智能体 MCP/工具教程/实践视频

11:59

歸藏(guizang.ai)@op7418

CodePilot学习用户风格并自动调整UI生成样式

CodePilot展示了强大的个性化能力，能通过用户频繁使用PPT功能的行为，学习并记录其视觉风格偏好。系统随后将这一风格应用于生成式UI组件的视觉样式中，使生成的可视化内容自动适配用户喜好，提升了内容的个性化与美观度。

智能体产品更新多模态

11:10

Luma@LumaLabsAI

优秀的广告不止于翻译，更在于共鸣。单一营销活动很难适用于所有市场。明确目标区域，设定核心信息，然后让 Luma Agents 处理后续所有本地化变体。为每个目标受众打造合适的创意与语言。触达每个市场 → http://lumalabs.ai/app

智能体产品更新视频

10:59

歸藏(guizang.ai)@op7418

Telegram上的机器人现在可以直接跟其他机器人对话了也就是你的群聊可以直接拉多个不同的Agent机器人进行交流。【引用 @durov】：🤖 AI开发者要求这个功能--我们实现了。 💬 机器人现在可以在Telegram上与其他机器人对话。 🧠 自主智能体现在拥有了人类可理解的通信层。

Pavel Durov: 🤖 AI devs asked for this - and we delivered. 💬 Bots can now talk to other bots on Telegram. 🧠 Autonomous agents now h...

智能体产品更新

10:59

歸藏(guizang.ai)@op7418

英伟达首款自研CPU Vera交付

英伟达正式开始交付其首款自研通用CPU——NVIDIA Vera。该芯片专门针对AI Agent时代高并发、高吞吐的长期运行场景进行优化，核心功能是作为Agent编排与工具调用的调度中枢。它旨在将原本由GPU承担的密集调度与I/O任务分离，由CPU专门处理，从而构建更高效的AI系统。首批Vera CPU由英伟达高管亲自送至Anthropic、OpenAI、xAI及甲骨文云（OCI），其中xAI由马斯克亲自接待。此举标志着英伟达正从GPU主导的推理市场，深入布局为AI Agent时代定制计算基础设施的新赛道。

NVIDIA: NVIDIA's Ian Buck hand-delivered the first-ever NVIDIA Vera CPUs to our partners @AnthropicAI, @OpenAI, @SpaceX, and @Or...

智能体 Anthropic OpenAI 产品更新

10:40

Alibaba Cloud@alibaba_cloud

阿里云新加坡展会主推AI企业转型方案

阿里云新加坡将在ATxEnterprise展会展示其通过智能基础设施、AI原生技术与现实解决方案加速企业转型的成果。重点展示包括AI Business Card Studio、AI视频工具Happy Horse、代理式AI助手Qoder、基于PingCAP AI就绪数据库能力的TiDB，以及Lingyang的企业AI解决方案。其合作伙伴Lumen Technologies亚太区也将参与。

智能体行业动态视频

09:56

Berryxia.AI@berryxia

精选76

首个实时多agent世界模型发布，人类可与AI同屏互动

奥德赛实验室推出Agora-1，这是全球首个实时多agent世界模型，允许多人与AI同时在同一个模拟世界中实时互动并相互影响。该模型以经典游戏GoldenEye死亡竞赛为演示场景，提供可玩研究预览，用户现在即可体验与AI共同参与动态生成的模拟世界。这标志着从单人生成视频向多人共享“活世界”的转变，长期来看可能重塑游戏、模拟、教育、机器人及AI协作等领域，使人类从旁观者变为与AI共同生活的参与者。

Odyssey: Introducing Agora-1, a multi-agent world model. Multiple participants-human or AI-can now interact inside the same world...

智能体多模态模型发布

推荐理由：Odyssey把世界模型推进到了多人实时交互，可玩的GoldenEye死亡竞赛预览比任何PPT都有说服力，做游戏和模拟的人得上去打两把。

09:56

Berryxia.AI@berryxia

Cursor发布Composer 2.5模型，号称目前最强

Cursor正式推出Composer 2.5模型，宣称其为当前最强大的AI模型。该模型在智能性、长任务持续执行及复杂指令遵循等方面均有显著提升，并声称在同等能力下效率提升10倍。此次升级主要基于扩大训练规模、构建更复杂的强化学习环境以及引入文本反馈机制。值得注意的是，Composer 2.5的底层架构与Moonshot的Kimi K2.5同源。同时，Cursor正与SpaceXAI合作，计划用十倍算力训练下一代更大模型。未来一周内，该模型的包含用量将翻倍。

Cursor: Introducing Composer 2.5, our most powerful model yet. It's more intelligent, better at sustained work on long-running t...

智能体产品更新编码

09:45

AYi@AYi_AInotes

GitHub爆火项目一键构建AI公司，集成Claude Code

一个GitHub项目引发关注，据称已获得10万星标并被称为2026年增长最快的AI项目。该项目的核心功能是模拟一整家AI公司，包含146个不同领域的AI专家角色和12个完整部门。用户可以通过一条命令，将这些“员工”全部集成到Claude Code中，从而免费获得涵盖前端开发、安全审计、产品管理、增长黑客等多方面的7x24小时AI支持。

智能体 GitHub 开源/仓库编码

09:26

meng shao@shao__meng

HTML 是新的 Markdown？

Claude Code核心开发者Thariq认为，Markdown在复杂任务中可读性差，导致人类易脱离协作循环。而HTML作为可视化、可交互的界面，能将人重新拉回人机协作回路，适配AI时代“算力分配者”的新角色。他提出了三个可落地的工作流：用交互式HTML进行头脑风暴；为特定任务生成“一次性微应用”；构建人机双向可读的“活体设计系统”。核心判断包括：媒介选择决定人类参与度；生成式算力应主要投入在对齐与沟通的“脚手架”上；软件边际成本趋零；以及明确信任指令能激发更创造性的输出。

claire vo 🖤: Soooo @trq212 has straight up changed my life with these 5 words: "HTML is the new markdown." It's so obvious in hindsig...

智能体 Anthropic MCP/工具教程/实践

08:56

meng shao@shao__meng

精选79

「开发日志」提示词：让AI编码决策可审计

针对AI协作编码中“规格永难完整”与“决策无法追踪”的核心矛盾，此提示词提出了第三条路径。它要求AI在实现需求时同步维护一份结构化文档，明确记录设计决策、对规格的偏离、考虑过的权衡以及待确认的开放性问题。这种方法的关键在于将AI执行过程中的隐性判断显式化、文档化，从而让Code Review可直接对照决策笔记，而非逆向工程代码。它不仅降低了模型的过度澄清倾向，更通过提供结构化产物，建立了一种可审计、可协作的人机开发新范式。

Thariq: a prompt I've been using a lot recently: implement <SPEC> and while you do, keep a running implementation-notes.html fil...

智能体 Anthropic 教程/实践编码

推荐理由：这个提示词解决了AI编码最棘手的问题，spec永远写不全，决策藏在diff里。把判断变成可审计的文件，review时直接对照笔记而非逆向工程，做coding agent的值得随时复制。

08:56

Berryxia.AI@berryxia

Claude Design大升级：Token限制翻倍

Anthropic宣布Claude Design所有计划的Token限制翻倍。这解决了以往在处理完整UI设计、多页设计稿或复杂Agent工作流时频繁出现的token不足问题。翻倍后的空间显著提升了连续创作的体验，让该工具在vibe coding、原型制作等任务中实用性大增，从“能用”跃升至“真香”。这体现了Anthropic为提升竞争力而对创作工具的持续优化。

Claude: You can now create more with Claude Design. We've doubled token limits across every plan.

智能体 Anthropic 产品更新编码