6月5日

04:25

Google Research：Blog（网页）

精选79

Google Research 开发了一种被动心率监测系统（PHRM），利用智能手机前置摄像头在日常使用中（人脸解锁后数秒内）捕捉面部视频，通过深度学习估算心率，平均绝对百分比误差（MAPE）低于10%（对比心电图金标准），满足各肤色人群的行业精度标准。系统将全天心率测量整合为每日静息心率（RHR），平均绝对误差（MAE）低于5 bpm（对比可穿戴设备）。研究同时发布了迄今最大规模的公开智能手机视频数据集及预训练模型PHRM-mini，合格研究人员可申请访问。

Google 数据/训练端侧论文/研究

推荐理由：Google 这项发表在 Nature 上的研究，把手机前置摄像头变成了被动心率仪，而且专门解决了深肤色人群精度差的老问题，虽然离产品还远，但方向很对，穿戴设备的护城河可能又浅了一点。

01:03

Dwarkesh Patel：Podcast & Blog（RSS）

精选63

Alex Imas 和 Phil Trammell：AGI 后什么仍然稀缺？

经济学家 Alex Imas 和 Phil Trammell 指出，AGI 时代机器人数量可以快速复制增长，但人类独特技能（以芭蕾舞演员为例）的数量保持不变，揭示了即使技术大幅进步，某些稀缺资源仍不可替代。

DeepMind Google 大佬观点

推荐理由：Alex Imas和Phil Trammell用经济学框架推演AGI后稀缺性，我没想到资本份额可能上升也可能下降，他们对“关系部门”的定义比简单说“人类服务值钱”更精准，值得一看。

6月4日

02:49

Google Research：Blog（网页）

精选72

洪水韧性新篇章：Google 开源水文建模框架

Google Research 在 GitHub 开源了其水文建模框架，这是一个基于 PyTorch 的 Python 包，采用与 Flood Hub 河段洪水预报相同的模型架构和训练数据。该框架允许研究者和预报员训练 AI 洪水预报模型、添加新模型与数据，并已与捷克水文气象研究所（CHMI）等合作测试。开放模型架构和训练管线旨在让各国气象水文部门在保留数据完全控制权的同时，整合基于 AI 的洪水预报。

Google 开源/仓库开源生态数据/训练

推荐理由：谷歌开源的水文模型框架，是少数真正能救命的AI应用。不是秀参数，而是把工具直接塞给一线预报员，让他们用本地数据训练。务实，值得给赞。

00:07

Google Developers Blog（RSS）

在笔记本电脑上运行 Gemma 4 12B：借助 Google AI Edge 解锁本地智能体工作流

Google DeepMind 的 Gemma 4 12B 模型可在 16GB RAM 的普通笔记本上运行，支持本地数据处理与视觉洞察生成。macOS 用户可通过 Google AI Edge Gallery 执行动态 Python 代码与可视化，通过 Google AI Edge Eloquent 实现完全离线的语音听写和文本编辑。另外，LiteRT-LM CLI 新增 serve 命令，可创建行业兼容的本地端点，驱动完全本地的 AI 工具和智能体。

智能体 Google 产品更新多模态

关联讨论 7 条

00:07

Google Developers Blog（RSS）

同事件精选78

Gemma 4 12B：开发者指南

Gemma 4 12B 是一款密集多模态模型，专为消费级设备上的高性能本地 AI 执行而设计。其采用新颖的无编码器架构，绕过传统视觉和音频编码器，将多模态数据直接输入大语言模型主干。

Google 多模态模型发布端侧

同一事件，精选展示《通过 Gemma 4 将 AI 推向边缘和设备端》

推荐理由：Google 把多模态模型直接塞进消费级设备，靠的不再是缩水而是架构层面的创新。12B 放在本地跑，这次玩法变了。

6月3日

21:34

Google Blog：AI（RSS）

Google Search 提升二手和复古购物体验的5种方式

Google Search 和 Google Shopping 中的 AI 工具帮助用户在二手和复古购物中发现好物。

Google 多模态搜索教程/实践

6月2日

01:26

Google Blog：AI（RSS）

谷歌员工如何使用 Gemini 制作 Google I/O 2026

本文介绍了谷歌员工使用 Gemini 模型来制作 2026 年的 Google I/O 开发者大会。

Google 图像生成多模态教程/实践

5月30日

03:08

Google Blog：AI（RSS）

精选55

参与我们的 I/O 2026 测验：该测验由 Google AI Studio 氛围编程生成

Google 使用其开发工具 Google AI Studio，通过氛围编程（vibe coding）方式，创建了一个关于 Google I/O 2026 主要公告的在线测验。

Google 教程/实践

推荐理由：Google 用 AI Studio 自己 vibe code 了个 I/O 测验，是想展示普通人也玩得转，但 quiz 本身信息量不大，想体验 vibe coding 的可以顺手玩玩。

01:38

Google Blog：AI（RSS）

同事件精选74

Gemini Omni 与 Gemini 3.5 的 11 个实战展示

Google 在 2026 年 Google I/O 大会上发布了新一代多模态模型 Gemini Omni 与 Gemini 3.5，并同步提供了 11 个视频，集中演示了这两款模型在实际场景中的能力。

Google 多模态模型发布视频

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Google 官方放出的这组视频演示，直接展示了 Gemini Omni 和 3.5 的实际表现，比参数和 benchmark 更直观，做多模态应用的可以逐帧研究。

5月29日

20:08

Google Blog：AI（RSS）

滑铁卢大学未来实验室展示AI原型

滑铁卢大学未来实验室的学生开发了用于重塑教育和工作未来的AI原型，其中包括手语辅导工具。

Google 行业动态

05:12

Google Research：Blog（网页）

精选79

创新时代：Google Research 在 I/O 2026

Google Research 在 I/O 2026 大会上展示了其在多个前沿领域的技术进展，包括应用AI、基础机器学习算法以及量子AI等。本次大会的核心主题是展示其在将科学发现与研究成果转化为现实世界影响方面的持续努力。

智能体 Google 推理论文/研究

推荐理由：Google 把研究成果直接发 Nature，ERA 和 Co-Scientist 这套工具让 AI 从写诗进化到做实验，健康 AI 的临床验证数据也很扎实，搞科研的可以蹲一下访问资格。

02:41

Google Developers Blog（RSS）

精选73

使用 Google Pay & Wallet Developer MCP server 加速你的集成工作流

Google 推出 Google Pay & Wallet Developer MCP server，这是一款开放标准工具，旨在将 AI 开发助手和 IDE 安全连接到实时的 API 与账户上下文。开发者无需离开开发环境，即可搜索官方文档、验证 Wallet pass 定义、检查集成状态以及管理商户账户。该集成旨在通过减少上下文切换并提供实时、可靠的 AI 支持来减少开发摩擦，从而加速开发工作流。

Google MCP/工具产品更新

推荐理由：这是 Google 为支付场景做的 MCP 服务器，把文档和账户操作直接塞进 IDE，减少上下文切换，做 Google Pay 集成的开发者可以试试看。

00:06

Google Blog：AI（RSS）

Google I/O 2026 一文速览：12 大重要时刻

Google I/O 2026 发布会上披露了 12 个重要时刻，其中包括 Gemini Omni 和 Gemini 3.5 Flash 等产品的相关消息。

Google 产品更新多模态推理

5月28日

23:41

Google Developers Blog（RSS）

精选64

社区如何利用Tunix和TPU训练Gemma学会"思考"

Google在Kaggle举办的Tunix黑客马拉松，挑战开发者利用TPU和有限算力，将小型基础模型转变为通用推理引擎。获胜团队通过多阶段后训练流程实现了这一目标，该流程结合了监督微调（SFT）与GRPO、SimPO等先进对齐技术。比赛结果表明，社区能够借助开源资源成功训练出高能力的结构化推理模型。

Google 开源生态教程/实践数据/训练

推荐理由：Google 官方比赛总结，证明用 Kaggle TPU 和开源工具就能把 Gemma 训练出不错推理能力，对想自己微调模型的小团队是个实用参考。

01:39

Google Developers Blog（RSS）

精选66

Google Pay 最新更新

Google Pay 正向"智能体商务"演进，推出了通用商务协议和新的 MCP 服务器，允许 AI 智能体管理集成与分析趋势。Android 平台更新引入了动态回调以支持快速结账，并通过 WebView 将支付功能扩展至社交媒体应用。此外，平台还推出了跨设备生物认证和新的交易信号，旨在帮助商家减少流程摩擦。

智能体 Google MCP/工具产品更新

推荐理由：Google Pay 往 agentic commerce 迈了一大步，新的通用协议和 MCP server 让 AI agent 能直接管支付和分析，做 agent 或支付的开发者都得看看。

01:34

Google Research：Blog（网页）

精选70

通过零信任聚合实现的隐私分析

Google Research 推出了一种新的隐私分析解决方案。该方案结合了一种新的密码学安全聚合协议与可信执行环境（TEE）的透明性，旨在实现前沿的隐私与安全保证。其核心是基于零信任原则，通过密码学与硬件保护的结合，确保系统仅能获取群体的匿名化聚合洞察。

Google 安全/对齐端侧论文/研究

推荐理由：Google 的隐私聚合新方案把多轮交互砍成一次提交，对做设备端联邦分析的人来说是工程上的一大步，而且结合 TEE 做双层防护，这个思路值得抄。

5月26日

23:49

Nathan Lambert：Interconnects（RSS）

精选67

未来展望：2026年5月的一些想法

文章展望了截至2026年5月AI领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡（open-closed balance）的讨论、美国开源力量的显著增长（America's open-source surge），以及由此引发的新兴权力博弈（emerging power struggles）。

Anthropic Google 大佬观点开源生态

推荐理由：Nathan Lambert 对开源模型追赶闭源的周期判断、Gemini 在编码代理领域的缺位分析，以及美国开源模型崛起的观察，为理解当前鼎立格局提供了扎实的坐标，值得从业者细读。

5月23日

02:18

Google Blog：AI（RSS）

同事件精选56

回顾Google I/O 2026对话环节

在2026年Google I/O开发者大会上，对话环节聚焦于未来科技趋势。行业领导者围绕人工智能、量子计算、机器人学以及创造力等核心议题展开了深入探讨，旨在勾勒这些前沿领域的技术演进路径与发展蓝图。

Google 行业动态

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Google I/O 对话环节的官方摘要，话题覆盖 AI、量子与机器人，但短短几句话没有实质内容，当成新闻简报可以一瞥，不值得细看。

5月22日

00:33

Google Developers Blog（RSS）

同事件精选63

发布 Kotlin版ADK与Android版ADK 0.1.0：在Android及其他平台构建AI Agent

Google发布了面向开发者的新工具包：Kotlin版ADK与Android版ADK 0.1.0。这两个工具包旨在帮助开发者构建AI Agent。其中，Kotlin版ADK将代理工作流引入后端项目开发；Android版ADK则专注于移动端应用，提供了构建AI代理所需的特定功能。此次发布为开发者提供了在Android生态及更广泛平台创建AI应用的官方工具基础。

智能体 Google 产品更新端侧

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Google 首次为 Android 推出端侧多 agent 开发框架，虽然还只是 0.1 版，但端云混合编排的思路已清晰，移动开发者可以提前踩坑了，这是端侧 AI 应用爆发前的一个信号。

00:33

Google Developers Blog（RSS）

精选75

推出 Gemini for Home 赋能服务提供商与硬件合作伙伴

Google 通过推出全栈 Gemini AI 解决方案扩展其智能家居生态系统。该方案集成了先进的摄像头智能、自然语言查询功能和日常活动摘要能力。它为服务提供商和硬件制造商提供了现成的参考设计与API，使其无需大量研发投入即可构建主动式、品牌化的智能家居服务。该计划旨在超越基础设备控制，迈向能够理解情境并实时响应用户需求的AI原生智能家居。

Google 产品更新多模态端侧

推荐理由：Google 把 Gemini 塞进智能家居，直接给硬件商和 ISP 提供交钥匙方案，这一步可能比 Nest 当年更有侵略性，做智能家居的得留意了。

5月21日

06:27

Tomer Tunguz 博客（VC 分析）

精选67

不可持续的补贴

三大AI厂商定价策略出现显著分化：Google的AI价格年增两倍，但其旗舰模型Gemini 3.1 Pro（输入2美元、输出12美元）仍是市场最低价；OpenAI的GPT-5.5（5美元/30美元）经历短期补贴后再次涨价；Anthropic的Claude Opus 4.7（5美元/25美元）价格保持稳定，且对最强模型有所下调。这些变动标志着行业正从不惜成本的市场份额争夺，转向注重利润与现金流管理的商业理性，以应对持续高昂的资本支出压力。

Anthropic Google OpenAI 大佬观点

推荐理由：Tunguz 把三家模型厂的定价画成曲线，涨价的真相一目了然——烧钱抢份额的阶段结束了，做 AI 产品的都该重新算算成本模型。

03:50

Google Blog：AI（RSS）

同事件精选68

我们在 I/O 2026 发布的 100 件事

在 Google I/O 2026 开发者大会上，公司共发布了 100 项内容，重点介绍了 Gemini Omni、Google Antigravity 和 Universal Cart 等新产品的核心亮点。

Google 产品更新多模态

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：I/O 今年还是全场景轰炸，Gemini Omni 加一堆新产品，花十分钟扫一眼，未来半年 AI 要替你做哪块活就清楚了。

01:19

Google Blog：AI（RSS）

新实验让Google Beam的团队会议体验更佳

Google推出一项针对混合办公场景的新实验功能。该功能通过改进视觉与音频技术，在Google Beam平台上实现参会者真实尺寸与声音的还原，显著提升了远程协作的沉浸感与包容性，旨在解决混合会议中常见的疏离问题。

Google 产品更新

5月20日

05:25

Google Developers Blog（RSS）

Google I/O 2026：从辅助工具到独立智能体的战略转型

在2026年开发者大会上，Google宣布其AI战略核心从辅助工具转向开发独立智能体。大会重点发布了Gemini 3.5系列模型，并对“反重力”智能体优先平台进行了重大更新。面向移动开发者，推出了Android CLI工具、评估排行榜及能将多种框架代码快速迁移至原生Kotlin的智能体。Web开发领域也迎来变革，包括专为智能体设计的Chrome DevTools、HTML-in-Canvas API，以及旨在让浏览器内AI智能体执行复杂任务的开放标准WebMCP提案。

智能体 Google 模型发布编码

05:25

Google Developers Blog（RSS）

精选57

创新一周年：庆祝Google Cloud x NVIDIA开发者社区达到10万会员

Google Cloud与NVIDIA开发者社区迎来成立一周年，会员规模突破10万。社区为开发者提供先进AI基础设施与资源支持，包括LLM优化、GPU加速数据分析等专项学习路径及专家网络研讨会。第二年计划将进一步扩展，推出实践实验室、工程活动及聚焦代理式AI增长的专项内容。

智能体 Google 行业动态

推荐理由：Google Cloud 和 NVIDIA 的开发者社区一年攒了 10 万人，不算大新闻，但官方放出的 agentic AI 课程和动手实验室对做 Agent 的工程师挺实在，可以关注一下。

04:25

Google Developers Blog（RSS）

使用LiteRT-LM在设备上实现闪电般的快速生成式AI

Google AI Edge推出LiteRT-LM引擎，为跨平台移动和边缘设备提供高度优化的基础设施，支持Gemma 4模型在设备端运行。通过内存高效动态加载和多令牌预测技术，实现高达2.2倍的速度提升，并集成思维模式、约束解码等高级工具。同时，该引擎正扩展至Apple生态，新增原生Swift API和WebGPU加速的JavaScript API，支持高性能浏览器端推理。

Google 产品更新多模态端侧

04:25

Google Developers Blog（RSS）

精选65

更智能的 Google AI Edge Gallery：MCP 集成、通知和会话连续性

Google AI Edge Gallery 应用在安卓平台上扩展了设备端 AI 能力，通过引入对开源模型上下文协议（MCP）的实验性支持，使得 Gemma 4 模型能够协调处理跨 Google Workspace 和 Google Maps 等外部数据源的复杂任务。此次更新添加了“定时通知”技能，用于实现日常事务的自动化管理，并新增了持久化聊天记录功能，允许用户近乎即时地恢复长会话上下文。该平台依托开源工具包，积极鼓励社区开发者通过其 GitHub 仓库构建并分享专注实用的工作流、提示配置与工具集成。

Google MCP/工具产品更新端侧

推荐理由：MCP 终于跑在 Android 设备上了，虽然是实验性支持，但 Gemma 4 能直连 Workspace 和 Maps，做自动化的开发者可以上手试试。

03:25

Google Developers Blog（RSS）

精选69

Google Tensor ML SDK 测试版发布

Google Tensor ML SDK 进入测试版，支持开发者直接在 Pixel 10 设备的 TPU 上构建和部署高性能机器学习模型。该 SDK 集成边缘部署框架 LiteRT，提供统一工作流，可高效转换、编译并运行 PyTorch 或 TFLite 模型，并具备稳定回退机制。此外，新推出的模型库包含超过 100 个经典及生成式 AI 模型（如 Gemma 3），支持低延迟、注重隐私的语音识别、计算机视觉与文本生成等功能。

Google 产品更新端侧

推荐理由：Google 把 TPU 塞进了 Pixel 10，现在开发者能直接在手机上跑 Gemma 3 了，这是移动端 AI 从「能用」到「好用」的关键一步，做 app 的值得关注。

02:25

Google Developers Blog（RSS）

精选58

重要更新：Gemini CLI将迁移至Antigravity CLI

Google正在整合其AI终端工具，将面向社区的Gemini CLI迁移至全新平台Antigravity CLI。这款新工具采用Go语言开发，作为代理优先的平台，支持复杂的多代理工作流，并提供更快的执行速度、异步处理能力以及与Antigravity 2.0桌面应用同步的统一架构。企业客户可维持现有访问权限，但个人及免费用户必须在2026年6月18日Gemini CLI停止服务前，完成向新平台的迁移。

智能体 Google 产品更新

推荐理由：Google 终端工具从 Gemini CLI 全面转向 Antigravity CLI，强调 agent 优先和多 agent 工作流，6 月 18 日后 Gemini CLI 停服，个人用户得赶紧迁移。

02:18

Google Blog：AI（RSS）

精选74

Google AI 订阅服务全新内容，源自 I/O 2026 大会

Google 在 I/O 2026 大会上宣布更新其 AI 订阅服务，推出了全新的 100 美元“AI Ultra”计划。同时，面向 Google AI Plus、Pro 和 Ultra 三个层级的现有订阅者，服务均增加了新的功能和权益。此次更新标志着 Google 在 AI 付费订阅领域推出了更高端的选项并强化了现有套餐的价值。

Google 产品更新

推荐理由：Google 在 I/O 上推出 $100 的 AI Ultra 计划，这是大厂把 AI 订阅当成‘基础套餐’来卖的信号，虽然细节还不算多，但想知道 Google AI 付费版最新整合的可以进去看一眼。

02:18

Google Blog：AI（RSS）

精选70

AI搜索的新时代

谷歌宣布了其搜索引擎与AI技术融合的最新进展，标志着AI搜索进入新阶段。此次更新旨在将搜索引擎的广度与AI的深度理解能力相结合，目标是提供更智能、更直观的搜索体验，推动搜索技术的下一代演进。

Google 产品更新搜索

推荐理由：Google搜索宣称开启AI新纪元，但这次官宣只放了张图没给干货，搜索入口的任何变动都牵动流量，值得跟踪但别急着判断。

02:18

Google Blog：AI（RSS）

精选83

Gemini 3.5：前沿智能与行动能力相结合

Google 在 I/O 大会上正式发布了最新的 Gemini 3.5 模型系列。该系列模型将前沿的人工智能能力与执行操作的功能相结合，旨在提供更强的综合性能。作为 Google 最新推出的模型，它代表了其在大模型技术上的最新进展。

智能体 Google 多模态推理

推荐理由：Google 在 I/O 上甩出 Gemini 3.5，这次不只拼多模态，更强调‘行动’，是所有做 Agent 的团队必须对标的新基座。

02:18

Google Blog：AI（RSS）

精选89

I/O 2026：欢迎来到自主的 Gemini 时代

Google 在 I/O 2026 大会上宣布 Gemini 进入自主代理时代，新功能使其能够自动执行复杂任务，显著提升用户工作效率。大会展示了 Gemini 如何通过代理操作简化工作流程，实现自动化处理，例如自动管理邮件、安排日程或生成报告，帮助用户从重复性工作中解放出来，专注于创造性任务。这一更新基于先进机器学习模型，强调准确性与效率，标志着 AI 助手向更智能、更自主的方向发展。

智能体 Google 模型发布

推荐理由：谷歌 I/O 大会上 Sundar Pichai 亲自宣布 agentic Gemini 时代到来，这是把 Gemini 从对话助手升级成真正能自主执行任务的 agent，所有做 AI 应用的接下来都得重新看一遍技术选型。

02:18

Google Blog：AI（RSS）

精选75

Google Workspace 推出全新创建方式与高效工作功能

Google 在最新更新中为 Gmail、Docs 和 Keep 增添了新的语音功能，并推出了一款名为 Google Pics 的全新设计工具。同时，其 AI Inbox 功能也得到了升级与优化。这些更新旨在进一步提升用户在工作场景中的协作效率与创作体验，通过集成更智能的工具和交互方式，帮助用户更便捷地完成多项任务。

Google 产品更新多模态语音

推荐理由：Google Workspace 直接植入了语音操作和设计工具 Pics，这波更新对办公效率很实在，做产品和运营的可以关注一下实际落地效果。

02:18

Google Blog：AI（RSS）

精选71

AI Mode 如何改变美国人的搜索方式

AI Mode 上线一周年，美国用户搜索行为呈现关键转变。数据显示，用户正从传统的关键词输入模式逐渐转向自然语言查询，这一变化反映了AI搜索技术的普及和用户交互方式的优化。自然语言查询的使用率显著提升，体现了AI搜索在日常信息获取中的影响力增强，预示着未来搜索体验的革新方向。

Google 搜索现象/趋势

推荐理由：AI Mode 上线一周年，Google 第一次拿出用户行为数据，从关键词到自然语言的转向比想象中快，做搜索和 SEO 的可以重新理解用户意图了。

02:06

Google Research：Blog（网页）

精选65

经验研究助手（ERA）：从Nature发表到催化计算发现

Google Research开发的经验研究助手（ERA）现已在《Nature》期刊发表论文。这是一款基于Gemini的AI工具，旨在协助科学家编写专业级经验科学代码，其核心能力包括搜索文献、生成代码、探索方案并迭代优化，以加速耗时的计算实验过程。该工具已被用于构建“计算发现”原型，并已通过Google Labs的“可信赖测试者计划”向更广泛的科学家群体开放初步试用。

Google 产品更新编码

推荐理由：谷歌把AI科学编码工具ERA发到了Nature，顺便在Google Labs推出了计算发现实验版，流行病预测和碳追踪的案例很扎实，科研圈的开发者和产品人可以关注下实际进展。

02:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

推进内容溯源，构建更安全、更透明的AI生态系统

OpenAI推出了新的AI内容溯源体系，旨在提升AI生成媒体的可信度。该体系集成了Content Credentials和SynthID两种技术标准，并配套推出了一个验证工具。此举的核心目标是帮助公众有效识别AI生成的内容，从而建立对AI媒体的信任，最终推动一个更安全、更透明的AI生态发展。

Google OpenAI 产品更新安全/对齐

01:48

Google Blog：AI（RSS）

精选81

Google I/O 2026

在Google I/O 2026大会上，Google宣布了多项旨在让AI更普惠、更实用的更新。这些发布聚焦于提升人工智能的辅助能力，使其能够服务更广泛的用户群体。大会涵盖了AI在开发者工具、用户应用以及日常生活场景中的具体改进，强调通过技术优化实现更自然、更便捷的人机交互体验。

Google 行业动态

推荐理由：Google I/O 2026 官方合集，一页看完今年谷歌所有的 AI 动作，从模型到产品都在这，嫌消息碎的收藏这篇就够了。

01:48

Google DeepMind：Blog（RSS）

精选81

介绍 Google Antigravity 2.0

Google Antigravity 2.0 是一款全新独立桌面应用，支持 macOS、Linux 和 Windows，无 IDE 绑定，由最新 Gemini 模型驱动，面向企业。核心为智能体，支持同步与异步交互。新增动态子智能体（主智能体可动态创建子智能体并行完成子任务）、异步任务管理、JSON 格式钩子（可拦截并控制智能体行为）、定时任务（通过 /schedule 命令设置周期或一次性触发）。引入“项目”概念替代“工作区”，可跨多个文件夹并独立设置权限与规则。新增斜杠命令：/goal 自动执行至完成、/grill-me 实施前反向确认、/browser 显式控制浏览器。语音输入改为实时转录。

智能体 Google 产品更新

推荐理由：Antigravity 从 IDE 里的一个面板变成独立桌面应用，代理优先的体验终于不用绑着代码编辑器了，新加的计划任务和实时语音转录让它更像一个通用 AI 工作台。

01:48

Google DeepMind：Blog（RSS）

同事件精选83

推出Gemini Omni多模态AI模型

谷歌推出原生多模态AI模型Gemini Omni，能够整合视频、图像、音频和文本等多种输入，生成高质量视频内容。其核心能力是通过自然语言对话进行视频编辑，并能保持角色一致性、物理规律与场景连贯性。首个模型Gemini Omni Flash已上线，未来将支持图像和音频输出。Gemini Omni结合了对物理世界的直觉理解与丰富的知识库，支持从写实到叙事的创意生成，并可通过多轮对话持续编辑视频，而不丢失原始场景上下文。

DeepMind Google 多模态模型发布

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Gemini Omni 把视频生成从画面堆砌推到了物理世界叙事，多轮自然语言编辑和世界知识融合是真正的代际升级，做视频内容的该重新理解工具的定义了。