Gemini Intelligence 登陆 Android Google 不再把 Android 仅描述为承载 App 的平台，而是定位为主动型 AI 系统：自动化任务、智能浏览、智能填表、口语成稿、生成式 widget。设备会"先你一步"完成事务，而非被动等待指令。 https://blog.google/products-and-platforms/platforms/android/gemini-intelligence/ 新能力以软硬件深度绑定的方式发布： · 首发设备：今年夏季登陆最新 Samsung Galaxy 与 Google Pixel 手机。 · 后续扩展：年内陆续覆盖 Wear OS 手表、Android Auto、智能眼镜、笔记本。 # 五大核心能力 1. 跨 App 多步任务自动化（App Automation） · 已在 Galaxy S26 与 Pixel 10 上对外卖、打车类 App 做了数月调优。 · 典型场景：抢动感单车前排座位；从 Gmail 找出课程大纲后自动把教材加入购物车。 · 视觉上下文加成：长按电源键即可让 Gemini 读取屏幕内容（例如把笔记里的购物清单一键变成下单），或拍下酒店宣传册说"在 Expedia 找 6 人团类似行程"。 · 控制权设计：仅在用户指令下执行，任务完成即停止，最终下单需用户确认。 2. Chrome 内的 Gemini（6 月下旬上线） · 浏览器助手负责研究、摘要、跨页对比。 · Chrome auto browse 可代办预约、车位预订等流程化操作。 3. 升级版 Autofill（Personal Intelligence 驱动） · 自动填写从"基础便利"升级为"理解上下文"——可跨应用调用相关信息填表，覆盖 Chrome。 · 严格 opt-in：用户主动连接 Gemini，设置中随时可断开。 4. Rambler——语音转"成稿" · 解决 Gboard 语音输入的痛点：口语中的"嗯/啊/重复"。 · 用 Gemini 抓取重点，整理为简洁书面表达。 · 多语种混说：支持单条消息内英语+印地语等混合切换，理解语境。 · 隐私：开启时有明确指示，音频仅实时转写、不存储。 5. Create My Widget——生成式 UI 第一步 · 用自然语言描述即可生成自定义 widget，并可在主屏调整尺寸。 · 例：每周自动生成 3 道高蛋白备餐食谱的 dashboard；只显示风速和降雨的天气卡。 · 同步覆盖 Wear OS 手表。

译Google将Android重新定位为主动型AI系统，推出Gemini Intelligence。其核心在于深度软硬件结合，首发于三星Galaxy和Google Pixel手机，后续将扩展至手表、汽车等设备。五大核心能力包括：跨应用多步骤任务自动化、Chrome浏览器内的智能研究与代办、基于上下文理解的智能填表、将口语实时整理成书面稿的“Rambler”功能，以及用自然语言生成自定义主屏幕Widget。这些功能均在用户指令下执行，并注重隐私与控制权。

meng shao@shao__meng · 5月13日71

Google 正式发布 Googlebook，第一款专门为 Gemini Intelligence 设计的笔记本，还有朋友记得很多年前的 Chromebook 吗 😂 Googlebook 融合了 Android（Google Play 应用生态 + 面向 AI 设计的现代 OS）与 ChromeOS（Chrome 浏览器）。15 年前 Chromebook 是为"云优先"时代而生；Googlebook 则是为"AI 优先"时代而生。 https://blog.google/products-and-platforms/platforms/android/meet-googlebook # 三大产品支柱 1. Magic Pointer（与 Google DeepMind 合作）把"光标"——电脑上使用频率最高、却几十年未变（上次大变化是加入右键）的交互元素——重新设计为 AI 入口。 · 抖动光标即可唤出 Gemini 的上下文建议 · 指向邮件中的日期 → 直接创建会议 · 选中"客厅照片 + 新沙发图" → 立刻合成可视化效果这是把 AI 从"独立聊天框"下沉到系统级指针交互，降低使用门槛。 2. Create Your Widget 通过自然语言提示生成自定义小组件，Gemini 可接入 Gmail、Calendar 等 Google 应用并联网，把一类任务（如"柏林家庭聚会"的航班、酒店、餐厅、倒计时）聚合成单一仪表盘。将"桌面"从静态图标列表升级为任务驱动的动态信息中枢。 3. Android 生态深度互通 · 手机 App 直接在笔记本上调用（如下单外卖、完成 Duolingo 课程） · Quick Access：在文件浏览器中直接查看、搜索、插入手机文件，无需传输对标 Apple 的 Continuity 生态，弥补 Google 多年以来手机与笔电协同的短板。

译Google 正式推出首款为 Gemini Intelligence 设计的笔记本 Googlebook，标志着从“云优先”的 Chromebook 时代进入“AI 优先”新阶段。其核心创新包括：Magic Pointer 将系统光标变为 AI 交互入口，可直接触发上下文建议与任务；Create Your Widget 允许通过自然语言生成聚合多源信息的动态桌面小组件；深度整合 Android 生态，实现手机 App 无缝调用与文件跨设备快速访问。该产品以 Gemini 为核心，旨在将 AI 能力下沉至系统级交互，降低使用门槛，并强化跨设备协同体验。

小互@xiaohu · 5月13日59

Google发布 Gemini Intelligence 把 Gemini 从“聊天机器人”，彻底升级成 Android 的“系统级大脑” 它更像 Google 对下一代 Android 的总架构定义：过去 Android 是：“App + 系统” 现在开始变成：“AI 理解层 + 系统 + App” Gemini 开始主动理解： • 你正在做什么 • 你可能想做什么 • 哪些 App 可以协同 • 下一步应该自动完成什么 Google 官方甚至直接用了：“proactive AI features”。也就是：主动式 AI。以前的手机逻辑，本质上还是“人操作 App”。你需要自己打开软件、复制信息、切换页面、一步一步完成任务。现在 Google 想做的，是让 AI 直接理解你正在做什么，然后替你跨 App 执行。

译Google将Gemini从聊天机器人升级为Android的“系统级大脑”，重新定义了下一代Android的架构。新架构从过去的“App + 系统”转变为“AI理解层 + 系统 + App”。Gemini作为主动式AI，能主动理解用户当前行为、潜在意图、可协同的App，并自动执行下一步任务。其核心目标是改变“人操作App”的传统手机逻辑，让AI直接理解用户意图并实现跨App的自动执行。

小互@xiaohu · 5月13日60

Google 刚刚发布了一个新东西：Googlebook 根据Google 自己的表述：他们想做的已经不再是传统意义上的“操作系统”，而是一个以 Gemini 为核心的 AI Laptop 平台。 Gemini 被塞进了“鼠标指针”：你晃一下光标，它会主动理解你当前屏幕内容，然后直接给动作建议。比如： • 指向邮件里的日期 → 自动创建会议 • 选两张图 → 自动生成搭配效果 • 指向内容 → 自动总结 / 改写 / 操作这其实已经不是传统 OS 思维了。以前电脑逻辑：人打开 App → 人操作功能。现在开始变成： AI 理解上下文 → AI 主动组织操作。

译Google推出新平台Googlebook，这是一个以Gemini AI为核心的笔记本电脑系统，旨在超越传统操作系统概念。Gemini被集成到鼠标指针中，能主动理解用户当前屏幕内容，并提供智能动作建议，如自动创建会议、生成图像搭配效果或总结改写内容。这标志着电脑操作逻辑的根本转变：从用户手动打开应用执行功能，变为AI基于上下文主动组织并执行操作，体现了向AI驱动平台的演进。

Berryxia.AI@berryxia · 5月13日65

刚看到 Google 今天官宣了 Gemini Intelligence，感觉这波是把 Gemini 的能力真正塞进高端 Android 设备里了。以前 Gemini 更多是聊天工具，现在他们直接把它和顶级硬件、系统软件结合在一起，让手机能主动帮你把一天的事情往前推一步，而不是等你开口才动。具体来说，以后你能让它跨 App 自动完成多步操作，比如它自己去 Gmail 里找到课程大纲，然后直接把需要的书加进购物车。或者一键帮你填完各种表单。说话的时候带点“嗯”“啊”，它能直接转成流畅的文字。还能自己建自定义小部件，把你最关心的信息一直放在首页最显眼的位置。这些功能会从今年夏天开始分批上线，先在三星 Galaxy 和 Google Pixel 这些高端机上落地，后面应该会慢慢覆盖更多设备。 Google 专门发了个博客详细介绍，想看的同学可以直接点进去看。

译Google推出Gemini Intelligence，将Gemini AI能力深度整合到高端Android设备，使其从聊天工具转变为主动助手。它整合高端硬件和创新软件，帮助用户提前一步、主动完成任务，例如跨App自动操作、表单填写、语音转流畅文字和创建自定义小部件。功能将从今年夏天开始分批上线，首批在三星Galaxy和Google Pixel设备落地，后续逐步覆盖更多Android设备。

Demis Hassabis@demishassabis · 5月13日81

Really cool work from the team reimagining the mouse pointer to be intelligent! Try the prototype in @GoogleAIStudio it's pretty magical.

译团队正在用AI重新构想鼠标指针，成果非常酷！在@GoogleAIStudio尝试原型版本，体验相当神奇。 [引用 @GoogleDeepMind]：我们正用AI重新构想这个存在50年的界面——鼠标指针。🖱️ 这些实验演示展示了人们如何通过动作、语音和自然简写，在屏幕上直观操控Gemini完成任务🧵

Chubby♨️@kimmonismus · 5月13日64

Gemini Intelligence turns Android into a more proactive AI system that can automate multi-step tasks across apps, browse and autofill. Two things are noteworthy here: 1) They're using the time to deeply integrate Gemini into the OS before Apple releases its revamped Siri (which uses Gemini). 2) They're releasing it *before* Google I/O, which suggests they'll be releasing something much bigger next week.

译Gemini智能将Android系统升级为能自动化执行跨应用多步骤任务的主动式AI。其发布策略有两点关键：一是抢在苹果搭载Gemini的新版Siri发布之前，深度整合AI至操作系统层；二是选择在Google I/O大会前公布，暗示下周大会可能有更重要的产品更新。该功能将分阶段推出，今年夏季率先登陆最新款三星Galaxy和Google Pixel手机，并于年底前扩展至手表、汽车、眼镜和笔记本电脑等其他Android设备。

Sundar Pichai@sundarpichai · 5月13日73

Today at the @Android Show (I/O edition) we announced Gemini Intelligence - bringing the best of Gemini to our most advanced devices. Automate multi-step tasks across apps and Chrome, fill out forms in a single tap, turn spoken thoughts into polished text with Rambler, build custom widgets & loads more.

译今天在@Android Show（I/O特别版）上，我们发布了Gemini智能——将Gemini的最佳功能引入我们最先进的设备。跨应用和Chrome自动化多步骤任务，一键填写表单，通过Rambler将口语想法转化为精炼文本，构建自定义小部件及更多功能。

🚨 AI News | TestingCatalog@testingcatalog · 5月13日70

GOOGLE 🔥: A new Android Intelligence has been introduced during Android Show 2026! - A whole new sleek design! - Automated multi-step tasks across Android apps - Gemini in Chrome gets Browser Use - Automated form filling - "Rambler" to turn voice notes into text - Custom Gen UI Widgets I need a Pixel now 👀

译GOOGLE 🔥: 在Android Show 2026上推出了全新的Android Intelligence！ - 全新的时尚设计！ - 跨安卓应用的自动化多步骤任务 - Chrome中的Gemini获得浏览器使用功能 - 自动表单填写 - "Rambler"可将语音笔记转为文本 - 自定义Gen UI小组件我现在就需要一台Pixel 👀

Google DeepMind@GoogleDeepMind · 5月13日52

We’re reimagining a 50-year-old interface - the mouse pointer - with AI. 🖱️ These experimental demos show how people can intuitively direct Gemini on their screens using motion, speech, and natural shorthand to get things done 🧵

译我们正用AI重新构想一个存在50年的界面——鼠标指针。🖱️ 这些实验演示展示了人们如何通过动作、语音和自然简写直观地指挥屏幕上的Gemini完成任务 🧵

🚨 AI News | TestingCatalog@testingcatalog · 5月12日45

GOOGLE 🔥: A new Gemini Omni banner has been added to the web build recently. > Gemini Omni will be an Agent that can combine text, images, and videos. > Users will be able to add themselves to different scenes. As we know, AI Avatars (Likeness) are coming to Gemini as well, and Gemini Omni will likely be connected to that. > "Likeness" feature will likely be highly coupled to mobile apps (as it used to work on Sora). What's the chance we will get it today during the Android show? h/t @Thomas16937378

译谷歌在网页版中新增了Gemini Omni横幅，预示其将成为一个能整合文本、图像和视频的多模态AI代理。关键功能是允许用户将自身形象添加到不同场景中，这与即将登陆Gemini的AI数字形象功能高度关联。该“Likeness”功能很可能深度集成于移动应用，其运作方式曾应用于Sora。外界猜测它可能在今日的Android活动中亮相。

🚨 AI News | TestingCatalog@testingcatalog · 5月12日42

Google will enable source selection for every artifact on NotebookLM soon. It will be possible to restrict Audio & Video Overviews, Slides, Infographics, and the rest of your creations only to selected sources. Power user feature 👀 * Not available yet

译Google即将为NotebookLM的每个生成内容启用来源选择功能。用户将能够将音频视频概述、幻灯片、信息图及其他创作内容限定在选定的来源范围内。高级用户功能👀 * 尚未开放

Berryxia.AI@berryxia · 5月12日53

大家说Google 最近疯狂降智的时候，是不是要有大的要来了。依稀的记得当时Gemini3.1 还没有来之前的鬼佬的疯狂吹捧，但是过了后，似乎都没有多少人真正使用。这一波我觉得时候也要搞点东西出来了吧~~~

译大家说Google 最近疯狂降智的时候，是不是要有大的要来了。依稀记得Gemini3.1 发布前海外疯狂吹捧，但过后似乎没多少人真正使用。这一波我觉得也该搞点东西出来了吧~~~ [引用 @testingcatalog]：Google keeps preparing its upcoming Gemini Omni models for the release. > Gemini Omni model will be available on APIs as well > The model will be considered as Agent, similarly to Deep Research on AI Studio Soon? 👀 P. S. Just a reminder that Nano Banana 1 wasn’t better than Imagen v4

歸藏(guizang.ai)@op7418 · 5月12日50

谷歌看起来要发布 Veo 4 了，也有可能是其他的名字。类似 Seedance 2.0 的全能参考，支持对视频进行：修改参考和内容替换质量上看起来，在文字生成上要比 Seedance 2.0 稍微好点，但在其他方面看不出更好的质量，可能在清晰度和细节上也会稍微好点。

译谷歌可能即将推出新一代视频生成模型，暂称Veo 4或类似名称。该模型被描述为类似Sora 2.0的全能参考模型，支持对现有视频进行修改参考和内容替换等操作。在文字生成质量上，它被认为比Sora 2.0略有优势，清晰度和细节可能也稍有提升。据透露，这款即将到来的Gemini Omni视频模型在视频编辑功能上将更为先进，能够完成去除水印、替换视频内物体等复杂任务。谷歌预计会发布该模型的两个版本，包括一个性能更强的Pro变体，而目前展示的样本可能并非Pro版本。

🚨 AI News | TestingCatalog@testingcatalog · 5月12日52

Google keeps preparing its upcoming Gemini Omni models for the release. > Gemini Omni model will be available on APIs as well > The model will be considered as Agent, similarly to Deep Research on AI Studio Soon? 👀 P. S. Just a reminder that Nano Banana 1 wasn’t better than Imagen v4

译谷歌持续为其即将推出的Gemini Omni模型做发布准备。 > Gemini Omni模型也将通过API提供 > 该模型将被视为智能体，类似于AI Studio上的深度研究功能快了吗？👀 附：提醒一下，Nano Banana 1并未优于Imagen v4

Google Gemini@GeminiApp · 5月12日63

Personal Intelligence can help you build a travel itinerary that’s fully custom to you. It saves time by connecting dots across your @Gmail, @GooglePhotos, @Google Search, and @YouTube history. Choose which apps to connect and manage your personalization settings at any time 🧵

译Personal Intelligence 可帮助您打造完全个性化的旅行行程。它通过关联您 @Gmail、@GooglePhotos、@Google 搜索和 @YouTube 历史记录中的信息点来节省时间。您可随时选择要连接的应用程序并管理个性化设置 🧵

Google AI Developers@googleaidevs · 5月12日60

Build production-ready solutions with @GoogleDeepMind’s Gemini for Developers course. Registration opens today for this specialization series from @coursera that teaches you how to: - Reason & Act: Build AI apps that don't just generate text, but reason through complex tasks - Connect & Automate: Use function calling to connect Gemini with real-world tools - Scale with Confidence: Build, test, and deploy scalable AI systems Start building with Gemini today ↓ https://www.coursera.org/specializations/gemini-for-developers?utm_source=tw&utm_medium=social&utm_campaign=launch_gemini_s12n_04292026

译谷歌DeepMind与Coursera合作推出的“Gemini for Developers”专项课程现已开放注册。该课程旨在指导开发者利用Gemini模型构建可用于生产环境的AI解决方案。其核心涵盖三大模块：“推理与行动”使AI应用能推理并执行复杂任务；“连接与自动化”通过函数调用将Gemini与现实世界工具集成；“规模化与信心”则专注于构建、测试和部署可扩展的AI系统。课程强调超越单纯文本生成，实现实际任务的自动化与系统集成，助力开发者快速上手。

🚨 AI News | TestingCatalog@testingcatalog · 5月11日55

GOOGLE 🔥: An upcoming Gemini Omni video model from Google is expected to be much more advanced in video editing, capable of completing tasks like removing watermarks, replacing objects in the video, and more. It is also likely that Google will release 2 versions of this model, including a Pro variant. And I assume what we see isn't Pro? Anime sample 👀

译谷歌即将推出的Gemini Omni视频模型在视频编辑方面预计将显著进步，能够完成去除水印、替换视频中物体等复杂任务。该模型可能发布两个版本，包括一个Pro变体。引用推文展示了该模型的实际编辑效果，对比了原始视频与编辑后的视频，并证实其在去除水印方面表现优异。

Chubby♨️@kimmonismus · 5月11日64

holy, google is cooking! New video model / gemini omni is crazy good and accurate. YouTube and TikTok will see a massive number of new AI-generated videos.

译天哪，谷歌正在放大招！新的视频模型/Gemini Omni 简直好得离谱且精准。 YouTube 和 TikTok 将涌现大量新的 AI 生成视频。

凡人小北@frxiaobei · 5月11日61

花了些时间研究 Google Health API，说几点感受。我前段时间基于 OpenClaw 搭了套主动式的个人健康管 Agent，目前数据源靠 Apple Health 打通，然后自己上传了一些体检、病历之类的材料，体验下来能用，但数据层面的可控性一般，需要花时间构建的也不少，并且生态也有点封闭。 Google 这个 API 的颗粒度和开放程度明显不在一个量级，31 个数据点、Webhook 推送、精细权限控制，这才是开发者应该有的样子。打算认真做一次融合：直接把它接进来当数据端，本地做一层轻备份，省掉不少造轮子的事儿。数据层的问题解决了，上面结合 Gemini 的能力，有意思的东西应该不少。这件事让我更坚定了一个判断，以后要刻意多买接入这套生态的海外健康终端。数据主权这件事，终端选择很重要。至于国内……开放性嘛，懂的都懂。

译作者在体验Apple Health后，认为其数据可控性与生态开放性不足。新推出的Google Health API提供了31种健康数据点、Webhook实时推送和精细权限控制，在数据颗粒度与开放程度上优势显著，为开发者构建健康AI Agent或自动化工作流奠定了强大基础。作者计划将其接入现有系统作为核心数据源，并强调未来将优先选择接入此生态的海外健康终端以掌握数据主权，同时暗示国内生态在开放性上存在差距。

Chubby♨️@kimmonismus · 5月11日40

New Google Omni-model incoming! Probably announce during i/o (see you guys next week in person :)) Probably an updated version of Veo 3.1 (maybe even the next iteration) h/t Zachary on reddit

译全新谷歌Omni模型即将到来！可能将在i/o大会上发布（下周现场见 :)) 可能是Veo 3.1的更新版本（甚至可能是下一代迭代）感谢reddit上的Zachary

🚨 AI News | TestingCatalog@testingcatalog · 5月11日61

GOOGLE I/O 🔥: New evidence of the upcoming Gemini Omni vide model has been spotted on the Gemini mobile app. A video sample below 👀 > "Meet our new video model. Remix your videos, edit directly in chat, try a template, and more." > Based on the description, we might be really talking about the true "Omni" model based on Gemini, rather than Veo. > It also seems to be quickly consuming usage limits, based on early tests. "Usage" is a new tab that will be available on both the web and mobile.

译在Google I/O期间，Gemini移动应用中发现了即将推出的Gemini Omni视频模型的新证据。该模型被描述为“我们的新视频模型”，功能包括混剪视频、在聊天中直接编辑以及使用模板等。分析指出，这可能是基于Gemini的真正“Omni”模型，而非Veo。早期测试显示，该模型会快速消耗使用额度，且网络和移动端应用都将新增一个“使用情况”标签页来追踪用量。

StepFun@StepFun_ai · 5月11日29

Google I/O week pulls the AI builder world into the Bay Area. We're powering SEAMATE x Linkloud's Front Row meetup on May 16, a builder-only room of ~500 founders & devs working on agents, multimodal, and AI-native infra. Our team is on the "Apps That Agents Actually Use" panel with Principle and Google. Plug and Play, Sunnyvale. May 16, 3pm. If you're in town, come say hi! http://luma.com/ai-native-developers-io-week?tk=fpHHGw

译谷歌I/O周将AI构建者聚集至湾区。我们为SEAMATE x Linkloud的Front Row聚会提供支持，这场仅限构建者参与的活动将于5月16日举行，约500名专注于智能体、多模态和AI原生基础设施的创始人及开发者将齐聚一堂。我们的团队将参与"智能体实际应用"专题讨论，与Principle和谷歌同台交流。地点：Plug and Play，桑尼维尔。5月16日下午3点。若您身在当地，欢迎前来交流！ http://luma.com/ai-native-developers-io-week?tk=fpHHGw

François Chollet@fchollet · 5月11日30

If you cannot express your idea in the language of mathematics or code, you do not understand your idea just yet. It is only an intuition.

译如果你无法用数学或代码的语言表达你的想法，说明你还未真正理解它。那仅仅是一种直觉。

阿绎 AYi@AYi_AInotes · 5月10日80

holy shit，The barrier to educational technology has vanished overnight. 这回教育科技的门槛，一夜之间归零了， why？来往下看，最后附上了任何人都可以做的零代码工作流教程 💻 • 2020年：做一个同等质量的3D教育App，需要3D建模师×2 + UI设计师×1 + 生物学家×1 + 前端工程师×3 + 产品经理×1，耗时6个月，成本80万美元。 • 2026年：一个懂生物的普通人，用GPT Images 2 + Gemini 3.1 Pro，48小时，成本不到10美元。没有团队，没有融资，没有技术门槛，你甚至都不需要会3D建模，不需要会写React，不需要懂Three.js。你只需要懂生物学，知道什么是对学生重要的。 AI会帮你把所有的技术活全部干完。 damn，这简直就是生产关系的效率革命，以前教育科技是大公司和亿万富翁的游戏。现在，任何一个老师，任何一个父母，任何一个对某个领域有热情的人，都能做出比教科书好100倍的教学工具。过去只有伊顿公学和哈佛附中才有虚拟实验室，现在，任何一个能上网的家庭，花10美元就能给自己的孩子做一个专属的。教育不平等，第一次有了被反向拉平的可能！可1:1复制的零代码工作流，任何人都能做，老规矩评论区自取👇

译AI工具GPT Images 2和Gemini 3.1 Pro的出现，彻底颠覆了教育应用的开发模式。过去需多人团队、数月时间和高昂成本才能完成的3D教育应用，如今一个具备领域知识（如生物学）的普通人，仅用约48小时和不到10美元即可实现。这消除了对编程、3D建模等技术能力的依赖，使教师、家长等个体也能独立创造高质量互动教学工具。此举有望推动过去仅属于精英机构的教学资源（如虚拟实验室）普及，为缩小教育不平等提供了新的技术路径。

小互@xiaohu · 5月10日58

兄弟们这个创意牛P啊 3D 趣味互动科学应用用GPT生成图像，然后使用Gemini 3.1 Pro生成，可以将任何知识的内容制作成3D可交互的效果展示！效果炸裂！

Berryxia.AI@berryxia · 5月10日72

Google 把 Fitbit Air 的全新 Google Health API 直接开放了！昨天 Fitbit Air 刚刚发布，但更重磅的是它自带了全新的 @googlehealth API，开发者现在可以直接在上面构建 AI Agent、MCP Server 或者 CLI，利用自己的睡眠、心率、运动等健康数据玩出花来。核心能力非常全面： - 31 种不同数据点，涵盖从运动、睡眠、心率到 SpO2 等全维度健康指标； - 支持 Webhooks 实时推送，当健康数据发生变化时立刻通知； - 读写权限精细控制，你只需要申请实际用到的权限即可； - 支持按时间范围查询、自动汇总每日数据、结果分页等灵活操作。作者自己是 Whoop 重度用户，但他也直言这波更新值得认真探索。完整入门 codelab 已经放出（包含第一步 API 调用教学）：https://developers.google.com/health/codelabs/make-your-first-api-call 对想做健康 Agent、个人数据工具、实时监控系统或者 MCP 相关项目的开发者来说，这等于把真实可穿戴设备的结构化健康数据彻底打开了，结合现在的 Agent 框架，能直接做出非常实用的个人健康自动化工作流。值得立刻去试试！

译Google 随新款 Fitbit Air 发布了全新的 Health API 并向开发者开放。该 API 提供了涵盖运动、睡眠、心率、血氧等维度的 31 种健康数据点，支持 Webhooks 实时数据推送、精细的读写权限控制以及按时间范围查询和汇总数据。开发者可利用该 API 基于个人真实健康数据构建 AI Agent、MCP Server、CLI 或实时监控系统等应用，从而创建实用的个人健康自动化工作流。官方已发布包含首次调用教学的入门指南。

Berryxia.AI@berryxia · 5月10日48

从此告别无聊的课堂教学！自己开发趣味互动科学应用创意～现在使用GPT-image-2 + Gemini 尝试生成3D生物结构，并开发了一款能交互探索这些结构的应用！

Chubby♨️@kimmonismus · 5月9日50

What is even more impressive is just how wide the gap between Claude Mythos and Gemini 3.1 Pro becomes when moving from a 50% success rate to an 80% success rate. Mythos doesn't just work "longer" - above all, it works significantly more accurately! That is the truly impressive part.

译更令人印象深刻的是，当成功率从50%提升到80%时，Claude Mythos与Gemini 3.1 Pro之间的差距会变得多么巨大。 Mythos不仅仅是"工作更持久"——最重要的是，它的工作准确率显著更高！这才是真正令人惊叹的部分。

🚨 AI News | TestingCatalog@testingcatalog · 5月9日40

Google is testing the option to mark Notebooks as "Donation Safe" as part of a Data Donation feature. > Your logs from using this notebook will NOT be scrubbed (this allows for quality improvement). > The notebook will immediately lose its Donation Safe status if shared. > Marking a notebook as Donation Safe allows you to Donate Detailed Feedback. > You must not donate NTK or Privileged data.

译Google正在测试将Notebook标记为"捐赠安全"的选项，作为数据捐赠功能的一部分。 > 使用此笔记本的日志将不会被清除（这有助于质量改进）。 > 若共享笔记本，其捐赠安全状态将立即失效。 > 将笔记本标记为捐赠安全可让您捐赠详细反馈。 > 请勿捐赠NTK或特权数据。

Ethan Mollick@emollick · 5月9日60

Very good hire by DeepMind.

译DeepMind 雇佣 @alexolegimas 担任 AGI Economics 总监，加入 @shanelegg 的跨学科AGI研究团队。他的团队将专注于前沿AI对经济的重塑，包括工作与劳动力变革、财富和权力分配、机构适应、AI代理影响市场等关键领域，并开发模型以推理不同于过去的未来。AGI 若改变社会运作，经济学将成为塑造共享未来的核心因素。

Google Gemini@GeminiApp · 5月9日73

Notebooks in Gemini bring organization to complex tasks. Take the grad school application process: With notebooks, you can gather your transcripts, essay drafts and admission requirements in one place, so Gemini can help track deadlines, give feedback, and assess your progress.

译Gemini中的笔记本功能为复杂任务带来条理性。以研究生院申请流程为例：通过笔记本，您可以将成绩单、文书草稿和录取要求集中在一处，让Gemini帮助追踪截止日期、提供反馈并评估您的进展。

Google AI Developers@googleaidevs · 5月9日22

End-of-week call for community builds! Have a project or demo that showcases Gemma 4 Multi-Token Prediction (MTP) drafters, File Search tool updates, or Webhooks in the Gemini API? Share them in the comments to let them shine 🌟

译周末社区作品征集！你有展示 Gemma 4 多令牌预测（MTP）草稿器、文件搜索工具更新或 Gemini API 中 Webhooks 的项目或演示吗？在评论区分享出来，让它们发光 🌟

Google AI@GoogleAI · 5月9日49

Happy Friday! 🎉We’re officially 11 days away from I/O (but the launches keep rolling in). Here’s what happened this week: — The @googlehealth app, featuring a personalized health coach built with Gemini that uses your wearables, favorite health & fitness apps, and medical records to deliver proactive wellness guidance that fits your life — Multi-Token Prediction (MTP) drafters in @googlegemma 4, which can speed up your workflows by up to 3X — Automatic source organization and customizable Mind Maps in @NotebookLM — Gemini API File Search tool updates with multimodal support, custom metadata, and page citations — Webhooks (now available in the Gemini API) replace continuous polling with push-based notifications — Some of our most popular AI features, like Nano Banana, Veo, and @googlephotos Remix are now available on Google TVs

译距离谷歌I/O大会仅11天，公司本周推出了一系列AI产品更新。Google Health应用集成Gemini，利用穿戴设备、健康应用和医疗记录提供个性化健康指导。Gemma 4引入多令牌预测技术，可将工作流速度提升高达3倍。NotebookLM新增自动源文件整理和可定制思维导图功能。Gemini API的文件搜索工具升级，支持多模态、自定义元数据和页面引用，并加入Webhooks推送通知以替代轮询。此外，Nano Banana、Veo和Google Photos Remix等热门AI功能现已登陆Google TV平台。

Berryxia.AI@berryxia · 5月8日63

最近Google真的是被谁都逮着按在地上摩擦了啊！刚刚GPT-Realtime-2 live 音频模型位居第一，将前阵子发布不久的Google gemini-3.1-flash-live 超越，并且领先不少。真是感慨，后半年的时候Google的香蕉🍌图像模型一战封神，Gemini 3.1 前段设计拉到一个新的高度，Veo3 也是爆火了一阵子。但是，2026 年来看。至少目前，还没有看到他们的杀手锏的东西出来，AI这个反馈的搏杀的战场，真的没有永远的赢家啊！太残忍了。期待Google 赶紧搞掂东西出啦啊。

译在ScaleAILabs的音频多挑战榜单中，OpenAI新发布的GPT-Realtime-2超越Google的gemini-3.1-flash-live，位居榜首。其指令保持能力较前代大幅提升，从36.7%增至70.8% APR，并在实时语音编辑方面表现突出，这对语音代理应用至关重要。尽管Google此前在图像模型和Gemini 3.1等产品上有过亮眼表现，但评论认为其在当前激烈的AI竞争中尚未展现出决定性的“杀手锏”。市场格局变化迅速，没有永远的赢家，期待Google能尽快推出突破性产品。

Berryxia.AI@berryxia · 5月8日67

能不能卷过DeppSeek v4-flash 啊！ Google继续把AI成本卷到地板上了。 Gemini 3.1 Flash-Lite正式更新，这才是他们目前最划算的模型，专门为高体积agent任务、翻译和简单数据处理优化，价格低到离谱，速度还快得吓人。以前大家卷参数、卷智能，现在Google直接告诉你：真正能跑通高频workflow的，是这种又便宜又稳的“轻量怪”。

Chubby♨️@kimmonismus · 5月8日41

I often find it more exciting to read about the practical advantages of AI in real-world applications. Back in 2025, I already had the impression that Google's AlphaEvolve was flying under the radar. AlphaEvolve is a Gemini-powered coding agent for designing advanced algorithms. Since 2025, it has been used to improve their in-house TPUs. Just one example: "AlphaEvolve has been used as a regular tool to optimize the design of the next generation of TPUs. It also helped discover more efficient cache replacement policies, achieving in two days what previously required a concerted, human-intensive effort spanning months." These are the examples that illustrate why Dario Amodei repeatedly refers to exponential growth. There is no area where AI isn't already helping to make progress - hardware, software, everywhere.

译作者认为关注AI在实际应用中的优势更令人兴奋，并以Google的AlphaEvolve为例。AlphaEvolve是一个基于Gemini的编码智能体，自2025年起被用于优化下一代TPU的设计。它在两天内就发现了更高效的缓存替换策略，而此前这需要人类团队数月的密集工作。这类实例印证了AI能力呈指数级增长的观点，表明AI已在硬件、软件等各个领域推动进步。

TestingCatalog News 🗞@testingcatalog · 5月8日64

GOOGLE 🚨: Gemini 3.1 Flash Lite is now Generally Available! Users can also test this model on AI Studio. > Designed for ultra-low latency, high-volume tasks, and unmatched cost-efficiency, Flash-Lite is already transforming how applications are built at scale.

译GOOGLE 🚨: Gemini 3.1 Flash Lite 现已全面开放！用户也可以在 AI Studio 上测试此模型。 > Flash-Lite 专为超低延迟、高吞吐量任务和无可比拟的成本效益而设计，已经在改变大规模应用的构建方式。

Chubby♨️@kimmonismus · 5月8日69

Reserach scientists at Google just tested an AI symptom checker on 14,000 real patients over 9 months via Fitbit. In blinded evaluation, clinicians ranked the AI diagnosis as #1 in 53% of cases. Independent physicians: 24%. But the real finding isn't "AI beats doctors.", but when users just type their symptoms and get an answer (the default mode of every consumer LLM right now), diagnostic accuracy drops ~27% compared to a structured AI-led interview. ChatGPT, Claude, Gemini, none of them systematically interview users about their symptoms. They just respond. This study shows that's a measurable failure mode. And then there's the second breakthrough: Fitbit data showed physiological shifts DAYS before users reported symptoms. Heart rate up, sleep disrupted, steps down, all visible before patients even opened the app. Conversational AI that asks the right questions + wearable sensors that detect illness before you feel it. That's the exciting find here.

译谷歌团队通过Fitbit对近1.4万名用户进行了为期9个月的AI症状检查测试。在盲评中，临床医生将AI诊断列为首选的比例达53%，显著高于独立医生的24%。研究核心发现并非“AI击败医生”，而是揭示了当前消费级大模型（如ChatGPT）仅凭用户输入直接回答的模式存在缺陷——其诊断准确率较AI主导的结构化访谈下降约27%。同时，可穿戴设备能提前数天监测到心率上升、睡眠紊乱等生理变化，早于用户主动报告症状。这表明，结合主动问询的对话AI与提前预警的传感器，才是未来医疗诊断的发展方向。

OpenRouter@OpenRouter · 5月8日68

Gemini 3.1 Flash Lite from @GoogleDeepMind is now GA on OpenRouter. Multimodal (text/image/video/audio/PDF → text), 1M context, selectable thinking levels, at $0.25/M in / $1.50/M out. Also works with our new service_tier param for cost/latency tradeoffs!

译Gemini 3.1 Flash Lite 来自 @GoogleDeepMind，现已在 OpenRouter 正式发布。多模态（文本/图像/视频/音频/PDF → 文本），100万上下文，可选的思考层级，输入每百万次$0.25，输出每百万次$1.50。还可配合我们新的 service_tier 参数使用，以权衡成本与延迟！