5月29日

09:37

Josh Woodward@joshwoodward

我们已收到关于在@GeminiApp上过快达到使用限制的反馈。我们正在推出多项修复措施，以使您的配额使用更持久、体验更可预测… 🧵

Google 产品更新

08:37

Google AI@GoogleAI

一些来自社区的有趣Gemini Omni用例 🧵👇

Google 产品更新多模态

06:14

Rohan Paul@rohanpaul_ai

Google Omni 值得更多关注。

Google 多模态大佬观点

05:49

🚨 AI News | TestingCatalog@testingcatalog

Google 宣布 Nano Banana 2 和 Nano Banana Pro 模型现已通过 API 达到通用可用状态。其中，Nano Banana 2 新增了支持将视频文件作为输入提示的功能。在输出方面，两款模型的 1K 和 2K 输出能力已正式发布，而 4K 输出功能仍处于预览阶段。达到通用可用意味着这些模型由企业级的基础设施和安全体系提供支持。它们可通过 Gemini Enterprise Agent Platform 集成，使开发者能够将高质量的图像生成与编辑功能整合到其应用与工作流中。

Thomas Kurian: Nano Banana 2 and Nano Banana Pro are now generally available via Gemini Enterprise Agent Platform. Backed by enterprise...

Google 图像生成多模态模型发布

05:12

Google AI Developers@googleaidevs

节省大量手动迁移工作。观看混乱的遗留代码在 @Antigravity 的示例中，由 Gemini 3.5 Flash 驱动，自主现代化为 Next.js。

Google 教程/实践编码

03:06

Google Gemini@GeminiApp

好消息！印度用户现在可以上传视频（来自相册或已保存文件），并使用Gemini Omni进行编辑和转换。快来试试，并告诉我们你的想法。

Vijay Choudhary: Gemini Omni seems to outperform everything. Crazy updates for Vibe Video Editing at #google Let's see when this update w...

Google 产品更新多模态视频

02:42

Google AI Developers@googleaidevs

🍌 Nano Banana Pro 【gemini-3-pro-image】和 Nano Banana 2 【gemini-3.1-flash-image】现已正式发布，可通过 Gemini API 投入生产使用。查看这些优秀的社区示例，了解两个模型的实际能力 🧵↓

Google 图像生成模型发布

01:42

Google AI Developers@googleaidevs

精选71

Google 图像生成模型发布

推荐理由：Google 把 Gemini 图像生成能力打包进 Nano Banana 系列并正式 GA，开发者现在可以稳定调用 Pro 和 Flash 级别的生图 API，对做图像应用的团队是个实在利好。

01:06

Google AI@GoogleAI

Google用AI工具让纸板和马克笔"活起来"

Google通过一部短片展示了如何利用AI工具将纸板、马克笔等简单物理材料“赋予生命”。该短片讲述了为Google I/O 2026舞台做准备的一群TPU的故事，创作中融合了木偶戏与3D动画。核心工具包括：Nano Banana（从原始木偶镜头和基础3D动画生成风格化首帧）、Google AI Studio（构建定制工具以大规模测试帧并确保一致性）、以及Gemini Omni和Google DeepMind的实验性模型（合并基础动画与风格化帧，提升至电影级画面）。整个AI流水线的设计旨在保护那些体现手工艺温度的细微细节，例如木偶戏的细微不完美感。

Google 多模态教程/实践视频

00:31

AYi@AYi_AInotes

Google Omni演示手部解剖，生物医学教学潜力获赞

推文回应了关于Google Omni能力的争议，展示了其将普通人手转化为逼真活体解剖影像的演示效果。该演示清晰呈现肌肉、肌腱、骨骼等组织结构，被评价为生物医学教学的理想工具。文中提及的对比对象为seedance 2.0，强调了该技术在教育领域的独特应用价值。

Google 多模态现象/趋势

00:05

Google Gemini@GeminiApp

好消息：印度用户现在可以直接使用Gemini Omni上传和编辑视频了！在应用或 http://gemini.google.com 中开始使用： > 上传您的视频 > 告诉Gemini您想要进行的更改 > 享受您的新作品我们迫不及待想看到您的创作！

Google 产品更新多模态视频

5月28日

23:05

OpenRouter@OpenRouter

精选69

提示：您可以为支持的模型（OpenAI、Google Vertex 等）使用 Flex 和 Priority 层级。定价信息请查看各模型页面。文档：https://openrouter.ai/docs/guides/features/service-tiers

Google OpenAI 教程/实践部署/工程

推荐理由：OpenRouter 这个 Flex/Priority 层级用法看似细枝末节，但你如果同时调 OpenAI 和 Vertex，知道怎么分层能免掉很多无谓的速率限制和成本焦虑。

21:12

Chubby♨️@kimmonismus

Bloomberg泄露iOS 27 Siri重大改版方案

Bloomberg泄露了苹果iOS 27中Siri的全面改版方案。核心架构是Siri将基于Google Gemini构建，界面新增下拉菜单，允许用户直接切换至ChatGPT或Claude。这表明苹果在重建Siri后，选择整合外部大模型。此外，苹果还将推出与Perplexity竞争的AI网络搜索功能、自然语言创建Shortcuts的能力以及AI照片编辑工具。此次更新是Siri历史上规模最大的一次。

Mark Gurman: BREAKING: A first look with renders at Apple's upcoming iOS 27, completely revamped Siri, major new AI features, enhance...

Google 大佬观点语音

20:18

NotebookLM@NotebookLM

如果你错过了，可以查看我们公开的笔记本，其中总结了 Google I/O 2026 的所有重要公告。访问地址：https://goo.gle/4dR9MiQ

Google 教程/实践

15:41

🚨 AI News | TestingCatalog@testingcatalog

如果你错过了 👀：现在，拥有 Google Genie 实验访问权限的用户可以使用 Google 地图中的地点来生成虚拟世界。 "金门大桥" 🤖

Google 产品更新图像生成多模态

11:31

Berryxia.AI@berryxia

Google发布新一代Coral板，本地AI进入生产力时代

Google发布最新Coral开发板，搭载Gemma系列模型，实现高效的本地设备端AI。核心演示包括板载实时语音翻译、通过自然语言控制硬件，以及利用视觉与声音生成音乐。此次升级的关键在于无需云端联网，解决了传统本地AI在延迟、隐私和成本方面的痛点。通过硬件与模型的深度结合，Google将AI的应用场景从云端拉回设备本地，计划于今年夏天推出。

Google Gemma: Introducing the newest Coral board, for efficient, on-device AI! Check out the demos in the video: - On-board speech tra...

Google 产品更新端侧语音

10:28

AYi@AYi_AInotes

一个地图截图+手绘路径，就能生成这么流畅、物理感强的无人机POV航拍视频，相比seedance、Kling，Google Omni最擅长的应该就是这种精确的相机控制，空间理解、世界模型的真实感

Google 多模态教程/实践视频

07:35

Ethan Mollick@emollick

Google拥有唯一真正的全模态模型，但各元素尚未连接。它似乎能接收和输出音频、图像、视频、歌曲、文本、代码等。但目前每种输出类型都是分离的。当你能直接访问模型，混合模式，很多事情就变得可能了。

Google 多模态大佬观点

07:35

Google AI Developers@googleaidevs

我们喜欢内部测试！🐶 在向大家推出这些更新之前，我们让Googlers在@GoogleAIStudio中尝试构建@AndroidDev应用。以下是我们的一些最爱…

Google 行业动态

06:07

Chubby♨️@kimmonismus

我刚看了@arrakis_ai制作的片段，对Google的Omni印象深刻。你可以在任意帧暂停，宝可梦卡牌上的文字都保持完美清晰且未改变。这种一致性和连续性是顶级水平。

Google 大佬观点视频

05:52

Google Gemini@GeminiApp

同事件精选77

使用 Gemini Omni 轻松将您的视频转换为新的视觉风格。只需上传视频或照片，并要求 Gemini 为您的最终输出应用某种外观或风格。

Google 产品更新多模态视频

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Gemini 终于把图像风格迁移做到视频上了，并且直接集成到 Omni 里，不需要任何剪辑软件，对短视频创作者是个小但实用的更新。

05:29

Google AI@GoogleAI

回顾上周的 I/O 大会公告，与 @NotebookLM 一起。您可以收听音频概览，观看视频回顾，甚至查看我们详细总结所有重大新闻和发布的幻灯片。在此查看：https://blog.google/innovation-and-ai/products/notebooklm/notebooklm-google-io-2026/?linkId=62068662

Google 产品更新语音

04:59

Google AI@GoogleAI

与 @NotebookLM 一起回顾上周的 I/O 发布内容。你可以收听音频概览、观看视频回顾，甚至查看我们详细的幻灯片，总结所有重大新闻和发布。在此查看：http://goo.gle/4xcgBoj

Google 多模态教程/实践

04:05

Google AI Developers@googleaidevs

智能体需要在复杂任务中兼顾速度与性能。观看 Gemini 3.5 Flash 的智能如何大规模处理这些任务，同时您进行构建 ↓

智能体 Google 教程/实践

01:22

Google Gemini@GeminiApp

从 #GoogleIO 舞台直接来到 Gemini Discord 舞台，加入我们的下一场社区活动，我们将与团队成员一起深入探讨两个新的智能体工具（Gemini Spark 和 Daily Brief）。观看这些新功能的现场演示，并有机会实时提问。 👉加入我们的 Discord 观看直播：http://discord.gg/gemini 📅 今天（周三，5月27日）太平洋时间上午 11：30

智能体 Google 产品更新

00:35

Chubby♨️@kimmonismus

同事件精选80

与Google搜索产品副总裁Robby Stein的访谈：AI原生搜索时代

本文记录了与Google搜索产品副总裁Robby Stein在Google I/O的访谈，核心探讨Google Search向“AI原生”模式的重大转变。讨论话题包括AI Mode是进化还是重塑、如何将复杂问题拆解为多轮搜索、AI搜索的高运行成本、Google TPU及基础设施的优势、AI时代搜索量不减反增的原因，以及优质AI回答与出版商流量之间的张力。访谈还涉及Google决定展示哪些信息源与链接的逻辑，并围绕一个核心问题展开：如果Google直接给出答案，传统的基于链接的网页生态将走向何方？

Google 大佬观点搜索

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Google 搜索 VP 首次拆解 AI Mode 背后的成本逻辑、流量分配和 TPU 优势，比 I/O 演讲深得多，做搜索和内容生态的都值得听。

00:23

Josh Woodward@joshwoodward

一项备受期待的功能正在 @NotebookLM 中推出：Google Drive 文件现在将自动同步！🔄 我们正在积极推出此功能，今天从 10% 的用户开始，很快将逐步扩大范围。

Google 产品更新

00:10

🚨 AI News | TestingCatalog@testingcatalog

GOOGLE 🔥： Gemini for Business 将推出协作项目新体验，团队可在共享环境中工作。此外，Google 正推出可在多个应用中执行自动化任务的工作流智能体。相同功能现已在 Gemini Enterprise 上可用，并将更好地集成到 Gemini for Business 的核心体验中。是我一个人这么觉得，还是 Gemini for Business 确实比面向消费者的 Gemini 体验好得多？

智能体 Google 产品更新

5月27日

23:51

Google Gemini@GeminiApp

添加文本、视频或最多五张图片作为素材，Gemini Omni可以将它们全部组合成一个连贯的十秒视频。今天就来试试，并在回复中分享你的创作。👇

Google 产品更新多模态视频

关联讨论 18 条

12:29

宝玉@dotey

前Gemini核心科学家透露，Google在技术上曾领先，其MoE模型GLaM（2021年）已超越GPT-3，PaLM 2（2023年初）早已训练完成。然而，因组织问题，为等待Google I/O大会，PaLM 2的发布被推迟，而OpenAI抢先发布GPT-4，从而改写了市场叙事。

硅谷101: Google其实比OpenAI更早做MoE。我们专访到了Gemini前核心科学家Andrew Dai。Andrew回忆,Google Brain在 2021 年就已经做出了比GPT-3更强的MoE大模型GLaM,PaLM 2甚至在2023...

Google OpenAI 大佬观点现象/趋势

11:33

歸藏(guizang.ai)@op7418

OpenRouter 获得 1.3 亿美元的 B 轮融资感觉这个估值有点低了，这种聚合 API 后面应该是新的 Token 经济的基础平台

OpenRouter: Today we're announcing our $113M Series B led by @CapitalGVC. Over the last 6 months, weekly volume on OpenRouter grew f...

智能体 Google 开源生态行业动态

08:27

Berryxia.AI@berryxia

Gemma 4新玩法：开源地牢游戏让AI实时构建Web应用

Google Gemma团队开源了AIventure项目，这是一款地牢爬行游戏。玩家可以向游戏中的NPC输入提示词，AI会实时构建可运行的Web应用。AI核心由Gemma 4驱动，负责理解指令、规划步骤并生成代码。项目将智能体工作流与氛围编程融入游戏，是面向开发者的实操大师课，从游戏设计到智能体集成均已开源。

Google Gemma: Gemma 4 meets retro gaming! 🕹️✨ Introducing AIventure: an open-source dungeon crawler designed as a developer mastercla...

智能体 Google 开源生态教程/实践

07:09

🚨 AI News | TestingCatalog@testingcatalog

GOOGLE 🔥： AI Studio Build 很快将支持主题功能，用户可以在 8 个预定义预设中选择，或创建自己的主题。设计 MD 支持会很不错 👀 h/t @thomas_gmry

Google 产品更新

05:58

Nathan Lambert@natolambert

释放100B Gemma 4 MoE！Gemini Flash 3.5已发布，现在可以发布它了！

Google 大佬观点开源生态

05:28

Google AI@GoogleAI

同事件精选75

Gemini Omni 视频提示词使用指南

Google 发布了其多模态模型 Gemini Omni 的视频生成功能使用指南。该模型可通过 Gemini 应用、Google Flow 等平台体验。指南包含五项提示词技巧：利用模型已有的现实世界知识进行简洁描述；精确控制文本在视频中的渲染与排版；使用专业镜头指令（如推拉摇移）像电影摄影师一样调度画面；通过迭代编辑高效修改视频；以及在生成中直接调整角色的动作节奏或情绪。其核心在于通过精准的提示词引导模型生成复杂且可控的视频内容。

Google 教程/实践视频

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Google 官方放出的视频提示技巧，没有废话全是可复制的 prompt，想玩 Gemini Omni 的创作者可以直接抄作业。

03:58

Elon Musk@elonmusk

推文展示了一次AI模型间的交互纠错。用户将一条关于比利时男子因仇恨言论被定罪的推文内容交给Gemini进行事实核查，Gemini最初判定该描述"严重不准确"。随后，用户将Gemini的回复转给Grok，Grok指出Gemini混淆了两个不同案件，并确认原推文描述准确。用户将Grok的回复反馈给Gemini后，Gemini承认错误并感谢纠正。推文者指出，这类AI模型之间相互纠错的情况时常发生。

i/o: Belgian man convicted of hate speech describes the judicial rationale for his latest conviction. I asked Gemini: Is this...

Google xAI 推理现象/趋势

03:20

swyx@swyx

每个人都在谈论中国追赶美国却很少有人谈论美国追赶中国干得好 @o_lacombe 等人，@robert_mchardy 等人！

Latent.Space: [AINews 3 Apr 2026] Gemma 4: The world's best small Multimodal Open Models, dramatically better than Gemma 3 in every wa...

Google 多模态大佬观点开源生态

01:29

小互@xiaohu

Strudel+Gemini 生成电子音乐有点酷… 视频来自抖音：@六月的小号

Google 其他多模态

01:07

Artificial Analysis@ArtificialAnlys

Gemini 3.5 Flash速度与agent能力提升，但成本显著增加

Gemini 3.5 Flash在速度与agent能力上实现进步，实测输出速度可达约280 output tokens/sec，在GDPVal-AA agent任务中ELO提升至约1650，相比Gemini 3 Flash有显著提升。但代价是成本增加约5倍，主要因token单价上涨（为Gemini 3.5 Flash的3倍）以及使用量更高。

智能体 Google 推理评测/基准

00:48

Google Gemini@GeminiApp

用大约一分钟时间，了解Google I/O上所有Gemini应用的更新。

Google 产品更新