5月13日

01:05

Google Developers Blog（RSS）

精选73

本文探讨了如何从无状态聊天机器人升级为生产级AI智能体，以管理长达数天或数周的企业工作流程（如HR入职）。通过引入Agent Development Kit（ADK），其架构核心采用持久状态机和持久化会话存储，确保智能体在“空闲时间”或服务器重启时永不丢失上下文。系统利用事件驱动的Webhook和多智能体委托机制，实现在暂停期间“休眠”，并在唤醒后以高推理准确性恢复复杂任务，从而构建出具备韧性和可靠性的长时运行智能体系统。

智能体 Google 教程/实践部署/工程

推荐理由：Google 官方手把手教你把无状态 chatbot 升级成能跨天跨周的持久化 agent，状态机和持久会话是两个关键切入点，做过生产环境 agent 的都懂这东西有多刚需。

5月12日

23:37

IT之家（RSS）

曝谷歌 Chromebook 品牌将升级为 Googlebook，深度整合 Gemini

谷歌正与宏碁、华硕、戴尔、惠普和联想等多家OEM厂商合作，计划将Chromebook品牌升级为“Googlebook”。新产品将深度整合Gemini等AI服务，其中“魔术光标”功能可读取屏幕内容并利用Gemini理解上下文以提供信息说明。系统还支持Android手机跨平台协同操作。官方渲染图显示设备可能配备被称为“Glowbar”的RGB发光灯带。更多细节或将在近期活动中公布。

Google 产品更新端侧

22:40

Google DeepMind：Blog（RSS）

精选57

Co-Scientist：一个加速研究的多智能体AI伙伴

Co-Scientist 是一款由 Gemini 构建的协作式 AI 助手，旨在帮助科研人员加速科学突破。它通过多智能体（multi-agent）的架构设计，作为研究人员的智能伙伴参与工作流程，以提升研究效率并推动创新发现。

智能体 DeepMind Google 产品更新

推荐理由：Google DeepMind 推出的科研助手，用多智能体框架帮科学家加速实验设计，如果做生物/材料领域研究，值得跟踪一下，但对其他领域暂时可能还是个概念。

22:04

🚨 AI News | TestingCatalog@testingcatalog

Gemini Omni将成多模态AI代理，整合用户数字形象

谷歌在网页版中新增了Gemini Omni横幅，预示其将成为一个能整合文本、图像和视频的多模态AI代理。关键功能是允许用户将自身形象添加到不同场景中，这与即将登陆Gemini的AI数字形象功能高度关联。该“Likeness”功能很可能深度集成于移动应用，其运作方式曾应用于Sora。外界猜测它可能在今日的Android活动中亮相。

智能体 Google 产品更新多模态

19:04

🚨 AI News | TestingCatalog@testingcatalog

Google即将为NotebookLM的每个生成内容启用来源选择功能。用户将能够将音频视频概述、幻灯片、信息图及其他创作内容限定在选定的来源范围内。高级用户功能👀 * 尚未开放

Google 产品更新

16:36

IT之家（RSS）

美国商务部官网悄然删除谷歌、xAI、微软 AI 模型安全测试协议细节

美国商务部官网已移除与谷歌、xAI和微软达成的AI模型安全测试协议细节。原公告链接失效，显示“抱歉，未找到该页面”，并重定向至人工智能标准与创新中心。此前，商务部于5月5日宣布这些企业需在新AI模型推出前提交政府检测，以排查网络攻击、军事滥用等潜在威胁。美国政府担忧如Anthropic的Mythos等强大AI系统的国家安全风险，但删除原因尚不清楚。

Google Microsoft 安全/对齐政策/监管

13:49

Berryxia.AI@berryxia

Google Gemini Omni模型发布在即

大家说Google 最近疯狂降智的时候，是不是要有大的要来了。依稀记得Gemini3.1 发布前海外疯狂吹捧，但过后似乎没多少人真正使用。这一波我觉得也该搞点东西出来了吧~~~ [引用 @testingcatalog]：Google keeps preparing its upcoming Gemini Omni models for the release. > Gemini Omni model will be available on APIs as well > The model will be considered as Agent, similarly to Deep Research on AI Studio Soon? 👀 P. S. Just a reminder that Nano Banana 1 wasn’t better than Imagen v4

🚨 AI News | TestingCatalog: Google keeps preparing its upcoming Gemini Omni models for the release. > Gemini Omni model will be available on APIs as...

Google 多模态大佬观点

12:36

IT之家（RSS）

谷歌 AI 截图应用 Pixel Screenshots 有望走出手机端，登陆 Aluminum OS 桌面

科技媒体发现，谷歌正测试将Pixel Screenshots应用从手机拓展至桌面设备。该应用目前仅支持Pixel 9和10系列，利用端侧AI自动整理截图内容，构建可搜索的资料库。代码中出现了桌面版版本号及2026年的更新时间，表明开发已在进行中。预计其将登陆传闻中的谷歌桌面系统Aluminum OS，但目前仅完成底层适配，完整界面与交互尚未就绪。

Google 产品更新搜索端侧

10:49

歸藏(guizang.ai)@op7418

谷歌或即将发布新一代视频模型Veo 4，功能全面升级

谷歌可能即将推出新一代视频生成模型，暂称Veo 4或类似名称。该模型被描述为类似Sora 2.0的全能参考模型，支持对现有视频进行修改参考和内容替换等操作。在文字生成质量上，它被认为比Sora 2.0略有优势，清晰度和细节可能也稍有提升。据透露，这款即将到来的Gemini Omni视频模型在视频编辑功能上将更为先进，能够完成去除水印、替换视频内物体等复杂任务。谷歌预计会发布该模型的两个版本，包括一个性能更强的Pro变体，而目前展示的样本可能并非Pro版本。

🚨 AI News | TestingCatalog: GOOGLE 🔥: An upcoming Gemini Omni video model from Google is expected to be much more advanced in video editing, capabl...

Google 模型发布视频

09:36

IT之家（RSS）

谷歌警告攻击者正用 AI 找漏洞，零日利用已出现真实案例

谷歌威胁情报团队首次确认一起由AI参与开发的零日漏洞利用事件。攻击针对一款开源Web管理工具，旨在绕过双因素认证，其利用代码中发现了大量教学性注释和“幻觉”生成的CVSS评分，风格符合AI生成特征。谷歌指出，此类高层语义与业务逻辑漏洞正是AI擅长发现的类型。这表明攻击者正更多借助AI来寻找和武器化漏洞，大幅降低了攻击的技术与时间门槛，导致面向互联网的管理后台安全风险加剧。

Google 安全/对齐行业动态

08:55

Hacker News 热门（buzzing.cc 中文翻译）

精选73

谷歌表示，犯罪黑客利用人工智能发现了一个重大的软件漏洞

谷歌披露，犯罪黑客利用人工智能技术发现并利用了一个重大的软件漏洞。该漏洞存在于广泛使用的开源软件中，可能导致大规模数据泄露或系统入侵。谷歌威胁分析小组追踪到此次攻击，并确认黑客借助AI工具显著提升了漏洞挖掘的效率与精准度。目前漏洞细节尚未公开，但相关软件维护方已发布安全更新。这一事件凸显了AI技术被恶意用于网络攻击的现实风险，对全球网络安全防御体系提出了新的挑战。

Google 安全/对齐

推荐理由：这不是演习，谷歌亲口确认黑客用AI挖到了真实漏洞，AI降低攻击门槛不再是理论推演，安全从业者该重新评估威胁模型了。

04:03

🚨 AI News | TestingCatalog@testingcatalog

谷歌持续为其即将推出的Gemini Omni模型做发布准备。 > Gemini Omni模型也将通过API提供 > 该模型将被视为智能体，类似于AI Studio上的深度研究功能快了吗？👀 附：提醒一下，Nano Banana 1并未优于Imagen v4

Google 多模态模型发布

01:35

Google Gemini@GeminiApp

Personal Intelligence 可帮助您打造完全个性化的旅行行程。它通过关联您 @Gmail、@GooglePhotos、@Google 搜索和 @YouTube 历史记录中的信息点来节省时间。您可随时选择要连接的应用程序并管理个性化设置 🧵

Google 产品更新搜索

00:27

Google AI Developers@googleaidevs

谷歌DeepMind与Coursera推出"Gemini for Developers"开发者专项课程

谷歌DeepMind与Coursera合作推出的“Gemini for Developers”专项课程现已开放注册。该课程旨在指导开发者利用Gemini模型构建可用于生产环境的AI解决方案。其核心涵盖三大模块：“推理与行动”使AI应用能推理并执行复杂任务；“连接与自动化”通过函数调用将Gemini与现实世界工具集成；“规模化与信心”则专注于构建、测试和部署可扩展的AI系统。课程强调超越单纯文本生成，实现实际任务的自动化与系统集成，助力开发者快速上手。

智能体 DeepMind Google MCP/工具

5月11日

23:33

🚨 AI News | TestingCatalog@testingcatalog

谷歌即将推出的Gemini Omni视频模型在视频编辑方面预计将显著进步，能够完成去除水印、替换视频中物体等复杂任务。该模型可能发布两个版本，包括一个Pro变体。引用推文展示了该模型的实际编辑效果，对比了原始视频与编辑后的视频，并证实其在去除水印方面表现优异。

Just a dragon: 🫨Google is creating a new Omni model with good video editing. Veo4? The original is on the left. Edited right. The new ...

Google 多模态模型发布视频

22:23

Chubby♨️@kimmonismus

天哪，谷歌正在放大招！新的视频模型/Gemini Omni 简直好得离谱且精准。 YouTube 和 TikTok 将涌现大量新的 AI 生成视频。

Chetaslua: Holllllyyyyyyyy @GeminiApp cooked 😳😳 🚨 Gemini Omni: New video model Here is the first output and see the text coheren...

Google 模型发布视频

20:34

IT之家（RSS）

谷歌母公司 Alphabet 计划首次发行日元债券，为 AI 基建融资

谷歌母公司Alphabet计划首次发行规模达数千亿日元的日元债券，为人工智能基础设施融资，发行条款预计本月敲定。此举标志着科技巨头正转向债券市场，以支持耗资巨大的AI布局。行业预计，今年全球科技企业在AI基础设施上的投入将超过7000亿美元。此外，亚马逊也正筹备首次发行瑞士法郎债券。近期，Alphabet已通过发行欧元和加元债券募资近170亿美元，并将其年度资本支出预期上调至1800亿至1900亿美元区间。

Google 行业动态

20:01

凡人小北@frxiaobei

对比研究Google Health API后的几点感受

作者在体验Apple Health后，认为其数据可控性与生态开放性不足。新推出的Google Health API提供了31种健康数据点、Webhook实时推送和精细权限控制，在数据颗粒度与开放程度上优势显著，为开发者构建健康AI Agent或自动化工作流奠定了强大基础。作者计划将其接入现有系统作为核心数据源，并强调未来将优先选择接入此生态的海外健康终端以掌握数据主权，同时暗示国内生态在开放性上存在差距。

Berryxia.AI: Google 把 Fitbit Air 的全新 Google Health API 直接开放了! 昨天 Fitbit Air 刚刚发布,但更重磅的是它自带了全新的 @googlehealth API,开发者现在可以直接在上面构建 AI Ag...

智能体 Google MCP/工具产品更新

16:53

Chubby♨️@kimmonismus

全新谷歌Omni模型即将到来！可能将在i/o大会上发布（下周现场见：））可能是Veo 3.1的更新版本（甚至可能是下一代迭代）感谢reddit上的Zachary

Google 行业动态视频

15:34

IT之家（RSS）

三星 AI 冰箱在美迎来重大升级：接入谷歌 Gemini 模型，提升食材识别与交互体验

三星在美国为Bespoke AI Family Hub冰箱系列推送重大更新，核心是接入谷歌Gemini模型。此举显著提升了AI视觉食材识别能力，可识别更多生鲜及包装食品。升级后的Bixby助手能理解复杂语音指令，如自动制冰或根据室外温度调节设置。新增即时简报功能可提供个性化资讯与菜谱推荐。冰箱还能通过声纹识别区分用户，提供纪念日提醒、健康报告等专属服务。配备32英寸屏的机型已可更新，9英寸机型将于年内推送。

Google 产品更新

14:32

🚨 AI News | TestingCatalog@testingcatalog

Google I/O曝光Gemini Omni视频模型新证据

在Google I/O期间，Gemini移动应用中发现了即将推出的Gemini Omni视频模型的新证据。该模型被描述为“我们的新视频模型”，功能包括混剪视频、在聊天中直接编辑以及使用模板等。分析指出，这可能是基于Gemini的真正“Omni”模型，而非Veo。早期测试显示，该模型会快速消耗使用额度，且网络和移动端应用都将新增一个“使用情况”标签页来追踪用量。

Google 多模态模型发布视频