创新时代:Google Research 在 I/O 2026
阅读原文· research.googleGoogle 把研究成果直接发 Nature,ERA 和 Co-Scientist 这套工具让 AI 从写诗进化到做实验,健康 AI 的临床验证数据也很扎实,搞科研的可以蹲一下访问资格。
Google Research 在 I/O 2026 大会上展示了其在多个前沿领域的技术进展,包括应用AI、基础机器学习算法以及量子AI等。本次大会的核心主题是展示其在将科学发现与研究成果转化为现实世界影响方面的持续努力。
发现新纪元:Google Research 在 I/O 2026 的展示
2026 年 5 月 28 日
Yossi Matias,Google 副总裁兼 Google Research 总经理
在上周的 Google I/O 2026 上,Google 各团队向用户、开发者和研究人员展示了我们最先进的技术。以下是 Google Research 今年的一些亮点,其中许多成果依托于多年努力,以实现研究的神奇循环。
快速链接
今年 Google I/O 的突破反映了一个全新的、大胆的智能体时代。凭借比以往更强大的模型和智能体编码平台,我们让 Google 产品对每个人都更有帮助,同时改变了研究人员应对最紧迫的科学和社会挑战的方式。随着研究转化为切实的现实影响,我们正在将 AI 和技术变成人类智慧的放大器。
以下是 Google Research 与 Google 内部多个团队及全球合作伙伴密切协作取得的几项关键亮点。
迈向科学发现的新纪元
AI 正在开启科学发现的新纪元。Google 正在构建先进的 AI 工具,旨在加速全球科学界的进步。我们的基础技术正在赋能全球研究人员,通过从假设生成到计算实验的科学方法,在各个领域取得突破。在 I/O 大会上,我们发布了基于基础研究构建的 Gemini for Science,其中包括实证研究辅助(ERA)和联合科学家(Co-Scientist)——这两项成果已于上周发表在《自然》期刊上。
实证研究辅助(ERA)是一个研究编码系统,旨在帮助科学家编写专家级的实证软件。上周 ERA 在《自然》期刊上发表,此前我们与学术合作伙伴进行了数月的合作,探索该系统的实际应用。ERA 已帮助加速从神经科学到宇宙学的发现。我们的最新成果包括预测呼吸系统疾病的住院人数,以及预测加利福尼亚河流域的季节性径流量。这些成果已收录在我们新的 GitHub 目录中。它们昭示着 AI 通过计算挖掘更深层洞察、加速发现的力量。
面对一个定义明确的问题和评分系统,实证研究助手(ERA)会扮演一个代码优化研究引擎的角色。它提出新概念,编写代码,评估结果,随后通过树搜索在数千个代码变体中搜索并迭代,以优化性能。
共同科学家(Co-Scientist)是一个基于 Gemini 的多智能体系统,作为协作式 AI 伙伴工作。我们关于 Co-Scientist 的基础研究上周发表在《自然》杂志上,同时还有一篇博客文章重点介绍了研究人员的反馈。我们此前的研究和验证论文展示了研究人员如何利用 Co-Scientist 来攻克从抗菌素耐药性到植物免疫和肝纤维化等一些最紧迫的科学难题。
Co-Scientist 概述:它利用一个由专门智能体组成的联盟,迭代地生成、评估和优化研究假设。
Gemini for Science 是一套实验性工具,旨在扩大科学探索的规模和精度——它与 Google Cloud、Google DeepMind 和 Google Labs 的团队紧密合作开发而成。Gemini for Science 中的新工具之一“计算发现”(Computational Discovery)是一个基于 ERA 和 AlphaEvolve 构建的智能体研究引擎。该计算发现原型能够并行生成并评分数千个代码变体,使科学家能够快速测试多种研究假设和新型建模方法,而这些工作若手动探索可能需要数月时间。
每年有数百万篇论文发表,综合所有科学文献已变得极其困难。另一个新工具“假设生成”(Hypothesis Generation)则基于 Co-Scientist 构建而成。它旨在通过以下方式弥合这一差距:与科学家合作定义研究挑战,并运行一场多智能体“点子竞赛”来生成、辩论和评估假设。为确保科学严谨性,主张均附有可点击的引用来源。
Gemini for Science 还集成了基于 NotebookLM 构建的“文献洞察”(Literature Insights)功能,可帮助用户综合梳理科学文献中的发现并结构化呈现结果。此外,任何在 Google Antigravity 等平台上进行智能体编码的用户,都可以从“科学技能”(Science Skills)中受益——这是一套智能体技能包,能够让研究人员在几分钟(而非数小时)内自动完成结构生物信息学、基因组分析等复杂工作流。
我们正在逐步开放这些工具的访问权限,并与全球科学界合作,负责任地推动科学发展。如果您有兴趣,可访问 labs.google/science 注册。
作为我们与生态系统合作、促进最新实验成果可及性的更广泛努力的一部分,我们还正在试点用于智能体同行评审和科学验证的工具。ICML、STOC 和 NeurIPS 等顶级科学会议正在探索我们的论文辅助工具(PAT)。在这些会议上,PAT 已在实验性能力范围内评审了超过 10,000 篇论文——帮助许多作者识别关键的理论空白,或基于该 AI 工具的反馈开展全新的实验。
我们还利用具备高级智能体推理能力的 Gemini Deep Think 加速数学与科学发现。通过与数学家、物理学家和计算机科学家的合作,我们最近解决了一系列专家级别的开放研究问题,包括:网络谜题中此前未解的僵局,解决了一个存在十年的优化猜想,解释了机器学习中的优化异常现象,升级了拍卖领域的经济理论,以及解决了宇宙弦中的物理奇点问题。
在科学家和研究人员手中,这些新型 AI 技术可能改变科研方式,并催化一个发现的新时代。
用 AI 推动健康事业发展
AI 可以在帮助人们活得更长寿、更健康方面发挥关键作用。多年来,我们持续推进 AI 研究以应对医疗健康挑战,并与医疗服务提供者、科学家、公职人员及学术界紧密合作,将我们的临床研究带入真实的医疗场景,确保我们的创新既安全又有用。
我们一直在研究的一个领域是:AI 如何在用户整个健康与 wellness 旅程中提供最佳支持——从了解症状、为就医做准备,到理解自己的医疗记录——这段旅程从用户见到医生之前就已开始,并持续到就诊之后很久。我们的基础研究正在为新的 Google Health 应用和 Google Health Coach 提供支撑。上周,我们已开始向所有现有 Fitbit 用户推出 Google Health 应用,使符合条件的用户能够获得个性化、整体化、自适应的健康指导。
这建立在我们多年研究工作的基础之上,其中包括关于个人健康大语言模型如何帮助改善睡眠与健身的研究。我们最新的研究包括 Symptom AI,这是一款研究型工具,旨在探索 AI 如何帮助推理与用户症状相关的对话数据。通过 Fitbit 应用开展的一项随机、知情同意的研究中,13,917 名参与者与实验性 AI 智能体进行了交互,捕获了真实世界中多样化的沟通风格以及符合实际的疾病分布。在一项针对研究参与者的盲法比较中,独立临床医生审阅了相同的对话,结果偏好 Symptom AI 鉴别诊断结果的频率约为其他临床医生的两倍。在我们的“Plan for Care”试点研究中,我们考察了 1,779 名参与者如何使用我们的系统为就诊做准备。与基线模型相比,感觉准备更充分的用户比例提高了 15%,感觉有信心充分利用就诊机会的用户比例提高了 13%。在个人健康记录(PHR,Personal Health Record)研究中,我们评估了将 PHR 数据纳入模型上下文对回答质量的影响,发现自动评分员和临床医生均判断 AI 回答的帮助性显著提高。
在提供 PHR 上下文时,AI 与临床医生评分员对 AI 回答帮助性的评估结果。请注意,评分员(包括 AI 和临床医生)是“预言机”,能够访问模拟用户的 PHR 上下文;换句话说,这些预言机知道模拟用户的既往健康背景,并可以利用这些信息来评估 AI 回答。
另一项重要的研究工作是关于人工智能在临床环境中的潜力。在此前发表于《自然》的两篇论文中,我们展示了AMIE——由谷歌研究与谷歌DeepMind开发的研究型多智能体系统——如何解读和推理复杂病例及医疗对话数据。在上周发表于《自然·医学》的新研究中,我们展示了该系统在多模态数据(包括病史、化验结果和复杂医学影像)上的能力。为了评估该系统在真实场景中的实用性,我们正与贝斯以色列女执事医疗中心合作,测试该系统如何帮助减轻患者就诊前实时采集病史的负担。我们还与Included Health合作,启动了一项全国范围的、首创性大规模研究,以评估由人工智能驱动的远程医疗护理。
推进医疗保健是一项全球性努力。我们通过MedGemma(我们的健康AI开发者基础套件(Health AI Developer Foundations)中的开源基础模型系列之一)赋能全球医疗保健开发者生态系统,供开发者在此基础上进行构建。MedGemma专精于多模态医疗文本、临床推理和影像理解。此外,MedASR提供了专门的医疗音频能力。这些模型正驱动着广泛的应用场景,有助于让优质医疗服务的获取更加普及。截至目前,MedGemma的下载量已超过500万次。
Coralboard:面向高能效边缘应用
我们正在开发平台和工具,以帮助硬件制造商生态系统构建高效的边缘应用。Coral NPU是我们为可穿戴设备和传感器等边缘应用开发的高能效人工智能机器学习加速器核心。基于开放硬件,并与深度硅供应商合作,这一经过验证的开源IP可用于商业硅集成,有助于创建加速边缘AI生态系统的标准架构。
在上周的 I/O 大会上,我们发布了首款来自 Synaptics 的 Coralboard,专为 AI 和机器学习工程师以及设备制造商设计,用于快速原型设计和开发设备。该板卡搭载了 Gemma 3 270M 开放模型,并提供丰富的硬件接口,包括摄像头和显示支持、麦克风输入,以及可选的 Wi-Fi/蓝牙连接。Synaptics 已投入资源将这些方案推向市场,将 Coral 在功耗与性能之间的平衡与他们的 Devboard 智能能力相结合。
这一业界首款实现方案的能力在一个独特的会前体验中得到了展示:Coralboard 被部署到蒙特雷湾水族馆,用于实时本地设备上的水母图像检测,其运动轨迹被用来编排大屏幕体验。Synaptics Coralboard 将于今年夏末正式上市。
Jellectronica 是一个生成式音乐实验,它将水母的运动转化为声音。该实验用于上周的 I/O 会前活动,直播信号来自蒙特雷湾水族馆。水母的追踪由运行在边缘设备上的目标检测模型完成,该模型运行在 Google 小巧、低功耗的 Coral NPU 上。
预测极端天气
热带气旋和洪水等自然灾害可能摧毁社区并危及生命。作为我们长期危机韧性工作的一部分,我们正在生成基于 AI 的准确预报,以帮助全球社区和组织保持安全,更好地为危机做好准备。
去年,我们宣布了与美国国家飓风中心的合作,利用来自 Google Research 和 Google DeepMind 团队开发的 WeatherNext 模型生成的气旋预测来支持他们的预报。在 I/O 大会上,我们展示了 WeatherNext 在最近一个飓风季中的影响。2025 年 10 月,当飓风梅丽莎逼近时,WeatherNext 提前五天以高置信度预测了其快速增强及在牙买加登陆的可能性。牙买加气象局得以提前通知公众,从而帮助挽救了生命和生计。
另一个近期里程碑是城市山洪暴发预测。为了解决因数据稀缺而长期未能有效预测的难题,我们推出了 Groundsource,这是一种可扩展的新方法,利用 Gemini 将 20 年非结构化的公开新闻报道转化为包含 260 万条记录的高质量数据集。该数据使我们能够训练针对城市地区山洪暴发的高级预测模型。这些预测已在 Flood Hub 上发布,与我们的河流洪水预测一同提供,后者目前覆盖 150 个国家/地区的 20 亿人口,用于预测最重大的洪水事件。
WeatherNext 和洪水预测模型是 Google Earth AI 的一部分,这是一个地理空间模型和数据集集合,旨在将行星信息转化为可操作的洞察。它已经在帮助企业、城市和非营利组织应对从环境监测、灾害响应到支持公共卫生等挑战。Earth AI 近期更新还包括关于道路管理、人口动态以及航空与卫星洞察的新见解。
观看影片
YouTube 视频链接
提升 Gemini 的核心能力
我们持续推动生成式 AI 的基础研究。与 Google DeepMind 合作,我们在事实性、多语言性和效率等领域的工作,有助于提升 Gemini 的模型质量和性能,并扩大我们产品的全球可及性,以更好地满足用户需求。
我们对大语言模型事实性的研究,可以追溯到 2021 年关于评估事实一致性的开创性研究,以及 2022 年的早期基准测试。我们持续推动 Gemini 和 AI Mode 向前发展,并发表前沿研究,帮助整个社区提供事实性信息。我们发布了 FACTS,并将其扩展为支持对大语言模型事实性进行稳健的基准测试,同时还推出了改进事实性的技术,涵盖文本到图像、视频生成、长上下文以及不确定性表达等方面。
在 I/O 大会上,我们看到信息旅程正变得越来越复杂,人们需要通过更长的对话来获取所需内容。这给大语言模型带来了多项挑战,包括能够在上下文窗口中推理和分析更多相关信息、遵守对话早期出现的约束条件,以及使用更长的强化学习轨迹。谷歌研究院在这些挑战上率先开展了研究工作,这些进展为我们的 Gemini 模型提供了支撑。
新的“Ask Maps”功能还允许用户在地图中提出复杂的、更长的问询。我们与 Ask Maps 团队合作,升级了其评估框架,并重新定义了地图实用性的衡量方式。通过精准定位涉及模型推理和工具执行的复杂边缘案例,这次合作建立了一个关键的反馈循环——这对 Ask Maps 性能的持续改进至关重要。我们还推动了提升 Ask YouTube(一项帮助用户轻松查找视频和信息的新功能)质量的研究。
生成式 AI 让各类工具和产品的易用性大幅提升,使技术能够真正贴合用户的实际场景。我们增强了 Gemini 的多语言和本地化能力,包括发布了一个基准测试,用于展示大语言模型在不同语言和不同地区中的表现,并在社区协作下开源了非洲语言数据集。这些努力助力 Gemini 扩展至覆盖 230 多个国家的 70 多种语言,使其成为全球可及性最广的 AI 助手。
谷歌构建其基础设施以实现低延迟和高吞吐量,从而满足全球用户、开发者和企业的需求。我们的研究团队在推测解码基础上开发了新技术——包括块验证和树状草稿生成,这些技术能够智能地同时探索多个候选续写内容,并在每一步接受更多模型 token。我们的实现针对谷歌 TPU 架构进行了高度优化,最大化硬件利用率,以在不损失质量的前提下提供显著更快的响应。这项工作实现了 Gemini 3.5 Flash 当前的运行速度,同样的模型也为 Antigravity 和 AI Studio 提供支持。
打造更具吸引力的生成式体验
我们对生成式 UI 的研究为搜索和 Gemini 应用中最新推出的沉浸式体验奠定了基础。在搜索中,新的生成式 UI 功能将于今年夏天向所有人开放。搜索可以构建理想的回复,以适合问题的格式呈现,为用户提供定制化体验,包括模拟、图表、追踪器和仪表盘。而在 Gemini 上,用户将看到交互式图片、时间线和嵌入式视频。该功能目前正在全球范围内推出,最终体验感觉更加流畅自然。
随着 AI 打开新的创意可能性之门,用户正在寻求引人注目、高质量的生成视频和图像。我们的研究团队与 Google DeepMind 密切合作,帮助改进 Gemini Omni——谷歌的新模型,可从任意输入创建任何内容,首先从视频开始。我们帮助提升了生成视频片段中叙事部分的质量,使其更加有趣且引人入胜,特别关注提高生成片段中人物表情的质量。
开发者生产力的新时代
Google Antigravity 2.0,我们改进后的智能体开发平台,于上周的 I/O 大会上发布。它允许用户并行管理多个本地智能体并自动化任务。我们的研究团队与 Google 内部多个团队合作,在 Antigravity 中引入了 `/teamwork-preview` 智能体,展示了基于新 Flash 模型的智能体如何执行复杂的长期软件与机器学习工程任务。这预示着开发者生产力新时代的到来,将多天的工程工作压缩至数小时。`/teamwork-preview` 命令工作流会调用一个智能体来优化用户提示词,随后在用户批准后,一个编排器接管任务,衍生出数十个专业化子智能体,自主编写、测试和调试代码,并支持长时间持续运行。在 I/O 大会上,我们演示了该多智能体系统如何从零构建一个可运行的操作系统——由一组自主智能体编写从调度器到内存管理再到文件系统的每一行代码。其他演示还包括实现 AlphaZero 论文,以及通过自我博弈构建出具有竞争力的围棋对弈程序。
开源软件和开放获取数据集是推动现代科学发展的动力。它们是为下一代开创性研究与产品赋能的关键。借助上文提到的 MedGemma 等开放模型和 Groundsource 等开放数据集,以及我们在基因组学、神经科学等领域提供的工具,我们确保创新能成为全球进步的催化剂。今年四月,Google 开源了 Gemma V4——这是我们迄今为止最先进的开放模型,专为推理、编码和智能体工作流而设计。在 I/O 大会上,Gemma V4 宣布在短短一个月内下载量突破 1 亿次。我们的研究团队引入了架构变化和训练策略,在保持相同高效计算足迹的同时,实现了更高的模型质量。这意味着开发者可以在无需更重计算资源的情况下,运行更复杂、更自主的智能体循环。
创新新的隐私和数据保护技术。
在一个由AI智能体代你购物付款、智能眼镜为你所见之处指引方向的世界里,赢得并维系用户信任至关重要。随着AI能力不断增强,隐私和数据保护成为首要任务。多年来,我们开发了隐私保护技术(PPT)来保障用户数据安全。PPT能够从聚合的匿名数据中提取洞察以改进应用,同时提供强有力的保证,确保个人隐私得到保护。例如,我们与Google搜索合作,针对AI模式过去一年的使用情况生成了隐私保护洞察,并于上周分享。近期的隐私创新包括针对用户如何使用聊天机器人和设备端AI的隐私保护聚合洞察,以及对机器学习、大语言模型、分区选择和合成数据生成中差分隐私基础原理的改进。
在实施这些数据保护措施的同时,我们正在利用在高级风险管理推理方面的创新,将其引入Gemini模型,以帮助保护AI生态系统,强化我们的AI系统,使其对新兴风险和漏洞更具韧性。
引领量子计算前沿
我们继续推进量子计算路线图,距离量子计算的实际应用更近一步。
我们率先开发了超导量子比特,并在纠错和可验证量子优越性方面取得了里程碑式成就。正如发表在《自然》杂志上的成果,借助我们的Willow芯片,我们展示了历史上首个实现可验证量子优越性的算法,即运行无序时间关联器(OTOC)算法,我们称之为量子回波。该算法在Willow芯片上的运行速度,比在世界上最快的超级计算机上运行的最佳经典算法快13000倍。今年早些时候,我们扩展了世界领先的量子计算研究,在超导量子比特之外,新增了中性原子量子计算方向——该技术将单个原子用作量子比特。通过对这两种技术路线进行投资,我们能够实现研究突破与工程创新的交叉融合。
在 I/O 大会现场,James Manyika 和 Hartmut Neven 谈到了量子计算与人工智能的交汇。这两项技术具有高度的互补性。人工智能已经在多个方面加速量子计算的进步,从芯片设计到更好的错误纠正。他们还讨论了量子计算在现实世界中使 AI 更有效的巨大潜力,因为量子计算可以比经典计算更接近、更准确地探测自然界在基础层面运作的量子力学原理。
上周,我们启动了“生命科学与量子AI交叉研究项目”(REPLIQA),这是一项向五所大学投入1000万美元的倡议,旨在将先进的量子科学和人工智能应用于生命科学,以改善人类福祉。
结论
在 I/O 大会上分享的突破性进展,标志着一个大胆创新的智能体新时代。其中许多成果展示了从研究到现实的“魔法循环”的力量,推动将不可能变为可能。随着 AI 的进步,这个魔法循环正在加速,使得我们能够研究更大的问题,对产品、科学和社会产生更快、更深远的影响。
感谢为这篇博客以及这里所呈现的工作做出贡献的众多团队和合作者。
快速链接