谷歌在2026年I/O开发者大会上推出Coral Board单板计算机,可本地运行Gemma 3模型。该设备搭载基于RISC-V架构的Coral NPU,提供1 TOPS算力,核心为Synaptics Astra SL2619芯片,配备2GHz双核处理器与2GB内存。现场演示了运行Gemma 3 270M模型进行实时翻译、语音控制硬件,以及利用YOLOv8模型追踪水母运动并生成音乐等应用,适用于网络受限、隐私敏感或低延迟场景。
谷歌 DeepMind 首席执行官德米斯·哈萨比斯预测,AGI 研发速度远超预期,最快可能在 2029 年至 2030 年前后出现。作为 AlphaGo、AlphaFold 的主导者,他认为当前 AI 智能体是未来更强智能的预演,随着多模态和自主决策能力成熟,三年内迎来 AGI 关键突破已非科幻。但他同时警示,全球社会对 AGI 到来的准备严重不足,必须提前建立规则与防护机制。
Google Research 在 I/O 2026 大会上展示了其在多个前沿领域的技术进展,包括应用AI、基础机器学习算法以及量子AI等。本次大会的核心主题是展示其在将科学发现与研究成果转化为现实世界影响方面的持续努力。
Apple 正尝试将大型 Gemini 模型集成到 iPhone 中,以支持全新的 Siri 功能。由于模型规模庞大,本地处理可能无法完全实现,因此一个云端组件很可能是必然的选择。
Google 推出 Google Pay & Wallet Developer MCP server,这是一款开放标准工具,旨在将 AI 开发助手和 IDE 安全连接到实时的 API 与账户上下文。开发者无需离开开发环境,即可搜索官方文档、验证 Wallet pass 定义、检查集成状态以及管理商户账户。该集成旨在通过减少上下文切换并提供实时、可靠的 AI 支持来减少开发摩擦,从而加速开发工作流。
Waymo开始向部分用户开放新款Ojai Robotaxi试乘服务,并在旧金山、洛杉矶和凤凰城率先部署第六代Waymo Driver硬件。Ojai是Waymo首款专为Robotaxi设计的车型,由极氪制造,注重乘客体验与无障碍功能。其搭载的第六代硬件传感器数量减少42%,但能力更强,单套硬件成本目标低于20000美元。Waymo目前在11座城市已完成超过2000万次全自动驾驶行程。
Google I/O 2026 发布会上披露了 12 个重要时刻,其中包括 Gemini Omni 和 Gemini 3.5 Flash 等产品的相关消息。
Google Cloud 推出“AI Threat Defense”平台,可自动发现、评估并修补企业系统中的安全漏洞。该平台整合了 Google 部分通过收购获得的技术,旨在快速响应由 AI 加速的网络攻击。
Google在Kaggle举办的Tunix黑客马拉松,挑战开发者利用TPU和有限算力,将小型基础模型转变为通用推理引擎。获胜团队通过多阶段后训练流程实现了这一目标,该流程结合了监督微调(SFT)与GRPO、SimPO等先进对齐技术。比赛结果表明,社区能够借助开源资源成功训练出高能力的结构化推理模型。
Google Pay 正在彻底改造其支付基础设施,以应对即将到来的 AI 智能体交易浪潮。最新更新引入了通用商务协议和新的服务器架构,旨在将 Google Pay 定位为自主智能体而非人类用户执行购买的中央清算所。
Google 在 I/O 大会上发布了新款 Coral Board,这是一款紧凑型单板计算机,专为设备端 AI 设计,可在本地运行 Gemma 3 模型。
YouTube推出一项新的AI功能,用户可以通过输入文字提示词(如特定兴趣、心情或主题)来创建个性化的视频内容流。该功能目前面向美国的YouTube登录用户,支持英语,并可在移动端应用或桌面端使用。用户可以在YouTube主页顶部点击“Your custom feed”选项卡,在AI文本框中输入描述来生成并固定自己的定制内容流。
谷歌AI摘要(AI Overview)频繁出现基础拼写错误,如将“Google”字母数答错、拼错常见单词。谷歌称大语言模型在单词字母计数上存在难题。研究人员解释,因模型基于Transformer架构,将文本拆分为词元(token)处理而非逐字母识别,此属固有缺陷,难以彻底根治。这类错误提醒用户需核实AI生成内容的准确性。
YouTube 更新了 AI 视频标注功能。首先,标注标签位置将更显眼:长视频标签将出现在播放器下方、描述栏上方;Shorts 短视频标签将以覆盖层形式显示在视频上。其次,若系统检测到视频使用了写实类 AI 但创作者未手动声明,系统将自动为其添加 AI 使用标签。创作者可在 YouTube Studio 中更新披露状态。此外,使用 YouTube 自有 AI 工具(如 Veo 或 Dream Screen)创作的内容,以及包含表明其为完全生成式 AI 的 C2PA 元数据的内容,其披露标签将永久显示。
Google I/O宣布AI生成答案现已成为搜索的核心内容,但大多数品牌几乎无法了解AI如何向客户描述他们。这改变了以往依赖10个蓝色链接的SEO策略规则。
谷歌声称用户喜爱其AI搜索模式后,搜索引擎DuckDuckGo的访问量在随后一周内增长了28%。
Google Pay 正向"智能体商务"演进,推出了通用商务协议和新的 MCP 服务器,允许 AI 智能体管理集成与分析趋势。Android 平台更新引入了动态回调以支持快速结账,并通过 WebView 将支付功能扩展至社交媒体应用。此外,平台还推出了跨设备生物认证和新的交易信号,旨在帮助商家减少流程摩擦。
Google Research 推出了一种新的隐私分析解决方案。该方案结合了一种新的密码学安全聚合协议与可信执行环境(TEE)的透明性,旨在实现前沿的隐私与安全保证。其核心是基于零信任原则,通过密码学与硬件保护的结合,确保系统仅能获取群体的匿名化聚合洞察。
YouTube将上线一套新的AI内容标签系统,旨在使标签位置更显眼:长视频的标签将显示在播放器下方,Shorts的标签将作为叠加层显示。从2026年5月开始,该平台将启动自动检测系统,即使创作者未主动披露,也会对AI生成内容进行标记。该系统对视频的推荐和变现没有影响。
Google正在将展示广告整合到其AI驱动的Demand Gen平台中,这标志着一个长期存在的数字广告模式的终结。Google展示网络(GDN)作为开放互联网的支柱已近二十年。此前,营销人员依赖其可预测的框架来定位广告位、竞标受众并进行静态创意的A/B测试。此次整合意味着广告投放将转向由AI主导的模式。
YouTube重新设计了AI标签的位置,使其更易被发现。对于普通视频和Shorts,标注AI生成内容的标签现在直接显示在视频播放器下方、描述文字之上。同时,平台将开始自动识别并为AI生成的内容添加标签。
Google DeepMind推出Gemini Embedding 2,这是一款原生多模态嵌入模型,支持在统一表示空间中嵌入视频、音频、图像和文本。该模型利用Gemini的多模态能力,通过大规模对比学习实现SOTA性能。在关键基准上表现优异:MSCOCO取得62.9 R@1,Vatex取得68.8 NDCG@10,MTEB multilingual达到69.9,MTEB Code达到84.0,超越了专用模型。其统一能力使其适用于RAG、推荐与搜索等下游任务,并在天文学、生物科学、艺术和烹饪等专业领域展现出强大的零样本性能。
本文对Gemma 3系列模型(1B-27B参数)上的线性探针欺骗检测方法进行系统测试。研究发现,该探针在干净数据上AUROC可达0.998以上,但在8种文本风格变换下性能崩溃。文章检验了四种欺骗信号的几何编码假设:单一线性方向、多维子空间、凸锥包及熵代理假设,均被拒绝(如单方向假设AUROC仅0.61-0.80)。然而,经过风格数据增强训练的探针(维度k≥5)在未见过的风格上能恢复近乎完美的检测能力(平均AUROC 0.979-0.983),且此模式在4B和27B模型上均成立,表明探针的脆弱性源于训练数据分布狭窄,而非模型规模局限。
Google 在 I/O 2026 大会上用 AI 智能体彻底重构了其搜索服务,取消了传统的蓝色链接。此举引发强烈用户反弹,数据显示 DuckDuckGo 应用下载量因此暴涨了 30%,反映出用户正积极寻求替代方案。
文章展望了截至2026年5月AI领域的动态。内容涉及 Gemini Flash 3.5 的发布、名为 Mythos 的新产品或项目、开源与闭源生态平衡(open-closed balance)的讨论、美国开源力量的显著增长(America's open-source surge),以及由此引发的新兴权力博弈(emerging power struggles)。
Google 与 Alphabet CEO Sundar Pichai 在 Google I/O 后受访,回顾了公司为应对 ChatGPT 而进行的战略重组与高管调整。访谈聚焦于新的 Gemini 模型及其在产品中的整合,包括全新的智能搜索框与 Gemini Spark 智能体平台,旨在让搜索从提供结果转向启动任务。Pichai 讨论了这些变化对开放网络的持续冲击,回应了主持人此前提出的“Google Zero”概念(即来自 Google 的网站流量可能归零),并提及 Google 正利用 YouTube 视频训练模型以改变视频搜索与索引方式。最后,他对 Google DeepMind CEO Demis Hassabis 关于“处于智能奇点起步阶段”的言论表示认同,并分享了对 AGI 时间线的看法。
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》Google Cloud首席运营官Francis de Souza强调,企业必须从AI战略的初始阶段就将安全性内建,将AI安全议题提升至董事会层面的战略高度,而不仅仅作为技术或机房层面的运维问题。
谷歌Gemini调整AI计费方式后,用户不满情绪升温。新规将配额计算从“每日提示词次数”改为“按算力计费”,并纳入请求复杂度、功能调用及聊天历史长度。有用户展示,其Google AI Pro订阅(月费20美元)在使用率为0%时,输入1条简单提示词生成视频,仅耗时约3~4分钟便消耗完5小时配额。Gemini负责人已关注此事并表示将调查。
澳大利亚用户反馈,智能家居版 Gemini for Home 在摄像头画面中出现识别错误:将猫误判为浣熊,把袋鼠和沙袋鼠错误归类为“人”,并将当地常见的多用途车辆 ute 统一标为普通卡车。用户表示即使已开启个性化功能并设置位置为澳大利亚,这些误识别问题仍持续出现。
谷歌针对Antigravity用户抱怨额度消耗过快,推出了新模型Gemini 3.5 Flash(Low)。该版本通过调整推理投入强度,处理简单任务时的token消耗比Medium版本减少约45%。同时,谷歌重置了所有免费和付费Gemini计划的配额。
Google DeepMind 的 AlphaProof Nexus 自主解决了 9 个开放的 Erdős 问题,其中包括两个困扰数学界 56 年的难题。其推理成本低至每个问题仅需几百美元。系统通过 Lean 编译器验证每个证明步骤,而非使用 OpenAI 的自然语言方法。当前的整体问题解决成功率为 2.5%。
同一事件,精选展示《AlphaProof Nexus:用形式化验证驱动AI数学证明搜索》近期多位科技公司高管在毕业典礼上因乐观谈论AI而遭遇学生嘘声。皮尤研究中心调查显示,约一半美国人对AI进入日常生活感到担忧超过兴奋。与此同时,美国应届毕业生失业率已升至4年来最高水平。谷歌CEO皮查伊表示,人们焦虑“完全合理”,但自己仍对年轻一代“非常乐观”。英伟达CEO黄仁勋则认为AI最终会带来积极影响。