Ads Advisor 集成三项全新的代理式安全与政策功能,全面升级 Google Ads 账户的安全防护与操作效率。这些智能化功能通过自动化安全机制和策略优化,在强化账户风险保护的同时简化管理流程,帮助广告主更快速地识别潜在威胁并确保合规投放。新方案兼顾安全性与便捷性,旨在为用户提供更流畅的广告管理体验,有效降低安全风险并提升整体运营效率。
Ads Advisor 集成三项全新的代理式安全与政策功能,全面升级 Google Ads 账户的安全防护与操作效率。这些智能化功能通过自动化安全机制和策略优化,在强化账户风险保护的同时简化管理流程,帮助广告主更快速地识别潜在威胁并确保合规投放。新方案兼顾安全性与便捷性,旨在为用户提供更流畅的广告管理体验,有效降低安全风险并提升整体运营效率。
谷歌联合创始人谢尔盖·布林亲自督战DeepMind组建精英团队,专攻Gemini模型的复杂编程能力以追赶Anthropic。该团队由Sebastian Borgeaud领导,致力于攻克从零编写软件等长周期编程挑战。布林在内部备忘录中强调必须缩小与Anthropic在Agent执行方面的差距,强制要求Gemini工程师使用内部智能体工具处理复杂任务,并通过追踪编程工具"Jetski"使用率对团队排名。他认为强大编程能力是AI自我改进的基石,目标是将模型转化为主要代码开发者,实现AI研究流程的自动化。
谷歌拟于5月16日发布无屏健身手环Fitbit Air,预估售价99美元(约676元人民币),提供曜石黑、薰衣草紫、浆果红三种配色及多款表带可选。该设备取消屏幕设计,依靠触觉反馈与手机通知交互,支持实时心率监测、睡眠分析及基础活动追踪。产品深度集成Google Health平台,并搭载AI个人健康教练服务,定位与Whoop竞争。
谷歌将于本周Cloud Next大会发布TPUv8系列AI芯片,采用双芯片策略全面取代TPUv7。其中TPUv8t(代号Sunfish)由博通设计,专注高性能训练;TPUv8i(代号Zebrafish)由联发科操刀,主打高性价比推理。新系列将集成基于Neoverse N3架构的Axion Arm CPU。值得注意的是,此前传闻参与的Marvell未出现在设计名单中,显示谷歌调整了合作伙伴策略。
Google 正加倍投入 AI 编程领域,组建精英团队以缩小与 Anthropic 的编程能力差距。公司联合创始人 Sergey Brin 再次亲自挂帅,领导开发能够自我改进的 AI 模型。该团队押注于可自主优化代码的系统,通过模型自我迭代技术维持 Google 的 AI 竞争力,应对当前激烈的市场格局。
Google 正与芯片设计公司 Marvell 深入洽谈,计划为其数据中心开发两款新的专用AI芯片,预计部署总量接近200万块。据 The Information 援引两位消息人士报道,Google 正通过引入 Marvell 的定制设计能力,加速AI基础设施扩张,以满足日益增长的AI计算需求。
开发者发布了一个基于 Gemma 4 和 E2B 的 Prompt-to-Excalidraw 浏览器演示,支持通过自然语言提示直接生成 Excalidraw 手绘图表。该方案将 3.1GB 的 Gemma 4 模型完全部署在浏览器端本地运行,借助 E2B 沙箱环境实现前端 AI 推理,无需后端服务器支持。项目在 Hacker News 获得 101 个赞。
Google 推出 A2UI 0.9,这是一项框架无关的生成式 UI 标准,支持 AI 智能体实时生成界面元素并直接调用应用现有组件库。该标准兼容 Web、移动端等多平台,使 AI 代理能够跨平台动态构建用户界面,无需为不同终端单独开发前端代码。
Google 正将 AI 模式深度整合至 Chrome 浏览器,即将推出的新功能可使网站内容直接在 AI 回复旁打开,无需用户点击进入原始网页。这一改变进一步削弱了传统页面直接访问的必要性,意味着用户未来或可通过 AI 交互直接获取信息,而无需访问原始网站。
Google 针对暑期出行场景发布七项智能旅行新功能,帮助用户优化行程规划、筛选高性价比方案并探索目的地。这些工具整合最新技术,提供从行前规划到实地探索的全流程支持,旨在提升旅行效率、降低出行成本,为用户带来更便捷、智能的今夏旅行体验。
Google正将AI模式深度整合至Chrome浏览器,未来网站内容将直接展示在AI回复旁边,用户无需点击链接即可浏览网页。这一功能进一步削弱了传统网页访问的必要性,意味着用户可在不离开搜索界面的情况下获取信息,标志着Google在AI搜索体验上的重大转变,可能彻底改变用户获取网络内容的方式。
Google 正式发布 Android CLI 命令行工具,允许开发者通过任意代理构建 Android 应用,官方数据显示构建速度较传统方式提升 3 倍。该工具为 Android 应用开发提供了更高效的构建方案,支持灵活的代理配置,能够显著缩短开发迭代周期,提升整体开发效率。
Google 推出原生 Gemini Mac 端应用,这是该 AI 助手首次发布桌面版本,打破了此前仅支持智能手机端的局限。作为 Google 桌面 AI 战略的重要一步,该应用专为 macOS 系统原生开发,与现有移动端应用形成互补。此次发布标志着 Gemini 正式完成从移动平台到桌面平台的关键跨越,用户现可直接在 Mac 设备上获得完整的本地 AI 助手体验。
一名开发者在Google AI开发者论坛披露,其Firebase项目的浏览器密钥因未设置API访问限制,短短13小时内被恶意调用Gemini API,导致账单激增5.4万欧元。该事件暴露了客户端API密钥配置不当可能引发的巨额成本风险,警示开发者需严格限制密钥权限。
Google官方宣布Gemini应用正式登陆macOS平台,Mac用户现可直接下载使用该AI助手。此次发布标志着Google在桌面端AI布局的重要进展,为用户提供原生Mac体验,支持快捷键快速调用AI功能。该消息在Hacker News技术社区获得100个点赞关注。
Google 推出 Gemini 3.1 Flash TTS 文本转语音模型,支持超过70种语言的自然语音合成。该模型引入音频标签功能,允许用户精确控制输出语音的风格、语速和语调,显著提升了语音合成的表现力和可控性,适用于多语言内容创作场景。
OpenAI 在欧洲的 Stargate 基础设施布局明显收缩。2025年7月,CEO Sam Altman 曾乐观预计将该巨型项目落地挪威纳尔维克,但数月后这一预期已大幅消退。随着 Microsoft 和 Google 接管了原本规划的数据中心容量,OpenAI 被迫缩减其欧洲算力扩张计划。
Google Chrome推出一项新功能,支持用户将常用AI提示语保存并转化为浏览器内的一键式工具,实现复杂指令的快捷调用,减少重复输入操作。该功能旨在提升AI工具的使用效率,目前Google已在官方博客发布技术详情,相关动态在Hacker News平台获得101点热度关注。
Google 为 Chrome 浏览器新增名为"Skills"的功能,允许用户将常用 AI 提示词保存为可一键调用的可复用工具。用户无需重复输入相同指令,只需预先保存即可在任意网站快速应用。Google 同时提供针对日常任务的预设技能库,帮助用户简化操作流程,提升浏览效率。
Google 在华盛顿特区举办 AI for the Economy Forum,汇聚各界人士共同探讨人工智能与经济发展的关键议题。该论坛旨在搭建多方对话平台,促进关于 AI 技术如何驱动经济增长、重塑劳动力市场及推动产业创新的深度交流,助力构建包容且可持续的 AI 经济生态,体现科技巨头在推动负责任人工智能发展中的积极作用。
Google Research发布实验性评估工具Vantage,通过生成式AI模拟多人协作场景,测试学生的批判性思维与协作等"未来就绪技能"。系统由Executive LLM驱动AI化身,在对话中动态引入冲突以收集能力证据,再由AI Evaluator实时评分。与纽约大学的联合研究显示AI评分与人类专家水平相当,188名18-25岁测试者参与了验证。该项目现已上线Google Labs。
Google 面向 Ultra 订阅用户推出 Veo 3.1 Lite 视频生成选项,允许用户在现有订阅权益内免费使用该功能,无需额外扣减积分。Veo 3.1 Lite 作为轻量化视频生成模型,为订阅者提供了更具成本效益的内容创作方案。此次更新降低了高级 AI 视频工具的使用门槛,Ultra 用户可直接调用该功能而无需担心积分消耗。
Google Research发布MoGen神经元形态生成模型,利用点云流匹配技术将随机三维点云转化为逼真神经元几何结构。在PATHFINDER重建模型训练中加入MoGen合成神经元后,错误率降低4.4%,主要减少神经元合并错误,相当于为完整小鼠大脑测绘节省157人年手动校对时间。这是生成式AI首次用于提升连接组学重建精度,盲测显示专家无法区分合成与真实神经元片段。
开发者已在 Codex CLI 中成功运行 Gemma 4 作为本地模型,实现无需云端连接的离线代码辅助功能。该技术方案将谷歌开源大模型与命令行编程工具集成,允许用户在本地环境直接调用 AI 完成代码生成与编辑任务,为注重数据隐私和低延迟需求的开发场景提供了替代方案。
研究人员对Google Gemini 2.5 Flash和Flash Lite在视频场景理解中的内部推理轨迹(思维流)进行基准测试,基于100小时视频提出内容丰富度、思维-最终输出覆盖率和主导实体分析三项指标。实验发现,增加思考长度带来的质量提升在最初几百个token后迅速趋于平缓,Flash Lite在质量与token消耗间达到最佳平衡。研究还揭示,当推理预算受限时,模型会在最终输出中添加未经推理的内容,产生"压缩步骤幻觉";Flash倾向于讨论推理过程,而Flash Lite更专注于场景描述。
研究者提出隐私主题挑战ToM-SB,要求防御模型充当双重特工,利用心智理论引导攻击者信念,使其误判已获取敏感信息。测试显示Gemini3-Pro和GPT-5.4在硬场景下难以欺骗攻击者。通过强化学习发现,欺骗能力与心智理论存在双向涌现关系:单独优化任一方均可提升另一方。结合两种奖励的AI双重特工在四种攻击者强度和OOD测试中全面超越前沿模型,验证信念建模是任务成功的核心驱动力。
研究团队系统评估了10个语言模型在6种语言上的多语言合成数据生成能力,生成140万SFT样本并训练240个学生模型,提出Polyglot Score指标衡量教师模型效果。结果显示Gemma 3 27B和Aya Expanse 32B跨语言表现最佳,而模型规模并非决定因素;提示多样性、长度和回答流畅性等数据质量指标可解释93.3%的质量方差。研究建议匹配师生模型家族并复用现有提示以提升低资源语言效果。
Google Research 发布 ConvApparel 数据集与评估框架,用于量化 LLM 用户模拟器的"真实感差距"。该数据集包含 4000 余组服装购物多轮对话,采用"好/坏"双智能体协议收集,涵盖从满意到恼怒的全谱系用户行为。框架通过反事实验证测试模拟器对意外糟糕体验的适应能力,解决现有模拟器过于耐心、知识过剩等不现实问题,为训练更鲁棒的对话智能体提供可信的 AI 测试基准。
Google Cloud推出PaperVizAgent与ScholarPeer两款学术AI智能体。前者通过检索、规划、风格、可视化与批判五个专门智能体协作迭代,将论文文本转化为符合发表标准的图表,综合评分(60.2)显著超越人类基线(50.0)及GPT-Image-1.5等模型;后者模拟资深审稿人流程,动态构建文献背景并验证基线,实现基于实证的自动化同行评审。
Anthropic宣布与Google、Broadcom达成新协议,将获得多千兆瓦下一代TPU算力,预计2027年上线。这是其迄今最大的算力投资,用以支持Claude模型及激增的客户需求。数据显示,Claude年收入运行率已突破300亿美元,年消费超百万美元的企业客户两个月内从500家翻倍至超1000家。新设施主要位于美国,符合其500亿美元投资美国基础设施的承诺。公司强调将继续保持多硬件平台策略,AWS仍是主要云服务商。
Gemma 4 的发布揭示了开放模型成功的真正标准。文章指出,决定模型成败的关键并非基准测试分数(benchmark scores),而是其他因素。当前 AI 领域过度关注 leaderboard 排名,但高分数不等于实际应用价值与社区采用率。真正的成功取决于模型解决真实场景需求的能力、开发者友好度以及生态建设,而非单纯的技术指标领先。这一观点挑战了以 benchmark 为导向的行业评估范式。
关联讨论 1 条X:Francois Chollet (@fchollet)Google Vids 接入 Lyria 3 与 Veo 3.1 模型能力,新增免费 AI 视频生成功能,用户可无成本创建、编辑和分享高质量视频。
Google 为 Gemini API 新增 Flex 和 Priority 两个推理层级,帮助开发者在成本与延迟之间灵活取舍。
Google Research 提出系统性评估框架,将标准化心理学问卷(如 IRI、ERQ)转化为情境判断测试,量化 LLM 行为倾向与人类共识的偏差。研究测试了25个模型,发现小模型(<25B)一致性显著较低,且模型存在两种偏差:偏离人类共识、未能覆盖人类观点的多样性。该框架通过真实场景(如职场冲突、日常决策)评估模型行为,为改进 LLM 社交互动能力提供依据。
Google DeepMind 发布了 Gemma 4 系列开源模型,旨在直接在设备端实现多步骤规划和自主智能体工作流。该版本包含用于实验“智能体技能”的 Google AI Edge Gallery,以及为开发者提供显著速度提升和结构化输出的 LiteRT-LM 库。Gemma 4 采用 Apache 2.0 许可,支持超过 140 种语言,并兼容移动设备、台式机及树莓派等多种物联网硬件平台。
Google 正式发布了 Gemma 4,这是一款前沿的多模态人工智能模型,其核心特点是能够在设备端本地运行。该模型通过开源方式发布,旨在推动人工智能技术的进步与民主化。Gemma 4 的“在设备端”能力意味着数据处理可在本地完成,无需持续连接云端,这有望提升响应速度、增强隐私保护并实现离线使用。此举是 Google 通过开源和开放科学来普及人工智能的持续努力的一部分。
Google 发布2026年3月人工智能更新回顾,通过信息图形式汇总当月产品发布与技术进展,展示公司最新 AI 成果。
Agent Development Kit (ADK) SkillToolset 推出了“渐进式披露”架构,使AI智能体能够按需加载领域专业知识,与传统单体提示相比,可减少高达90%的令牌使用量。该系统通过四种模式——从简单的内联清单到智能体可自行编写代码的“技能工厂”——使智能体能在运行时利用通用的 agentskills.io 规范动态扩展其能力。这种模块化方法确保了复杂的指令和外部资源仅在相关时被访问,从而为现代AI开发构建了一个可扩展且能自我扩展的框架。
Veo 3.1 Lite 现已开放付费预览,作为 Google 成本效益最高的视频生成模型,支持通过 Gemini API 调用及 Google AI Studio 测试。
Orbax 和 MaxText 引入了连续检查点新功能,旨在优化模型训练中可靠性与性能的平衡。它改变了传统固定频率检查点的模式,通过在前一个保存操作成功完成后才异步启动新操作,最大化I/O带宽并降低故障风险。基准测试表明,该方法显著缩短了检查点间隔,并实现了可观的资源节约,这在平均故障间隔时间较短的大规模训练任务中效果尤为突出。