谷歌在 Canary 频道最新 Chrome 浏览器中引入实验性 Flag,启用后工具栏可嵌入 AI Mode 快捷方式。AI Mode 是谷歌搜索结果页的 AI 对话交互,支持自然语言提问、多轮对话及文件上传分析。用户启用“Contextual Tasks Pin Button In Toolbar”Flag 后,点击按钮将在当前页面右侧弹出侧边栏,可针对浏览内容提问并上传文件。谷歌正测试“Browse with AI”和“Google Search AI Mode”两个暂用名。
谷歌在 Canary 频道最新 Chrome 浏览器中引入实验性 Flag,启用后工具栏可嵌入 AI Mode 快捷方式。AI Mode 是谷歌搜索结果页的 AI 对话交互,支持自然语言提问、多轮对话及文件上传分析。用户启用“Contextual Tasks Pin Button In Toolbar”Flag 后,点击按钮将在当前页面右侧弹出侧边栏,可针对浏览内容提问并上传文件。谷歌正测试“Browse with AI”和“Google Search AI Mode”两个暂用名。
Google Docs中Gemini弹窗可通过点击顶栏“Gemini”并选择“底部栏偏好”关闭底部AI栏。更彻底的方案是进入Gmail设置,在“查看所有设置”中找到“Google Workspace智能功能”,关闭相关开关,即可禁用Gemini弹窗及其他AI建议(如光标处的“help me write”)。
Google 分享了三种集成 A2UI 与 MCP Apps 的架构模式,旨在结合两者优势。A2UI 采用声明式框架,通过 JSON payload 定义 UI,由宿主原生渲染,确保一致性与安全性,但受限于预定义组件库。MCP Apps 在 iframe 中使用标准 Web 技术提供自定义界面,但存在设计碎片化、性能与安全挑战。三种模式包括:通过 MCP 服务器提供 A2UI,利用 MCP Resources 或 Tool 调用传递 JSON,实现“一次编写,原生渲染”的跨平台能力;以及静态与动态交付方案。Google 正考虑扩展 MCP 以原生支持 A2UI。
由自动驾驶领域连续创业者Oliver Cameron(CEO)和Jeff Hawke(CTO)联合创立的世界模型AI公司Odyssey完成3.1亿美元B轮融资,估值14.5亿美元。本轮由Natural Capital领投,Amazon、AMD Ventures、GV等跟投。Odyssey成立于2023年,其世界模型通过人员背负相机采集物理世界数据并模拟真实物理效果。公司提供面向游戏制作和机器人等场景的多款世界模型,以从文本提示生成交互视频而知名。AWS成为首选云服务商,模型将针对AWS Trainium芯片优化。天使投资者包括Jeff Dean、Elad Gil等,累计融资3.37亿美元。
Google推出首款专为Gemini打造的智能音箱Google Home Speaker,售价99.99美元。支持自然语言请求和多步指令,可在说话中途纠正,并具备连续对话功能。内置10种新声音。高级AI功能需订阅Google Home Premium(月费10美元或年费100美元),包括Gemini Live自由对话、Nest摄像头活动摘要等。即日起预售,本月发货。
谷歌去年八月发布的新款智能音箱 Google Home Speaker 现已开启预售,售价 $99.99,6 月 25 日正式开售。扁球体织物外观有淡褐、瓷白、翠绿和浆果红四色。支持 360 度声场,底部环形灯带在语音交互时亮起,配备三个远场麦克风和静音开关。内部搭载四核 A55 处理器及专用 NPU,运行本地 AI 模型提升降噪。仅有一个 58mm 全频驱动单元,音质介于 Nest Audio 与 Nest Mini 之间。可与 Google TV Streamer 配对实现沉浸式音频,兼容其他 Nest 设备。购买附赠六个月 Google Home Premium,启用 Gemini Live 支持连续对话。
Agentic Resource Discovery(ARD)是一项开放规范,用于在Web上发布、发现和验证AI工具、技能与智能体。它基于两个原语:组织在其自有域名下托管catalog描述可用能力,registry作为搜索引擎索引catalog并响应发现请求。ARD支持加密验证,使客户端与端点连接前确认发布者身份,然后直接通过原生协议调用能力。Google Cloud的Gemini Enterprise Agent Platform通过Agent Registry提供企业级支持,包括URN命名、出站策略、工具固定和基于Agent Identity的信任验证。该规范现已发布,开发者可通过托管ai-catalog.json文件使其服务可发现。
今日发表在《自然》杂志上的研究展示了 Google 的医学推理 AI 系统 AMIE(Articulate Medical Intelligence Explorer)从单次诊断对话演进到长期疾病管理的能力。AMIE 利用 Gemini 模型的长上下文能力,整合共情对话智能体和深度思考管理推理智能体,可交叉引用数百页临床指南。在盲测中,AMIE 与 21 名初级保健医生相比,在整体管理推理上匹配临床医生,在计划精确性和指南一致性上得分显著更高。
谷歌发布新一代 Google Home 智能音箱,搭载 Gemini for Home AI 语音助手,支持自然语言交流与多步骤语音指令,用户中途改口也能正确理解。球形设计,360° 环绕音效,麦克风系统可自动调节拾音。硬件:1GB LPDDR4 内存、四核 Cortex-A55 2.0GHz 处理器、4GB 存储,顶部电容触控,3D 织物材质三种配色。可与 Google TV Streamer 组成立体声环绕系统。6 月 25 日上市,定价 100 美元(约 677 元)。
Google Home Speaker 于 6 月 17 日开启预购,6 月 29 日发货,售价 $99。该音箱专为 Gemini for Home 设计,内置本地模型用于降噪和回声抑制,支持 360 度音频,可配对立体声或配合 Google TV Streamer 实现空间环绕声。它还是 Matter 控制器和 Thread 1.3 边界路由器。Gemini for Home 延迟降低 40%,修复超 25,000 个问题,新增 50 余项功能。部分高级功能(如 Gemini Live)需订阅 Google Home Premium($10/月),购买前可获赠 6 个月。
英国住房社区和地方政府部与科学创新技术部部署了两款基于 Gemini 基础模型的生成式 AI 工具。Extract 应用将历史 PDF 中的非结构化数据转为结构化数据集,每年为每个议会节省约 255 小时人工录入。APD 原型自动完成文档整合、法规检查、公众总结和评估报告起草四项任务,但保留人类官员最终决策权。目标将规划申请决策时间缩短 50%。Extract 已扩展至英格兰所有议会,APD alpha 版在三个地方机构测试,计划 2027 年部署至 300 多个英格兰地方当局。
6月17日,谷歌向Pixel Watch 2、3、4正式推送Wear OS 7更新。系统功耗优化使续航比Wear OS 6提升10%。交互新增手机端“实时更新”功能,可追踪外卖、快递状态;无手机时可通过音频切换器管理音乐播放。智能方面,部分2026年发布的手表将获Gemini Intelligence支持,能理解指令、调用应用完成多步骤任务,支持语音创建定制化小部件,并可调用Google Docs、Gmail中的个人数据提供智能服务。
6 月 17 日,谷歌正式推送 Android 17 正式版及 Wear OS 7,首发搭载 Pixel 设备。新系统集成音乐生成模型 Lyria 3、多模态大模型 Gemini Omni 及基于 AudioLM 的语音翻译工具(适配 Pixel 10a)。Pixel 专属更新:Gemini Omni 支持对话中剪辑视频,Lyria 3 可输入文字或图片生成曲目;老款 Pixel 8a、9a 快速分享兼容苹果 AirDrop。系统新增“气泡任务栏”多任务控件、同屏录摄、家长管控及折叠屏 50/50 游戏模式。手表新增车祸、摔倒、无脉搏自动呼救,续航提升 10%,夏季将上线 Gemini 桌面小组件。
Google DeepMind 与英国政府合作,基于 Gemini 构建 AI 规划原型,旨在将家庭规划申请处理时间减半。该工具可整合数据、识别本地政策、总结公众反馈并起草评估报告,但规划官员保留最终决策权。原型已在 Barnet、Camden 和 Dorset 试点,计划 2027 年向全英议会开放。此前推出的 Extract 工具(同样基于 Gemini)已向英格兰所有议会开放,能将非结构化 PDF 转为可用数据,预计为每个议会每年节省约 255 小时人工。家庭规划申请占每年规划申请的近 70%,AI 工具旨在让官员聚焦更复杂的公共利益申请。
柏林法院近日裁定,Google的AI Overviews仅是一种“新的搜索结果格式”,用于汇总第三方内容,而非搜索引擎自身的原创陈述。法院认为普通用户能清楚识别AI是整合其他来源信息,Google对回答内容没有“决定性影响”。该判决源于一家香水公司因商标问题提起的诉讼——AI摘要中出现了其受保护品牌名及平价仿品链接。此前慕尼黑法院在另一起虚假事实案中得出相反结论,认定AI摘要为独立内容,Google须为算法错误负责。两起案件涉及不同法律基础(商标与竞争法 vs. 虚假陈述),上诉结果可能重塑AI搜索的责任边界。
美国国防部通过自建GenAI.mil平台向全军提供Google Cloud的Gemini for Government等生成式AI工具,用于撰写国会要求的年度报告。首席技术官Emil Michael称原本需200小时的工作可压缩至5小时。副助理部长Jacob Glassman也透露团队使用后称“这是五年来最好的报告”。平台用户数从2025年12月的8万激增至2026年6月的150万。但AI报告存在错误风险——KPMG曾因AI生成错误案例而撤回报告,而五角大楼的审查流程尚不透明。
Google 近日发布 Android 17 正式版及 Wear OS 7,率先登陆 Pixel 设备。Pixel Drop 新增 AI 模型支持:音乐生成模型 Lyria 3、多模态 Gemini Omni 及基于 AudioLM 的语音翻译工具(Pixel 10a)。Quick Share 文件分享兼容 Apple AirDrop。Android 17 引入“气泡栏”多任务界面、自拍屏幕录制、折叠游戏模式(50/50 布局与动态手柄)以及“标记为丢失”等安全与家长控制功能。Pixel Watch 新增车祸/跌落/无脉搏自动紧急呼叫。Wear OS 电池续航提升最高 10%,并将在夏季推出更多 Gemini 智能功能。
Google Research 发布 Vectorized Farmscapes 2020 向量化数据集,将英格兰超 130,000 km² 高分辨率栅格地图转化为树篱、石墙、小树林等精细生态特征量化清单。该数据集基于 RSF 的 Vision-Transformer Backbone(在超 3 亿张卫星图像上预训练)微调,融合亚米级影像与 1 米 LiDAR 数据实现双层标注。为突破 247 km² 标注数据限制,采用 Polsby–Popper 紧凑性评分对几何形状功能分类,区分林地、连接廊道与孤立树丛。旨在不侵占农业用地提升碳汇与生物多样性。
2026 年 5 月底,ChatGPT 市场份额降至 46.4%,为发布以来首次低于 50%。Gemini 以 27.7% 紧随其后,Claude 占 10.3%。ChatGPT 仍以超 11 亿月活跃用户领先,Gemini 和 Claude 分别拥有 6.62 亿和 2.45 亿用户。用户在不同助手间切换意愿增强,OpenAI 与美国国防部的合作曾引发卸载高峰。Claude 订阅转化率达 13%,领先行业。OpenAI 已在 ChatGPT 中试验广告,5 月日均 17% 用户看到广告,软件与购物为主要广告类别。ChatGPT 正向 Target、Walmart 等零售商导流,Amazon 因封锁爬虫错失流量。
谷歌今日推出 TPU Developer Hub,面向模型构建者与开发者提供端到端教育资源。内容覆盖预训练、后训练及推理工作负载,涵盖硬件架构、软件栈(XLA、PyTorch 零成本迁移)、追踪调试(XProf 工具)、并行优化(Pallas 内核、KV cache 卸载)及网络安全实践。资源形式包括交互式 Colab、开源代码配方与深度技术文档,支持 AI 智能体辅助集成,帮助用户充分发挥 Cloud TPU 性能。
2026年6月16日,vickiboykis.com 上发布了一篇题为“Running local models is good now”的文章,作者认为当前阶段在本地硬件上运行大语言模型已经能够取得不错的效果。该文章在 Hacker News 社区引发讨论,相关帖子获得 114 点热度,表明本地模型运行体验得到了社区的认可。
Google Cloud 发布 Open Knowledge Format (OKF) v0.1,一种供应商中立的 Markdown 规范,为 AI 智能体提供结构化上下文知识。OKF 将知识表示为带 YAML 前置元数据的 markdown 文件目录,每个概念对应一个文件,通过 type、title、description 等少量保留字段实现互操作。无需专有服务、SDK 或运行时,目录可托管在 GitHub、以 tarball 传输或挂载到任意文件系统。OKF 旨在解决组织内部知识碎片化问题——表结构、指标定义、runbook 等散落在不同 catalog 和 wiki 中,各厂商方案互不兼容。遵循最少意见原则,只强制 type 字段,生产者和消费者可独立实现。使用场景包括数据团队将 BigQuery 表定义导出为代码、为智能体存储 incident runbook、跨组织知识交换等。
谷歌更新Android Bench榜单,GPT-5.5以74分居首,GPT-5.4与Gemini 3.1 Pro Preview并列第二(72.4分),Claude Opus 4.7(68.7分)和Opus 4.6(66.6分)分列第四、第五。谷歌自家Gemini 3.5 Flash仅获63.7分排第六,平均Token消耗3.559亿,单次运行成本147.1美元,为榜单最贵模型。成本仅为其约1/3的Gemini 3.1 Pro Preview性价比更高。DeepSeek V4 Flash以52.7分排第12,单次运行成本仅8.4美元,后者成本仅为前者的1/17.5。
谷歌CEO桑达尔·皮查伊在斯坦福大学毕业典礼上发表演讲,全程未提及人工智能。他坦言,许多人建议他避开这一话题,因为此前多位高管(如前CEO施密特)在毕业演讲中谈AI时曾遭学生嘘声和离场抗议。皮查伊鼓励毕业生“选择乐观”,并分享自己用“金黄”而非“枯黄”来形容加州景色的经历,以此比喻将不如意之事重新解读为希望。他承认AI将冲击入门级岗位,但强调本届毕业生既是变革的推动者,也将直面其影响。
Google Cloud 发布 Open Knowledge Format (OKF),一种将分散的组织知识标准化为带 YAML frontmatter 的 Markdown 文件的极简规范。OKF 使知识可移植且可直接供 AI 智能体使用,正式化了 Andrej Karpathy 近期推广的 “LLM Wiki” 模式。
谷歌在AI模式中正式推出搜索智能体功能,首批上线信息智能体,可全天候自动监测博客、新闻、社交媒体及实时数据库,覆盖金融行情、商品库存、体育赛事等。用户只需输入“持续为我关注”等句式并补充条件即可设置。相比此前Gemini应用的定时任务(每日或每15分钟一次),新智能体实现即时推送。该功能目前仅面向谷歌AI Ultra订阅用户开放,月费99.99美元或199.99美元,计划今年夏季晚些时候下放至AI Pro订阅档位。
Google Research 提出通过复用淘汰的旧手机来搭建低碳计算平台,相关研究细节已在 research.google 发布。该项目旨在降低计算过程的碳排放,属于可持续硬件利用方向的探索。
用户向 Gemini 提交一个长提示词,五分钟后返回一个功能完整的预览窗口和一条“信道不可恢复损坏”的 Bug 消息。Gemini 提供“修复 Bug”按钮,用户点击后,233 秒内模型自行诊断并解决了“阻塞”和“竞态条件”问题,用户完全无需理解技术细节。整个过程只靠单次提示词驱动。
Google Research 推出 Gemini-SQL2,基于 Gemini 3.1 Pro,可将自然语言转换为可执行 SQL 查询。该模型在 BIRD 基准上达到 80.04% 准确率,大幅领先 OpenAI 和 Anthropic。Google 表示该技术将改进其数据服务的自然语言功能。
生成式AI被宣传将彻底改变电影制作,但至今未出现值得付费观看的AI项目。大多数AI视频模型只能产出短暂且视觉不一致的片段,好莱坞部分重大AI合作也已消失。Google DeepMind使用“Dear Upstairs Neighbors”的概念艺术训练了其Veo和Imagen模型的自定义构建,展示了不同于直接调用通用模型的路径。目前大型制片厂主要产出的仍是短视频垃圾。
谷歌Android平台安全负责人René Mayrhofer辞职,他在5月18日内部告别信中指责公司“丧失道德指针”,批评谷歌悄悄放弃碳中和目标(因AI模型能耗),并与美国战争部签署允许AI用于“任何合法目的”的协议。今年4月下旬谷歌宣布向五角大楼提供AI用于机密工作,2025年2月更新AI原则时移除了不使用AI开发武器或监控工具的承诺。Mayrhofer担忧谷歌AI产品可能被用于针对公民的大规模监控,包括自己和家人。
Google Research发布Gemini-SQL2模型,基于Gemini 3.1 Pro,专攻自然语言转SQL任务。在BIRD单模型赛道执行准确率80.04%,超越此前Gemini-SQL。BIRD涵盖95个数据库、37个专业领域及12751组问题-SQL配对,含脏数据与外部知识需求。业务人员可用自然语言查询营收、流失等指标。谷歌尚未公布API、模型卡或技术报告,亦未确认产品接入。
Google Research 于 2026 年 6 月 12 日发布 Gemini-SQL2,基于 Gemini 3.1 Pro 驱动的文本转 SQL(Text-to-SQL)能力,在 BIRD 单模型排行榜上达到 80.04% 的执行准确率。
谷歌起诉名为“Outsider Enterprise”的中国网络犯罪团伙,指控其利用人工智能技术实施诈骗,受害者达数十万人。该团伙在两周内发送了约 250 万条诈骗短信。
Google 起诉一个名为“Outsider Enterprise”的组织,指控其利用人工智能在两周内发送了 250 万条诈骗短信,导致数十万受害者上当。该组织被描述为中国网络犯罪团伙。
Google Research 在《JAMA Dermatology》发表两项研究,探索 AI 帮助普通人理解自身皮肤问题。一项涉及 2345 名参与者的定量研究显示,AI 辅助显著提升了用户识别皮肤疾病名称的能力,并影响了其就医或自我护理的下一步决策。另一项混合方法研究对比了用户通过 AI 工具与医生对话获取的认知。这些工作基于此前开发的 AI 鉴别诊断模型和 SCIN 数据集,旨在通过高质量信息支持皮肤健康决策。
谷歌对一中国网络犯罪网络提起诉讼。该团伙涉嫌利用 Gemini 创建并运营诈骗网站,目标达数十万人。
Google首次与FBI联合提起诉讼,针对一个涉嫌源自中国的AI诈骗网络;OpenAI同时屏蔽了多个来自中国的隐蔽影响力集群。两家公司均表示,这些操作的目标是美国基础设施和政治辩论。
消息称,谷歌正与三星晶圆代工部门洽谈生产其自研 TPU 芯片。目前谷歌第七代 Ironwood TPU 超 60% HBM 由三星提供。内部人士透露,谷歌推进代号“冰鱼”的 TPU v10,其计算引擎仍由台积电代工,而内存 I/O Die 可能交由三星 2nm 工艺生产。TPU 性能与英伟达 H100 相当,成本降低约 80%。双方尚未签署正式协议。
Anthropic 已签署十多份美国数据中心初步租约,总容量超 1GW,同时寻求谷歌母公司 Alphabet 提供财务担保,传闻谷歌将为其共同设计芯片。2026 年 4 月,谷歌决定向 Anthropic 投资 100 亿美元,承诺后续再投 300 亿美元。作为协议部分,Anthropic 承诺五年内向谷歌云支出高达 2000 亿美元。此外,亚马逊此前已投资 40 亿美元,Anthropic 将在十年内从 AWS 采购超 1000 亿美元算力。