华盛顿邮报调查显示,多数主流AI聊天机器人在政治问题上明显偏左。OpenAI GPT-5.5在80%回答中仅呈现左派论据;DeepSeek V4 Pro为70%;Anthropic Claude Opus 4.8有43%纯左、57%给出双方观点。xAI的Grok 4.3左倾回答仍多于右倾。右翼平台Gab的Arya左倾回答是右倾的12倍。Google Gemini 3.1 Pro是例外,93%回答同时呈现双方立场。特朗普推动的“反觉醒”AI未能改变这一格局。
华盛顿邮报调查显示,多数主流AI聊天机器人在政治问题上明显偏左。OpenAI GPT-5.5在80%回答中仅呈现左派论据;DeepSeek V4 Pro为70%;Anthropic Claude Opus 4.8有43%纯左、57%给出双方观点。xAI的Grok 4.3左倾回答仍多于右倾。右翼平台Gab的Arya左倾回答是右倾的12倍。Google Gemini 3.1 Pro是例外,93%回答同时呈现双方立场。特朗普推动的“反觉醒”AI未能改变这一格局。
Google Research提出一种新架构,在已冻结的Gemini Nano v3模型上改造Multi-Token Prediction(MTP),以加速Pixel 9和10系列上的设备端推理。该方法基于EAGLE框架和CALM,无需单独训练占用内存的草稿模型,通过“晚期退出”策略实现加速。AI通知摘要和校对功能因此生成文本速度显著提升、能耗降低,开发者无需为每个新任务微调独立模型。
知情人士透露,谷歌正对其主攻AI编程工具的专项攻坚小组进行重组,调整模型训练思路,既要提升代码能力,也要强化生成演示文稿等其他场景能力。重组发生在乔纳斯·阿德勒和亚历山大·普里策尔计划离职并转投Anthropic之后,两人均为Gemini模型关键贡献者。近期谷歌流失人才还包括诺贝尔奖得主约翰·詹珀(同样跳槽Anthropic)以及Gemini联席负责人诺姆·沙泽尔(将加盟OpenAI)。另据消息,谷歌下一代前沿模型Gemini 3.5 Pro发布时间已推迟至7月。
据Bloomberg报道,Gemini模型关键人物Jonas Adler(AI编程方向)和Alexander Pritzel(训练方向)计划加入Anthropic。此前诺贝尔奖得主John Jumper已转投Anthropic,Gemini负责人Noam Shazeer则去了OpenAI。离职引发投资者担忧,拖累Alphabet股价。原因之一是Anthropic与OpenAI均临近IPO,能提供丰厚股权激励。SignalFire分析显示,DeepMind工程师流向Anthropic的频率是反方向的11倍。Google DeepMind CEO Demis Hassabis在戛纳活动上回应称,Google拥有业内最深厚的AI研究团队。
Google将“Computer Use”功能直接集成到Gemini 3.5 Flash,模型可自主看、理解并操作电脑、浏览器和移动设备,此前该功能仅作为独立Gemini 2.5模型提供。结合函数调用、Search和Maps等工具,开发者可构建跨平台智能体,用于软件测试或办公自动化。在OSWorld基准测试中,Gemini 3.5 Flash得分78.4,高于Gemini 3 Flash(65.1)和GPT-5.4 mini(72.1),略低于GPT-5.5(78.7),Anthropic的Opus 4.8以83.4领先。安全方面采用对抗训练和两项可选企业防护:敏感操作需用户确认、自动阻止间接提示注入。该功能通过Gemini API和Gemini Enterprise Agent Platform提供,附带Browserbase演示和GitHub参考实现。
谷歌升级 Gemini 3.5 Flash 模型,原生引入“Computer Use”工具,并搭配 Chrome 149 浏览器增强 AI 交互。Chrome 新增“Select from screen”功能,用户可框选屏幕上的图片或文字,直接送入 Gemini 提示词,获得针对性 AI 交互,例如在鞋类网站选中多双运动鞋询问适合的跑步风格。该功能类似 Google Lens,但由对话式 AI 处理。Computer Use 工具使 AI 智能体能在网页、桌面、移动端执行访问网站、填写表单、点击按钮等复杂任务。
顶尖AI研究员乔纳斯·阿德勒与亚历山大·普里策尔即将离开谷歌,加入Anthropic。二人为谷歌Gemini大模型研发核心骨干。此前传奇研究员诺姆·沙泽尔离职转投OpenAI,谷歌曾以27亿美元收购其创立的Character.AI并请回主持Gemini研发。数日后,谷歌DeepMind主管、2024年诺贝尔化学奖得主约翰·江珀也宣布跳槽至Anthropic。随着OpenAI与Anthropic筹备上市,通过股权期权吸引顶尖研究者的趋势或延续。
据 Business Insider 获悉,谷歌下一代大语言模型 Gemini 3.5 Pro 原定 6 月上线,现推迟至 7 月,以收集更多早期测试用户反馈并进行优化。该模型在 5 月 I/O 开发者大会预告,CEO 皮查伊称将于“次月”发布。部分用户已通过谷歌“Antigravity”平台及 LMArena 进行体验。新模型预计在长文本任务和驱动 AI 智能体方面提升性能,并融入了 Flash 3.5 用户反馈,包括 token 消耗过快问题。
据Bloomberg报道,顶尖AI研究员Jonas Adler和Alexander Pritzel离开Google加入Anthropic,二人曾参与Gemini模型开发。上周,传奇研究员Noam Shazeer(曾创立Character.AI,后Google通过收购将其带回)宣布离开Google加入OpenAI。几天后,Google DeepMind总监John Jumper(因AlphaFold获2024年诺贝尔化学奖)也离职加入Anthropic。报道指出,随着OpenAI和Anthropic筹备上市,这一人才流失趋势可能持续。
Google 将计算机使用(Computer use)作为内置工具集成至 Gemini 3.5 Flash,使开发者能构建跨浏览器、移动端和桌面环境的智能体。此前该功能仅作为独立模型在 Gemini 2.5 中提供,现已原生整合至主 Flash 模型。开发者可通过 Gemini API 及 Gemini Enterprise Agent Platform 调用。安全方面,模型采用针对性对抗训练降低提示注入风险,并新增两项可选企业级保护:要求用户确认敏感操作、检测到间接提示注入时自动停止。该能力在持续软件测试、跨应用知识工作等长周期企业自动化场景中表现更优。(198字)
关联讨论 1 条X:Google AI for Developers (@googleaidevs)Google DeepMind 宣布,computer use 现作为内置工具集成于 Gemini 3.5 Flash,开发者可构建跨浏览器、移动端和桌面的智能体,实现视觉感知、推理与操作。此前该功能仅以独立模型形式存在于 Gemini 2.5。3.5 Flash 已支持函数调用及 Search、Maps 等内置工具,新增的 computer use 可提升持续软件测试和跨专业应用知识工作等长周期企业自动化任务的性能。安全方面采用针对性对抗训练,并可选配两项企业防护系统:要求用户确认敏感操作,以及在检测到间接 prompt 注入时自动停止任务。可通过 Gemini API 和 Gemini Enterprise Agent Platform 使用。
关联讨论 1 条X:Google AI for Developers (@googleaidevs)Google Research研究发现,推理(chain-of-thought)能帮助大语言模型(LLM)回忆简单事实,即使这些事实无需复杂推导。在Gemini-2.5 Flash和Pro以及Qwen3-32B上,启用推理后模型能够回答原本无法直接回答的简单问题,pass@k显示正确事实存在于输出分布中。该现象由两个机制驱动:一是生成的推理token充当计算缓冲,允许模型进行隐藏计算以提取参数化知识;二是推理过程中产生的相关事实起到启动效应(factual priming),帮助模型激活正确答案。
Google 新款 Home Speaker 售价 99 美元,体积小巧但音质饱满,低音优于同尺寸的 UE Wonderboom,清晰度和响度均超过 Amazon Echo Dot Max。配备三个麦克风,唤醒词识别灵敏,即便在淋浴中也能响应“Hey, Google”。外观呈彩色毛线球状,无可见按键;音量可通过点击左右侧调节,但触控区域小且方向不直观,顶部播放/暂停触控正常。灯光环隐藏于底部,反馈不够明显。不支持标准蓝牙,可通过 Google Cast 串流或与 Google TV Streamer 配对。内置 Gemini 智能助手,可用于控制家居、规划日程和查询信息。
Google Home 将从 6 月 23 日起更新面部识别功能:当人脸不清晰时,可通过“非生物识别信号(体型、衣服颜色等)”继续识别已在 Familiar Faces 库中标记的人。该库还将自动更新家庭成员的最新照片。AI 生成的事件描述新增识别特定声音(狗叫、警报、脚步声)的能力,即使声音来自摄像头外。同步发布的 Google Home 应用 4.20 版加入了 Nest 恒温器检测到的 HVAC 系统健康警报,并改进了 Matter 开关支持。
售价 99 美元的 Fitbit Air 是一款轻便手环,续航出色(一个月仅充电三次,45 分钟可充至 85%),支持心率、睡眠、血氧、准备度等指标。核心亮点是与 Google Health 绑定的 AI 健康教练,基于 Gemini 驱动,每日推送睡眠与准备度总结及行动建议,可解读数据趋势并生成旅行健身计划,但不提供诊断。该教练需 $99/年 Premium 订阅,且不独占于 Air。作者认为多数 AI 健康功能是“糟糕的贴金捞钱”,但 Google Health Coach 是其中最接近不糟糕的一款,前提是用户愿意投入大量精力进行引导。
欧洲自由软件基金会(FSFE)于6月15日向欧盟委员会提交意见,要求依据《数字市场法》加强管控谷歌安卓系统。FSFE指出,谷歌在未明确告知用户的情况下悄然安装AI模型,用户卸载后仍会重装,违反法案。建议欧盟施压谷歌整改AOSP,让用户完整移除预载AI组件,禁止未经知情重新安装或激活。同时要求谷歌扩展安卓互操作性,不应以注册、授权或签订合同为前提。此外,谷歌拟于2026年9月上线的开发者验证计划要求开发者登记并付费才能发布应用到F-Droid等替代商店,FSFE认为这对自由软件开发者不利。
Oracle披露过去12个月裁员2.1万人(13%),AI是原因之一;5月科技裁员创单月新高,AI最常被引用。GitLab裁员350人(14%)以资助AI基础设施;Google通过绩效评估和买断计划裁减Cloud部门,估计2026年裁减1500-3000+工程师;Intuit裁员3000人(17%);Meta裁员8000人(10%)并转岗7000人;Cisco裁员近4000人(5%)聚焦AI;Cloudflare裁员1100人(20%)。
Google DeepMind 宣布 Interactions API 正式可用,成为 Gemini 模型和智能体的默认接口。该 API 自 2025 年 12 月进入 Beta 测试,现取代 Google AI Studio 和文档中的旧 generateContent 接口;未来新智能体功能仅通过它提供。近期新增功能包括:自带 Linux 沙箱的 Managed Agents、后台执行、Google 搜索与地图工具链、图像/音乐/语音媒体生成。架构从旧的 "user"/"model" 角色简化为 typed steps,每步动作独立定义。开发者可选择 Flex 模式(成本降低 50%)或 Priority 模式(优化速度)。
一篇技术博客展示了如何用 Google Agent Development Kit (ADK) 与 Agent2Agent (A2A) 协议搭建跨语言多智能体流水线:Python agent 调用 Gemini 解析合同条款,Go agent 用纯确定性逻辑校验合规性。A2A 协议通过 Agent Card 实现能力发现、JSON-RPC 2.0 完成通信、Task 状态机管理任务生命周期;ADK 的 RemoteA2aAgent 抽象可将任意 A2A 兼容服务封装成本地子智能体。文中强调将单体提示词分解为专业化微智能体,以解决上下文退化、故障爆炸半径和不可测试性问题。完整源码已在 GitHub 发布。
Google Labs 提出以“洞察策略”评估 AI 编码智能体的主动性,而非仅按任务完成度打分。团队基于 Google 内部代码库 705 个 bug(1178 个 CL),通过时空近邻与语义相似度聚类还原开发者实际的高层级目标。初步实验显示:Jules 在单轮探索下洞察相关性评分平均 4.5/5;探索预算从两轮增至三轮时,Hit@5 准确率从 33% 升至 57%。团队正将评估方法扩展至公开 GitHub 数据,并探索纳入问题追踪器、对话等更丰富的上下文。
谷歌 DeepMind 杰出工程师、Gemini 预训练负责人弗拉基米尔·费恩伯格在博客中指出,进入 OpenAI、Anthropic 等前沿 AI 实验室竞争激烈。顶尖大学生通常具备目标感、数学成熟度和毅力三项特质。他建议选择困难数学证明课程、大量编程,并牺牲夜晚和周末投入额外时间。求职者可从前沿实验室的业务边界(如基础设施或输出接入)寻找突破口,同时要成为同事愿意看到你成功的人,推动合作项目。
Google Deepmind与电影工作室A24建立长期研究合作伙伴关系,Google同时向A24投资约7500万美元。A24电影制作人将在日常工作中测试并帮助塑造AI工具,作为交换,Google Deepmind获得来自专业从业者的实际反馈。目前尚无具体产品或成果,双方表示将共同探索AI在电影制作中的可用方式。A24曾出品《瞬息全宇宙》及近期作品《Backrooms》。
谷歌云与诺基亚宣布扩展合作,将谷歌 Gemini 模型整合至 Nokia Assurance Center 网络软件套件。双方基于 Gemini 开发了六个专项 AI 智能体:路由智能体(核心编排)、事件分类智能体(告警分析与历史比对)、KPI 选择器智能体(解读性能指标)、异常推理智能体(判断数据偏差是否为故障)、动作推理智能体(匹配自动化操作目录)及仪表板智能体(自然语言生成可视化)。目标是为电信运营商降低运营成本、快速定位网络故障,推动网络运维向全自动化“自驾”模式演进。官方将于 6 月 23 日至 25 日在哥本哈根 DTW Ignite 大会现场演示上述智能体。
郭明錤6月22日称,谷歌将在TPU v9基础上升级推理优化版,代号或为“Triggerfish”,由联发科独家接单。该芯片旨在缓解“CPU墙”与“内存墙”,片内SRAM缓存为原版2~3倍,片外DRAM升级至HBM4E。预计2027年底投产、2028年底放量,生命周期出货100~200万颗,单价高出约三成。此外引入“simulation die”,可能用于本地TPU管理、训推切换等。
当地时间18日,谷歌前工程副总裁、Gemini技术联席负责人诺姆·沙泽尔宣布离职加入OpenAI。他是Transformer架构论文《Attention Is All You Need》共同作者,曾参与LaMDA等AI项目,并撰写了2016年论文《Sparsely-gated Mixture of Experts》。他于2021年离开谷歌创办Character.AI,2024年通过交易回归谷歌DeepMind。OpenAI CEO奥尔特曼发文欢迎,称其是从创立之初最希望合作的人之一。
同一事件,精选展示《Noam Shazeer 离开 Google 加入 OpenAI》Google Docs 中出现的 Gemini 弹窗可通过两种方式关闭。一是点击文档顶部菜单栏的 Gemini,在下拉菜单中选择 “bottom bar preferences” 并关闭底部栏。二是通过 Gmail 设置:点击齿轮图标进入 “See all settings”,找到 “Google Workspace smart features” 并管理开关,关闭 Workspace 智能功能(包括 Docs 中的 Gemini 弹窗)。该方法可统一禁用多个 AI 功能,避免逐一关闭。
DuckDuckGo官方晒截图显示,谷歌AI概览在用户搜索“no AI”时建议前往DuckDuckGo的“No AI Search”页面。自2026年Google I/O以来,谷歌持续扩展AI模式,引发用户反感。DuckDuckGo美国区应用安装量平均周环比增长18.1%,峰值超30%,iPhone端涨幅更大。DuckDuckGo虽推出AI功能但允许关闭,而谷歌至今未提供永久关闭AI概览的选项,形成鲜明对比。
SAP 与 Google Cloud 联合部署智能体商务架构,通过 Universal Commerce Protocol 标准化零售商、支付网关与自主智能体之间的数据交换,实现从搜索、交易到售后的全序列自动化执行。SAP Commerce Cloud 集成 Google Gemini 能力构建 Shopping Assistant,支持聊天、语音和文本交互,实时查询库存确保推荐可行。该架构基于 SAP Business Data Cloud Connect for Google BigQuery 的双向零拷贝数据链接,融合天气、位置等外部变量与客户画像、交易历史等内部行为数据,由 SAP Engagement Cloud 驱动自主智能体编排个性化互动。SAP 研究显示,78% 的企业认为 AI 对 2026 年保留客户至关重要,但仅 37% 的公司跨客户体验平台共享数据、39% 跨 CRM 共享。
Google宣布将对德国慕尼黑地区法院的一项裁决提出上诉。该法院于2026年5月底判决,AI Overviews属于独立内容而非单纯搜索结果,Google需对其直接承担责任。案中AI错误地将两家慕尼黑出版商与欺诈计划关联。柏林法院6月初在另一案中得出相反结论,认为AI Overviews只是另一种形式的搜索结果,Google仅承担间接责任。Google将在上诉中引用柏林裁决。
谷歌携手艺术家Refik Anadol,在洛杉矶打造全球首个AI艺术博物馆Dataland,将于6月20日开馆。博物馆面积约2500平方米,开幕展“Machine Dreams: Rainforest”由Large Nature Model驱动。利用Google Cloud的Gemini Enterprise Agent Platform和Compute Engine,协调GANs、扩散模型和Gemini等AI模型,将环境数据转化为12亿像素的超生成现实。博物馆通过Google基础设施生成动态声景、实时情绪感应和算法增强气味,与访客动态交互。系统使用87%无碳可再生能源运行。
6 月 18 日报道,Pixel 10 系列手机出现 AI 功能抢占输入焦点问题。用户在 Gmail 回复邮件时,基于 Gemini 的 AI 写作辅助功能“Help me write”被错误优先显示,导致正常键盘无法弹出。Pixel 10 Pro XL 用户需多次点击回复区并关闭左下角隐藏按钮才可能唤起键盘;Pixel 10 Pro Fold 则完全无法显示光标,回复字段无反应,仅剩 AI 界面选项。该 Bug 在 vivo X300 FE、OnePlus 15 及 iOS 版 Gmail 上均未复现。
前Google研究员、Transformer架构共同作者诺姆·沙齐尔在X上宣布,他将加入OpenAI,并期待与那里的卓越团队合作。沙齐尔表示这是一个艰难的决定,同时对Google团队及其共同取得的成果感到无比自豪。
关联讨论 6 条X:Kim (@kimmonismus)X:Jason Liu (@jxnlco)X:Yuchen Jin (@Yuchenj_UW)X:歸藏 (@op7418)X:Sam Altman (@sama)TechCrunch:AI(RSS)Google 庆祝Agent-to-Agent(A2A)协议发布一周年。A2A专为生成式AI设计,相比传统REST API提供安全边界、零上下文污染、动态自主性和工作负载分布四大架构优势。应用实例FoldRun是一个独立的智能体接口,可在Gemini Enterprise或Gemini CLI等A2A兼容环境中部署,自动管理蛋白质结构预测任务,动态选择AlphaFold 2、OpenFold 3或Boltz-2等模型,无需自定义胶水代码。
德国团队开发的MIRA智能体在模拟电子病历中操作85,000种选项,500余例急诊诊断准确率88.9%,对比测试(311例)得分87.8%,高于资深专科医生(78.1%)和混合团队(71.1%)。MIRA在阑尾炎(98.6%)和胰腺炎(92.3%)最佳,未发现危险药物交互或剂量错误,性能不受语言影响,代码已公开。谷歌AMIE采用双智能体架构,在100个多访视病例中治疗计划适切率95%(初级保健医生72%),并在药物知识基准RxQA上超过医生。两项研究均警告模拟环境与现实存在差距,实际性能可能更低。
谷歌正在测试新版 reCAPTCHA,要求用户拍摄一段对摄像头挥手的视频。系统分析手部运动,提取手指关节、手掌位置等 21 个关键点坐标以判断动作真实性。视频不会与身份绑定、不录制音频,验证完成后自动删除。新系统意在抵御机器人批量注册和凭证填充攻击,但被批评推动生物特征认证。
汇丰银行与Google Cloud签署多年合作协议,将在财富管理、金融犯罪风险管理和内部决策支持中部署AI工具,采用Gemini模型和Gemini Enterprise Agent平台。合作预计两年内支持超过200个AI用例,部分有望带来超1亿美元直接收益或效率提升。汇丰现有600多个AI用例,涵盖欺诈检测、交易监控、客户服务等。金融犯罪检测系统自2021年试点已发现2-4倍犯罪行为,每月筛查12亿笔交易,新协议下干预速度提升2倍。财富管理结合AI洞察;AI决策助手减少行政时间至分钟级;超2万名开发者使用编码助手,效率提升15%。汇丰于4月任命首位首席AI官。
长上下文大语言模型的KV缓存随序列和批次线性增长,成为内存和延迟瓶颈。Google与NYU的TurboQuant采用数据无关随机旋转与最优标量量化,在3–4 bit位宽实现近乎无损,4×压缩下Needle-in-a-Haystack全精度召回。Together AI的OSCAR使用注意感知旋转校准,INT2(2.28有效比特)下精度不崩溃,集成SGLang,Qwen3-32B上仅差0.02分,GLM-4.7-FP8匹配BF16,解码速度提升约3倍,KV缓存内存减少约8倍。Apple的EpiCache则针对两者均未解决的多轮对话场景。两者在各自目标位宽上各有优劣,具有理论互补潜力。
"Attention Is All You Need"论文合著者 Noam Shazeer 离开 Google 加入 OpenAI。他此前担任 Google 工程副总裁,与 Jeff Dean、Oriol Vinyals 共同领导 Gemini 模型。Shazeer 于 2000 年加入 Google,2021 年离职创办 AI 聊天机器人初创公司 Character.AI,2024 年作为价值 27 亿美元交易的一部分返回 Google,负责改进公司至今未追上 OpenAI 和 Anthropic 的推理模型。此次跳槽是今年最重大的 AI 人才变动之一。
关联讨论 6 条X:Kim (@kimmonismus)X:Jason Liu (@jxnlco)X:Yuchen Jin (@Yuchenj_UW)X:歸藏 (@op7418)X:Sam Altman (@sama)TechCrunch:AI(RSS)Transformer 核心作者 Noam Shazeer 宣布加入 OpenAI。2021 年他因谷歌拒绝发布其聊天机器人而离职创办 Character.AI;2024 年谷歌以约 27 亿美元技术许可协议将其请回,他担任 Gemini 技术负责人。此次离职后 OpenAI 与 xAI 均参与争抢。Shazeer 是《Attention Is All You Need》主要作者,发明了 Transformer 架构与混合专家模型,2026 年 2 月当选美国国家工程院院士。至此,Transformer 论文八位作者已全部离开谷歌。
关联讨论 6 条X:Kim (@kimmonismus)X:Jason Liu (@jxnlco)X:Yuchen Jin (@Yuchenj_UW)X:歸藏 (@op7418)X:Sam Altman (@sama)TechCrunch:AI(RSS)英国竞争与市场管理局(CMA)依据2025年数字竞争框架,限期6个月要求谷歌全面整改搜索排名系统。所有自然搜索结果必须基于客观、非歧视的标准,AI概述功能也不得偏袒任何平台。CMA同时要求谷歌建立更透明的内部投诉处理流程,并允许用户将个人搜索数据安全迁移至第三方。谷歌需在3个月内完成数据可移植性架构。谷歌发言人回应称其排名系统已公平透明,但将配合监管。