Google Deepmind正在开发一款“AI协诊医生”系统以辅助医生诊疗。在模拟研究中,该系统表现优于GPT-5.4,但仍未达到经验丰富医师的水平。研究同时指出,类似ChatGPT语音模式的技术目前尚无法胜任严肃任务,更难以应用于医疗咨询场景。这项进展揭示了AI在专业医疗辅助领域的当前能力边界与发展潜力。
Google Deepmind正在开发一款“AI协诊医生”系统以辅助医生诊疗。在模拟研究中,该系统表现优于GPT-5.4,但仍未达到经验丰富医师的水平。研究同时指出,类似ChatGPT语音模式的技术目前尚无法胜任严肃任务,更难以应用于医疗咨询场景。这项进展揭示了AI在专业医疗辅助领域的当前能力边界与发展潜力。
Google正式发布Gemini Embedding 2统一嵌入模型,该模型能将文本、图像、视频、音频和文档映射到同一语义空间。开发者可通过单请求处理交织多模态输入,显著提升智能RAG、视觉搜索等内容审核任务的性能。模型支持超100种语言,并提供任务特定前缀和马特廖什卡降维等特性,为构建复杂AI智能体提供高效精准的基础。
研究团队正致力于开发一款AI联合临床医生,以探索AI增强医疗护理的路径。该研究旨在创建一种新型医疗模式,让AI作为临床医生的协同伙伴深度参与诊疗过程,共同提升医疗服务的质量和效率。这项工作标志着医疗保健领域正从辅助工具阶段,迈向AI作为核心协作者的新范式。
谷歌云业务在Alphabet第一季度财报中表现亮眼,营收同比大涨63%至200亿美元,占公司整体营收18%,预计一两个季度后占比将达五分之一。人工智能是核心驱动力,推动云业务营业利润同比增至三倍达66亿美元,利润率从9.4%飙升至32.9%。这标志着云业务已从边缘化转向结构性拐点。尽管AI需求强劲,但若热潮放缓可能影响其增长。此外,云部门的企业销售文化与谷歌本部工程师文化的内部碰撞也值得关注。
Alphabet计划在2026年前向AI和云基础设施投入高达1900亿美元,并预计2027年支出将再次“显著”增长。公司CEO Pichai表示,用户对搜索中的“AI Overviews”功能反响积极,该功能提升了用户参与度,促使人们更频繁地使用搜索服务。这项投资旨在巩固其在AI驱动搜索领域的领先地位。
Mozilla在GitHub上公开反对谷歌Chrome提出的Prompt API新标准。该API旨在让网站直接调用浏览器内置的大型语言模型,但Mozilla认为这存在重大隐私和安全风险,可能使网站过度获取用户敏感信息。目前该提案已获得110个Hacker News社区点赞,引发技术社区对浏览器权限与AI集成边界的广泛讨论。
2026年第一季度,三大云服务巨头资本支出合计1120亿美元。谷歌云以63%的同比增长率领跑,远超微软Azure的40%和亚马逊AWS的28%。谷歌增长主要受企业AI解决方案驱动,云服务积压订单环比翻倍至超4600亿美元。客户通过API每分钟处理160亿个令牌,同比增长60%。为满足需求,谷歌将2026年资本支出指引上调至1800-1900亿美元,超过微软的约1200亿美元。谷歌凭借全栈自研的Gemini模型和TPU芯片,在增长速度和结构优势上表现突出。
调研机构Counterpoint Research预测,联发科凭借与谷歌的合作,其AI服务器计算ASIC出货量有望在未来两年内实现数量级增长。到2028年,联发科预计将交付500万颗谷歌TPU芯片,占据该市场26%的份额,成为仅次于博通的第二大设计服务参与者。合作中,谷歌负责核心计算芯片设计,联发科提供I/O芯片,这种新模式有助于节省设计成本并避免HBM内存的加价。双方正共同推进TPU v8e项目,计划于2027年底量产,并可能采用英特尔的先进封装技术。
谷歌宣布其Gemini应用现已支持直接生成并下载多种格式文件。用户仅需输入一条提示词,即可在对话中创建PDF、Microsoft Word、Excel、谷歌Workspace文档等,无需离开应用即可完成从构思到成文的流程。该功能已面向全球所有Gemini用户开放,生成的文件可直接下载至设备或导出至谷歌云端硬盘。支持的格式包括谷歌文档、表格、幻灯片、PDF、Word(docx)、Excel(xlsx)、CSV、LaTeX、Markdown、纯文本(TXT)和富文本格式(RTF)。
谷歌母公司Alphabet在财报会议上确认,将开始向部分精选客户交付TPU硬件设备,供其部署在自有数据中心,这为TPU系列AI硬件开辟了云端算力之外的新变现模式。谷歌近期发布了第八代TPU新品TPU 8t和TPU 8i,性能较上代大幅提升。相关协议预计在今年晚些时候带来少量收入,大部分收入将在2027年实现。此外,Google Cloud在2026年第一季度营收首次突破200亿美元,同比增长63%。
<谷歌相册推出AI衣橱规划功能,通过人工智能自动提取用户照片中的服装图像,整理到数字衣橱。用户可按类别筛选服装,混搭单品设计穿搭,并支持虚拟试穿预览;还可保存穿搭到数字情绪板,适用于不同场合。该功能预计今年夏季首发于安卓平台,随后登陆iOS设备。>
自去年秋季推出实证研究辅助(ERA)工具以来,谷歌研究团队已将其应用于多个科学领域以解决实际问题。在流行病学中,它助力流感与新冠预测;在宇宙学里,协助分析星系数据以探究暗能量;在大气监测方面,提升了二氧化碳排放的追踪精度;在神经科学领域,则用于解析大脑活动数据。这些实践表明,ERA能帮助科学家生成专家级的实证软件,其成果超越了黑箱模型,可发现兼具可解释性与机制准确性的解决方案,从而有效加速科学发现进程。
Google Gemini 新增了在聊天界面内直接创建完整办公文档的功能。用户现可基于PDF、Word文件等源材料,让AI生成对应的文档、电子表格和演示文稿。这一集成将内容创建流程进一步简化,用户无需切换应用即可在对话中完成多种办公文件的制作。
Google Cloud推出了一项高性能集成方案,通过fsspec接口将Rapid Storage直接连接至PyTorch,以消除AI训练瓶颈。该方案利用Google的Colossus架构和双向gRPC流技术,可提供高达15 TiB/s的聚合吞吐量,并显著降低延迟。开发者仅需更新存储桶类型而无需修改代码,即可将总训练时间缩短23%。
Gemini 现已具备记忆用户偏好的能力,并支持从其他人工智能应用导入聊天历史记录。该功能率先在欧洲市场推出,允许用户将外部数据(例如来自 ChatGPT 的对话记录)迁移至 Gemini,以提升服务的个性化体验。
通用汽车宣布在美国为约400万辆2022款及更新的凯迪拉克、雪佛兰、别克和GMC车型推送谷歌Gemini AI助手,这是Gemini在汽车行业内规模最大的部署之一。该助手将与车辆信息娱乐系统中的谷歌服务及OnStar连接能力深度集成,提供增强的AI体验。此外,Gemini更新未来将逐步扩展到其他市场并支持更多语言。
据爆料,谷歌预计于2026年发布的Pixel 11系列手机将搭载Tensor G6芯片。该芯片的CPU架构将改为1+4+2的7核设计,大核升级为ARM C1 Ultra或C1 Pro,主频达4.11GHz。但其GPU被指将沿用2021年发布的PowerVR CXT-48-1536,被称为“古董级”图形技术。为弥补GPU弱势,谷歌增强了NPU以优化AI负载,并集成了全新的Titan M3安全协处理器以提升硬件级数据保护。这一“重NPU、轻GPU”的策略被认为有助于控制成本,但可能影响游戏体验。
谷歌翻译迎来20周年,目前支持近250种语言和逾6万个语言对,覆盖全球约95%人口。官方推出发音练习功能,在安卓版应用中利用AI分析用户语音并提供即时反馈,帮助改善发音,该功能已在美国和印度上线,支持英语、西班牙语和印地语。数据显示,谷歌翻译最常用短语为“谢谢”,其他热门查询包括“你好吗?”、“我爱你”、“你好”和“请”。
据报道,谷歌已与美国五角大楼达成一项关于人工智能技术应用的协议。根据协议,谷歌将允许美国国防部在“任何合法”的军事用途中使用其人工智能工具。这一合作标志着谷歌与军方关系的显著转变,此前谷歌员工曾因涉及AI的军事项目(如Maven项目)发起抗议。新协议旨在为国防部提供广泛的AI技术访问权限,涵盖从后勤到情报分析等多个领域,但强调所有应用必须符合法律和伦理规范。此举可能引发关于科技公司与军事部门合作边界的进一步讨论。
Google Translate 迎来 20 周年,从 2006 年的一项 AI 实验起步,现已支持近 250 种语言。官方分享了 20 条相关趣闻,并介绍了用户可尝试使用的实用技巧与新功能,以展示其多年来的技术演进与服务扩展。
Google 已与美国国防部签署合同,允许后者在机密工作中使用其 AI 模型。此举无视了公司内部超过 600 名员工的联名抗议信。法律专家指出,合同中的安全条款不具备法律约束力。该合作标志着 Google 在军事 AI 应用领域的进一步深入。
谷歌云在Google Cloud Next大会上推出由英伟达Vera Rubin系统驱动的A5X裸金属实例。该实例采用英伟达ConnectX-9 SuperNIC和谷歌Virgo Network AI数据中心架构,单站点集群可扩展至8万个Rubin GPU,多站点集群更可支持多达96万个GPU,旨在运行超大规模AI工作负载,为客户提供高性能、低延迟的物理服务器解决方案。
据报道,谷歌已与美国国防部签署协议,允许其人工智能模型用于机密军事工作,如任务规划和武器目标定位。该协议是五角大楼2025年与多家顶尖AI公司签署的系列合作之一,每份价值最高达2亿美元。协议要求谷歌应政府需求调整AI安全设置,但规定不得用于缺乏人工监督的大规模监控或自主武器。不过,谷歌无权否决政府的合法运营决策。此前,Anthropic因拒绝解除相关安全限制被国防部列为供应链风险企业。
谷歌在印度安得拉邦维沙卡帕特南启动人工智能中心建设,计划未来五年投资150亿美元(约1025亿元人民币)构建综合AI生态系统。该项目将与印度企业Nxtra by Airtel、AdaniConneX合作,建成印度国内首个千兆瓦级AI数据中心,以支持先进AI部署和数字服务扩展。同时,谷歌将通过“美印互联”计划扩展光纤网络,并优先接入清洁能源,助力印度在2030年实现500吉瓦非化石能源目标。
欧盟委员会初步认定,谷歌在安卓系统中给予其AI助手Gemini系统级优先待遇,限制了第三方AI服务调用系统功能、屏幕上下文、本地数据和硬件的能力。为此,欧盟要求谷歌开放安卓的AI相关权限,允许第三方AI工具通过唤醒词或按键启动、读取屏幕内容、访问本地数据并控制已安装应用,同时为开发者提供必要的硬件访问以支持本地模型运行。欧盟将在收集反馈后,最晚于7月27日公布最终决定。若谷歌未按要求调整,可能面临最高相当于其全球年收入10%的罚款。
Google Meet 的实时语音翻译功能已开始向移动设备端推送。该功能支持英语、西班牙语、法语、德语、葡萄牙语和意大利语共六种语言,能在对话中近乎实时地将一种语言翻译成另一种,并用近似原说话者音色的合成语音播放译文。目前该功能仍处于早期测试阶段,在网页浏览器端运行较为成功,但在 iPhone 与 iPad 等移动设备间的通话中尚不稳定。
Google 与 Kaggle 再度推出为期 5 天的 AI Agents 强化课程,现已开放注册。该课程旨在教授开发者如何构建和部署 AI 智能体,内容涵盖从基础概念到实际应用。课程形式为短期集中学习,参与者将通过 Kaggle 平台进行实践。
根据 Epoch AI 机构基于 AI Chip Owners 数据库的估算,截至 2025 年第四季度,谷歌凭借其大规模部署的自研 TPU 芯片,成为全球最大的单一 AI 算力持有者,掌握了全球累计 AI 算力的大约四分之一,其规模超过了微软、Meta 和亚马逊。该统计覆盖了英伟达、AMD、谷歌、亚马逊及华为的主要 AI 芯片,据信已涵盖全球绝大多数专用 AI 算力。微软与 Meta 的自研芯片虽未纳入此次统计,但对整体估算影响甚微。
谷歌正依靠人工智能边缘计算战略,以追赶云计算市场的领先者亚马逊和微软。该公司通过将AI技术整合到边缘设备,旨在提升云服务性能、降低延迟并扩大市场份额。这一举措针对亚马逊AWS和微软Azure的主导地位,谷歌希望借助边缘AI的实时数据处理和隐私优势吸引企业客户,加速缩小竞争差距。目前,云计算市场竞争激烈,谷歌的AI边缘布局被视为关键追赶手段。
韩国政府与谷歌旗下AI公司DeepMind签署谅解备忘录,将围绕AI联合研究、人才培养及负责任使用AI展开合作。双方将以5月启动的国家科学AI研究中心为核心,保障韩国创新项目“K-Moonshot”顺利实施。该项目旨在2035年前攻克生物、未来能源、物理AI等八大领域国家级难题,以提升韩国在AI领域的技术竞争力,应对中美主导地位。双方还将在生物科技、气象气候等领域深化合作,并通过成立工作组定期会议保持沟通。
Google DeepMind 与韩国政府建立合作伙伴关系,旨在利用前沿AI模型加速科学突破。此次合作将聚焦于将如Gemini、Claude、GPT-4等大型语言模型以及AlphaFold等科学AI工具,应用于关键研究领域,特别是生物技术和材料科学。目标是提升韩国的AI研发能力,计划在未来五年内培养超过1000名AI专家,并支持10个以上由AI驱动的大型科研项目。
一名印度医学生利用谷歌Gemini生成名为Emily Hart的AI虚拟形象,针对美国保守派男性群体运营社交媒体账号。该角色以护士身份发布亲基督教、反移民等MAGA倾向内容,单条短视频播放量高达数百万,一个月内粉丝破万。通过销售订阅内容及主题T恤,其月收入达数千美元。此类政见导向的AI虚拟账号正大量涌现,而平台对AI内容标识监管松散。该账号已于今年2月因“欺诈行为”被Instagram封禁。
Google 计划向人工智能公司 Anthropic 投资高达 400 亿美元。Anthropic 是聊天机器人 Claude 的开发商,被视为 ChatGPT 的主要竞争对手。加上亚马逊此前承诺的 250 亿美元投资,这意味着在短短几周内,Anthropic 将获得高达 650 亿美元的巨额资金注入。这笔投资将极大增强 Anthropic 在 AI 领域的研发与竞争实力。
谷歌发布了 TorchTPU,使 PyTorch 能够原生在 TPU 上运行,并实现谷歌级规模的计算。这一变化让开发者无需大幅修改代码即可利用 TPU 的高性能硬件,显著提升了 PyTorch 在大型模型训练和推理任务中的效率与可扩展性。此举标志着 PyTorch 与谷歌定制硬件生态的深度集成,为人工智能研究与开发提供了新的强大基础设施。
LiteRT 是一个生产就绪的框架,旨在帮助移动开发者充分发挥神经处理单元(NPU)的效能,以突破传统 CPU 或 GPU 在性能与电池续航上的瓶颈。该框架通过提供统一的 API 来屏蔽底层硬件复杂性,已成功助力 Google Meet、Epic Games 等行业领先者高效部署复杂的 AI 模型,实现实时视频处理、动画生成与语音识别等高级功能。此外,平台还提供基准测试工具并具备跨平台兼容性,能够支持 AI 应用无缝部署于移动设备、AI PC 及工业物联网硬件等多种终端。
Google发布第八代TPU,推出两款专为自主智能体(Agentic)时代设计的AI芯片。新一代TPU针对复杂AI工作负载和自主代理应用优化,旨在为下一代人工智能基础设施提供算力支撑。作为Google Cloud AI基础设施的核心组件,新芯片延续专用架构优势,进一步巩固其在云端AI训练与推理市场的竞争力,标志着AI计算进入自主代理新阶段。
谷歌在 Google Cloud Next 大会发布两款 AI 芯片 TPU 8t 与 TPU 8i,分别面向大规模训练与智能体推理。TPU 8t 的 Pod 规模扩至 9600 颗,FP4 算力提升近 2 倍,单芯片横向扩展带宽达 400Gbps;TPU 8i 配备 384MB 片上 SRAM 与 288GB 片外 HBM,Pod 规模增至 1152 颗,FP8 算力提升 8.67 倍。两款芯片能效均为上一代 TPU Ironwood 的两倍。
Google 发布第八代 TPU,内含两款面向智能体时代的专用芯片。新处理器专为 AI 未来发展设计,针对智能体工作负载进行专门优化,提供更强算力支持。作为 Google AI 基础设施的最新升级,该系列芯片将助力下一代智能体应用的开发与部署。
YouTube向娱乐行业开放人脸声纹检测工具,用于识别并下架未经授权的AI深度伪造内容。该技术类似Content ID系统,专门检测复制他人外貌或声音特征的AI生成视频及音频,标记后当事人可直接审核并要求移除,无需通过常规举报渠道。该工具于2024年启动测试,今年早些时候已覆盖政府官员及新闻记者,现进一步向演艺明星和娱乐从业者开放,无论其是否拥有YouTube频道。YouTube与CAA、UTA等经纪公司合作优化了该系统。
Google Cloud提出ReasoningBank智能体记忆框架,突破传统方法仅记录动作轨迹或成功经验的局限,从成败经验中提炼可泛化的高层推理策略。该框架通过LLM-as-judge自评估构建检索-提取-整合闭环,特别利用失败案例生成预防性策略,并创新提出Memory-aware Test-Time Scaling技术将测试时计算转化为高质量记忆。在网页浏览与软件工程基准测试中,该系统显著提升任务成功率并减少执行步骤。