Google 为 NotebookLM 新增视频概览功能,可将上传的源文件转换为 60 秒竖屏短视频,分解特定主题。该功能目前正在移动端和网页端向 Google AI Ultra 和 Pro 订阅者推出,免费用户即将获得访问权限。NotebookLM 是 Google 的 AI 笔记工具,能分析多源内容并以不同格式重新打包。
Google 为 NotebookLM 新增视频概览功能,可将上传的源文件转换为 60 秒竖屏短视频,分解特定主题。该功能目前正在移动端和网页端向 Google AI Ultra 和 Pro 订阅者推出,免费用户即将获得访问权限。NotebookLM 是 Google 的 AI 笔记工具,能分析多源内容并以不同格式重新打包。
2025年,谷歌年度用电量同比上涨37%,创历史最大增幅。数据中心全年消耗超4200万兆瓦时,超过新西兰、丹麦、尼日利亚等国总用电量。自2019年以来,谷歌总用电量已增长超250%。用电激增主要来自Google Cloud、YouTube视频流及支撑AI产品和服务的数据中心建设与运营。公司表示,AI基础设施建设速度超过电网脱碳速度,但仍致力于扩大全球清洁电力规模,并通过技术创新降低运营排放。2024年谷歌用电量增幅为27%。
ghealth 是一款封装 Google Health API v4 的开源命令行工具,以单个 Go 二进制文件发布(Apache 2.0 协议)。它提供 40 种已验证的数据类型(包括步数、心率、睡眠、体重、血氧饱和度、心率变异性等)的结构化 JSON 输出。工具采用 Agent 优先设计,具备确定性退出码、--dry-run 和 --raw 标志,并附带两个 SKILL.md 文件供 AI 智能体使用。用户需自行创建 OAuth 凭据,通过 PKCE S256 认证。数据来源覆盖 Fitbit、Pixel Watch 及连接的第三方设备。
谷歌昨日发布视频,详细介绍安卓Halo功能。该功能于今年5月I/O大会亮相,旨在提升后台AI助手透明度。启用后,屏幕顶部状态栏拥有专属席位,实时显示AI智能体(如Gemini)状态。安卓总裁萨米尔·萨马特称,Halo为智能体提供专用沟通平台,用于报告更新、接受用户指示,在需要人工介入的后续提问、进度更新、结果展示时,用户无需重新打开AI应用即可交互。
Google官方博客阐述了构建ADK 2.0的动机——包括核心特性与升级理由,并解释了开发者应考虑迁移的原因。该文章发布于ADK 2.0正式上线次日。
Google Cloud Workbench Notebooks 扩展正式上线,开发者可在 VS Code 中直接连接可扩展的云端 Jupyter 环境,无需切换上下文即可利用高性能 Google Cloud 基础设施完成机器学习全流程。该扩展已完全开源,可在 GitHub 和 VS Code Marketplace 获取。
开源框架 Genkit 推出 Agents API,将消息历史、工具循环和流式传输封装为单一接口,简化对话 AI 开发。该 API 支持服务器或客户端管理的状态持久化,可实现历史分支、长时间运行的分离任务及多智能体协调等高级工作流,并通过统一线协议连接前后端。目前以 TypeScript 和 Go 预览版发布,集成 Genkit Developer UI,开发者无需编写客户端代码即可测试、调试和检查智能体快照。
Google与New York Jobs CEO Council、Urban Assembly联合举办AI教育峰会,150名教育及行业领袖参与。通过aiEDU的“Vibe Coding”和Google的“Meet LEA”实践环节,与会者探索了Google AI mode和NotebookLM如何激发好奇心、提升AI素养。行业领袖指出,AI的真正价值在于赋能问题解决,而适应性、协作、批判性判断等“人类技能”愈发关键。与会者一致同意,需坚守隐私和公平访问原则。最终共识:技术创新必须与学校合作,而非绕开学校。
谷歌 AI 智能体 Gemini Spark 已登陆 macOS,整合进现有 Gemini 桌面客户端。Mac 版支持实时追踪赛事比分、股价、突发新闻等资讯,并可对接 Google Tasks、Google Keep、Canva、Dropbox、Instacart、OpenTable、Zillow 等应用,执行餐厅订位、生鲜采购、设计海报、预约看房等任务,还能读取本地文件分类整理或生成谷歌办公套件文档。macOS 测试版目前仅面向美国地区谷歌 AI Ultra 订阅会员开放,初期不支持跨设备联动,后续将支持手机端下达复合指令调用桌面端。谷歌同期推出对自定义 MCP 协议的支持。
Google 的 AI 智能体助手 Gemini Spark 本周三正式登陆 Mac 版 Gemini 桌面应用。新增实时追踪话题功能,可追踪体育比分、股票、突发新闻等动态。已集成 Google Tasks、Google Keep 以及 Canva、Dropbox、Instacart、OpenTable、Zillow Rentals 等第三方应用。用户可用 Spark 整理文件,将电脑文件作为 Google Workspace 文档的数据源。未来将在手机上支持指派多步骤任务。目前 Mac 版 Spark(beta)仅限美国地区 Google AI Ultra 订阅者使用,同时支持自定义 Model Context Protocol(MCP)连接更多应用。
Google 推出首款“为 Gemini 打造”的智能音箱 Home Speaker,售价 99.99 美元。硬件设计精巧,音质在体积相当的产品中表现良好,支持 360 度音效、立体声配对、Matter 控制及 Thread 边界路由器功能,可配合 Google TV Streamer 作为音频输出。然而,内置的 Gemini for Home 智能助手响应缓慢、不可靠,且部分功能需要付费才能使用。相比前代 Nest Audio,新款音箱尺寸更小但低频偏弱,在同价位竞品(Echo Dot Max、HomePod Mini)中音质排名第三。
Google Research 发布 TabFM v1.0.0,一种面向表格数据的零样本基座模型,无需针对特定数据集训练、调参或特征工程即可进行分类和回归。TabFM 将整个数据集作为统一提示,通过上下文学习在单次前向传播中生成预测。其架构融合 TabPFN 风格的行/列交替注意力与 TabICL 风格的行压缩和上下文学习。模型在数亿个由结构因果模型动态生成的合成数据集上训练。在 TabArena 基准(38 个分类、13 个回归数据集,样本量 700 至 15 万)上,TabFM 及添加交叉特征和 SVD 特征、采用 32 路集成的 TabFM-Ensemble 均优于经过深度调优的监督算法。模型已开源在 Hugging Face 和 GitHub,Google BigQuery 即将通过 AI.PREDICT SQL 命令集成。
谷歌发布新款 AI 图像与视频生成模型 Nano Banana 2 Lite,可在 4 秒内生成一张图像,延迟较此前明显下降。每生成 1000 张图像收费 0.034 美元(约合 0.23 元人民币),主打速度和批量处理能力,面向高频、大规模的内容生产流程。该模型现已登陆谷歌 AI Studio、Gemini API 和 Gemini Enterprise Agent Platform,并将取代初代 Nano Banana。
Gemini 3.1 Flash Lite Image(API 名 gemini-3.1-flash-lite-image,代号 Nano Banana 2 Lite)发布,被描述为“最快最便宜的 Gemini 图像模型”,专为速度和规模优化。作者在 AI Studio 中测试生成“寻找浣熊”风格的图像,效果优于此前 Nano Banana 模型,但存在拼写错误。
Google NotebookLM 近日为 AI Ultra 和 Pro 订阅用户推出新功能:可基于用户上传的源文件自动生成 60 秒竖屏 AI 视频,并配上 AI 生成图像和旁白。官方示例以纸片剪贴画风格回顾澳大利亚对鸸鹋的战争。用户可在 NotebookLM 网页或 App 的 Studio 栏中选择“Video”→“Short”,指定或自定义主题后点击生成。此前 NotebookLM 已支持 AI 播客、电影风格视频和视觉解释器。该功能目前仅支持英语,免费用户将很快可用。
周二,Google 推出其自研 AI 图像和视频生成器最新版本 Nano Banana 2 Lite。该模型延迟大幅降低,可在4秒内生成图像,成本为每1000张图像0.034美元,针对高吞吐量工作流优化,现已通过 Google AI Studio、Gemini API 及 Gemini Enterprise Agent Platform 上线,并取代原 Nano Banana 成为“遗留模型”。同日,Google 还宣布扩大 Gemini Omni Flash 的发布范围,视频输出价格为每秒0.10美元,并展示了可将静态图像转为电商视频的演示应用 Omni Product Studio。
Google DeepMind 发布 Nano Banana 2 Lite(正式名 Gemini 3.1 Flash Lite Image),默认低思考模式下约4秒生成一张图像,标准 Nano Banana 需约20秒。API 价格为每1000张图像 $0.034,输入 token $0.25/1M,输出 token $1.50/1M,是 Nano Banana 2 的一半,输出成本为 Nano Banana Pro 的八分之一。用户 Arena.ai Elo 评分接近非 Lite 版本,但在文本处理、小字和角色一致性上较弱。所有输出图像均带有 SynthID 水印。即日起可通过 Google AI Studio、API 及 Gemini(选择 Flash-Lite 选项)使用。
新加坡初创公司 Acti 发布基于 Google Gemini 的智能体键盘,可代替用户在应用中执行操作。核心功能 Skills 允许用自然语言创建快捷方式,如长按 T 键翻译消息、C 键发送会议链接。早期测试者两周内创建超 1000 个 Skills。采用本地优先架构,默认不访问私人消息。公司获 530 万美元种子轮融资,由 BITKRAFT Ventures 领投,现已开放下载。
Google 推出两款新生成式 AI 模型。Nano Banana 2 Lite 可在 4 秒内生成图像,每张成本 0.034 美元(1K 分辨率),API 名称为 gemini-3.1-flash-lite-image。Gemini Omni Flash 允许开发者通过文本提示在 API 中生成和编辑最长 10 秒的视频,每秒输出价格 0.10 美元。Google 推荐将两个模型链式使用:先用 Nano Banana 2 Lite 生成图像,再传递给 Gemini Omni Flash 转化为视频。两者均使用 SynthID 水印,已通过 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform 提供。
Agent Development Kit (ADK) for Go 2.0 发布,引入了一类基于图的工作流引擎,用于组合复杂多智能体应用。新版本内置人工参与循环(HITL)编排、使用纯 Go 代码的动态执行、以及指数退避重试等自动弹性特性。统一执行模型后,单智能体应用与复杂图均运行在同一运行时上,简化了遥测与状态持久化。
Google推出了一项面向编码智能体的新开发者技能,将评估过程自动化成五阶段飞轮:准备数据、运行推理、使用自适应AutoRaters评分、分析失败聚类、执行针对性优化。该工具可针对生产流量持续运行或通过合成场景按需触发,开发者用自然语言描述测试目标,独立评估服务安全验证并统计实际性能提升。
Google DeepMind 推出 Nano Banana 2 Lite(gemini-3.1-flash-lite-image),为 Nano Banana 系列速度最快、成本最低的图像模型,文本到图像输出仅需 4 秒,每 1K 分辨率图像成本 $0.034,已上线 Google AI Studio、Gemini API 及消费者产品(AI Mode in Search、Gemini app 等)。同时推出 Gemini Omni Flash(gemini-omni-flash-preview),支持高画质视频生成与对话式编辑,视频输出定价 $0.10/秒,面向开发者开放 API。
关联讨论 3 条X:Google DeepMind (@GoogleDeepMind)X:Logan Kilpatrick (@OfficialLoganK)X:Google AI (@GoogleAI)人形机器人公司Apptronik在奥斯汀建成近9万平方英尺(约8361平方米)的机器人实训园,其Apollo机器人通过远程操控反复进行装箱、分拣等实操训练,数据用于优化AI模型。公司累计融资约10亿美元,估值超55亿美元。投资方梅赛德斯-奔驰已在工厂部署Apollo,谷歌DeepMind借助Apollo改进机器人AI模型Gemini Robotics。2023年推出的初代Apollo已迭代至二代,身高约1.8米,可举25公斤,续航4小时。公司同步开发双足与轮式机型,目标让机器人进入工厂、服务行业与家庭。
Google UK与Public First研究发现,英国职场AI采用率一年内从34%升至73%,但呈不均衡曲线。仅15%的“AI Trailblazers”(深度用户)晋升概率高84%、绩效高88%、加薪概率高55%,每周节省近8小时。其余85%仍处于旁观、实验或实践阶段。阻碍因素包括:一次即弃的提示词习惯、搜索框思维、缺乏明确使用许可。Public First推出AI技能测验,Google的“AI Works for Britain”计划支持2030年前培训1000万工人AI技能的目标。
谷歌在 reCAPTCHA 中测试新的人机验证方式,要求用户对着摄像头完成挥手或张开手掌等动作,由 AI 提取 21 个手部关节坐标完成验证。系统仅收集手部地标数据,验证后删除视频/图片,不保留音频。网友 @Patrosi73 发现可用静态手部图片通过 OBS 虚拟摄像头输入绕过验证,Neowin 作者复现成功,调整通用挥手图片位置即可被识别为有效手势。
谷歌宣布,所有符合条件的美国 Gemini 免费用户均可使用由 Nano Banana 驱动的个性化图像生成功能,不再仅限 Plus、Pro 和 Ultra 订阅用户。该功能从用户授权的 Gmail、谷歌相册、YouTube 和谷歌搜索中获取信息,自动生成贴合个人兴趣的图像。用户需主动开启“个性化智能”,并自行选择 Gemini 可访问的应用,也可随时关闭。据悉,今年早些时候 Gemini 月活跃用户已突破 7.5 亿。
Anthropic 今日推出 Claude apps gateway,一个自托管控制平面,让企业能在 Amazon Bedrock 和 Google Cloud 上运行 Claude Code。它作为单个无状态容器部署于 Linux,后端使用 PostgreSQL,提供企业级 SSO 登录(通过 OIDC 对接 Google Workspace、Microsoft Entra ID、Okta 等)、集中策略管理、角色权限、路由(支持故障转移)以及按日/周/月、按组织/群组/用户的消费上限。遥测数据通过 OTLP 发送至用户配置的收集器。gateway 不会向 Anthropic 发送推理流量或使用数据(除非配置使用 Claude API)。即日起可用。
Google 宣布,Gemini 应用的 Nano Banana 驱动个性化图片生成功能向所有符合条件的美国用户免费开放,此前仅限 Plus、Pro 和 Ultra 订阅用户。该功能基于 Gemini 对用户喜好的理解生成图片,无需在提示词中指定具体内容,并可从 Google Photos 提取用户照片。数据来自 Gmail、Google Photos、YouTube 和 Search 等 Google 账户连接。Personal Intelligence 为可选功能,默认用于每个提示,用户可在 Tools 菜单中关闭。上个月 Google 预告了 Gemini 应用的后续更新,包括 Daily Brief、改版界面、AI 视频模型 Gemini Omni 和个人 AI 智能体 Gemini Spark。Gemini 月活跃用户已超 7.5 亿。
谷歌云将上线 SandboxAQ 的两款专业 AI 模型:AQCat 用于半导体制造、电池开发等场景,识别具有潜力的催化剂和材料候选物;AQPotency 用于药物发现,筛选最可能结合疾病靶点的分子。SandboxAQ 前身为 Alphabet 量子技术部门,已通过美国《芯片法案》获 5 亿美元拨款。CEO 表示生物制药是当前最大短期机遇,客户正利用该技术研究胶质母细胞瘤、前列腺癌、阿尔茨海默病、帕金森病和心血管疾病。
Android 平台最新版谷歌翻译应用(版本号 10.23.29.934758792.2-release)出现了名为“连续打卡天数”的桌面小组件,可显示当前连续练习天数。用户点击小组件即可直接进入练习模式,小组件支持自由调整大小。该功能基于谷歌翻译练习模式原有的“连续练习”机制——用户每天完成一次练习即可增加连续打卡天数,类似多邻国的“连续学习天数”,旨在鼓励语言学习习惯养成。
据英国《金融时报》报道,谷歌对Meta使用其Gemini AI模型设限。Meta寻求的计算容量超出谷歌所能提供,导致其部分内部AI项目受阻延迟。其他谷歌客户也受影响,程度较轻。Meta已鼓励员工提高AI token使用效率。
Meta 向谷歌申请的 Gemini 算力规模超出后者供给能力,谷歌现已对 Meta 调用其 Gemini 大模型实施使用限制。Alphabet 约在今年 3 月告知 Meta 无法满足所需算力,导致 Meta 多项内部 AI 项目受阻延期。Meta 已要求员工节约使用模型 token。谷歌一季度云营收达 200 亿美元,CEO 皮查伊表示算力供给瓶颈制约云业务增速,同时令云部门积压订单量环比近乎翻倍。
谷歌今年 5 月宣布将 Play 商店集成至 Gemini 助手,现已逐步推送。用户可在 Gemini 聊天窗口中直接搜索、安装应用或进行内购,无需离开 Gemini。例如,询问“帮我找一款可以规划每周吃什么的 App”,Gemini 会搜索并跳转至 Play 商店详情页。该功能需年满 18 周岁,仅支持个人账号,且 Android 设备需安装 Play 商店。
苹果今日发布 Xcode 26.6 IDE,新增 Google Gemini 编程助手支持。该版本包含 Swift 6.3.3 及 iOS 26.5、iPadOS 26.5、tvOS 26.5、watchOS 26.5、visionOS 26.5、macOS 26.5 的 SDK。编程助手现已可选 Anthropic Claude Agents 和 OpenAI Codex 作为 AI 提供商。此外更新还新增 ACP 兼容能力,并修复多项 Bug。Xcode 26.6 已上架 App Store,开发者可免费下载。
Google 发布 Paper Assistant Tool(PAT),一个用于深度科学评审和验证的智能体 AI 框架。PAT 能摄取完整学术论文,生成综合评估,包括检查理论结果、验证实验、提出改进建议和识别潜在缺陷。通过利用推理扩展技术,PAT 在 SPOT 基准上对数学错误的召回率比零样本提升 34%。该工具已在 STOC 和 ICML 两大计算机科学会议上作为作者预提交工具进行试点,可发现关键错误并提出实质性改进,在保留评审员对结果控制权的同时减轻其认知负担。
Google Finance 推出首款独立移动应用,目前仅限 Android 平台,全球 Play Store 可用。应用内置生成式 AI,股价图表旁由 AI 生成“关键时刻”解释数字变动,底部“Ask”按钮可让用户与金融调优的聊天机器人对话查询股票。同步更新的 Finance 网站也离开 beta,AI 成为核心体验,支持上传 CSV 或 PDF 建立投资组合并获取 AI 洞察与建议,AI 研究工具还可发送定期简报(如每日盘前加密货币动向),完成后通过移动应用通知用户。
Google Research 与 Google Cloud 提出线性弹性缓存,将缓存管理转为线性成本优化问题,动态调整大小以最小化总拥有成本。为每条数据引入“滑雪租赁”决策框架,在租用内存(持续付费)与购买缺失(缓存未命中惩罚)间选择,并用轻量级机器学习实时优化内存占用与缺失率权衡。无服务器云场景下(每 GiB 内存每天 $3),该技术可在不牺牲性能的同时显著降本。论文发表于 CIDR。
本周,Google Finance 推出正式版 Android 应用,同步上线全球投资组合跟踪功能。用户可通过截图、CSV/PDF 上传或文字描述创建组合,并利用 AI 研究工具提问资产配置、固定收益影响等问题。新增市场情报简报功能:用户设定任务(如每日盘前简报),后台自动生成并推送至 Google 应用(Android/iOS)及网页端。Android 应用包含 watchlist、实时数据、金融新闻 feed、AI 研究工具及 AI 驱动的“关键时刻”解释股价波动。未来数月将把更多 web 功能(如财报电话、投资组合与任务)迁移至移动端,今年晚些推出 iOS 应用。