Google为YouTube Shorts推出了一项基于Gemini Omni的AI混剪功能。用户可在短视频界面点击“Remix”并选择“reimagine”选项,通过输入文字提示,将原视频转换为像素艺术、动漫或恐怖片风格,还能通过AI调整内容,例如替换服装、插入背景人物甚至将自己合成进视频。该功能允许创作者自主选择开启或关闭其视频的混剪权限。
Google为YouTube Shorts推出了一项基于Gemini Omni的AI混剪功能。用户可在短视频界面点击“Remix”并选择“reimagine”选项,通过输入文字提示,将原视频转换为像素艺术、动漫或恐怖片风格,还能通过AI调整内容,例如替换服装、插入背景人物甚至将自己合成进视频。该功能允许创作者自主选择开启或关闭其视频的混剪权限。
谷歌的AI系统正面临被操纵的风险。为应对这一挑战,这家科技巨头已悄然启动防御措施,以保护其AI生成内容的结果免受恶意干扰。此举旨在确保搜索和AI服务的可靠性与可信度,反映了当前人工智能安全领域日益增长的对抗性问题。谷歌在未公开宣传的情况下,正在通过技术手段加强对其AI系统的防护。
Google I/O大会发布了Gemini 3.5 Flash和Gemini Spark。Gemini Spark是一个基于Gemini 3.5 Flash与Antigravity运行的个人AI代理,能原生连接Gmail、日历等Google应用。Antigravity是开源工具套件,包括桌面应用、CLI工具、Python SDK及VS Code分支IDE。Gemini Spark在Google Cloud运行,采用临时隔离虚拟机和安全网关保障企业数据安全。此外,开源的Gemini CLI将于6月18日后停服,由闭源的Antigravity CLI取代。
Google正将AI技术深度整合到其搜索广告业务中。当用户搜索产品时,Gemini AI模型会自动推荐相关商品,并生成定制化说明,解释为何应购买该产品。这一更新紧随Google推出支持长对话式查询的新搜索框之后,后者也强调AI生成结果。例如,搜索“紧凑型咖啡胶囊机”的用户可能看到带“赞助产品”标签的商品,旁附AI生成的详细描述。这标志着搜索广告从静态展示转向AI驱动的、更具互动性和解释性的新形态,部分广告还将内置聊天机器人功能。
谷歌在I/O大会宣布,其AI Studio现支持根据文本提示直接生成原生Android应用,这些应用采用Kotlin语言与Jetpack Compose框架构建,并可在浏览器模拟器中进行测试。对于追踪器、待办清单这类简单的工具型应用,此举使得开发和分发变得极为便捷,可能削弱谷歌Play Store作为核心分发渠道的传统地位。与此同时,苹果公司则采取相反策略,持续阻止这类基于AI生成的“氛围编程”应用上架App Store。
AI搜索领域已悄然成为消费级AI中最具吸引力的赛道之一。多家AI搜索初创公司近期获得显著增长与资本关注,行业竞争态势加速。这类应用通过对话式交互与实时信息整合,正在重塑传统搜索体验,并可能改变用户获取信息的核心方式。
AI代理正从过去像“无用的实习生”般的承诺,转变为切实可用的工具,这一转变主要得益于近六个月来开源AI代理平台OpenClaw的兴起。谷歌被认为最有能力大规模实现这一目标。在I/O 2026大会上,谷歌宣布推出用于信息收集、活动规划、收件箱与日历总结等功能的新一代AI代理。这些代理能持续在后台运行,谷歌宣称它们将无缝集成到各类服务中,标志着AI助手实用性的重大进展。
在2026年谷歌开发者大会上,谷歌发布了新一代Android XR智能眼镜。谷歌安卓生态系统总裁萨米尔·萨马特总结认为,早期Google Glass项目未能普及的最大教训是外观时尚远比技术吸引力更重要。他指出,Meta与时尚品牌合作的智能眼镜自2023年面世以来销量已突破700万台,印证了这一观点。为此,谷歌此次携手Warby Parker和Gentle Monster等知名眼镜品牌,推出注重实用与颜值的纯语音版智能眼镜,预计今年秋季上市。搭载显示屏的版本则计划于明年推出,并将借助Gemini大模型承担核心功能。
Google DeepMind 将其 Genie 3 世界模型与多年积累的街景图像数据相结合,推出了一项新功能。用户现在可以在地图上指定一个真实地点,系统便能生成一个基于该地点的、可供行走和探索的 AI 生成世界。这一整合不仅为创意演示提供了强大工具,更重要的是,海量的街景数据成为了训练 AI 代理和机器人的重要战略资源,为人工智能在模拟现实环境中的交互与导航能力开辟了新路径。
Google发布了新一代AI模型Gemini 3.5 Flash,其性能较前代有显著提升,但运行成本大幅增加。基准测试显示,该模型的运行成本是上一代的5.5倍。在代理任务场景中,总成本甚至比更高端的Gemini 3.1 Pro还高出75%,主要原因是该模型需要比同类模型更多的交互步骤。这一现象并非个例,受巨额研发投入的商业回报压力影响,整个AI行业正普遍走向更昂贵的发展阶段。
近日,Waymo 自动驾驶出租车在美国亚特兰大市多处死胡同内出现集体“迷路”现象。据报道,近几周来,数十辆无人车频繁无故驶入并滞留于该区域,有居民反映仅清晨一小时内就有 50 辆车在一条死胡同来回行驶。该异常行为引发当地居民对交通扰民及周边儿童、宠物安全隐患的担忧。Waymo 公司已就此表示着手整改,但未说明问题根源,并强调其服务每周可完成超 50 万趟出行订单。
Google在2026年I/O大会上发布了新一代模型Gemini 3.5 Flash。该模型在代码生成和AI智能体任务等基准测试中性能超越了此前的旗舰版本,同时运行速度提升四倍,推理成本降低一半。这一更新显著增强了模型在实际应用中的效率与经济性,特别面向需要快速响应和复杂任务处理的开发者场景。
谷歌宣布将于2026年6月18日停止其命令行工具Gemini CLI的服务。该工具届时将不再可用,其功能将过渡到全新的Antigravity CLI工具。此消息由谷歌开发者博客发布,目前在Hacker News上获得了超过100点的热度关注。
项目 llm-gemini 发布了 0.32 版本,本次更新主要新增了对谷歌最新发布的模型 gemini-3.5-flash 的支持。发布信息同步提供了关于 Gemini 3.5 Flash 的技术笔记,以及作者使用升级后的插件绘制的图像示例,展示了该模型的实际应用效果。
谷歌正在测试 Gboard 输入法的三项新 AI 功能,包括自定义提示词输入框、根据描述起草完整内容以及支持读取屏幕上下文或对话内容以提供更贴合语境的回复建议。此次升级标志着 Gboard 的 AI 能力从固定的润色、改写预设,转向更灵活的个性化写作辅助。新功能将允许用户以自然语言指令(如“让语气更幽默”)直接定制文本风格,并可能结合图库截图等屏幕信息自动组织回复。
谷歌在I/O大会上发布了Gemini 3.5 Flash模型,该模型跳过预览阶段直接正式发布,并已被集成到谷歌Gemini应用、搜索、开发者平台及企业解决方案等多项核心产品中。该模型价格显著上涨:输入价格为每百万令牌1.50美元,输出价格为9美元,分别是前代模型的3倍和6倍,已接近更高端的Gemini 3.1 Pro定价。技术上,它支持约100万输入令牌和约6.5万最大输出令牌。同时,谷歌推出了新的Interactions API测试版。这一价格上调趋势与OpenAI等公司近期策略相似,表明主要AI实验室正在试探API客户的价格承受能力。
OpenAI宣布在其AI生成的图像中集成谷歌的SynthID水印技术,并推出配套的验证工具。这一举措旨在增强AI生成内容的可追溯性,使用户能够识别图像是否由AI生成。该更新已于2026年5月19日生效。SynthID水印技术此前由谷歌开发,可嵌入难以察觉的数字标识,而新验证工具则允许用户检测这些标识。OpenAI表示这将帮助打击虚假信息传播。
同一事件,精选展示《SynthID水印技术扩展合作,覆盖超千亿内容》Google 在 IO 2026 大会上正式展示了其在 AI 设计领域的能力。该公司推出了一款新应用,旨在让包括教师、小企业主在内的所有人都能轻松使用。这款应用的发布标志着 Google 进一步将 AI 技术下沉至日常创作工具中,强调其易用性与普惠性,试图降低专业设计的门槛。
在2026年开发者大会上,Google宣布其AI战略核心从辅助工具转向开发独立智能体。大会重点发布了Gemini 3.5系列模型,并对“反重力”智能体优先平台进行了重大更新。面向移动开发者,推出了Android CLI工具、评估排行榜及能将多种框架代码快速迁移至原生Kotlin的智能体。Web开发领域也迎来变革,包括专为智能体设计的Chrome DevTools、HTML-in-Canvas API,以及旨在让浏览器内AI智能体执行复杂任务的开放标准WebMCP提案。
Google Cloud与NVIDIA开发者社区迎来成立一周年,会员规模突破10万。社区为开发者提供先进AI基础设施与资源支持,包括LLM优化、GPU加速数据分析等专项学习路径及专家网络研讨会。第二年计划将进一步扩展,推出实践实验室、工程活动及聚焦代理式AI增长的专项内容。
在 Google IO 2026 大会上,Google 宣布扩展 Gmail 的 AI 收件箱功能。用户现在可以通过对话式语音搜索,直接与收件箱交互,使用 Gemini 快速查找和提取被埋没的电子邮件细节。该功能旨在简化邮件检索流程,提升操作效率。
Google 推出 AI 驱动的信息代理,这些代理能够在后台自动监控指定主题,并主动向用户推送更新和变化通知。此功能旨在帮助用户突破传统搜索的限制,提供更智能、实时的信息追踪体验,实现从被动搜索到主动获取的转变。
在I/O 2026大会上,Google发布了一系列AI驱动的新工具,旨在提升用户生活效率。其中包括始终在线的AI助手Gemini Spark,可协助组织活动;Daily Brief提供每日日程概览;以及扩大使用范围的Gmail AI收件箱,能基于邮件内容生成待办事项并起草个性化回复。这些功能的核心是一个处理海量个人信息的AI引擎,虽然便捷,但引发了用户信任和数据隐私的重大担忧,使隐私保护成为Google AI战略的关键挑战。
谷歌在2026 I/O开发者大会上宣布,为Google AI Studio新增原生安卓应用生成功能。用户可通过浏览器输入文本提示,直接创建使用Kotlin与Jetpack Compose构建的完整、可安装安卓应用。该应用支持离线运行和硬件特性接入,并整合了开发、预览与测试发布流程。开发者能利用内置模拟器实时测试,也可一键发布至Google Play进行内部测试。当前版本主要适用于工具类、社交类应用及Gemini驱动项目。
在2026年I/O开发者大会上,谷歌宣布推出Antigravity 2.0,这是一款围绕智能代理编排构建的独立桌面应用程序。同时发布的还包括Antigravity命令行工具(CLI)和软件开发工具包(SDK),并在Gemini API中引入了托管代理功能。此外,通过Gemini Enterprise提供企业级支持。此次发布标志着谷歌从工具集成迈向构建完整代理开发生态的重要转变。
谷歌于2026年5月对其搜索框进行了重大更新。此次更新的核心是在搜索结果顶部新增一个由人工智能驱动的“概览”区域,用于直接回答用户的查询。这一变化标志着谷歌搜索引擎从传统的链接列表,进一步转向提供整合信息的人工智能助手模式。
Google AI Edge推出LiteRT-LM引擎,为跨平台移动和边缘设备提供高度优化的基础设施,支持Gemma 4模型在设备端运行。通过内存高效动态加载和多令牌预测技术,实现高达2.2倍的速度提升,并集成思维模式、约束解码等高级工具。同时,该引擎正扩展至Apple生态,新增原生Swift API和WebGPU加速的JavaScript API,支持高性能浏览器端推理。
Google AI Edge Gallery 应用在安卓平台上扩展了设备端 AI 能力,通过引入对开源模型上下文协议(MCP)的实验性支持,使得 Gemma 4 模型能够协调处理跨 Google Workspace 和 Google Maps 等外部数据源的复杂任务。此次更新添加了“定时通知”技能,用于实现日常事务的自动化管理,并新增了持久化聊天记录功能,允许用户近乎即时地恢复长会话上下文。该平台依托开源工具包,积极鼓励社区开发者通过其 GitHub 仓库构建并分享专注实用的工作流、提示配置与工具集成。
Google 在 I/O 2026 上宣布重组其 AI 订阅服务,推出三级订阅方案,月费从 7.99 美元至 99.99 美元不等。此次更新引入了 Gemini Omni 等新模型以及 AI 代理 Gemini Spark,并调整了使用限制策略。最显著的变化是,Google 放弃了原有的每日提示次数限制,转而采用基于计算资源消耗的计费模式,这正成为行业的新趋势。
谷歌宣布其传统搜索产品将发生根本性转变,标志着以关键词和链接列表为主的搜索时代结束。此次更新核心在于深度整合人工智能技术,以对话式生成回答直接响应用户查询,取代传统网页跳转模式。新界面将显著减少广告展示位,并优先呈现经过AI整合的信息来源。这一变革旨在应对新兴AI搜索工具的竞争,预计将彻底改变用户获取信息的方式及数字广告市场的格局。
在2026年I/O开发者大会上,谷歌发布了Antigravity 2.0桌面应用及一系列配套工具。产品定位从智能体式IDE转变为通用智能体优先工作平台,支持开发者同时部署多个子智能体处理不同编程任务。新功能包括通过“/schedule”命令设置定时任务,以及多种斜杠命令以提升任务可控性。产品结构改为按“project”管理,取消了与代码仓库的强绑定。云端方面,Gemini API推出Managed Agents,一次API请求即可启动一个持久化的隔离Linux环境智能体。同时,Google AI Studio移动应用开放预注册,并新增Android原生应用生成与直接导出测试的能力。
谷歌在 2026 年 I/O 开发者大会上发布智能手表平台 Wear OS 7。新版本重点升级续航与智能交互,电池续航从 Wear OS 6 升级后最高提升 10%。新增 Gemini Intelligence 支持,用户可通过语音执行智能体任务,如启动应用或完成多步骤操作。系统还能作为跨设备任务入口,减少手机依赖,同时推出 AppFunctions API 供开发者集成 Gemini 助手,增强自动化体验。
谷歌在2026年I/O开发者大会上宣布,为Google TV整合Gemini AI,推出新的应用发现工具。该工具旨在帮助用户更轻松地找到新应用和可观看内容,建立在2026年3月已上线的Gemini功能基础上。同时,谷歌改进了浏览交互方式,支持动态遥控器指针控制,相比传统十字方向键更便捷,提升内容定位和选择的效率。
谷歌在2026年I/O开发者大会上推出“Ask Play”功能,应用于Play应用商店。该功能将应用搜索转变为连续问答模式,用户可通过多轮对话逐步细化需求(如先找“无广告科幻策略游戏”,再补充“支持离线”),系统能综合上下文语义进行精准推荐。同时上线“Ask Play highlights”,在结果页顶部提供摘要,减少用户筛选时间。此外,谷歌正将Gemini大模型整合至应用推荐流程,未来几周内上线,使其能在Android和网页聊天界面中根据对话意图主动推荐相关应用。
谷歌在2026年I/O开发者大会上,面向Workspace用户推出了AI图像生成与设计工具Google Pics。该工具以网页应用形式上线,核心是将图像生成与编辑设计整合在同一流程中,用户可通过鼠标悬停点选元素,并用文字或语音指令进行局部精细调整,无需重新生成整张图片。系统会提供多个候选版本,成品可输出为JPG或PNG格式。目前仅对部分受信测试者开放,AI Pro订阅用户将在夏季稍后体验,未来计划推出移动应用并整合到更多Workspace应用中。
Google Tensor ML SDK 进入测试版,支持开发者直接在 Pixel 10 设备的 TPU 上构建和部署高性能机器学习模型。该 SDK 集成边缘部署框架 LiteRT,提供统一工作流,可高效转换、编译并运行 PyTorch 或 TFLite 模型,并具备稳定回退机制。此外,新推出的模型库包含超过 100 个经典及生成式 AI 模型(如 Gemma 3),支持低延迟、注重隐私的语音识别、计算机视觉与文本生成等功能。
谷歌于2026年5月19日发布了Gemini 3.5 Flash模型,这是Gemini系列的最新版本,主打“前沿智能,即刻行动”。该模型强调高效的实时响应与处理能力,适用于需要快速决策的场景。该发布在技术社区Hacker News上获得了116分的关注度,显示出开发者对其性能与应用潜力的浓厚兴趣。不过,目前关于该模型在速度、准确率等具体性能指标上的提升幅度,官方尚未提供详细数据。
两个基于AI的科学助手在药物重定位研究中展现出实际应用潜力。它们能够自主生成科学假设,其中一个工具还能进一步分析实验数据。这类技术有望加速药物研发流程,通过AI辅助发现现有药物的新用途,提升研究效率并降低开发成本。目前该任务已成功验证了AI在复杂生物医学问题中的辅助决策能力。