AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 649 条
全部一手资讯X论文
标签「Google」清除
5月20日周三
02:55IT之家(RSS)73谷歌搜索迎 25 年来最大改版,AI 重塑搜索体验与交互方式
02:55IT之家(RSS)63谷歌发布 Ask YouTube,搜索视频支持完整句子与连续追问
02:55IT之家(RSS)64谷歌升级 Workspace:语音对话协作 AI 检索邮件、起草文档、整理笔记
02:55IT之家(RSS)60谷歌推出 AI 通用购物车,联合亚马逊、Meta、微软打造 AI 电商协议
02:55IT之家(RSS)54谷歌携手三星展示 2 款智能眼镜:整合 Gemini AI,支持语音导航、实时翻译
02:55IT之家(RSS)54谷歌展示街景版 Genie 世界 AI 模型,用真实街景创建想象世界
02:55IT之家(RSS)54谷歌升级 AI 创意平台 Flow:增强视频编辑,Agent 辅助头脑风暴等
02:55IT之家(RSS)56谷歌推出科研版 Gemini,能追踪论文、写实验代码
02:37Ars Technica:AI(RSS)65Google的SynthID AI水印技术正被OpenAI、Nvidia等采用
02:28Hacker News 热门(buzzing.cc 中文翻译)66谷歌I/O开发者大会
02:25Google Developers Blog(RSS)58精选重要更新:Gemini CLI将迁移至Antigravity CLI
02:18Google Blog:AI(RSS)74精选Google AI 订阅服务全新内容,源自 I/O 2026 大会
02:18Google Blog:AI(RSS)70精选AI搜索的新时代
02:18Google Blog:AI(RSS)83精选Gemini 3.5:前沿智能与行动能力相结合
02:18Google Blog:AI(RSS)89精选I/O 2026: 欢迎来到自主的 Gemini 时代
02:18Google Blog:AI(RSS)75精选Google Workspace 推出全新创建方式与高效工作功能
02:18Google Blog:AI(RSS)71精选AI Mode 如何改变美国人的搜索方式
02:11Ars Technica:AI(RSS)60Gemini 3.5 Flash 可能足够快,让生成式AI真正实用起来
02:11VentureBeat:AI(RSS)69Google 25年来首次重塑搜索框:AI驱动对话时代来临
02:06Google Research:Blog(网页)65精选经验研究助手(ERA):从Nature发表到催化计算发现
02:00OpenAI:官网动态(RSS · 排除企业/客户案例)51推进内容溯源,构建更安全、更透明的AI生态系统
01:59The Decoder:AI News(RSS)63谷歌I/O开发者大会公告:新模型、永不休眠的云端代理与重新设计的Gemini应用
01:55IT之家(RSS)77精选谷歌每月处理超 3200 万亿 Token,同比增长 7 倍
01:55IT之家(RSS)77谷歌 Gemini Omni 全能模型发布:可从任意输入生成任意输出,一句话让 AI 修改视频
01:55IT之家(RSS)50谷歌 Gemini 集成 C2PA 内容凭证:增强判断图片是否经过 AI 编辑
01:55IT之家(RSS)50谷歌 Gemini 3.5 Pro 模型官宣下月登场:已在内部使用,进步超强
01:55IT之家(RSS)73谷歌发布 Gemini 3.5 Flash 模型:AI 输出速度 4 倍于 GPT-5.5
01:55IT之家(RSS)59谷歌推出 AI Ultra 新订阅计划,月费 100 美元起
01:55IT之家(RSS)51谷歌发布安卓 Halo,在手机顶栏实时显示 AI 智能体状态
01:55IT之家(RSS)68谷歌 Gemini Spark 个人智能体发布:一句话让 AI 干几份活,不用担心乱搞数据
01:48Google Blog:AI(RSS)81精选Google I/O 2026
01:48Google DeepMind:Blog(RSS)81精选介绍 Google Antigravity 2.0
01:48Google DeepMind:Blog(RSS)83同事件精选推出Gemini Omni多模态AI模型同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
01:48Google DeepMind:Blog(RSS)51使用 Project Genie 和 Street View 模拟真实世界场景
5月19日周二
15:51IT之家(RSS)42消息称谷歌收紧 Gemini 免费版,设置百分比周限额
10:45IT之家(RSS)73精选谷歌联手黑石组建 AI 云公司:50 亿美元起步,2027 年冲刺 500 兆瓦
5月17日周日
21:50Google DeepMind:Blog(RSS)55精选Gemini for Science:面向科学的AI实验与工具,开启发现新时代
21:43Google DeepMind:Blog(RSS)63精选让了解网络内容的创建和编辑过程变得更简单
10:44IT之家(RSS)65谷歌前 CEO 施密特毕业演讲被嘘:AI 焦虑触动学子神经
01:32Nathan Lambert:Interconnects(RSS)53最新开源成果(#21):开源模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月20日
02:55
IT之家(RSS)
73
谷歌搜索迎 25 年来最大改版,AI 重塑搜索体验与交互方式

谷歌在2026年I/O开发者大会上宣布,旗下搜索业务迎来25年来最大改版,核心是用AI重塑搜索入口与交互方式,由最新Gemini 3.5 Flash模型提供支撑。主要变化包括:用户交互从输入关键词转向描述完整需求,搜索框将动态扩展并支持文本、图片、视频等多模态输入。用户可从AI概览中连续追问,形成聊天式对话。新版引入搜索智能体,可在后台24小时运行并追踪用户设定的目标。此外,谷歌将生成式界面功能引入搜索,并将个人智能扩展至98种语言、近200个国家。据悉,AI Mode月活用户已突破10亿,查询量每季度翻倍。

智能体Google产品更新多模态
02:55
IT之家(RSS)
63
谷歌发布 Ask YouTube,搜索视频支持完整句子与连续追问

谷歌在2026年I/O大会上发布了“Ask YouTube”功能,将视频搜索从关键词匹配升级为对话式搜索。用户可使用完整句子描述复杂需求,系统将理解真实意图并提供更精准的结果。该功能支持连续追问,以逐步缩小搜索范围,并从YouTube整个平台的视频库(含长短视频)中整理出最相关的互动式回应。目前,此功能已向美国18岁及以上的YouTube Premium会员开放,未来将扩展至所有用户。

Google产品更新搜索
02:55
IT之家(RSS)
64
谷歌升级 Workspace:语音对话协作 AI 检索邮件、起草文档、整理笔记

谷歌在2026年I/O开发者大会上宣布升级Google Workspace,将Gmail、Docs、Keep等工具整合为支持自然语音交互的协作助手。核心新功能包括:可通过语音直接检索邮件内容的Gmail Live、支持口述起草与格式整理的Docs Live,以及能自动将零散想法整理成清单的Keep更新,旨在将办公流程从点击输入转向更自然的语音交互。此外,谷歌还推出了基于Nano Banana模型的独立图像编辑应用Google Pics,支持对图像进行精确的局部对象分割与修改。

Google产品更新多模态语音
02:55
IT之家(RSS)
60
谷歌推出 AI 通用购物车,联合亚马逊、Meta、微软打造 AI 电商协议

在2026年I/O开发者大会上,谷歌宣布推出AI电商通用购物车“Universal Cart”及相关协议。核心协议包括开源的通用购物车协议UCP(获亚马逊、Meta、微软等支持),旨在为智能体提供通用语言;以及智能体支付协议AP2,用于管理AI支付流程。该功能将于今年夏天在谷歌搜索、Gemini、YouTube、Gmail中上线,支持多场景添加商品、追踪优惠与历史价格,并具备智能推理能力,可检测兼容性并推荐替代品。

智能体Google产品更新开源生态
02:55
IT之家(RSS)
54
谷歌携手三星展示 2 款智能眼镜:整合 Gemini AI,支持语音导航、实时翻译

谷歌在2026年I/O开发者大会上携手三星发布了2款智能眼镜,由Gentle Monster与Warby Parker参与设计。眼镜定位为手机伴侣设备,深度整合Gemini AI模型,核心功能包括语音导航、实时翻译(音频及视觉文字翻译)、基于路线的个性化推荐与订单下达,并能将通知压缩为摘要。外观提供时尚与经典两种风格。产品售价尚未公布,传闻无显示版本价格区间为379至499美元,预计今年秋季上市。

Google产品更新多模态端侧
02:55
IT之家(RSS)
54
谷歌展示街景版 Genie 世界 AI 模型,用真实街景创建想象世界

谷歌在2026年I/O开发者大会上宣布,将街景服务与Project Genie世界模型结合。Genie原本能生成可互动的虚拟环境,此次更新后可直接基于真实街景图像构建可探索的3D世界,用于AI智能体或机器人训练。用户可通过Google Maps选择美国地点并指定风格(如“石器时代”),生成定制化想象世界。该能力目前为实验性原型,仅支持美国地点,未来计划逐步扩展。

Google产品更新具身智能多模态
02:55
IT之家(RSS)
54
谷歌升级 AI 创意平台 Flow:增强视频编辑,Agent 辅助头脑风暴等

谷歌在2026年I/O大会上宣布升级AI创意平台Flow,重点整合Gemini Omni Flash模型,显著提升视频编辑精度和多镜头角色一致性。同时推出Flow Agent,能辅助头脑风暴、内容生成与批量编辑。此外还新增了自然语言定制工具的Flow Tools和支持分段编辑的Flow Music功能。目前Flow已覆盖全球140多个国家和地区。

Google产品更新多模态视频
02:55
IT之家(RSS)
56
谷歌推出科研版 Gemini,能追踪论文、写实验代码

在2026年谷歌I/O开发者大会上,谷歌宣布推出专用于科研领域的Gemini for Science模型。该模型能够实时追踪前沿论文、将研究目标转化为可执行的实验代码,并生成新的科学假设。谷歌同时透露,未来该技术有望模拟更复杂的生物系统,甚至包括虚拟细胞。目前,谷歌已有多个基于该技术的项目进入临床前阶段,聚焦免疫疾病与癌症等领域,旨在重新构想药物发现的流程。

Google产品更新多模态
02:37
Ars Technica:AI(RSS)
65
Google的SynthID AI水印技术正被OpenAI、Nvidia等采用

Google推出了名为SynthID的AI内容水印技术,该技术能为AI生成的文本、图像、音频等内容嵌入几乎不可察觉的标识。目前,OpenAI、Nvidia等多家领先AI公司已开始采用这一技术。SynthID旨在帮助用户和平台在AI生成内容日益逼真的背景下,有效鉴别内容来源,区分真实与合成信息,从而提升AI生态的透明度与可信度。

GoogleOpenAI安全/对齐行业动态
02:28
Hacker News 热门(buzzing.cc 中文翻译)
66
谷歌I/O开发者大会

谷歌I/O开发者大会的官方页面现已上线,定于2026年举行。页面展示了大会的主视觉设计,并提供了官方网站链接与具体发布时间信息。作为谷歌年度重要的开发者活动,I/O大会通常涉及新产品、技术平台与开发者工具的发布与更新。目前大会的具体议程与发布内容尚未披露,预计将在后续公布更多细节。

Google行业动态
02:25
Google Developers Blog(RSS)
精选58
重要更新:Gemini CLI将迁移至Antigravity CLI

Google正在整合其AI终端工具,将面向社区的Gemini CLI迁移至全新平台Antigravity CLI。这款新工具采用Go语言开发,作为代理优先的平台,支持复杂的多代理工作流,并提供更快的执行速度、异步处理能力以及与Antigravity 2.0桌面应用同步的统一架构。企业客户可维持现有访问权限,但个人及免费用户必须在2026年6月18日Gemini CLI停止服务前,完成向新平台的迁移。

智能体Google产品更新

推荐理由:Google 终端工具从 Gemini CLI 全面转向 Antigravity CLI,强调 agent 优先和多 agent 工作流,6 月 18 日后 Gemini CLI 停服,个人用户得赶紧迁移。
02:18
Google Blog:AI(RSS)
精选74
Google AI 订阅服务全新内容,源自 I/O 2026 大会

Google 在 I/O 2026 大会上宣布更新其 AI 订阅服务,推出了全新的 100 美元“AI Ultra”计划。同时,面向 Google AI Plus、Pro 和 Ultra 三个层级的现有订阅者,服务均增加了新的功能和权益。此次更新标志着 Google 在 AI 付费订阅领域推出了更高端的选项并强化了现有套餐的价值。

Google产品更新

推荐理由:Google 在 I/O 上推出 $100 的 AI Ultra 计划,这是大厂把 AI 订阅当成‘基础套餐’来卖的信号,虽然细节还不算多,但想知道 Google AI 付费版最新整合的可以进去看一眼。
02:18
Google Blog:AI(RSS)
精选70
AI搜索的新时代

谷歌宣布了其搜索引擎与AI技术融合的最新进展,标志着AI搜索进入新阶段。此次更新旨在将搜索引擎的广度与AI的深度理解能力相结合,目标是提供更智能、更直观的搜索体验,推动搜索技术的下一代演进。

Google产品更新搜索

推荐理由:Google搜索宣称开启AI新纪元,但这次官宣只放了张图没给干货,搜索入口的任何变动都牵动流量,值得跟踪但别急着判断。
02:18
Google Blog:AI(RSS)
精选83
Gemini 3.5:前沿智能与行动能力相结合

Google 在 I/O 大会上正式发布了最新的 Gemini 3.5 模型系列。该系列模型将前沿的人工智能能力与执行操作的功能相结合,旨在提供更强的综合性能。作为 Google 最新推出的模型,它代表了其在大模型技术上的最新进展。

智能体Google多模态推理

推荐理由:Google 在 I/O 上甩出 Gemini 3.5,这次不只拼多模态,更强调‘行动’,是所有做 Agent 的团队必须对标的新基座。
02:18
Google Blog:AI(RSS)
精选89
I/O 2026: 欢迎来到自主的 Gemini 时代

Google 在 I/O 2026 大会上宣布 Gemini 进入自主代理时代,新功能使其能够自动执行复杂任务,显著提升用户工作效率。大会展示了 Gemini 如何通过代理操作简化工作流程,实现自动化处理,例如自动管理邮件、安排日程或生成报告,帮助用户从重复性工作中解放出来,专注于创造性任务。这一更新基于先进机器学习模型,强调准确性与效率,标志着 AI 助手向更智能、更自主的方向发展。

智能体Google模型发布

推荐理由:谷歌 I/O 大会上 Sundar Pichai 亲自宣布 agentic Gemini 时代到来,这是把 Gemini 从对话助手升级成真正能自主执行任务的 agent,所有做 AI 应用的接下来都得重新看一遍技术选型。
02:18
Google Blog:AI(RSS)
精选75
Google Workspace 推出全新创建方式与高效工作功能

Google 在最新更新中为 Gmail、Docs 和 Keep 增添了新的语音功能,并推出了一款名为 Google Pics 的全新设计工具。同时,其 AI Inbox 功能也得到了升级与优化。这些更新旨在进一步提升用户在工作场景中的协作效率与创作体验,通过集成更智能的工具和交互方式,帮助用户更便捷地完成多项任务。

Google产品更新多模态语音

推荐理由:Google Workspace 直接植入了语音操作和设计工具 Pics,这波更新对办公效率很实在,做产品和运营的可以关注一下实际落地效果。
02:18
Google Blog:AI(RSS)
精选71
AI Mode 如何改变美国人的搜索方式

AI Mode 上线一周年,美国用户搜索行为呈现关键转变。数据显示,用户正从传统的关键词输入模式逐渐转向自然语言查询,这一变化反映了AI搜索技术的普及和用户交互方式的优化。自然语言查询的使用率显著提升,体现了AI搜索在日常信息获取中的影响力增强,预示着未来搜索体验的革新方向。

Google搜索现象/趋势

推荐理由:AI Mode 上线一周年,Google 第一次拿出用户行为数据,从关键词到自然语言的转向比想象中快,做搜索和 SEO 的可以重新理解用户意图了。
02:11
Ars Technica:AI(RSS)
60
Gemini 3.5 Flash 可能足够快,让生成式AI真正实用起来

Google发布了更高效的Gemini 3.5 Flash模型。该公司表示,这款模型的效率提升是实现智能体式AI未来的关键所在,意味着生成式AI的应用将更为便捷和实用。

智能体Google模型发布
02:11
VentureBeat:AI(RSS)
69
Google 25年来首次重塑搜索框:AI驱动对话时代来临

在2026年I/O大会上,Google宣布对其标志性搜索框进行25年来最大升级。搜索框从简单的关键词输入,演变为支持文本、图像、PDF、视频及网页标签等多模态输入的AI对话起点。同时,AI概览与AI模式合并为统一体验,用户无需在传统结果与AI生成答案间切换。此次升级标志着Google核心产品正从关键词检索工具,彻底转向以AI和全网知识为基础的开放式对话界面。

智能体Google产品更新多模态
02:06
Google Research:Blog(网页)
精选65
经验研究助手(ERA):从Nature发表到催化计算发现

Google Research开发的经验研究助手(ERA)现已在《Nature》期刊发表论文。这是一款基于Gemini的AI工具,旨在协助科学家编写专业级经验科学代码,其核心能力包括搜索文献、生成代码、探索方案并迭代优化,以加速耗时的计算实验过程。该工具已被用于构建“计算发现”原型,并已通过Google Labs的“可信赖测试者计划”向更广泛的科学家群体开放初步试用。

Google产品更新编码

推荐理由:谷歌把AI科学编码工具ERA发到了Nature,顺便在Google Labs推出了计算发现实验版,流行病预测和碳追踪的案例很扎实,科研圈的开发者和产品人可以关注下实际进展。
02:00
OpenAI:官网动态(RSS · 排除企业/客户案例)
51
推进内容溯源,构建更安全、更透明的AI生态系统

OpenAI推出了新的AI内容溯源体系,旨在提升AI生成媒体的可信度。该体系集成了Content Credentials和SynthID两种技术标准,并配套推出了一个验证工具。此举的核心目标是帮助公众有效识别AI生成的内容,从而建立对AI媒体的信任,最终推动一个更安全、更透明的AI生态发展。

GoogleOpenAI产品更新安全/对齐
01:59
The Decoder:AI News(RSS)
63
谷歌I/O开发者大会公告:新模型、永不休眠的云端代理与重新设计的Gemini应用

谷歌在I/O开发者大会上发布了一系列新AI产品,包括轻量级模型Gemini 3.5 Flash和多模态模型Gemini Omni。同时推出名为Gemini Spark的个人代理,该代理可在云端24/7全天候运行。此外,Gemini应用程序也进行了重大重新设计。

智能体Google产品更新多模态
01:55
IT之家(RSS)
精选77
谷歌每月处理超 3200 万亿 Token,同比增长 7 倍

在2026年谷歌I/O开发者大会上,谷歌宣布其AI业务关键指标大幅增长。2026年5月,谷歌每月处理的Token数量超过3200万亿,同比增长达7倍。其Gemini App月度活跃用户已突破9亿,同比增长超过一倍,每日请求量增长超7倍。此外,Nano Banana模型已累计生成超过500亿张图片。

Google现象/趋势行业动态

推荐理由:谷歌AI用量一年涨7倍,Gemini月活破9亿,这不是谷歌自己的数字,是整个AI产业从尝鲜到普及的放大镜。
01:55
IT之家(RSS)
77
谷歌 Gemini Omni 全能模型发布:可从任意输入生成任意输出,一句话让 AI 修改视频

在2026年谷歌I/O开发者大会上,谷歌正式推出Gemini Omni模型。该模型代表了Gemini家族迄今最全面的能力,“Omni”意为全能,能够无缝处理文本、图像、音频和视频等多种信息模态,实现“从任何输入生成任何输出”。其核心亮点在于支持对话式编辑,用户可通过自然语言指令轻松修改视频元素。同时,谷歌发布了首款衍生模型Gemini Omni Flash,现已在Gemini App、Google Flow和YouTube Shorts中可用,后续将提供API服务。

Google多模态模型发布视频
01:55
IT之家(RSS)
50
谷歌 Gemini 集成 C2PA 内容凭证:增强判断图片是否经过 AI 编辑

谷歌在2026年I/O开发者大会上宣布,Gemini正式集成C2PA内容凭证标准,以增强对深度伪造内容的识别能力。此前,其SynthID技术已为超过10亿张图片视频以及6万年的音频添加隐形水印。目前,用户可在谷歌搜索和Chrome浏览器中直接使用相关功能,通过圈选图片或右键点击来查询特定图像是否经过AI编辑处理。

Google产品更新安全/对齐
01:55
IT之家(RSS)
50
谷歌 Gemini 3.5 Pro 模型官宣下月登场:已在内部使用,进步超强

谷歌在2026年I/O开发者大会上宣布,新一代模型Gemini 3.5 Pro将于下月正式发布。该模型目前已在谷歌内部投入使用,官方表示其性能相比前代有显著提升。不过,具体的技术细节和性能指标尚未公开。

Google模型发布
01:55
IT之家(RSS)
73
谷歌发布 Gemini 3.5 Flash 模型:AI 输出速度 4 倍于 GPT-5.5

谷歌在2026年I/O开发者大会上推出了Gemini 3.5 Flash模型。该模型在多项基准测试中性能超越前代,并实现了每秒289 tokens的输出速度,较Claude Opus 4.7和GPT-5.5 xhigh快约4倍。此外,谷歌团队使用Antigravity工具,在12小时内启动93个子智能体,生成26亿tokens,成功构建出一个可运行的操作系统核心,展示了模型的强大能力。

Google推理模型发布
01:55
IT之家(RSS)
59
谷歌推出 AI Ultra 新订阅计划,月费 100 美元起

谷歌在2026年I/O开发者大会上宣布推出全新的AI订阅计划,月费100美元起。该计划位于现有20美元AI Pro与250美元AI Ultra之间,旨在填补面向高级用户的市场空白,为处理复杂工作流或AI编程的用户提供介于两者之间的资源配额。此举旨在通过更精细的定价策略,与Anthropic、OpenAI等竞争对手争夺中高端市场。

Google产品更新
01:55
IT之家(RSS)
51
谷歌发布安卓 Halo,在手机顶栏实时显示 AI 智能体状态

谷歌在2026年I/O开发者大会上发布了安卓Halo功能,旨在提升手机端AI助手的透明度。该功能将在手机屏幕顶部显示一个状态提示图标,向用户实时展示AI智能体是否正在运行、处理任务或发送消息。此设计解决了用户需反复切换应用查看AI进度的痛点,使任务状态在任何应用界面下都保持可见。Halo功能将首先支持Gemini Spark,并计划在2026年晚些时候扩展支持更多AI智能体。

智能体Google产品更新
01:55
IT之家(RSS)
68
谷歌 Gemini Spark 个人智能体发布:一句话让 AI 干几份活,不用担心乱搞数据
智能体GoogleMCP/工具产品更新
01:48
Google Blog:AI(RSS)
精选81
Google I/O 2026

在Google I/O 2026大会上,Google宣布了多项旨在让AI更普惠、更实用的更新。这些发布聚焦于提升人工智能的辅助能力,使其能够服务更广泛的用户群体。大会涵盖了AI在开发者工具、用户应用以及日常生活场景中的具体改进,强调通过技术优化实现更自然、更便捷的人机交互体验。

Google行业动态

推荐理由:Google I/O 2026 官方合集,一页看完今年谷歌所有的 AI 动作,从模型到产品都在这,嫌消息碎的收藏这篇就够了。
01:48
Google DeepMind:Blog(RSS)
精选81
介绍 Google Antigravity 2.0

Google Antigravity 2.0 是一款全新独立桌面应用,支持 macOS、Linux 和 Windows,无 IDE 绑定,由最新 Gemini 模型驱动,面向企业。核心为智能体,支持同步与异步交互。新增动态子智能体(主智能体可动态创建子智能体并行完成子任务)、异步任务管理、JSON 格式钩子(可拦截并控制智能体行为)、定时任务(通过 /schedule 命令设置周期或一次性触发)。引入“项目”概念替代“工作区”,可跨多个文件夹并独立设置权限与规则。新增斜杠命令:/goal 自动执行至完成、/grill-me 实施前反向确认、/browser 显式控制浏览器。语音输入改为实时转录。

智能体Google产品更新

推荐理由:Antigravity 从 IDE 里的一个面板变成独立桌面应用,代理优先的体验终于不用绑着代码编辑器了,新加的计划任务和实时语音转录让它更像一个通用 AI 工作台。
01:48
Google DeepMind:Blog(RSS)
同事件精选83
推出Gemini Omni多模态AI模型

谷歌推出原生多模态AI模型Gemini Omni,能够整合视频、图像、音频和文本等多种输入,生成高质量视频内容。其核心能力是通过自然语言对话进行视频编辑,并能保持角色一致性、物理规律与场景连贯性。首个模型Gemini Omni Flash已上线,未来将支持图像和音频输出。Gemini Omni结合了对物理世界的直觉理解与丰富的知识库,支持从写实到叙事的创意生成,并可通过多轮对话持续编辑视频,而不丢失原始场景上下文。

DeepMindGoogle多模态模型发布
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:Gemini Omni 把视频生成从画面堆砌推到了物理世界叙事,多轮自然语言编辑和世界知识融合是真正的代际升级,做视频内容的该重新理解工具的定义了。
01:48
Google DeepMind:Blog(RSS)
51
使用 Project Genie 和 Street View 模拟真实世界场景

谷歌宣布向全球的 Google AI Ultra 订阅者开放新的访问权限,并推出一项基于 Street View 数据驱动的全新功能。该功能能够模拟真实世界的地点与场景,标志着 AI 在结合地理信息与沉浸式体验方面迈出新步伐,为用户带来更具现实感的交互与探索可能性。

DeepMindGoogle产品更新具身智能
5月19日
15:51
IT之家(RSS)
42
消息称谷歌收紧 Gemini 免费版,设置百分比周限额
Google产品更新
10:45
IT之家(RSS)
精选73
谷歌联手黑石组建 AI 云公司:50 亿美元起步,2027 年冲刺 500 兆瓦

谷歌与黑石集团宣布合作成立一家新的AI云服务公司,黑石率先投入50亿美元股权资本,结合后续杠杆,总投资规模预计约250亿美元。该公司计划依托谷歌自研的TPU芯片和云基础设施,与CoreWeave等算力服务商展开竞争,并争取在2027年上线容量达500兆瓦的数据中心,相当于一座中等城市的用电规模。此举标志着谷歌迄今最大规模的对外芯片商业化尝试,将加剧与英伟达等公司在AI算力市场的角逐。

Google行业动态部署/工程

推荐理由:谷歌第一次把TPU武装到对外市场,拉黑石砸250亿美元建云公司,要正面抢英伟达的算力饭碗,做AI基础设施生意的人必须盯着这件事。
5月17日
21:50
Google DeepMind:Blog(RSS)
精选55
Gemini for Science:面向科学的AI实验与工具,开启发现新时代

Google 推出 Gemini for Science 项目,发布一系列基于 Gemini 模型的科学工具与实验性应用。该项目旨在扩展科学探索的规模与精度,通过人工智能辅助研究人员处理复杂计算、模拟实验系统并加速数据分析流程。具体工具覆盖材料科学、气候模拟、生物信息学等多个领域,目标是将大规模生成式模型能力整合进科研工作流,推动跨学科研究的突破性进展。

智能体DeepMindGoogle产品更新
关联讨论 3 条X:Google AI for Developers (@googleaidevs)X:Google DeepMind (@GoogleDeepMind)X:Google AI (@GoogleAI)
推荐理由:Google DeepMind把Co-Scientist和AlphaEvolve打包成实验工具集,试图用AI智能体加速假设生成、计算实验和文献综述。虽然还只是原型,但这是科学AI走向产品化的信号,科研人员可以试试。
21:43
Google DeepMind:Blog(RSS)
精选63
让了解网络内容的创建和编辑过程变得更简单

平台宣布扩展其内容透明工具,旨在让用户更便捷地追溯网络内容的创建与编辑历史。这项更新将适用于社交媒体平台、网页内容等多个场景,帮助用户识别信息的修改痕迹,提升数字内容的透明度。

Google产品更新多模态安全/对齐

推荐理由:Google 把 SynthID 水印和 C2PA 凭证推向搜索、Chrome 和 API,普通人也能随手查「这是 AI 做的吗?」,这对虚假信息是实际的约束。
10:44
IT之家(RSS)
65
谷歌前 CEO 施密特毕业演讲被嘘:AI 焦虑触动学子神经

谷歌前CEO埃里克·施密特在亚利桑那大学毕业典礼演讲时,因谈论人工智能引发学生嘘声。他承认毕业生对AI导致工作消失、气候危机等问题的恐惧“在情理之中”,并指出技术发展加剧了社会分化。施密特鼓励学生主动塑造AI未来,而非被动接受。当前,AI自动化已导致Klarna、IBM等公司裁员,约半数美国人对AI普及感到担忧。相比之下,英伟达CEO黄仁勋近期演讲基调更积极,强调掌握AI技能将创造新机会。

Google行业动态
01:32
Nathan Lambert:Interconnects(RSS)
53
最新开源成果(#21):开源模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。基于CAISI的V4评估。

本月开源AI模型领域迎来密集发布,包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新,反映出开源社区当前高速迭代的竞争态势。

DeepSeekGoogle大佬观点开源生态
‹ 上一页
1…89101112…17
下一页 ›