5月21日

03:35

Chubby♨️@kimmonismus

AI改变世界："工业革命的10倍规模，以10倍速度推进，即100倍"（Demis Hassabis）【引用 @kimmonismus】："我们距离AGI仅剩数年（…）现在已能初见端倪。2026、2027年将是起点。" Demis Hassabis向来不以制造热点著称。听他坦言我们正走在通向AGI的道路上，令我倍感振奋。

Chubby♨️: "We are only a few years away from AGI (...) we can start feeling it now. 2026,2027 is when it's starting." Demis Hassab...

DeepMind 大佬观点

5月20日

19:33

The Decoder：AI News（RSS）

Google 将 Genie 世界模型与街景结合，基于真实地点创建可探索的 AI 世界

Google DeepMind 将其 Genie 3 世界模型与多年积累的街景图像数据相结合，推出了一项新功能。用户现在可以在地图上指定一个真实地点，系统便能生成一个基于该地点的、可供行走和探索的 AI 生成世界。这一整合不仅为创意演示提供了强大工具，更重要的是，海量的街景数据成为了训练 AI 代理和机器人的重要战略资源，为人工智能在模拟现实环境中的交互与导航能力开辟了新路径。

DeepMind Google 产品更新具身智能

11:05

Berryxia.AI@berryxia

Google DeepMind 发布 Gemini 3.5 Flash：性能大幅提升，但成本显著增加

Google DeepMind 最新发布的 Gemini 3.5 Flash 模型在性能与速度的平衡上取得突破。其智能指数得分为 55，较上一代大幅提升，超越了 Grok 4.3 和 Claude Sonnet 4.6。模型在智能体任务和降低幻觉率方面进步显著，输出速度超过 280 tokens/s。然而，其 API 定价相比前代模型上涨约 3 倍，运行基准测试的成本更是达到 5.5 倍。这意味着 Gemini 3.5 Flash 在实现“更快更智能”的同时，也显著改变了 Flash 系列以往低成本的市场定位。

Artificial Analysis: Google's new Gemini 3.5 Flash is the clear leader on the Intelligence vs Speed Pareto frontier and makes large gains on ...

智能体 DeepMind 多模态模型发布

09:55

IT之家（RSS）

DeepMind CEO反对AI裁员论谷歌连发新模型强调AI增强生产力

谷歌DeepMind CEO哈萨比斯近期强烈批评“AI取代开发者”的论调，指出这是重大错误且别有用心。他认为企业应利用AI将工程师生产力提升3-4倍所带来的能量去扩展业务规模、探索更多创新，而非进行裁员。在谷歌I/O大会期间，公司发布了编程能力强大的Gemini 3.5 Flash模型及编程工具Antigravity，并宣布更强大的Gemini 3.5 Pro将于下月推出。这一系列动作旨在表明，AI的核心价值在于增强人类生产力，而非替代工作。

DeepMind 大佬观点行业动态

09:14

meng shao@shao__meng

Gemini Omni 来了！Google 的优势，果然还是在多模态模型吧？！

Google发布了原生多模态模型Gemini Omni。与传统模型需逐帧描述不同，它采用底层原生设计，支持以意图驱动生成视频，并能通过多轮对话进行编辑，每一步都基于上一结果，确保一致性。该模型融合了Gemini的世界知识与物理直觉，并能将图、文、音视频等任意参考物组合，实现跨模态叙事生成。其目标是“从任何东西创造任何东西”，并从视频生成起步。

Google DeepMind: We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....

DeepMind Google 多模态模型发布

08:32

Ethan Mollick@emollick

谷歌DeepMind发布实验性AI工具集Gemini for Science，旨在为科学研究全流程提供支持。该工具包含三大组件：基于NotebookLM的文献洞察工具，可自动生成数据表与报告；基于Co-Scientist的假设生成工具，通过多智能体辩论评估研究假设；以及基于AlphaEvolve的计算发现工具，能并行测试大量代码以加速建模。工具集体现了AI作为科研力量倍增器的理念，目前在生物科学领域应用较为突出，并将持续迭代优化。

Pushmeet Kohli: The results of the research happening in my team @GoogleDeepMind have convinced me that the next era of scientific disco...

智能体 DeepMind Google 产品更新

06:16

The Verge：AI（RSS）

谷歌DeepMind负责人：我们可能正处在"奇点"的初始阶段

在谷歌I/O 2026主题演讲的压轴环节，谷歌DeepMind首席执行官德米斯·哈萨比斯将当下称为“人类的深刻时刻”。他宣布发布Gemini 2.5 Pro和2.5 Flash模型，并介绍了“Project Astra”原型项目的最新进展。哈萨比斯宣称，谷歌尖端的AI研究将释放通用人工智能（AGI）的巨大潜力，成为人类创造力的“力量倍增器”，开启科学发现的新黄金时代，最终改善全球每个人的生活。在回顾展望时他表示，我们可能正处在“奇点”的初始阶段。

DeepMind 大佬观点行业动态

03:11

Google DeepMind@GoogleDeepMind

我们希望借助AI帮助科学家发现下一个重大突破。 Gemini for Science是我们全新的实验性工具套件，旨在帮助他们探索更多假设、大规模验证工作、轻松解析文献等。🧵

DeepMind Google 产品更新多模态

02:55

AYi@AYi_AInotes

Google Gemini Omni重新定义视频生成

Google推出Gemini Omni，首个面向消费者的世界模型。它通过自然语言交互，将Gemini的智能与生成媒体系统结合，实现了对物理规律、历史、生物等世界的深刻理解。用户可以像编辑ChatGPT文本一样用单句指令编辑视频，实现人物一致性、风格迁移、角度调整等功能。它不是单纯生成像素，而是模拟连贯的物理与语义世界，标志着AI视频生成从拼接工具向智能创作系统的飞跃。

Google DeepMind: We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....

DeepMind Google 图像生成多模态

02:03

Artificial Analysis@ArtificialAnlys

速度智能兼得的新一代AI：谷歌Gemini 3.5 Flash发布

谷歌发布新模型Gemini 3.5 Flash，其在智能指数上提升9分至55分，超越Grok 4.3和Claude Sonnet 4.6，尤其在代理任务和知识真实性（大幅减少幻觉）方面进步显著。输出速度超280 tokens/s，使其位于速度与智能的领先前沿。然而，模型运行成本相比前代增加5.5倍，主要由于输入令牌用量及定价上涨。此外，它在多模态评估MMMU-Pro中取得最高分，支持多模态输入，展现了谷歌的综合优势。

智能体 DeepMind Google 多模态

01:48

Google DeepMind：Blog（RSS）

同事件精选83

推出Gemini Omni多模态AI模型

谷歌推出原生多模态AI模型Gemini Omni，能够整合视频、图像、音频和文本等多种输入，生成高质量视频内容。其核心能力是通过自然语言对话进行视频编辑，并能保持角色一致性、物理规律与场景连贯性。首个模型Gemini Omni Flash已上线，未来将支持图像和音频输出。Gemini Omni结合了对物理世界的直觉理解与丰富的知识库，支持从写实到叙事的创意生成，并可通过多轮对话持续编辑视频，而不丢失原始场景上下文。

DeepMind Google 多模态模型发布

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Gemini Omni 把视频生成从画面堆砌推到了物理世界叙事，多轮自然语言编辑和世界知识融合是真正的代际升级，做视频内容的该重新理解工具的定义了。

01:48

Google DeepMind：Blog（RSS）

使用 Project Genie 和 Street View 模拟真实世界场景

谷歌宣布向全球的 Google AI Ultra 订阅者开放新的访问权限，并推出一项基于 Street View 数据驱动的全新功能。该功能能够模拟真实世界的地点与场景，标志着 AI 在结合地理信息与沉浸式体验方面迈出新步伐，为用户带来更具现实感的交互与探索可能性。

DeepMind Google 产品更新具身智能

01:41

Google DeepMind@GoogleDeepMind

我们推出Gemini Omni：这是迈向一个能从任何内容生成任何内容的模型的第一步--从视频开始。它结合了Gemini的智能与我们的生成式媒体系统--代表了在世界理解、多模态和编辑方面的飞跃🧵

DeepMind Google 多模态模型发布

5月19日

18:51

IT之家（RSS）

消息称谷歌 DeepMind 创始人哈萨比斯是 Anthropic 的天使投资人，门徒撑起半个 AI 圈

谷歌 DeepMind 创始人德米斯·哈萨比斯被披露为人工智能公司 Anthropic 的天使投资人。Anthropic 是谷歌的主要竞争对手，估值已达 9000 亿美元。此外，自 2021 年以来，前 DeepMind 科研人员创办的十余家公司累计融资至少 140 亿美元，包括哈萨比斯创立的 Isomorphic Labs 等。同时，多名 DeepMind 高层已调任谷歌关键岗位。这一系列动态突显了哈萨比斯的影响力以及 DeepMind 人才对 AI 行业的广泛推动作用。

Anthropic DeepMind 现象/趋势行业动态

5月17日

21:50

Google DeepMind：Blog（RSS）

精选55

Gemini for Science：面向科学的AI实验与工具，开启发现新时代

Google 推出 Gemini for Science 项目，发布一系列基于 Gemini 模型的科学工具与实验性应用。该项目旨在扩展科学探索的规模与精度，通过人工智能辅助研究人员处理复杂计算、模拟实验系统并加速数据分析流程。具体工具覆盖材料科学、气候模拟、生物信息学等多个领域，目标是将大规模生成式模型能力整合进科研工作流，推动跨学科研究的突破性进展。

智能体 DeepMind Google 产品更新

关联讨论 3 条

推荐理由：Google DeepMind把Co-Scientist和AlphaEvolve打包成实验工具集，试图用AI智能体加速假设生成、计算实验和文献综述。虽然还只是原型，但这是科学AI走向产品化的信号，科研人员可以试试。

16:40

Rohan Paul@rohanpaul_ai

DeepMind研究揭示AI智能体核心安全风险在于其交互环境

Google DeepMind论文指出，AI智能体的安全威胁不仅源于模型本身，更在于其实时交互的信息环境。研究首次系统阐述了如何将网络武器化以攻击自主智能体，并提出了针对感知、推理、记忆、行动等维度的“AI智能体陷阱”分类法。关键发现是，对智能体构成威胁的网页无需呈现恶意外观，因为它们可能解析人类不可见的隐藏内容。一旦引入RAG等记忆机制，潜伏的记忆污染攻击成功率可超过80%。研究强调，当智能体能在推理时摄取网络信息，每个页面、文档和记忆写入都成为了安全边界的一部分。

智能体 DeepMind 安全/对齐

5月16日