宝玉@dotey

2026-05-01 08:47·62天前

AI 摘要

Demis Hassabis认为当前AI范式（预训练+RLHF+思维链）可能是AGI架构的一部分，但仍有50%概率需要一两个关键突破，未解决持续学习、长程推理和记忆等问题。他指出，百万token上下文窗口处理实时视频仅够20分钟，现有方法如同“用胶带糊住”。AlphaGo时代的技术正被重新引入基础模型以推动进步。智能体尚处实验阶段，投入产出比不匹配。完整虚拟细胞等科学突破还需约10年，关键瓶颈是活细胞成像技术。

http://x.com/i/article/2050005869304102912

Demis Hassabis：AGI 还缺什么，智能体到底行不行，下一个科学突破长什么样

Demis Hassabis 是 Google DeepMind 的 CEO，也是 Isomorphic Labs 的 CEO。他在棋手神童和游戏开发者的身份之外，拿了认知神经科学的博士学位，研究海马体和记忆的工作方式。2024 年，他因为 AlphaFold 的工作获得诺贝尔化学奖。

这次他做客 Y Combinator 的 How to Build the Future 直播，和 YC CEO Garry Tan 聊了四十分钟。几个核心话题：当前 AI 范式距离 AGI 还差什么、智能体的真实水平、AI 在科学领域的突破模式，以及给深科技创业者的建议。

原始视频：https://www.youtube.com/watch?v=JNyuX1zoOgU

原始标题：Demis Hassabis： Agents， AGI & The Next Big Scientific Breakthrough

要点速览

Hassabis 认为当前范式（预训练+RLHF+ 思维链）会是 AGI 架构的一部分，但有 50% 的概率还需要一两个尚未发现的关键突破，持续学习、长程推理和记忆是三个未解问题

百万 token 上下文窗口听起来很大，但处理实时视频时只够录 20 分钟，当前把所有东西塞进上下文窗口的做法是"用胶带糊住的临时方案"

AlphaGo 和 AlphaZero 时代的技术（蒙特卡洛树搜索等）正在被重新引入当代基础模型，Hassabis 认为未来几年的进步将大量来自这些旧想法的规模化应用

他用下棋来测试 Gemini 的推理能力，发现模型会识别出一步是错棋，找不到更好选择后又回去走那步错棋，这种"缺乏自省"是当前推理系统的核心缺陷

创造力的真正测试是能否从一段高层描述中发明围棋这个游戏本身，AlphaGo 下出 Move 37 级别的创造力还远远不够

完整虚拟细胞大约还需要 10 年，关键瓶颈是无法在不杀死细胞的情况下对活细胞进行纳米级分辨率成像

他给创业者的建议：如果你的 AGI 时间线是 2030 年，深科技创业通常需要 10 年，那 AGI 会在你旅程的中途出现，你的商业计划必须把这个因素算进去

【1】AGI 还缺一两块拼图，概率 50/50

Garry Tan 开场问：当前的 AI 范式，大规模预训练、RLHF、思维链，这些东西里已经包含了多少 AGI 的最终架构？还有什么根本性的缺失？

Hassabis 的回答比较谨慎。他说当前这些组件"几乎可以确定"会是 AGI 最终架构的一部分，走到今天这一步已经证明了太多东西，不可能突然发现这是一条死路。但在已有的东西之上，可能还需要一两个大想法。

他列出了三个未解问题：持续学习（continual learning，即模型在部署后持续从新经验中学习的能力）、长程推理、以及记忆的某些方面。这些问题也许能靠现有技术的渐进式创新解决，也许需要全新的方法。

他给出了一个有意思的概率判断：50/50。一半概率是现有技术足够，另一半概率是还缺一两个关键突破。Google DeepMind 两边都在押注。

【2】记忆：百万 token 上下文其实不够用

话题自然转到了记忆和上下文窗口。Garry Tan 提到现在的系统每次处理都是无状态的，持续学习缺失的情况下，大家都在用"梦境循环"（定期批量更新）这类临时方案。

Hassabis 对这个话题有独特的发言权。他的博士研究就是海马体如何将新知识优雅地整合进已有的知识库。大脑在睡眠（特别是 REM 快速眼动期）中回放重要的经历片段来巩固学习，DeepMind 最早的 Atari 游戏 AI 程序 DQN 就借鉴了这个机制，用"经验回放"（experience replay）反复重放成功的游戏轨迹来加速学习。

> 我们现在的做法有点像用胶带糊住，就是把所有东西都塞进上下文窗口。（"We're kind of using duct tape right now-shove it all in the context window."）

他接着解释为什么这个方案不够好。百万 token 上下文窗口听起来很大，人类的工作记忆平均只有 7 个数字左右，而 AI 有百万甚至千万级别的上下文。但问题是，我们把所有东西都扔进去了，不管重要不重要、对不对。更关键的是，如果你要处理实时视频流，天真地录入所有 token 的话，百万 token 其实只够 20 分钟。如果你想让系统理解你一两个月的生活，远远不够。

即使存储空间无限，找到当下决策真正需要的那条信息，这个检索成本也是不可忽视的。Hassabis 认为记忆领域还有很大的创新空间。

【3】AlphaGo 的技术遗产正在复活

Garry Tan 追问 DeepMind 在强化学习方面的历史积累，AlphaGo、AlphaZero、MuZero 这些系统背后的哲学在今天构建 Gemini 时发挥了多大作用。

Hassabis 说强化学习的重要性"在起伏中轮回"。DeepMind 从创立第一天起就在做智能体，Atari 游戏 AI 和 AlphaGo 说到底都是智能体系统，能自主设定目标、做决策、制定计划。当时选择游戏领域是为了让问题可控，然后逐步挑战更复杂的游戏，比如 AlphaGo 之后又做了星际争霸（AlphaStar）。

智能体 DeepMind 大佬观点推理

在 X 查看原推导出 Markdown

宝玉@dotey · X

63导出 Markdown

2026-05-01 08:47·62天前

在 X 看原推· x.com

AI 摘要

http://x.com/i/article/2050005869304102912

Demis Hassabis：AGI 还缺什么，智能体到底行不行，下一个科学突破长什么样

原始视频：https://www.youtube.com/watch?v=JNyuX1zoOgU

原始标题：Demis Hassabis： Agents， AGI & The Next Big Scientific Breakthrough

要点速览

Hassabis 认为当前范式（预训练+RLHF+ 思维链）会是 AGI 架构的一部分，但有 50% 的概率还需要一两个尚未发现的关键突破，持续学习、长程推理和记忆是三个未解问题

Demis Hassabis：AGI 还缺什么，智能体到底行不行，下一个科学突破长什么样

要点速览

【1】AGI 还缺一两块拼图，概率 50/50

【2】记忆：百万 token 上下文其实不够用

【3】AlphaGo 的技术遗产正在复活

Demis Hassabis：AGI 还缺什么，智能体到底行不行，下一个科学突破长什么样

要点速览

【4】小模型在快速变聪明

【5】Gemini 下棋暴露的推理缺陷

【6】智能体：实验阶段，投入产出比还没对上

【7】半小时做出 Theme Park，但爆款在哪？

【8】Gemma 开源背后的战略计算

【9】多模态的长期赌注

【10】推理永远不会免费

【11】虚拟细胞：10 年后的目标

【12】AI 是科学的终极工具

【13】AlphaFold 式突破的三个条件

【14】"爱因斯坦测试"：AI 能做真正的科学发现吗？

【15】给创业者的建议：把 AGI 算进你的商业计划

Q&A 速览

【1】AGI 还缺一两块拼图，概率 50/50

【2】记忆：百万 token 上下文其实不够用

【3】AlphaGo 的技术遗产正在复活

【4】小模型在快速变聪明

【5】Gemini 下棋暴露的推理缺陷

【6】智能体：实验阶段，投入产出比还没对上

【7】半小时做出 Theme Park，但爆款在哪？

【8】Gemma 开源背后的战略计算

【9】多模态的长期赌注

【10】推理永远不会免费

【11】虚拟细胞：10 年后的目标

【12】AI 是科学的终极工具

【13】AlphaFold 式突破的三个条件

【14】"爱因斯坦测试"：AI 能做真正的科学发现吗？

【15】给创业者的建议：把 AGI 算进你的商业计划

Q&A 速览