他透露了一个值得关注的信息:Google DeepMind 正在重新审视当年的一些旧想法,包括蒙特卡洛树搜索(Monte Carlo tree search)等方法,在当今基础模型的规模上重新应用。他认为未来几年 AI 的很多进步将来自于 AlphaGo 和 AlphaZero 时代的想法与现代基础模型的结合。
【4】小模型在快速变聪明
Garry Tan 观察到蒸馏技术让小模型越来越接近前沿模型的能力,Flash 模型大约能达到前沿模型 95% 的水平,成本只有十分之一。他问蒸馏有没有极限。
Hassabis 说这是 Google DeepMind 的核心优势之一。他们当然要建最大的模型来推动能力边界,但快速把这些能力压缩到更小模型中是他们的强项。Google 有十几个十亿用户级的产品,搜索的 AI 概览和 AI 模式、Gemini 应用、YouTube、Maps,每一个都需要 AI 服务。几十亿用户需要极快、极高效、低延迟的服务,这种商业压力反过来成了技术进步的发动机。
Garry Tan 问智能体是炒作还是刚刚开始。Hassabis 的回答是:刚刚开始,但还在实验阶段。
他的论点是:要达到 AGI,你必须有一个能主动解决问题的系统,智能体就是通向 AGI 的路径。但目前,智能体在"完整任务"上还不够好,主要是因为它们不能在具体使用环境中持续学习和适应。缺乏持续学习是智能体无法做到"交付后不管"(fire and forget)的根本原因。
他还提到了一个耐人寻味的观察:
> 我看到很多人启动几十个智能体跑 40 个小时,但我不确定产出能匹配这种级别的投入。 ("I see a lot of people working on setting off dozens of agents for like 40 hours, but I'm not sure I've seen the output that yet quite justify that level of input going in.")
最近两三个月,人们才开始找到智能体真正有价值的使用场景,不再是"玩具展示"而是真正增加效率的工具。
【7】半小时做出 Theme Park,但爆款在哪?
谈到创造力和凭感觉编程(vibe coding),Hassabis 给出了一个令人印象深刻的对比。
> 我现在半小时就能做出 Theme Park 的原型,而我 17 岁的时候花了 6 个月。 ("I can do a prototype of Theme Park in half an hour now, which took me 6 months back when I was 17.")
【注:Theme Park 是 Hassabis 在 1994 年参与开发的模拟经营游戏,全球销量超过 1500 万份。】
切换到开源话题。Hassabis 说 Google DeepMind 一直是开放科学的倡导者,AlphaFold 完全免费开放就是例子。Gemma 系列的目标是在同等参数规模下做到世界领先。
他提到了一个有意思的地缘考量:
> 也很重要的一点是,开源里要有西方栈。中国模型很多都很出色,目前在开源里领先。 ("It's important for there to be Western stacks on open source. A lot of the Chinese models are excellent, and they're currently leading in open source.")
Garry Tan 问他在所有科学领域中最看好哪个。Hassabis 没有直接排名,而是说这一直是他做 AI 的核心动力。
> DeepMind 的使命分两步:第一步解决智能,也就是建造 AGI;第二步用它解决其他所有问题。 ("Step one was solve intelligence, i.e., build AGI, and then step two was use it to solve everything else.")
> 用 1901 年的物理学知识训练一个系统,然后看它能不能做出爱因斯坦 1905 年做的事情,包括狭义相对论。 ("Can you train a system with the knowledge of physics of 1901, and then will it come up with what Einstein did in 1905, including special relativity?")
> 追求困难的问题和追求简单的问题,难度其实差不多。只是难的地方不一样。 ("Going after hard problems is no more difficult than going after a shallower, simpler problem. They're just differently difficult.")
他用自己的经历收尾。2010 年创办 DeepMind 时,投资人告诉他"AI 我们试过了,不行"。学术界也认为 AI 是 90 年代就被证伪的边缘学科。但他从很年轻的时候就决定了要做 AI,因为这既是他能想到的最重要的事,也是最有趣的事。即使今天 AI 还没成功,他也会在某个车库里继续做下去。
Hassabis 同时在做两件事:建前沿模型(Gemini),用 AI 做科学(AlphaFold、Isomorphic Labs)。这让他的判断比纯模型派或纯应用派更有参考价值。他对 AGI 路径的判断,"可能还缺一两个大想法",比大多数行业声音更克制。他对智能体投入产出比的质疑也值得注意,尤其是在 Google 自己也在大力推广智能体产品的情况下。
他透露了一个值得关注的信息:Google DeepMind 正在重新审视当年的一些旧想法,包括蒙特卡洛树搜索(Monte Carlo tree search)等方法,在当今基础模型的规模上重新应用。他认为未来几年 AI 的很多进步将来自于 AlphaGo 和 AlphaZero 时代的想法与现代基础模型的结合。
【4】小模型在快速变聪明
Garry Tan 观察到蒸馏技术让小模型越来越接近前沿模型的能力,Flash 模型大约能达到前沿模型 95% 的水平,成本只有十分之一。他问蒸馏有没有极限。
Hassabis 说这是 Google DeepMind 的核心优势之一。他们当然要建最大的模型来推动能力边界,但快速把这些能力压缩到更小模型中是他们的强项。Google 有十几个十亿用户级的产品,搜索的 AI 概览和 AI 模式、Gemini 应用、YouTube、Maps,每一个都需要 AI 服务。几十亿用户需要极快、极高效、低延迟的服务,这种商业压力反过来成了技术进步的发动机。
Garry Tan 问智能体是炒作还是刚刚开始。Hassabis 的回答是:刚刚开始,但还在实验阶段。
他的论点是:要达到 AGI,你必须有一个能主动解决问题的系统,智能体就是通向 AGI 的路径。但目前,智能体在"完整任务"上还不够好,主要是因为它们不能在具体使用环境中持续学习和适应。缺乏持续学习是智能体无法做到"交付后不管"(fire and forget)的根本原因。
他还提到了一个耐人寻味的观察:
> 我看到很多人启动几十个智能体跑 40 个小时,但我不确定产出能匹配这种级别的投入。 ("I see a lot of people working on setting off dozens of agents for like 40 hours, but I'm not sure I've seen the output that yet quite justify that level of input going in.")
最近两三个月,人们才开始找到智能体真正有价值的使用场景,不再是"玩具展示"而是真正增加效率的工具。
【7】半小时做出 Theme Park,但爆款在哪?
谈到创造力和凭感觉编程(vibe coding),Hassabis 给出了一个令人印象深刻的对比。
> 我现在半小时就能做出 Theme Park 的原型,而我 17 岁的时候花了 6 个月。 ("I can do a prototype of Theme Park in half an hour now, which took me 6 months back when I was 17.")
【注:Theme Park 是 Hassabis 在 1994 年参与开发的模拟经营游戏,全球销量超过 1500 万份。】
切换到开源话题。Hassabis 说 Google DeepMind 一直是开放科学的倡导者,AlphaFold 完全免费开放就是例子。Gemma 系列的目标是在同等参数规模下做到世界领先。
他提到了一个有意思的地缘考量:
> 也很重要的一点是,开源里要有西方栈。中国模型很多都很出色,目前在开源里领先。 ("It's important for there to be Western stacks on open source. A lot of the Chinese models are excellent, and they're currently leading in open source.")
Garry Tan 问他在所有科学领域中最看好哪个。Hassabis 没有直接排名,而是说这一直是他做 AI 的核心动力。
> DeepMind 的使命分两步:第一步解决智能,也就是建造 AGI;第二步用它解决其他所有问题。 ("Step one was solve intelligence, i.e., build AGI, and then step two was use it to solve everything else.")
> 用 1901 年的物理学知识训练一个系统,然后看它能不能做出爱因斯坦 1905 年做的事情,包括狭义相对论。 ("Can you train a system with the knowledge of physics of 1901, and then will it come up with what Einstein did in 1905, including special relativity?")
> 追求困难的问题和追求简单的问题,难度其实差不多。只是难的地方不一样。 ("Going after hard problems is no more difficult than going after a shallower, simpler problem. They're just differently difficult.")
他用自己的经历收尾。2010 年创办 DeepMind 时,投资人告诉他"AI 我们试过了,不行"。学术界也认为 AI 是 90 年代就被证伪的边缘学科。但他从很年轻的时候就决定了要做 AI,因为这既是他能想到的最重要的事,也是最有趣的事。即使今天 AI 还没成功,他也会在某个车库里继续做下去。
Hassabis 同时在做两件事:建前沿模型(Gemini),用 AI 做科学(AlphaFold、Isomorphic Labs)。这让他的判断比纯模型派或纯应用派更有参考价值。他对 AGI 路径的判断,"可能还缺一两个大想法",比大多数行业声音更克制。他对智能体投入产出比的质疑也值得注意,尤其是在 Google 自己也在大力推广智能体产品的情况下。