向阳乔木@vista8

2026-07-01 13:31·1天前

AI 摘要

Grant Sanderson（3Blue1Brown）与Dwarkesh Patel对话指出，2024年AI在IMO已达金牌，但组合数学仍卡住。AI数学进展分两类：连接闪电（跨领域连接，如Erdős第1196号问题、单位距离猜想反例）和建造山峰（如伽罗瓦群论，需百年验证）。训练依赖RLVR，但伽罗瓦想法当时被拒，无反馈信号。可验证仅是必要条件，可磨性（并行实例）才是充分条件；电脑操作虽可验证但缺可磨性，进展慢。

http://x.com/i/article/2072191016476856320

从伽罗瓦到夸克：需要200年验证的想法，AI能产生吗？

https://www.youtube.com/watch?v=TfyPshgMbug

一个 19 岁的少年，在监狱里写下了一套没人看懂的数学笔记。

他把笔记托付给朋友，请他转交给当时最伟大的数学家高斯，朋友尽力了，但没有成功。

这个少年在一场决斗中死去，年仅 20 岁。

又过了二十年，一位叫刘维尔的数学家翻出这些笔记，觉得里面可能有点东西。

又过了二十年，有人把这些想法整理成现代数学能读懂的形式。

再过一百年，物理学家盖尔曼用这套理论预测了夸克的存在。

这个少年叫伽罗瓦。他留下的东西，叫群论。

从一个模糊的直觉，到改变物理学，中间隔了将近两百年。

在这两百年里，这个想法被拒稿，被遗忘，被误解，在多个人的脑子里辗转流传，才慢慢结晶成一座数学的山峰。

现在，有人想用 AI 来做同样的事。

问题是：你怎么训练一个系统，去产生一个需要两百年才能被验证的想法？

这是 Grant Sanderson 和 Dwarkesh Patel 在 2026 年初的一场对话里反复触碰的困境。

Grant 是 3Blue1Brown 的创始人，YouTube 上最受欢迎的数学频道，几百万订阅者。

但他的身份很奇特：他不做研究数学，他解释数学。

他的整个职业，就是在回答"理解和证明有什么区别"这个问题，这让他在 AI 和数学的讨论里，站在一个很特殊的位置。

Dwarkesh 是一个播客主，专门采访 AI 领域最顶尖的研究者和创始人，他的优势是局外人的视角，他的问题往往比答案更有趣。

他们聊了两个多小时，以下是这场对话的精华提炼。

IMO 金牌：一个没有改变任何事情的里程碑

三年前，Dwarkesh 问过 Grant 一个问题：当 AI 能在国际数学奥林匹克（IMO）拿金牌的时候，那是不是就等于 AGI 了？

IMO 的题目需要真正的创造力，连专门训练过的顶尖学生都未必能全解。

如果 AI 能做到，它不就什么都能做了吗？

Grant 当时的回答是：不会的。那只是又一个被超越的基准，不会有顿悟时刻。

他是对的。

2024 年，AI 在 IMO 上的表现已经达到金牌水准，世界没有因此改变，没有人突然觉得 AGI 到来了，没有经济结构发生剧变，数学家们继续做他们的研究。

IMO 的题目分四类：几何、数论、代数、组合数学。

AI 在几何上的表现是 19 秒解完，因为有暴力求解器可以直接上，而且几何题有相对固定的训练路径可以覆盖大部分题型。

但组合数学不一样。那些题目更像是谜题，需要一种"玩感"，需要从意想不到的角度切入。

2024 年的 IMO 恰好有两道组合数学题，AI 在这里卡住了。

向阳乔木@vista8 · X

66导出 Markdown

2026-07-01 13:31·1天前

在 X 看原推· x.com

AI 摘要

http://x.com/i/article/2072191016476856320

从伽罗瓦到夸克：需要200年验证的想法，AI能产生吗？

https://www.youtube.com/watch?v=TfyPshgMbug

一个 19 岁的少年，在监狱里写下了一套没人看懂的数学笔记。

他把笔记托付给朋友，请他转交给当时最伟大的数学家高斯，朋友尽力了，但没有成功。

这个少年在一场决斗中死去，年仅 20 岁。

又过了二十年，一位叫刘维尔的数学家翻出这些笔记，觉得里面可能有点东西。

又过了二十年，有人把这些想法整理成现代数学能读懂的形式。

再过一百年，物理学家盖尔曼用这套理论预测了夸克的存在。

这个少年叫伽罗瓦。他留下的东西，叫群论。

从一个模糊的直觉，到改变物理学，中间隔了将近两百年。

在这两百年里，这个想法被拒稿，被遗忘，被误解，在多个人的脑子里辗转流传，才慢慢结晶成一座数学的山峰。

现在，有人想用 AI 来做同样的事。

从伽罗瓦到夸克：需要200年验证的想法，AI能产生吗？

IMO 金牌：一个没有改变任何事情的里程碑

从伽罗瓦到夸克：需要200年验证的想法，AI能产生吗？

一道闪电，和一座山峰

一百年的验证循环

可验证，还不够，还得能"磨"

自回归是一种奇怪的思考方式

AI 最被低估的优势，不是它有多聪明

Lean：被高估的训练工具，被低估的探索引擎

黎曼猜想被证明之后，我们会理解它吗

AI 为什么写作越来越烂，但数学越来越好

数学家的未来：博物馆策展人

给数学从业者的一个实际建议

IMO 金牌：一个没有改变任何事情的里程碑

一道闪电，和一座山峰

一百年的验证循环

可验证，还不够，还得能"磨"

自回归是一种奇怪的思考方式

AI 最被低估的优势，不是它有多聪明

Lean：被高估的训练工具，被低估的探索引擎

黎曼猜想被证明之后，我们会理解它吗

AI 为什么写作越来越烂，但数学越来越好

数学家的未来：博物馆策展人

给数学从业者的一个实际建议