OpenAI模型证伪了离散几何中的一个核心猜想
阅读原文· openai.com数学界等了80年的猜想被AI自己证伪了,而且用的是代数数论这种“跨界”手法,这个里程碑说明AI的创造性推理已经进入前沿研究。虽然实战还用不上,但作为能力信号,值得每个关心AI前沿的人看。
OpenAI开发的人工智能模型成功解决了数学界悬而未决逾80年的“单元距离问题”,并由此推翻了离散几何领域的一个核心猜想。这一突破被视作人工智能驱动数学研究的里程碑事件,标志着AI在基础科学理论探索中取得了实质性进展。该模型通过创新算法处理复杂的几何问题,展示了机器在自动化发现与验证数学猜想方面的巨大潜力。
近 80 年来,数学家们一直在研究一个看似简单的问题:在平面上放置 $n$n 个点,两点之间距离恰好为 $1$1 的对数最多能有多少?
这就是平面单位距离问题,最早由 Paul Erdős 在 1946 年提出。它是组合几何中最著名的问题之一,表述简单,解决起来却异常困难。2005 年 Brass、Moser 和 Pach 合著的《离散几何研究问题》一书称其为“可能是组合几何中最著名(也最容易解释)的问题”。普林斯顿大学著名组合学家 Noga Alon 将其描述为“Erdős 最喜爱的问题之一”。Erdős 甚至为此问题的解决设立了奖金。
今天,我们分享一个关于单位距离问题的突破性进展。自 Erdős 最初的工作以来,主流观点一直认为下文进一步展示的“方形网格”构造在最大化单位距离对数方面基本是最优的。一个 OpenAI 内部模型否定了这一长期存在的猜想,提供了一个无限系列的例子,实现了多项式级别的改进。该证明已由一组外部数学家审核。他们还撰写了一篇配套论文,解释该论证,并为该结果的重要意义提供进一步的背景和语境。
这一结果因其发现方式同样引人注目。该证明来自一个新型通用推理模型,而非专门为数学训练的系统,也非通过搜索证明策略来构建,更非针对单位距离问题特别设计。作为测试先进模型能否为基础研究做出贡献的更广泛努力的一部分,我们在一组 Erdős 问题上对该模型进行了评估。在这种情况下,它给出了一个解决该开放问题的证明。
这一证明对数学界和 AI 界而言是一个重要的里程碑。它标志着 AI 首次自主解决一个在数学子领域中居于核心地位的著名未解问题。它也展示了当前这些系统所支持的推理深度。数学为推理提供了一个尤为清晰的试验平台:问题精确、可能的证明可被验证,而且一个长的论证只有在其推理从头到尾都成立时才能成立。解决该问题的方法同样值得注意。这一证明将来自代数数论的、意想不到的深刻思想引入了一个基础的几何问题。
菲尔兹奖得主蒂莫西·高尔斯在配套论文中称这一成果为“AI 数学的一个里程碑”。据著名数论学家阿鲁尔·尚卡尔所言:“在我看来,这篇论文表明当前的 AI 模型已不仅仅是人类数学家的助手——它们能够产生原创性的巧妙想法,并将其贯彻到底。”
数学家们对该结果的评价
1/4
“这是 Erdős 最喜爱的问题之一,我曾亲耳听到他在讲座中多次提及这个问题。我认为可以公允地说,每一位从事组合几何研究的数学家都思考过这个问题,而其他领域的许多数学家也至少花过一些时间思考它……在我看来,OpenAI 的内部模型解决了这个问题,是一项杰出的成就,终结了一个长期未解的难题。正确答案并不是 \(n^{1+o(1)}\) 这一事实令人惊讶,而构造及其分析则以一种优雅而巧妙的方式运用了代数数论中相当精深的工具。”
——诺加·阿隆
“毫无疑问,单位距离问题的解是 AI 数学的一个里程碑:如果这篇论文是由人类撰写并提交给《数学年刊》,而我被要求给出快速审稿意见,我会毫不犹豫地建议接收。此前没有任何 AI 生成的证明能达到这个水平。”
——蒂莫西·高尔斯
“该模型的思维链(CoT)极为有趣。值得注意的一点是,其绝大多数思考都在试图构造一个反例来反驳那个被广泛认为的上界,而非试图去证明它。这表明该模型兼具良好的直觉、愿意尝试学界视为冷门方向的意愿,以及倾向于进行构造性尝试的特质……在我看来,这篇论文表明,当前的 AI 模型已经超越了人类数学家的助手角色——它们能够产生原创性的巧妙想法,并将其付诸实现。”
Arul Shankar
“这是一项真正令人印象深刻的工作,我会毫不犹豫地将其接收至任何期刊。实际上,我曾短暂研究过这个问题,并试图构造一个反例,但未能取得进展……即便你清楚其中的逻辑,这个构造本身也极具挑战性,更不用说亲自去探索实现了。”
Jacob Tsimerman
Noga Alon Tim Gowers Arul Shankar Jacob Tsimerman
Noga Alon Tim Gowers Arul Shankar Jacob Tsimerman
该证明可在此处获取(在新窗口中打开)。由顶尖外部数学家撰写的配套论文可在此处获取(在新窗口中打开)。该模型思维链的精简版可在此处找到(在新窗口中打开)。
此前已知的、由缩放后的正方形网格构造出的多个单位距离。
设 $u(n)$ 为平面上 $n$ 个点之间单位距离对数的最大可能数量。构造达到线性增长率的例子很容易:将 $n$ 个点排成一条直线可得到 $n-1$ 对,而正方形网格则能得到大约 $2n$ 对。此前已知的最佳构造来自一个经过缩放的正方形网格,它甚至能给出更多:对于某个常数 $C$,可达 $n^{1 + C / \log \log (n)}$。由于 $\log \log (n)$ 会随着 $n$ 趋于无穷大,因此指数中的额外项趋于 $0$,这意味着这些构造的增长速度仅略高于线性。几十年来,人们普遍认为这个速率本质上已经是最优的,并且没有任何构造能在正方形网格的基础上有显著改进。用专业术语来说,Erdős 曾猜想上限为 $n^{1 + o(1)}$,其中额外的 $o(1)$ 表示一个随 $n$ 趋于 $0$ 的量。
我们的新结果推翻了这一猜想。更精确地说,对于无穷多个 $n$ 值,该证明构造出 $n$ 个点的配置,其中至少包含 $n^{1 + \delta}$ 对单位距离,且 $\delta > 0$ 为某个固定指数。(原始的 AI 证明并未给出显式的 $\delta$,但普林斯顿大学数学教授 Will Sawin 随后改进的结果表明可以取 $\delta = 0.014$。)
该问题的历史有助于理解这一结果为何令人惊讶。自 Erdős 最初于 1946 年给出的构造以来,已知的最佳下界基本没有变化。最佳上界 $O(n^{4/3})$ 则源自 Spencer、Szemerédi 和 Trotter 在 1984 年的工作,尽管后来 Székely、Katz 和 Silier、Pach、Raz、Solymosi 以及其他学者在相关结构性研究上有所改进,但这一上界基本保持不变。作为支持该猜想的证据,Matoušek 以及 Alon-Bucić-Sauermann 研究了平面上非欧几里得距离下的这一问题,并证明在某种意义上,“大多数”此类非欧几里得距离都服从该猜想。
令人惊讶的是,该构造的关键要素来自一个完全不同的数学分支——代数数论,它研究诸如整数扩(即代数数域)中的因式分解等概念。
在验证了初始证明后,我们研究了模型在不同测试时计算量下解决该问题的成功率。结果如下所示。
来自代数数论的新技巧
从宏观角度看,该证明始于一个熟悉的几何想法,并将其推向了出人意料的方向。
厄尔迪什的原初下界可以通过高斯整数来理解:即形如 $a + b i$ 的数,其中 $a$ 和 $b$ 是整数,$i$ 是 $-1$ 的平方根。高斯整数扩展了普通整数,并且与普通整数一样,享有质因数分解唯一性等性质。这种对普通整数或有理数的扩展被称为代数数域。新的论证用代数数论中更复杂、具有更丰富对称性的推广结构取代了高斯整数,从而能够产生更多单位长度差。
确切的论证使用了无限类域塔和戈洛德—沙法列维奇理论等工具,来表明论证所需的数域确实存在。这些概念对代数数论学者而言早已熟知,但令人大为意外的是,它们竟对欧几里得平面中的几何问题具有启示意义。
这对数学意味着什么
这一结果标志着人工智能与数学互动中的一个重要时刻:一个AI系统自主解决了一个活跃领域的核心长期未解问题。它也为AI与人类数学家之间一种新型合作提供了初步展望。在本案例中,外部数学家撰写的配套论文所描绘的图景远比原始解法本身更为丰富。
正如托马斯·布卢姆在配套评注中所写:
“在评估一个AI生成的证明的重要性与影响力时,我问自己的一个问题是:它是否让我们对这个问题有了新的认识?我们现在是否更好地理解了离散几何?我认为答案是有保留的肯定:它表明数论构造对于这类问题的启示远超我们之前的预期;而且,所需的数论知识可以非常深奥。毫无疑问,未来几个月里,许多代数数论学者将仔细审视离散几何中的其他未解问题。”
代数数论与离散几何之间出人意料的联系,正是该解答引人注目的原因之一。它不仅解决了一个具体的猜想,还可能为数学家提供一座桥梁,让他们开始探索更多相关问题。
布鲁姆还指向了一个更广阔的可能性:
“知识的边界是参差不齐的,毫无疑问,未来数月乃至数年,数学的许多其他领域也将看到类似的成功——那些长期悬而未决的问题,由 AI 揭示出意想不到的联系,并将已有的技术手段推向极限,从而得到解决。AI 正在帮助我们更充分地探索几个世纪以来所建造的数学大教堂;还有哪些未被发现的奇观正在幕后等待?”
这一结果提供了一个令人鼓舞的范例:AI 不仅贡献了一个解答,而且贡献了一项数学发现,其意义在后续的人类理解中变得越发清晰和丰富。
为何重要
其启示意义远不止于这一具体结果。更强的数学推理能力可以使 AI 成为更强的研究伙伴:能够将困难的思路线索整合在一起,在相隔遥远的知识领域之间建立联系,呈现专家可能尚未重视的、有前景的方向,并帮助研究人员在那些原本因过于复杂或耗时而难以着手的问题上取得进展。
这些能力的重要性并不局限于数学。如果一个模型能够保持复杂推理的前后连贯性,在相隔遥远的知识领域之间建立联系,并产出经得起专家审视的成果,那么这些能力在生物学、物理学、材料科学、工程学和医学中同样有用,并且它们是我们迈向更自动化研究的长期路径的一部分——即那些能够帮助科学家和工程师探索更多想法、攻克更艰深技术问题的系统。
AI 即将在研究中的创造性环节扮演非常重要的角色,而最重要的是,在 AI 研究本身中。尽管这一进展并非意料之外,但它增强了我们当前对理解 AI 下一发展阶段、对高智能系统进行对齐的挑战,以及人机协作未来的紧迫感。
那个未来依然依赖于人类的判断。专业知识的价值变得更高,而非更低。AI 可以帮助搜索、提出建议和验证。而由人类来选择哪些问题真正重要,解读结果,并决定接下来要探索什么问题。
2026
作者
OpenAI
继续阅读
查看全部
更优记忆,打造更有帮助的 ChatGPT
梦想:更优记忆,打造更有帮助的 ChatGPT 研究 2026年6月4日
为 GPT-Rosalind 引入新功能 产品 2026年6月3日
借助 Rosalind 生物防御加强社会韧性 产品 2026年5月29日