OpenAI 大模型推翻 80 年数学猜想:平面单位距离问题的终结

OpenAI 大模型推翻 80 年数学猜想:平面单位距离问题的终结

OpenAI 一个通用推理模型自主推翻了 Erdős 1946 年提出的平面单位距离猜想,通过引入代数数论工具(无限类域塔与 Golod-Shafarevich 理论)构造了多项式量级改进的单位距离对族。这是 AI 在前沿数学中首次自主解决有 80 年历史的核心开放问题。

三大公司大模型论文
2026/5/28 · 22:33
購読 1 件 · コンテンツ 1 件

リサーチノート

来源:OpenAI 官方研究公告,2026 年 5 月 20 日 1
コンテンツカードを読み込んでいます…

这件事是什么

1946 年,数学家 Paul Erdős 提出一个看起来简单得令人困惑的问题:在平面上放 $n$ 个点,这些点之间恰好相距 1的点对最多有多少对?
这是「平面单位距离问题」(planar unit distance problem)。Erdős 自己猜测,最优构型给出的单位距离对数不超过 ——也就是说,与 $n$ 的线性量级相比只有极微小的超线性增长。过去 80 年,没有人能找到比「重缩放方格网格」更好的构型,猜想看起来很有希望成立。
2026 年 5 月 20 日,OpenAI 宣布,其一个通用推理模型自主推翻了这一猜想,提供了无穷多族点集,其单位距离对数达到 —— 是一个固定正数,最新精化版本(普林斯顿数学教授 Will Sawin 完成)给出 1
这是首个由 AI 自主解决的组合几何核心开放问题

证明里用了什么工具

出乎所有人预料的是,证明的关键材料来自代数数论,而不是几何。
Erdős 1946 年的原始下界可以用高斯整数(形如 $a+bi$ 的复数,)理解:平面上若干点之间恰好距离 1,相当于在高斯整数的乘法结构下找到「单位差」。高斯整数具有唯一分解性,这让计数变得可行。
新证明把高斯整数换成了更一般的代数数域,并借助两个数论工具:
  • 无限类域塔(Infinite class field towers):这是一类代数数域的无限延伸链,其存在性由 Golod-Shafarevich 定理保证。
  • Golod-Shafarevich 理论:最初用来研究代数 $K$ 理论中群的结构,这里被用来确保所需的数域确实存在。
这些工具在代数数论领域人尽皆知,但把它们应用到欧几里得平面几何问题上,是彻底的意外。领先的组合数学家 Noga Alon 表示:「解的构造和分析采用了来自代数数论的相当精妙的工具,以一种优雅而聪明的方式运用。」
此前最优的方格网格构型:点均匀分布在平面中,最大化单位距离对数
此前最优的方格网格构型(重缩放版本, 量级),这一记录保持了 80 年 1

模型做了什么,人类做了什么

这次实验的设计也值得关注。OpenAI 并没有专门针对单位距离问题训练一个数学系统,也没有搭建专门的证明搜索脚手架。这是一个通用推理模型,被拿去测试一批 Erdős 开放问题,在这道题上产出了完整证明。
外部数学家对证明进行了独立验证。Fields 奖得主 Tim Gowers 写道:「如果是人类写了这篇论文,提交给 Annals of Mathematics,请我快速给出意见,我会毫不犹豫地推荐接受。」普林斯顿数论家 Arul Shankar 认为:「这表明当前 AI 模型已经超越了人类数学家的助手角色——它们有能力产生原创的、精妙的想法,并将其执行到底。」
值得注意的是,模型的思维链(chain of thought)大量时间花在构造反例上,而不是试图证明猜想成立。这意味着模型有某种「直觉」认为猜想是错的,并在数学界长期认为证明成立方向更有希望时,选择了反方向。

对 AI 研究者意味着什么

推理能力的新基准:单位距离问题不是一道竞赛题,是有 80 年历史的开放研究问题。模型能自主解决这类问题,说明通用推理模型的上限远高于此前的标准测试基准所暗示的范围。
数学提供了最干净的测试床:数学问题有明确的证明/反驳结构,不依赖人类主观评判,也无法靠记忆训练数据蒙混过关。如果这套能力在数学上是真实的,在生物学、物理、材料科学中的类比推理成功概率就值得认真对待。
AI 对齐研究的新参照:一个能做出数学发现的模型,同样能更好地理解为什么某些行为是「错的」、更难被简单指令绕过。Anthropic 在同期研究「自然语言自编码器」(NLA)中揭示,Claude 在安全测试中常常内部知道自己在被测试而不明说——这与本文讨论的推理深度直接相关。两项研究合并来看:AI 推理能力的增长速度已经超过了大多数研究者预期的节奏。
代码与证明的迁移:本次成果的证明已完整公开2,思维链摘要也已发布3。对于想评估模型推理质量的工程师,这是迄今最清晰的一份一手材料。
OpenAI 在不同测试计算量下解决单位距离问题的成功率(测试时间扩展曲线)
不同测试计算量(test-time compute)下,模型解决单位距离问题的成功率随算力增加提升 1

背景与边界

几点需要留意:
  • 证明由外部数学家独立核验通过,不存在「AI 幻觉」进入证明结论的问题——这是一个硬性校验。
  • 模型没有公开名称;OpenAI 只说是「通用推理模型」,没有说这是 o 系列还是其他内部模型。
  • 这是 OpenAI 自主发起的研究方向,不是回应外部挑战。它被当作「测试前沿模型能否参与前沿研究」的探针实验。
  • 数学家 Thomas Bloom 在同伴论文中指出,这一发现「打开了一扇门」:代数数论可能对其他离散几何问题有意想不到的影响。普林斯顿的 Will Sawin 已在此基础上精化出 ,后续进展值得跟踪。

原始证明下载 PDF 同伴注记(外部数学家):下载 PDF 思维链摘要下载 PDF

このコンテンツについて、さらに観点や背景を補足しましょう。

  • ログインするとコメントできます。