大西洋月刊:AI已站在数学的边缘

大西洋月刊:AI已站在数学的边缘

过去几个月里,几位研究者开始提出同样引人注目的主张:他们使用生成式人工智能工具解决了一个先前悬而未决的数学问题。

最极端的承诺——即人工智能辅助解决数学领域某些最棘手难题——很可能最终被证明是空洞的炒作。但由人工智能撰写的若干解决方案,尽管针对的是远非那么著名的问题,却已通过验证。这些解答针对的是多个埃尔德什问题——由匈牙利数学家保罗·埃尔德什提出的超过 1000 个数学问题——并借助包括 ChatGPT 在内的生成式人工智能模型完成。OpenAI 迅速宣称胜利:“GPT-5.2 Pro 解决了又一个未解的埃尔德什问题,”OpenAI 总裁格雷格·布罗克曼在一月份于 X 平台上发布道。“对于数学和科学进步而言,这将是疯狂的一年!”(OpenAI 与《大西洋月刊》存在企业合作关系。)

围绕这一消息的兴奋很大程度上源于这些 AI 证明的评审者:陶哲轩,加州大学洛杉矶分校教授,被广泛认为是当今在世的最伟大的数学家。他的认可似乎为生成式 AI 的最大承诺——推动人类知识和文明的边界——赋予了合法性。本月早些时候,我致电陶哲轩,询问他对 AI 能为数学带来什么的看法,他的态度更为审慎。他告诉我,AI 生成的埃尔德什问题解决方案令人印象深刻,但并非压倒性的:陶哲轩说,这些机器人在功能上取得了一些“廉价的胜利”。

阅读:我们正进入数学的未知领域

陶哲轩长期以来对人工智能工具在其领域所能发挥的作用既感兴趣又持保留态度。2024年秋天我们初次交谈时,他曾将聊天机器人比作“平庸但并非完全无能”的研究生。大约六个月后,他告诉我这些模型在“某些类型的高层次数学推理”方面有所进步,但仍缺乏创造力且会犯细微错误。然而在我们最近的对话中,他表现得更为乐观。人工智能或许尚未达到解决世界所有重大数学问题的临界点,但聊天机器人已发展到能够与人类数学家协作的阶段。他表示,在这个过程中,这项技术正在开辟一种不同的“数学研究方式”。

本次对话经过编辑,以精简内容并提升清晰度。

马泰奥·王: 近期,ChatGPT 解决部分埃尔德什问题的能力引发了广泛关注。在过去一年左右的时间里,您如何看待生成式 AI 在数学能力方面的演进?

陶哲轩: 有一大群人真心实意地渴望看到人工智能的成功故事。同时,还有一群人数相当、立场相反的人,他们想要否定人工智能的所有进展。而我们面对的,其实是介于两者之间一个极其复杂且微妙的故事。

推荐阅读
Three adults posing with a young child
三亲家庭的兴起
安吉拉·陈

A girl lies across from her boyfriend
亲爱的治疗师:男友的抑郁症让我对我们的未来产生疑虑
洛丽·戈特利布

如何面对死亡
乔丹·迈克尔·史密斯

在这些埃尔德什问题中,有一小部分备受关注的核心问题是我们真正想要解决的,然后还有一大批非常晦涩难懂的问题。人工智能非常擅长系统性地探索这些长尾问题,并解决其中最简单的问题。但这与人类的风格截然不同。人类不会系统地浏览所有1000个问题,然后挑选出12个最简单的问题来解决,而这正是人工智能正在做的事情。

这些数学问题之间的难度差异确实非常巨大。观察人工智能迄今独立解决的问题,感觉就像是: 哦,原来它们用的是标准解法 。如果专家花半天时间研究,同样也能解决。现在已经出现了更复杂的解决方案,这些是人工智能辅助完成的。我认为短期内,纯粹的人工智能方法将在简单问题上取得大量快速成果。而在未来几个月内,我认为我们将看到各种人机协作的混合型成果。

我从一些出现的证明中学习。我喜欢阅读它们——也许它们运用了1960年某篇论文中的技巧,而我之前并不知晓。因此,它可能并非极其、极其富有创意,但它是新颖的,并且能够做到人类专家审视此问题时忽略的事情。

Wong: 你曾写道 ,当人类数学家处理新问题时,无论成功与否,他们都会产生该领域其他人可以借鉴的见解——而基于人工智能的证明无法提供这一点。这是为什么呢?

陶哲轩: 这些问题如同远方的目的地,需要徒步前往。在过去,你必须踏上旅程。你可以留下路标供他人跟随,也可以绘制地图。

人工智能工具就像乘坐直升机直达目的地,你错过了旅途中的所有收获。你只是直接抵达了终点,而这实际上只是解决问题价值的一部分。

Wong: 当您思考这些模型当前的能力时,除了让非数学家能够处理更高级的问题之外,它们还能为您的领域做出什么贡献?

陶哲轩: 如今有许多我们不愿处理的繁琐数学类型,因此我们寻找巧妙的方法来规避它们。但人工智能会欣然攻克这些繁琐的计算。当我们将人工智能与人类工作流程结合时,便能轻松跨越这些障碍。

我也认为数学家们将开始在更大规模上进行数学研究。想想科学中个案研究与人口调查的区别。如果你在18世纪研究一种疾病,如果这是一种罕见病,你可能会研究一位患有此病的患者,记录其所有症状并做详细笔记。但在21世纪,你可以进行临床试验,给1000人用药,通过统计分析获得关于药物疗效更为精确的信息。

数学在很大程度上仍处于个案研究阶段。一篇论文会选取一两个问题,以极其手工化、密集化的方式对其进行深入研究。这是我们的风格。但人工智能工具所实现的,是群体研究。

Wong: 人工智能模型在数学能力方面取得的进展是否让您感到惊讶?

陶哲轩: 有点惊讶。发生的很多事情,我原本就预料到了,但它们比我预期的来得稍早一些。不过也没早太多。

例如在 2023 年,我为微软撰写了这篇文章 ,预测到 2026 年,人工智能将成为值得信赖的合著者——其贡献将达到技术论文合著者的水平。这篇论文引发了褒贬不一的反应:有人认为我过于雄心勃勃,也有人觉得我太过悲观。但我认为这个时间表基本准确。我们正见证人工智能的贡献水平,已相当于我预期中一位初级人类合著者所能达到的程度,尤其是那种乐于处理繁琐基础工作、能解决大量枯燥案例的协作者。

Wong: 在未来一两年内,您希望或期待生成式 AI 模型有哪些改进?

陶哲轩: 存在一个中间地带,我们既要鼓励负责任地使用人工智能,也要阻止不负责任的使用。这是一条需要谨慎把握的微妙界限。但我们以前做到过。数学家们常规性地使用计算机进行数值计算,当计算机辅助证明首次出现时,曾遭到大量反对,因为你怎么能信任计算机代码呢?但我们在二三十年间已经解决了这个问题。不幸的是,现在的时间线被大大压缩了。所以我们必须在几年内确立我们的标准。而我们的学术界通常不会行动得那么快。

对数学界很有帮助的一个基本点:当人工智能回答问题时,通常不会给出任何关于其答案可信度的明确指示,或者总是说我完全确定这是真的 。人类会这样做。无论他们对某件事是否有信心,这都是非常重要的信息,可以暂时提出你不确定的事情,但重要的是要标明你对此不确定。但人工智能工具无法准确评估自己的信心。这降低了它们的实用性。我们期待更诚实的人工智能。

此外,许多人工智能公司痴迷于追求一键式、完全自主的工作流程:你只需将任务交给 AI,然后去喝杯咖啡,回来时问题就已解决。这实际上并不理想。面对复杂问题时,真正需要的是人类与 AI 之间的对话。而人工智能公司目前并未真正促进这种互动。

如果我们能与至少一些愿意开发更具互动性平台的技术公司合作,这些平台将更容易被大众接受。我们不希望仅仅沦为按按钮的角色。
分类