GPT-5.4 Pro 在 FrontierMath 上创造了一项全新的记录，在前 3 个难度级别中解决了 50% 的问题。

用户杜海艳 · 发表于 2026-3-29 10:06:57

GPT-5.4 Pro 在 FrontierMath 上创造了一项全新的记录，在前 3 个难度级别中解决了 50% 的问题。

作为背景，这项高阶数学基准测试旨在极难应对，即使对于花费数年时间研究这些主题的数学专家来说也是如此。

在最难的级别（称为 Tier 4）中，GPT-5.4 Pro 版本达到了 38% 的成功率。

这一得分使这款新机型远远领先于其他顶级系统，如 Gemini 3 Pro 和 Opus 4.6。

最令人印象深刻的时刻之一是，人工智能解决了一个其他模型从未完成过的特定四级问题。

它通过找到一篇 2011 年的研究论文实现了这一目标，该论文包含一个连最初的问题提出者都不知道的捷径。

尽管 OpenAI 为这项测试提供了资金，并且掌握了一些解决方案，但人工智能在面对从未见过的秘密问题时，表现依然非常出色。

这证明该模型不仅仅是记忆答案，而是能够通过复杂的逻辑推理不断提高推理能力。

尽管取得了这些胜利，但人工智能仍然无法解决任何人类尚未知道答案的完全开放的数学难题。

它对这些未解决的问题提出了一些新的见解，但研究人员认为，就目前而言，这些问题相对来说并不有趣。

GPT-5.4 Pro 在 FrontierMath 上创造了一项全新的记录，在前 3 个难度级别中解决了 50% 的问题。

本帖子中包含更多资源

浏览过的版块