Redis作者 antirez 的一项实验，这里GPT 5.4 要优于Claude Opus

埋葬冬天的回忆 · 发表于 2026-4-8 09:23:26

Redis作者 antirez 的一项实验，这里GPT 5.4 要优于Claude Opus

-----------------------------
过去一周里，我分别对 Claude Code Opus 4.6 和 Codex GPT 5.4 跑了很长时间的自主会话，两者都开到了最大思考预算。它们运行在各自克隆出的目录中；只要其中一边落后了，我就会重新刷新目录。我为此消耗了大量 token（按固定资费计算，使用的是我的 OSS 免费账号和 PRO 账号）。

不过，结果已经非常有代表性。手头这个任务极其复杂：我们与一家计算机博物馆合作，出于计算机历史研究的目的，给定一份 90 年代初期的 Unix 磁盘镜像，希望仅凭系统中的使用痕迹，重建一块早已消失的 SCSI 硬件环境。

这是一个 SYSV 系统，驱动是直接编译进内核的，没有任何硬件抽象层，运行在一台配备 8MB 内存的 486 机器上。几天下来，经过多轮运行，在使用相同工具条件的前提下，GPT 5.4 完成了几乎全部关键进展，而 Opus 只取得了少量推进。

对于严肃的工程工作，两者之间的差距大得惊人。面对非常复杂的任务时，Claude Code + Opus 基本处在接近无用的边缘；而 GPT 5.4 则能够完成逆向工程任务，把硬件知识、大规模反汇编能力等多种技能结合起来。

顺带一提，一个很有意思的现象是：有时模型会卡住很多小时，但只要给它一点高层级的提示，告诉它怎样更高效地推进工作，即便并不知道具体卡点是什么，比如 DMA 传输异常之类的问题，它也能重新取得进展。

现在 unfortunately，我的 @OpenAIDevs token 已经用完了，接下来 48 小时内都没有额度了。所以这次逆向工程只能先停在这里，我得把剩下的 token 留给 Redis 相关工作。两天后再继续。

当前状态是：系统已经明显进入 init 阶段，fork() 可以工作，有时 /dev/console 的链接也能建立成功。