查看: 2|回复: 0

Redis作者 antirez 的一项实验,这里GPT 5.4 要优于Claude Opus

[复制链接]

10

主题

2

回帖

34

积分

新手上路

积分
34
发表于 6 小时前 | 显示全部楼层 |阅读模式
Redis作者 antirez 的一项实验,这里GPT 5.4 要优于Claude Opus  

-----------------------------
过去一周里,我分别对 Claude Code Opus 4.6 和 Codex GPT 5.4 跑了很长时间的自主会话,两者都开到了最大思考预算。它们运行在各自克隆出的目录中;只要其中一边落后了,我就会重新刷新目录。我为此消耗了大量 token(按固定资费计算,使用的是我的 OSS 免费账号和 PRO 账号)。

不过,结果已经非常有代表性。手头这个任务极其复杂:我们与一家计算机博物馆合作,出于计算机历史研究的目的,给定一份 90 年代初期的 Unix 磁盘镜像,希望仅凭系统中的使用痕迹,重建一块早已消失的 SCSI 硬件环境。

这是一个 SYSV 系统,驱动是直接编译进内核的,没有任何硬件抽象层,运行在一台配备 8MB 内存的 486 机器上。几天下来,经过多轮运行,在使用相同工具条件的前提下,GPT 5.4 完成了几乎全部关键进展,而 Opus 只取得了少量推进。

对于严肃的工程工作,两者之间的差距大得惊人。面对非常复杂的任务时,Claude Code + Opus 基本处在接近无用的边缘;而 GPT 5.4 则能够完成逆向工程任务,把硬件知识、大规模反汇编能力等多种技能结合起来。

顺带一提,一个很有意思的现象是:有时模型会卡住很多小时,但只要给它一点高层级的提示,告诉它怎样更高效地推进工作,即便并不知道具体卡点是什么,比如 DMA 传输异常之类的问题,它也能重新取得进展。

现在 unfortunately,我的 @OpenAIDevs token 已经用完了,接下来 48 小时内都没有额度了。所以这次逆向工程只能先停在这里,我得把剩下的 token 留给 Redis 相关工作。两天后再继续。

当前状态是:系统已经明显进入 init 阶段,fork() 可以工作,有时 /dev/console 的链接也能建立成功。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

在本版发帖
关注公众号
返回顶部