autoresearch 是 Andrej Karpathy 开发的一个实验性框架,项目让 AI Agent(如 Claude 或 GPT-4)自主进行机器学习研究。该项目建立了一个闭环系统,允许 Agent 直接修改核心训练代码(train.py),然后在单 GPU 上运行固定时间(如 5 分钟)的训练实验,并根据验证集性能(val_bpb)决定是否保留修改;通过这种方式,Agent 可以在无人干预的情况下通宵进行架构调整或超参数搜索,实现代码的“自我进化”。
项目地址:github.com/karpathy/autoresearch
下面是AK的介绍:
-------------------------
我将“autoresearch”项目打包成了一个新的自包含最小仓库,供大家周末试用。它基本上是 nanochat LLM 训练核心,精简成单 GPU、单文件版本,约 630 行代码,然后:
----人类迭代提示(.md 文件)
----AI 代理迭代训练代码(.py 文件)
目标是设计你的代理,使其能够无限制地以最快速度推进研究进展,而无需你的任何干预。在图中,每一个点代表一次完整的 LLM 训练运行,精确持续 5 分钟。代理在 git 功能分支上以自主循环方式工作,并在找到更优的神经网络架构、优化器及所有超参数设置(最终降低验证损失)时,向训练脚本累积 git 提交。你可以想象比较不同提示、不同代理的研究进展情况。
部分代码,部分科幻,再加上一点精神错乱的味道 :)
#How I AI#