autoresearch 是 Andrej Karpathy 开发的一个实验性框架，项目让 AI Agent（如 Claude 或 GPT-4）自主进行机器学习研究。

麦麦的蜜蜂 · 发表于 2026-3-9 13:21:08

autoresearch 是 Andrej Karpathy 开发的一个实验性框架，项目让 AI Agent（如 Claude 或 GPT-4）自主进行机器学习研究。该项目建立了一个闭环系统，允许 Agent 直接修改核心训练代码（train.py），然后在单 GPU 上运行固定时间（如 5 分钟）的训练实验，并根据验证集性能（val_bpb）决定是否保留修改；通过这种方式，Agent 可以在无人干预的情况下通宵进行架构调整或超参数搜索，实现代码的“自我进化”。
项目地址：github.com/karpathy/autoresearch
下面是AK的介绍：
-------------------------
我将“autoresearch”项目打包成了一个新的自包含最小仓库，供大家周末试用。它基本上是 nanochat LLM 训练核心，精简成单 GPU、单文件版本，约 630 行代码，然后：
----人类迭代提示（.md 文件）
----AI 代理迭代训练代码（.py 文件）

目标是设计你的代理，使其能够无限制地以最快速度推进研究进展，而无需你的任何干预。在图中，每一个点代表一次完整的 LLM 训练运行，精确持续 5 分钟。代理在 git 功能分支上以自主循环方式工作，并在找到更优的神经网络架构、优化器及所有超参数设置（最终降低验证损失）时，向训练脚本累积 git 提交。你可以想象比较不同提示、不同代理的研究进展情况。

部分代码，部分科幻，再加上一点精神错乱的味道

#How I AI#

autoresearch 是 Andrej Karpathy 开发的一个实验性框架，项目让 AI Agent（如 Claude 或 GPT-4）自主进行机器学习研究。

本帖子中包含更多资源