找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 3|回复: 0

autoresearch 是 Andrej Karpathy 开发的一个实验性框架,项目让 AI Agent(如 Claude 或 GPT-4)自主进行机器学习研究。

[复制链接]

8

主题

1

回帖

26

积分

新手上路

积分
26
发表于 9 小时前 | 显示全部楼层 |阅读模式

autoresearch 是 Andrej Karpathy 开发的一个实验性框架,项目让 AI Agent(如 Claude 或 GPT-4)自主进行机器学习研究。该项目建立了一个闭环系统,允许 Agent 直接修改核心训练代码(train.py),然后在单 GPU 上运行固定时间(如 5 分钟)的训练实验,并根据验证集性能(val_bpb)决定是否保留修改;通过这种方式,Agent 可以在无人干预的情况下通宵进行架构调整或超参数搜索,实现代码的“自我进化”。
项目地址:github.com/karpathy/autoresearch
下面是AK的介绍:
-------------------------
我将“autoresearch”项目打包成了一个新的自包含最小仓库,供大家周末试用。它基本上是 nanochat LLM 训练核心,精简成单 GPU、单文件版本,约 630 行代码,然后:
----人类迭代提示(.md 文件)
----AI 代理迭代训练代码(.py 文件)


目标是设计你的代理,使其能够无限制地以最快速度推进研究进展,而无需你的任何干预。在图中,每一个点代表一次完整的 LLM 训练运行,精确持续 5 分钟。代理在 git 功能分支上以自主循环方式工作,并在找到更优的神经网络架构、优化器及所有超参数设置(最终降低验证损失)时,向训练脚本累积 git 提交。你可以想象比较不同提示、不同代理的研究进展情况。


部分代码,部分科幻,再加上一点精神错乱的味道


#How I AI#





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一起港湾 ( 青ICP备2025004122号-1 )

GMT+8, 2026-3-9 22:34 , Processed in 0.150284 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表