查看: 48|回复: 0

Karpathy深夜炸出自动化AI研究新项目

[复制链接]

11

主题

1

回帖

35

积分

新手上路

积分
35
发表于 2026-3-8 12:28:16 来自手机 | 显示全部楼层 |阅读模式
Karpathy深夜炸出自动化AI研究新项目:autoresearch ,让AI帮你做自动化循环LLM训练,你给指令然后躺着等结果

5分钟即完成一次训练,单卡能跑

人工不用在苦哈哈的去改Python代码、调参数、改神经网络架构,只给Prompt,AI自己去修改代码优化模型

给AIAgent一个真实的LLM训练环境,让它通宵达旦自主进行实验研究,人类给Prompt来指导AI思考和研究

Karpathy把这个项目打包成一个独立的迷你代码库,方便上手体验,这个项目本质上是nanochat模型训练核心的精简版,被压缩成一个630行的单文件代码,能在单GPU上运行

然后人训练LLM就变成了AI训练LLM
你告诉AI:去改改训练代码,看能不能让模型效果更好
AI收到指令: 修改train.py,跑5分钟训练,看结果
如果结果变好,保留修改
如果结果变差,丢弃重新改
然后重复循环……

这个项目里可以看到AI自主做研究的可行性,AI不仅写代码能开始接管最硬核的AI算法研究本身了

或许谁能写出更好的Prompt,谁能调教出更聪明的AI智能体才是核心竞争力,在这个范式中,Prompt就是新的源代码

github:http://t.cn/AXVtrJLJ

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

在本版发帖
关注公众号
返回顶部