查看: 2|回复: 0

微软又出一个开源重磅——Agent Lightning,让 AI Agent 自己学会改进自己。

[复制链接]

12

主题

1

回帖

48

积分

新手上路

积分
48
发表于 3 小时前 | 显示全部楼层 |阅读模式
微软又出一个开源重磅——Agent Lightning,让 AI Agent 自己学会改进自己。


把 RL 训练层和 Agent 框架解耦,既存的任何 Agent 框架(LangChain、AutoGen、原生 Python、多 Agent 系统)只需要加几行 trace 代码,就能接进 RL 训练管道,不需要改 Agent 本身。

核心循环:
截获 — 无缝捕获 Agent 的每一次 prompt、工具调用、反馈信号
经验池 — 打包成结构化数据
RL 优化 — 用强化学习算法读取经验,优化 prompt 模板或直接调整模型权重
热更新 — 把进化后的策略直接推回推理引擎,线上生效

关键工程价值是"零侵入":以往要让 Agent 学会自我改进,得在框架层大改代码,或者自己搭一套训练 pipeline。Agent Lightning 把 RL 训练做成了一个可以插拔的中间件,Agent 框架该干嘛干嘛,训练数据它帮你收,RL 算法它帮你跑,优化结果它帮你推回去。

GitHub 即将突破 1.7 万 star,热度说明社区对这类"Agent 自我进化"基础设施的需求非常饥渴。

GitHub:http://t.cn/AXPGyP5U
Microsoft Research:http://t.cn/AXM7WvNW











本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:2776601884@qq.com

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

在本版发帖
关注公众号
返回顶部