微软又出一个开源重磅——Agent Lightning，让 AI Agent 自己学会改进自己。

月儿湾 · 发表于 2026-4-12 13:55:03

微软又出一个开源重磅——Agent Lightning，让 AI Agent 自己学会改进自己。

把 RL 训练层和 Agent 框架解耦，既存的任何 Agent 框架（LangChain、AutoGen、原生 Python、多 Agent 系统）只需要加几行 trace 代码，就能接进 RL 训练管道，不需要改 Agent 本身。

核心循环：
截获 — 无缝捕获 Agent 的每一次 prompt、工具调用、反馈信号
经验池 — 打包成结构化数据
RL 优化 — 用强化学习算法读取经验，优化 prompt 模板或直接调整模型权重
热更新 — 把进化后的策略直接推回推理引擎，线上生效

关键工程价值是"零侵入"：以往要让 Agent 学会自我改进，得在框架层大改代码，或者自己搭一套训练 pipeline。Agent Lightning 把 RL 训练做成了一个可以插拔的中间件，Agent 框架该干嘛干嘛，训练数据它帮你收，RL 算法它帮你跑，优化结果它帮你推回去。

GitHub 即将突破 1.7 万 star，热度说明社区对这类"Agent 自我进化"基础设施的需求非常饥渴。

GitHub：http://t.cn/AXPGyP5U
Microsoft Research：http://t.cn/AXM7WvNW

微软又出一个开源重磅——Agent Lightning，让 AI Agent 自己学会改进自己。

本帖子中包含更多资源