但是,光有闭环还不够。瓦特的调速器需要调校,Kubernetes 的控制器需要正确的配置,而让 AI 在你的代码库上工作,需要提供更难的东西。
让基础的反馈循环运转起来,这只是起点。测试要能让 AI 运行,CI 要能输出可解析的结果,错误信息要能指向修复方向。Anthropic 的研究员 Carlini 演示过这一点:他让 16 个并行的 AI 代理构建了一个 C 编译器,用的提示词简单到令人尴尬,但测试基础设施设计得非常精心。他说:“我的大部分精力都花在设计 Claude 周围的环境上,测试、环境、反馈。”
更难的问题是用你系统特有的知识来校准传感器和执行器。这是大多数人卡住的地方,也是他们责怪 AI 的地方。