【读懂 Agent 底层逻辑：平庸模型靠顶级支架也能逆袭】

还有什么不可以 · 发表于 2026-5-23 09:15:53

【读懂 Agent 底层逻辑：平庸模型靠顶级支架也能逆袭】

快速阅读：Agent 的核心公式是“模型 + Harness（支架）”。与其盲目追求更强的模型，不如通过工程化的支架（提示词、工具、反馈环、沙箱）来弥补模型的局限。

如果你觉得某个 Agent 表现很烂，大概率不是模型笨，而是它身上的支架没搭好。

很多人在讨论模型时，总在纠结谁更聪明、谁写代码更干净。但这其实只看了一半。模型只是输入流里的一个环节，真正让它像个“智能体”跑起来的，是包裹在它外面的 Harness。这包括了提示词策略、工具集、上下文压缩、沙箱环境，还有那套让它出错后能自我修正的反馈环。

有句话说得很透：一个平庸的模型配上顶级的支架，表现往往能稳赢一个顶级模型配上烂支架。

这让我想起系统工程里的“棘轮效应”。每当 Agent 犯错，不要只是简单地重试，而是要把它变成一条永久的规则。如果它不小心删除了测试文件，那就直接在支架里加一个拦截钩子，或者在规范文档里写死一条禁令。这种做法就像 SRE（站点可靠性工程）里的故障处理：不修补症状，只更新契约。

有网友提到，这本质上是在把“事故响应”转化为可执行的脚手架。

不过，这事儿也有个悖论。当模型能力迭代时，原本为了补坑而设计的支架可能会变成“上下文垃圾”，导致系统臃肿。所以，优秀的工程师不仅要学会加约束，还得学会什么时候把旧的约束删掉。

现在的趋势很明显，大家不再单纯卷模型 API，而是在卷 Harness API。支架正在从静态的配置文件，变成像编译器一样复杂的运行时环境。

最后有个挺有意思的问题：如果 Agent 的失败大多是因为“判断力”问题，比如“现在该重构还是该上线”，这种涉及品味而非逻辑的模糊地带，支架真的能通过工程化解决吗？

addyosmani/status/2053231239721885918

【读懂 Agent 底层逻辑：平庸模型靠顶级支架也能逆袭】

本帖子中包含更多资源