查看: 7|回复: 0

【读懂 Agent 底层逻辑:平庸模型靠顶级支架也能逆袭】

[复制链接]

13

主题

1

回帖

41

积分

新手上路

积分
41
发表于 5 小时前 | 显示全部楼层 |阅读模式

【读懂 Agent 底层逻辑:平庸模型靠顶级支架也能逆袭】

快速阅读:Agent 的核心公式是“模型 + Harness(支架)”。与其盲目追求更强的模型,不如通过工程化的支架(提示词、工具、反馈环、沙箱)来弥补模型的局限。

如果你觉得某个 Agent 表现很烂,大概率不是模型笨,而是它身上的支架没搭好。

很多人在讨论模型时,总在纠结谁更聪明、谁写代码更干净。但这其实只看了一半。模型只是输入流里的一个环节,真正让它像个“智能体”跑起来的,是包裹在它外面的 Harness。这包括了提示词策略、工具集、上下文压缩、沙箱环境,还有那套让它出错后能自我修正的反馈环。

有句话说得很透:一个平庸的模型配上顶级的支架,表现往往能稳赢一个顶级模型配上烂支架。

这让我想起系统工程里的“棘轮效应”。每当 Agent 犯错,不要只是简单地重试,而是要把它变成一条永久的规则。如果它不小心删除了测试文件,那就直接在支架里加一个拦截钩子,或者在规范文档里写死一条禁令。这种做法就像 SRE(站点可靠性工程)里的故障处理:不修补症状,只更新契约。

有网友提到,这本质上是在把“事故响应”转化为可执行的脚手架。

不过,这事儿也有个悖论。当模型能力迭代时,原本为了补坑而设计的支架可能会变成“上下文垃圾”,导致系统臃肿。所以,优秀的工程师不仅要学会加约束,还得学会什么时候把旧的约束删掉。

现在的趋势很明显,大家不再单纯卷模型 API,而是在卷 Harness API。支架正在从静态的配置文件,变成像编译器一样复杂的运行时环境。

最后有个挺有意思的问题:如果 Agent 的失败大多是因为“判断力”问题,比如“现在该重构还是该上线”,这种涉及品味而非逻辑的模糊地带,支架真的能通过工程化解决吗?

addyosmani/status/2053231239721885918



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:2776601884@qq.com

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

在本版发帖
关注公众号
返回顶部