最颠覆的一点:agent可以自己写新的skill。你跟OpenClaw说"我想让你能管理我的Todoist",它自己写一个连接Todoist API(应用程序接口)的skill,然后这个能力就永久获得了。社区用户已经让它自动生成了Whoop健康数据、WordPress管理、Hetzner服务器运维等skill。这就是它的标语所说的——"真正能干活的AI"(the AI that actually does things)。不只是说,还能做,甚至能自我扩展。
所有工具默认输出JSON(一种结构化数据格式,机器读起来比人类读起来方便得多),方便agent解析而不是方便人类阅读。错误处理极度宽容——Peekaboo的窗口匹配不要求精确名称,agent说"Chrome"能匹配到"Google Chrome"。他在博客里的原则是"工具调用应该宽容"(tool calling should be lenient),因为"agent一定会搞错参数"(agents make mistakes with parameters)。
这和传统软件工程的"严格校验输入"完全相反。但对agent来说,这才是对的设计。
三、为什么是他而不是别人?
Peter Steinberger不是一个AI领域的新人碰巧做对了一件事。他是一个有13年产品经验的创始人——PSPDFKit(业界领先的PDF开发组件)2021年以超过1亿美元退出。经历了三年的迷茫期后,他用AI工具重新开始造东西。
这也是奥特曼花大钱买的东西。他在宣布招聘时说:"未来一定是高度多agent协作的。"(The future is going to be extremely multi-agent.)多个agent之间互相协作、互相调用skill、共同完成复杂任务——这正是Peter用40多个CLI工具和一个skill框架搭出来的原型。
Peter自己说:他可以把OpenClaw做成一家大公司,但"那对我来说没什么意思"(it's not really exciting for me)。他的下一个目标是:"做一个连我妈都会用的agent。"(Build an agent that even my mum can use.)