Obsidian 的用户群不是极客,核心受众是做笔记、搞知识管理的普通人。这样一款产品突然加了命令行工具,图什么?答案写在官方公告里:“scripting, automation, and integration with external tools”。翻译成人话:让 AI Agent 能直接操作你的笔记库。
去年底豆包手机的遭遇就是例子。字节跳动的 AI 助手用 AI 模拟人操作手机界面(GUI Agent),替用户跨 App 操作,结果微信、支付宝、淘宝纷纷限制使用。表面理由是安全,更深的原因是 Agent 绕过了广告和推荐链条,影响了平台收入。
但封杀一个豆包,封不住整个行业。苹果 Siri 在接入 Gemini,华为小米 vivo 全在推 AI 助手,IDC 预测 2026 年中国 AI 手机出货量将占过半。更关键的是,GUI Agent 本身就是一种“翻窗”操作:AI 模拟人点屏幕,效率低、易出错、触发风控。如果 App 主动提供了 API 或 MCP,Agent 就不需要“装成人”去操作界面,而是通过授权的、结构化的方式调用功能,操作透明、权限可控。