Vercel Labs 的开源项目 agent-browser,针对 AI 设计的浏览器自动化 CLI 工具,基于极速 Rust 原生二进制,性能超棒,还能回退到 Node.js,兼容性极强。
它集成了完整的浏览器控制能力:打开页面、点击、填写输入框、截图、抓取元素文本,支持等待元素出现、滚动、键盘和鼠标事件注入,甚至还能管理多会话和持久化浏览数据。
尤其适合 AI 代理执行自动化任务,比如自动登录、数据爬取、测试脚本自动执行,还支持 iOS 模拟器控制和云端远程浏览,非常适合各种自动化和 AI 助理场景。
GitHub:github.com/vercel-labs/agent-browser
主要功能:
- 极速 Rust CLI,操作流畅且延迟极低;
- 多种选择器支持,推荐用 refs 快速定位元素;
- 支持截图、PDF导出、页面快照及元素高亮;
- 多会话和持久化配置,支持加密保存浏览状态;
- 可连接远程调试浏览器或用云端浏览器运行;
- iOS 模拟器与真机皆可操控Safari;
- 安全特性丰富,比如域名白名单、动作确认和内容边界标记。
安装也极简单:npm全局安装agent-browser,再执行agent-browser install自动下载Chromium浏览器即可启动。
适用 Web、macOS、Windows、Linux,适合开发者和AI从业人员构建智能自动化工作流。
##