Vercel推出 Agent Browser:让AI自己控制浏览器,比Playwright节省93%上下文
2026-03-06 224 0
近年来,AI Agent 正从只能回答问题走向真正执行任务。为了让大模型拥有实际操作网页的能力,Vercel 推出了全新的开源工具 Agent Browser。这是一款专门为 AI 设计的浏览器自动化工具,它允许 AI 自主打开网页、点击按钮、填写表单甚至完成复杂的在线任务。相比传统工具如 Playwright,Agent Browser 通过优化数据结构和交互方式,最多可以减少 93% 的网页上下文数据,从而显著降低 Token 消耗并提升执行效率。

Vercel AI Agent GitHub 地址:https://github.com/vercel-labs/agent-browser
在 AI Agent 快速发展的背景下,这款工具被认为是连接大模型智能与真实互联网操作的重要基础设施。
什么是 Agent Browser
Agent Browser 是 Vercel Labs 开源的一款 专为 AI Agent 设计的浏览器自动化 CLI 工具。它基于 Rust 构建,提供高性能的无头浏览器能力,同时兼容 Node.js 环境,开发者可以通过简单命令让 AI 操作网页,例如打开网站、点击元素、输入文本或抓取数据。
与传统自动化框架不同,Agent Browser 的核心目标不是为人类编写脚本,而是让 AI 能够更容易理解网页并执行操作。例如,在执行浏览器任务时,AI 不需要解析完整的 DOM 结构,而是通过简化的页面快照获取可交互元素的引用,再通过这些引用完成点击或输入等动作。
这种设计让 AI 可以更专注于决策逻辑,而不是被复杂的网页结构干扰,从而大幅提升执行效率。
为什么比 Playwright 更适合 AI
传统浏览器自动化工具(如 Playwright 或 Puppeteer)最初是为开发者设计的,当这些工具被 AI 使用时,会出现一个明显的问题:上下文过于庞大。
网页 DOM 通常包含大量 CSS、布局信息和无关节点,当这些内容被传递给大模型时,会迅速消耗上下文窗口和 Token。Agent Browser 对此进行了专门优化,通过结构重构只保留 关键 DOM 信息和可操作元素,最多可减少 93% 的无关上下文数据。
此外,它还采用 Rust 编写核心模块,相比 Node.js 或 Python 实现具有更快的启动速度、更低的资源占用以及更高的稳定性,特别适合需要高频浏览器操作的 AI Agent 场景。
简单来说,Playwright 更像是开发者的自动化工具,而 Agent Browser 是 为 AI 重新设计的浏览器执行引擎。
AI Agent生态中的关键基础设施
Agent Browser 还具备非常开放的生态兼容性。当前它已经可以与多种 AI 编程助手和代理系统集成,例如 Claude Code、Gemini、Cursor 以及 GitHub Copilot 等。开发者只需在现有 AI 工作流中加入该工具,就可以让 AI 从生成代码升级为执行任务。
这种能力意味着 AI 不再只是回答问题,而是能够真正完成实际操作。例如:
- 自动填写网站表单
- 电商平台自动比价
- 自动测试 Web 应用
- 自动收集网页数据
- 帮用户完成在线订票或注册流程
随着 AI Agent 技术的发展,未来很多在线任务可能不再需要人工点击,而是由 AI 直接在浏览器中完成。Agent Browser 的出现,正是推动这一趋势的重要一步。
总结
Agent Browser 的发布标志着 AI 应用从语言交互向真实操作迈出了关键一步。通过极致精简的网页上下文结构和高性能 Rust 内核,它大幅降低了 AI 操作浏览器的成本,并为 AI Agent 提供了真正可执行的能力。
在未来的 AI 原生应用中,浏览器将成为 AI 与互联网交互的主要入口,而 Agent Browser 很可能会成为这一生态的重要基础设施。如果 AI 能像人类一样浏览网页、点击按钮、完成流程,那么许多在线工作流程都将被彻底重塑。