Playwright 與 agent-browser 對比：現代瀏覽器自動化工具解析

作者：吃灰思考

日期：2026年2月12日上午12:31

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Playwright 適合傳統測試，agent-browser 專為 AI 代理而設，揀邊款取決於你嘅核心需求

整理版摘要

呢篇文章係由一個瀏覽器自動化嘅愛好者寫嘅，佢想比較兩款主流工具——微軟嘅 Playwright (Python) 同 Vercel Labs 嘅 agent-browser。作者覺得而家好多人都搞唔清楚呢兩款工具嘅定位，成日混淆，所以佢決定從背景、核心特性、適用場景逐點拆解。最終結論係：Playwright 係為端到端測試同 Web 抓取而設計，功能全面、生態成熟；agent-browser 就係「AI-first」，用可訪問性樹快照幫 LLM 慳上下文窗口，適合整 AI 代理嘅開發者。兩者各有千秋，揀之前一定要搞清楚自己係要做測試定係想俾 AI 用。

作者先介紹 Playwright，話佢係微軟 2020 年開源嘅，團隊前身係 Google Puppeteer 班底，主打跨瀏覽器、自動等待、瀏覽器上下文呢啲強勁功能。然後講 agent-browser，係 Vercel Labs 專為 AI 代理整嘅 CLI 工具，核心賣點係將網頁抽成可訪問性樹快照，減到得返原本 7% 嘅資訊量，仲有確定性引用 (refs) 俾 AI 直接操作。

最後作者用一個對比表 highlight 兩者嘅設計哲學、元素定位方式、上下文窗口效率同架構差異。佢建議：如果你係寫測試或者爬蟲，揀 Playwright；如果你係整 LLM agent 需要自主瀏覽網頁，揀 agent-browser。仲有廣告推咗個用 Rust 重寫嘅 OpenClaw…

Playwright 係微軟出品，專攻端到端測試同 Web 抓取，用 DOM 選擇器，功能全面但會傳曬成個 DOM 俾 AI，好食 context window。
agent-browser 係 Vercel Labs 嘅 CLI 工具，AI-first 設計，用可訪問性樹快照同 refs，慳到 93% context window。
核心差異在於元素定位：Playwright 用傳統 CSS/XPath，agent-browser 用確定性引用，唔怕 DOM 變動。
啟發：AI 代理同網頁互動要考慮精簡表示，唔好硬塞完整 HTML，否則又快又貴。
可行動點：根據任務揀工具——測試用 Playwright，AI agent 用 agent-browser；可以兩者結合，例如 agent-browser 做瀏覽，Playwright 做測試驗證。

值得記低

工具 github.com

agent-browser

Vercel Labs 出品，AI-first CLI 瀏覽器自動化工具，支援可訪問性樹快照與確定性引用。

工具 github.com

OpenClaw

Rust 重寫嘅瀏覽器自動化框架，整合 agent-browser 查詢能力。

整理重點

Playwright：傳統 Web 測試嘅不二之選

Playwright 係微軟 2020 年開源嘅瀏覽器自動化庫，核心團隊由前 Google Puppeteer 工程師組成，目的係解決跨瀏覽器兼容同測試穩定性嘅問題。佢支援 Chromium、WebKit、Firefox 三大引擎，仲可以喺 Windows、Linux、macOS 行，有頭無頭都得。

Playwright 嘅設計理念係「為端到端測試而生」

佢嘅核心特性包括：自動等待機制減少 flaky tests；瀏覽器上下文做到獨立會話，適合並行測試；網絡攔截可以模擬後端；仲有語義選擇器例如 get_by_role 同 get_by_text，定位元素更穩陣。

適用場景：端到端測試、複雜 Web 抓取、CI/CD 整合。
Python API 好跟 Python 習慣，社區成熟，文檔齊全。
Trace Viewer 可以錄製操作過程，連 DOM 快照同視頻都有，除錯好方便。

整理重點

agent-browser：AI 優先嘅瀏覽自動化新思維

agent-browser 係 Vercel Labs 專為 AI 代理設計嘅 CLI 工具。佢嘅出發點係要解決 LLM 同網頁互動時嘅上下文窗口限制同非確定性問題。

核心係可訪問性樹快照 + 確定性引用 (refs)

佢唔似 Playwright 咁傳曬成個 DOM 俾 LLM，而係抽取出精簡嘅可訪問性樹，大小最多可以減 93%。每個可互動元素都有唯一 ref，AI 可以靠 ref 直接操作，唔使再自己諗 selectors。

採用客戶端-守護進程架構：Rust CLI 配 Node.js 守護進程，啟動快又穩定。
默認 Chromium，但透過 Playwright 協議都可以支援 Firefox 同 WebKit。
適合場景：AI 代理自主瀏覽、填表、數據收集，尤其係要慳 context window 嘅 LLM 應用。

整理重點

直接對壘：Playwright vs agent-browser

兩者嘅設計哲學完全唔同：Playwright 係俾人類開發者精準控制瀏覽器，agent-browser 係俾 AI 代理高效理解網頁。以下係關鍵差異：

元素定位：Playwright 用 DOM 選擇器（CSS/XPath），agent-browser 用可訪問性樹 refs

上下文窗口效率：Playwright 傳完整 DOM，agent-browser 慳 93%

Playwright 庫直接整合，agent-browser 係 CLI + daemon 架構。
Playwright 社區成熟，agent-browser 仲喺發展中，但專注 AI 整合。
如果任務係測試／爬蟲，Playwright 係首選；如果係整 AI agent，agent-browser 更適合。

整理重點

點樣揀？睇你核心需求

作者總結得好清楚：如果你主要做端到端測試、Web 抓取或者通用自動化，而且想用 Python 同成熟生態，就揀 Playwright。

但如果你係開發AI 代理，尤其係用 LLM 嚟自主瀏覽網頁、填表、操作，而且好在意上下文窗口成本同操作確定性，就應該揀 agent-browser。

甚至兩者可以結合：agent-browser 負責 AI 瀏覽，Playwright 負責測試驗證

文章最後仲推介咗一個 OpenClaw 工具，係用 Rust 重寫嘅瀏覽器自動化框架，已經整合咗 agent-browser，有興趣可以睇下。

Playwright：
https://playwright.dev/
https://github.com/microsoft/playwright

Agent Browser：
https://agent-browser.dev/
https://github.com/vercel-labs/agent-browser

喺今日數碼時代，瀏覽器自動化已經成為軟件測試、數據收集同埋 AI 代理同網頁互動嘅關鍵技術。呢篇文章會詳細比較微軟嘅 Playwright (Python) 同 Vercel Labs 嘅 agent-browser，由背景、功能、適用情況等方面去分析，希望幫讀者揀啱自己需要嘅工具。

Playwright：網頁測試同自動化嘅好幫手

Pasted image 20260211101536.png

背景同歷史

Playwright 係微軟喺 2020 年推出嘅開源瀏覽器自動化庫 (1)。佢嘅核心團隊由前 Google Puppeteer 工程師組成，專為解決傳統工具喺跨瀏覽器兼容、自動化穩定性同開發體驗上面嘅問題 (2)。Playwright 嘅設計理念係「為端到端測試而生」，支援 Chromium、WebKit 同 Firefox 等主流瀏覽器引擎，可以喺 Windows、Linux、macOS 上運行，仲支援無頭/有頭模式同流動裝置模擬 (3)。Python 版本嘅 Playwright 提供咗符合 Python 語法習慣嘅 API，好快就成為網頁測試同自動化工作嘅首選。

核心功能

Playwright 靠住佢嘅創新功能突圍而出：

跨瀏覽器、跨平台支援
：自動化 Chromium、Firefox 同 WebKit，支援多個操作系統，確保廣泛兼容 (3)。
自動等待
：智能等待機制，減少測試唔穩定同 Flaky Tests (4)。
瀏覽器上下文
：獨立嘅會話，有自己嘅緩存、Cookie 同本地儲存，適合並行測試 (5)。
網絡攔截
：攔截、修改或模擬網絡請求和回應，適用於模擬後端 API、性能測試等 (6)。
強大嘅選擇器
：除咗傳統選擇器，仲提供語義化選擇器，例如 get_by_role、get_by_text，提升元素定位嘅穩健性同可讀性 (7)。
Trace Viewer
：記錄測試執行過程，包括操作、網絡請求、DOM 快照同影片，簡化除錯 (8)。

適用情況

Playwright (Python) 適合好多種情況：

端到端測試
：提供穩定、快速、可靠嘅網頁應用端到端測試方案。
網頁抓取
：有效率噉處理複雜動態網頁同反爬機制。
通用瀏覽器自動化
：自動化重複性工作、報告生成、網站監控等。
CI/CD 整合
：無頭模式同跨平台特性令佢好適合整合到 CI/CD 流程。

Vercel Labs' agent-browser：為 AI 代理而設嘅瀏覽器自動化

Pasted image 20260211101654.png

背景同歷史

agent-browser 係 Vercel Labs 專為 AI 代理設計嘅命令列工具 (CLI) (9)。佢嘅核心概念係「AI-first」，旨在解決大型語言模型 (LLM) 同網頁互動時遇到嘅上下文窗口限制同非確定性問題 (10)。Vercel Labs 推出 agent-browser 嘅動機係想幫 AI 代理更高效、更可靠噉理解同操作網頁，通過提供精煉嘅關鍵信息，同時保持操作嘅確定性 (11)。

核心功能

agent-browser 圍繞「AI-first」理念，提供獨特功能：

AI 優先設計
：優化 AI 代理同網頁嘅互動，透過結構化、精簡嘅頁面資訊，等 LLM 更有效噉理解頁面狀態 (10)。
客戶端-守護進程架構
：Rust CLI 客戶端同 Node.js 守護進程一齊做嘢，守護進程管理 Playwright 瀏覽器實例，確保高效能同穩定性 (9)。
可訪問性樹快照同確定性引用
：生成頁面嘅可訪問性樹快照，為可互動元素分配確定性引用 (refs) (10)。AI 代理透過簡潔引用操作元素，減少 LLM 上下文窗口負擔，提高穩定性 (11)。
上下文窗口優化
：透過精簡嘅可訪問性樹快照，將網頁表示大小減少高達 93%，大幅慳返 LLM 上下文窗口，降低成本，提高 AI 代理效率 (10)。
多瀏覽器引擎支援
：預設 Chromium，透過 Playwright 協議支援 Firefox 同 WebKit (9)。

適用情況

agent-browser 主要面向以下情況：

AI 代理驅動嘅網頁互動
：等 LLM 更有效噉理解同操作網頁，實現自主瀏覽、數據收集同任務執行。
自主瀏覽
：等 AI 代理可以自己導航、填表、㩒連結等操作。
減少 LLM 上下文窗口使用
：大幅減少傳畀 LLM 嘅頁面資訊量，降低運行成本同提高效率。

Playwright (Python) 同 agent-browser 對比分析

兩者喺設計理念、目標用戶、核心技術同適用情況上有明顯分別。下表總結咗主要對比：

特性	Playwright (Python)	Vercel Labs' agent-browser
核心設計理念	端到端測試、通用瀏覽器自動化	AI 優先、賦能 AI 代理同網頁互動
主要目標用戶	軟件測試工程師、網頁開發者、數據科學家	AI 代理開發者、構建自主網頁代理嘅工程師
核心技術	完整嘅 DOM 結構、CSS/XPath 選擇器、自動等待	可訪問性樹快照、確定性引用 (refs)、客戶端-守護進程架構 (9, 10)
元素定位	依賴 DOM 結構同各種選擇器	透過可訪問性樹快照生成嘅確定性引用 (refs) 定位 (10)
上下文窗口效率	傳遞完整嘅 DOM 結構，可能好快用盡 LLM 上下文窗口	透過精簡嘅可訪問性樹快照，顯著優化 LLM 上下文窗口使用 (10)
架構	通常作為庫直接整合到應用程式	客戶端-守護進程 (Rust CLI + Node.js Daemon) 架構 (9)
生態系統成熟度	社羣成熟、文件齊全、插件豐富	相對較新，生態系統仲喺發展中，專注 AI 代理整合

核心哲學差異

Playwright 強調對瀏覽器行為嘅精確控制同模擬，提供全面嘅 API，等開發者好似真實用戶噉同網頁互動。agent-browser 就代表「AI 優先」模式，透過可訪問性樹快照同確定性引用，將複雜網頁抽象成 AI 代理更容易理解同操作嘅結構，提高 AI 代理效率同可靠性。

技術實現差異

Playwright 作為庫直接整合到 Python 應用。agent-browser 用客戶端-守護進程架構，Rust CLI 同 Node.js 守護進程一齊做嘢，提供更快啟動速度同更穩定運行環境。元素定位方面，Playwright 依賴傳統 DOM 同選擇器，而 agent-browser 就用可訪問性樹快照同確定性引用，用更少資訊、更確定嘅方式同頁面互動，避免 DOM 結構變化導致指令失效。

總結同揀選建議

Playwright (Python) 同 Vercel Labs' agent-browser 各自針對唔同情況優化咗。

揀 Playwright (Python)：主要關注網頁應用端到端測試、複雜網頁抓取、通用瀏覽器自動化，同埋想用 Python 語言優勢同成熟社羣資源。
揀 Vercel Labs' agent-browser：開發或整合 AI 代理（尤其係基於 LLM 嘅代理），面對 LLM 上下文窗口限制，需要自主瀏覽能力同 AI 友好嘅頁面表示方式。

揀邊個，關鍵係要搞清楚你嘅核心需要同目標。

參考文獻

(1) Playwright (software). Wikipedia. Available at: https://en.wikipedia.org/wiki/Playwright_(software)

(2) Playwright vs Puppeteer: Choosing the Right Browser Automation. Medium. Available at: https://medium.com/front-end-weekly/playwright-vs-puppeteer-choosing-the-right-browser-automation-tool-in-2024-d46d2cbadf71

(3) Installation | Playwright Python. Playwright Documentation. Available at: https://playwright.dev/python/docs/intro

(4) 6 Features That Made Me Love Python Playwright. Medium. Available at: https://python.plainenglish.io/6-features-that-made-me-love-python-playwright-e50f966d3204

(5) BrowserContext | Playwright Python. Playwright Documentation. Available at: https://playwright.dev/python/docs/api/class-browsercontext
(6) Network | Playwright Python. Playwright Documentation. Available at: https://playwright.dev/python/docs/api/class-page#page-route
(7) Locators | Playwright Python. Playwright Documentation. Available at: https://playwright.dev/python/docs/locators
(8) Trace Viewer | Playwright Python. Playwright Documentation. Available at: https://playwright.dev/python/docs/trace-viewer
(9) vercel-labs/agent-browser. GitHub. Available at: https://github.com/vercel-labs/agent-browser
(10) Agent-Browser: AI-First Browser Automation That Saves 93% of Your Context Window. Medium. Available at: https://medium.com/spillwave-solutions/agent-browser-ai-first-browser-automation-that-saves-93-of-your-context-window-7a2c52562f8c
(11) The Context Wars: Why Your Browser Tools Are Bleeding. Paddo.dev. Available at: https://paddo.dev/blog/agent-browser-context-efficiency/

最後推薦大家試嚇用 Rust 重寫嘅 OpenClaw，目前整合咗 agent-browser 支援查詢能力：

https://github.com/microclaw/microclaw

㩒呢度睇原文打開

Playwright:
https://playwright.dev/
https://github.com/microsoft/playwright

Agent Browser:
https://agent-browser.dev/
https://github.com/vercel-labs/agent-browser

在當今數字時代，瀏覽器自動化已成為軟件測試、數據抓取及AI代理與Web交互的關鍵技術。本文將深入對比微軟的 Playwright (Python) 和 Vercel Labs 的 agent-browser，從背景、特性、適用場景等方面進行分析，旨在幫助讀者選擇最適合自身需求的工具。

Playwright: Web測試與自動化利器

Pasted image 20260211101536.png

背景與歷史

Playwright 是微軟於2020年推出的開源瀏覽器自動化庫 (1)。其核心團隊由前 Google Puppeteer 工程師組成，旨在解決傳統工具在跨瀏覽器兼容性、自動化穩定性及開發體驗上的痛點 (2)。Playwright 的設計理念是“為端到端測試而生”，支持 Chromium、WebKit 和 Firefox 等主流瀏覽器引擎，可在 Windows、Linux、macOS 上運行，並支持無頭/有頭模式及移動設備模擬 (3)。Python 版本的 Playwright 提供了符合 Python 語言習慣的 API，迅速成為Web測試和自動化任務的首選。

核心特性

Playwright 憑藉其創新特性脱穎而出：

跨瀏覽器、跨平台支持
：自動化 Chromium、Firefox 和 WebKit，支持多操作系統，確保廣泛兼容性 (3)。
自動等待
：智能等待機制，減少測試不穩定性和 Flaky Tests (4)。
瀏覽器上下文
：獨立會話，擁有獨立的緩存、Cookie 和本地存儲，適用於並行測試 (5)。
網絡攔截
：攔截、修改或模擬網絡請求和響應，適用於模擬後端 API、性能測試等 (6)。
強大的選擇器
：除了傳統選擇器，還提供語義化選擇器，如 get_by_role、get_by_text，提升元素定位的健壯性和可讀性 (7)。
Trace Viewer
：記錄測試執行過程，包括操作、網絡請求、DOM 快照和視頻，簡化調試 (8)。

適用場景

Playwright (Python) 適用於多種場景：

端到端測試
：提供穩定、快速、可靠的Web應用端到端測試解決方案。
Web 抓取
：高效處理複雜動態網頁和反爬機制。
通用瀏覽器自動化
：自動化重複性任務、報告生成、網站監控等。
CI/CD 集成
：無頭模式和跨平台特性使其非常適合集成到 CI/CD 流程中。

Vercel Labs' agent-browser: 為AI代理而生的瀏覽器自動化

Pasted image 20260211101654.png

背景與歷史

agent-browser 是 Vercel Labs 專為 AI 代理設計的命令行工具 (CLI) (9)。其核心理念是“AI-first”，旨在解決大型語言模型 (LLM) 在與Web界面交互時面臨的上下文窗口限制和非確定性問題 (10)。Vercel Labs 推出 agent-browser 的動機在於賦能 AI 代理，使其能更高效、可靠地理解和操作Web頁面，通過提供精煉的關鍵信息，同時保持操作的確定性 (11)。

核心特性

agent-browser 圍繞“AI-first”理念，提供獨特功能：

AI 優先設計
：優化 AI 代理與Web頁面的交互，通過結構化、精簡的頁面信息，使 LLM 更有效地理解頁面狀態 (10)。
客戶端-守護進程架構
：Rust CLI 客戶端與 Node.js 守護進程協同工作，守護進程管理 Playwright 瀏覽器實例，確保高性能和穩定性 (9)。
可訪問性樹快照與確定性引用
：生成頁面的可訪問性樹快照，為可交互元素分配確定性引用 (refs) (10)。AI 代理通過簡潔引用操作元素，減少 LLM 上下文窗口負擔，提高穩定性 (11)。
上下文窗口優化
：通過精簡的可訪問性樹快照，將Web頁面表示大小減少高達93%，顯著節省 LLM 上下文窗口，降低成本，提高 AI 代理效率 (10)。
多瀏覽器引擎支持
：默認 Chromium，通過 Playwright 協議支持 Firefox 和 WebKit (9)。

適用場景

agent-browser 主要面向以下場景：

AI 代理驅動的Web交互
：使 LLM 更有效地理解和操作Web頁面，實現自主瀏覽、數據收集和任務執行。
自主瀏覽
：賦能 AI 代理進行自我導航、填寫表單、點擊連結等操作。
減少 LLM 上下文窗口使用
：顯著減少傳遞給 LLM 的頁面信息量，降低運行成本並提高效率。

Playwright (Python) 與 agent-browser 對比分析

兩者在設計理念、目標用戶、核心技術和適用場景上存在顯著差異。下表總結了主要對比：

特性	Playwright (Python)	Vercel Labs' agent-browser
核心設計理念	端到端測試、通用瀏覽器自動化	AI 優先、賦能 AI 代理與Web交互
主要目標用戶	軟件測試工程師、Web開發者、數據科學家	AI 代理開發者、構建自主Web代理的工程師
核心技術	完整的 DOM 結構、CSS/XPath 選擇器、自動等待	可訪問性樹快照、確定性引用 (refs)、客戶端-守護進程架構 (9, 10)
元素定位	依賴於 DOM 結構和各種選擇器	通過可訪問性樹快照生成的確定性引用 (refs) 進行定位 (10)
上下文窗口效率	傳遞完整的 DOM 結構，可能迅速耗盡 LLM 上下文窗口	通過精簡的可訪問性樹快照，顯著優化 LLM 上下文窗口使用 (10)
架構	通常作為庫直接集成到應用程序中	客戶端-守護進程 (Rust CLI + Node.js Daemon) 架構 (9)
生態系統成熟度	社區成熟、文檔完善、插件豐富	相對較新，生態系統正在發展中，專注於 AI 代理集成

核心哲學差異

Playwright 強調對瀏覽器行為的精確控制和模擬，提供全面的 API，讓開發者像真實用戶一樣與Web頁面交互。agent-browser 則代表“AI 優先”範式，通過可訪問性樹快照和確定性引用，將複雜Web頁面抽象成AI代理更容易理解和操作的結構，提高AI代理效率和可靠性。

技術實現差異

Playwright 作為庫直接集成到 Python 應用中。agent-browser 採用客戶端-守護進程架構，Rust CLI 與 Node.js 守護進程協同工作，提供更快啓動速度和更穩定運行環境。元素定位上，Playwright 依賴傳統 DOM 和選擇器，而 agent-browser 使用可訪問性樹快照和確定性引用，以更少信息量、更確定性方式與頁面交互，避免DOM結構變化導致的腳本失效。

總結與選擇建議

Playwright (Python) 和 Vercel Labs' agent-browser 各自優化了不同場景。

選擇 Playwright (Python)：主要關注Web應用端到端測試、複雜Web抓取、通用瀏覽器自動化，並希望利用 Python 語言優勢和成熟社區資源。
選擇 Vercel Labs' agent-browser：開發或集成 AI 代理（特別是基於 LLM 的代理），面臨 LLM 上下文窗口限制，需要自主瀏覽能力和AI友好的頁面表示方式。

選擇時，關鍵在於明確你的核心需求和目標。

參考文獻

(1) Playwright (software). Wikipedia. Available at: https://en.wikipedia.org/wiki/Playwright_(software)

(3) Installation | Playwright Python. Playwright Documentation. Available at: https://playwright.dev/python/docs/intro

(4) 6 Features That Made Me Love Python Playwright. Medium. Available at: https://python.plainenglish.io/6-features-that-made-me-love-python-playwright-e50f966d3204

最後推薦大家嘗試下用Rust重寫的OpenClaw，目前集成了agent-browser支持查詢能力：

https://github.com/microclaw/microclaw

點擊查看原文打開