絕!一個 skill,讓 AI 替你刷小紅書、搶票、扒數據
整理版優先睇
agent-browser 係 Claude Skills 生態首個爆款,以極低 token 成本實現瀏覽器自動化,仲可以接管 Electron 桌面應用。
呢篇文章介紹咗一個叫 agent-browser 嘅 Claude Skill,佢喺一星期內被安裝咗 18.7 萬次,成為生態入面第一個爆款。核心賣點唔係單純嘅瀏覽器自動化,而係 token 成本比傳統方案低 10 到 20 倍。作者指出,Playwright MCP 每次操作要用 3000-5000 個 token,而 agent-browser 只需 200-400 個,差距非常驚人。呢個突破令到長任務嘅 token 開銷大幅降低,直接影響到 agent 嘅續航力同成本。
文章詳細解釋咗點解可以做到咁低 token:第一係 element ref 設計,將網頁上每個可交互元素編號成 @e1、@e2,AI 只需直接操作編號,唔使讀曬成個 DOM;第二係用純文本輸出代替結構化 JSON,信息密度更高,token 更慳。另外,agent-browser 有兩種打開方式:後台悄悄跑(適合輕量任務但易被反爬識別)同埋接管現有用戶嘅 Chrome 瀏覽器(利用現有登錄態,反爬系統睇唔出)。呢個設計令佢既靈活又實用。
最後,作者提到 agent-browser 仲有一個隱藏功能:子 skill electron 可以接管所有 Electron 應用,例如 VS Code、Slack、Discord、Figma,等於一個 skill 覆蓋曬成個桌面。安裝方面,可以透過 npm 或 brew 一鍵完成,而且 skill 係共享嘅,…
- 核心爆點:token 成本比 Playwright MCP 低 10 到 20 倍(200-400 vs 3000-5000),直接影響 agent 續航同成本。
- 兩大設計關鍵:element ref(@e1 編號)避免讀 DOM,純文本輸出代替 JSON,大幅慳 token。
- 反爬策略:可接管現有 Chrome,用返已登錄嘅賬號,反爬系統以為係真人操作,唔會被 ban。
- 子 skill electron:一次過解鎖 VS Code、Slack、Discord、Figma 等 Electron 應用,AI 可以喺桌面程式入面自動操作。
- 安裝簡單:npm / brew 一鍵安裝,skill 文件放喺 .claude/skills/,多個 agent 自動識別,唔使逐個 setup。
安裝 agent-browser skill
npm install -g agent-browser && agent-browser install 或 brew install agent-browser && agent-browser install,然後執行 npx skills add --skill agent-browser
token 成本砍十倍的兩個設計
agent-browser 能夠將 token 成本降到 200-400,關鍵在於兩個設計。第一個係 element ref,佢將網頁上每個可交互元素都編一個號,例如 @e1、@e2,AI 只要睇到「點 @e7」就知點邊度,成個 DOM 唔使入上下文。
第二個係用 文本輸出代替 JSON。Playwright MCP 返回結構化 JSON,字段嵌套深、token 貴,複雜頁面一次可以到 5 萬 token;agent-browser 用純文本,信息密度更高,AI 讀起嚟反而更準。
兩種打開方式與反爬策略
agent-browser 有兩種打開方式。第一種係 後台悄悄跑,佢自己開一個睇唔見嘅瀏覽器進程,跑得快、唔佔屏幕,適合做啲輕量任務。但弱點係太似爬蟲,好容易被 Cloudflare、Google、X 呢啲反爬系統 ban 咗。
第二種係 直接接管你日常用緊嗰個 Chrome。你嘅瀏覽器已經登曬賬號、裝曬插件、跳曬彈窗,agent-browser 直接接入嚟,喺你已經用緊嘅 Chrome 上面鬱手。反爬系統睇唔出分別,因為對佢嚟講,呢個就係一個真人喺度用瀏覽器,只係多咗隻 AI 手。
解鎖 Electron 全家桶
agent-browser 自帶一個叫 electron 嘅子 skill。VS Code、Slack、Discord、Figma 呢啲全部都係 Electron 應用,佢哋本質上都開咗一個 CDP 端口。
- 裝咗 agent-browser,呢啲桌面應用可以一次性被 AI 接管,例如叫 agent 喺 Figma 改組件顏色、喺 VS Code 跑重構。
- 以前要裝五個唔同嘅 MCP server,而家一個 skill 就全部覆蓋,效率提升好多。
裝一次到處用
skill 係 Anthropic 官方嘅擴展機制,同一個 skill 可以畀多個 agent 調用。例如小龍蝦、愛馬仕、Claude Code 呢啲桌面 agent,只要裝一次 agent-browser,三個都同時擁有瀏覽器能力。
skill 比 MCP server 體驗更好
MCP server 每個 agent 要獨立配置,skill 放喺 .claude/skills/ 一個位置,所有支援嘅 agent 會自動識別,唔使逐個 setup。
安裝指南
- 1 npm install -g agent-browser && agent-browser install
- 2 或者 macOS 用戶:brew install agent-browser && agent-browser install
- 3 agent-browser install 會下載一個隔離嘅 Chrome 畀 daemon 用,唔會影響你日常嘅 Chrome。
- 4 然後執行 npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser,skill 文件會落到 .claude/skills/agent-browser/,Claude Code 即刻識別。
成個過程幾秒就搞掂,裝完即刻用得。記得用 npm install -g agent-browser 或者 brew install agent-browser 開始。
固定 profile 避免登錄失效
CDP 默認每次開嘅係臨時 profile,關咗就清空,所以第二次用嘅時候登錄態會冇咗,要重新輸入密碼。
.claude/skills/ 一處,所有支援嘅agent自動識別。npm install -g agent-browser
agent-browser install
brew install agent-browser
agent-browser install
agent-browser install 呢一步會下載一個隔離嘅Chrome畀daemon用,唔會污染你平時嘅Chrome。npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser.claude/skills/agent-browser/,Claude Code即刻識別。幾秒裝完就用得。用 agent-browser CDP 打開瀏覽器的 profile,
要固定指定位置,保存到 tools.md 中,
後續都用這個位置。
.claude/skills/ 一處,所有支持的 agent 自動識別。npm install -g agent-browser
agent-browser install
brew install agent-browser
agent-browser install
agent-browser install 這一步會下載一個隔離的 Chrome 給 daemon 用,不污染你日常的 Chrome。npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser.claude/skills/agent-browser/,Claude Code 立刻識別。幾秒裝完就能用。用 agent-browser CDP 打開瀏覽器的 profile,
要固定指定位置,保存到 tools.md 中,
後續都用這個位置。