絕!一個 skill,讓 AI 替你刷小紅書、搶票、扒數據

作者:戴衞得
日期:2026年5月11日 上午6:58
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

agent-browser 係 Claude Skills 生態首個爆款,以極低 token 成本實現瀏覽器自動化,仲可以接管 Electron 桌面應用。

整理版摘要

呢篇文章介紹咗一個叫 agent-browser 嘅 Claude Skill,佢喺一星期內被安裝咗 18.7 萬次,成為生態入面第一個爆款。核心賣點唔係單純嘅瀏覽器自動化,而係 token 成本比傳統方案低 10 到 20 倍。作者指出,Playwright MCP 每次操作要用 3000-5000 個 token,而 agent-browser 只需 200-400 個,差距非常驚人。呢個突破令到長任務嘅 token 開銷大幅降低,直接影響到 agent 嘅續航力同成本。

文章詳細解釋咗點解可以做到咁低 token:第一係 element ref 設計,將網頁上每個可交互元素編號成 @e1、@e2,AI 只需直接操作編號,唔使讀曬成個 DOM;第二係用純文本輸出代替結構化 JSON,信息密度更高,token 更慳。另外,agent-browser 有兩種打開方式:後台悄悄跑(適合輕量任務但易被反爬識別)同埋接管現有用戶嘅 Chrome 瀏覽器(利用現有登錄態,反爬系統睇唔出)。呢個設計令佢既靈活又實用。

最後,作者提到 agent-browser 仲有一個隱藏功能:子 skill electron 可以接管所有 Electron 應用,例如 VS CodeSlackDiscord、Figma,等於一個 skill 覆蓋曬成個桌面。安裝方面,可以透過 npm 或 brew 一鍵完成,而且 skill 係共享嘅,…

  • 核心爆點:token 成本比 Playwright MCP 低 10 到 20 倍(200-400 vs 3000-5000),直接影響 agent 續航同成本。
  • 兩大設計關鍵:element ref(@e1 編號)避免讀 DOM,純文本輸出代替 JSON,大幅慳 token。
  • 反爬策略:可接管現有 Chrome,用返已登錄嘅賬號,反爬系統以為係真人操作,唔會被 ban。
  • 子 skill electron:一次過解鎖 VS CodeSlackDiscord、Figma 等 Electron 應用,AI 可以喺桌面程式入面自動操作。
  • 安裝簡單:npm / brew 一鍵安裝,skill 文件放喺 .claude/skills/,多個 agent 自動識別,唔使逐個 setup。
值得記低
流程 github.com

安裝 agent-browser skill

npm install -g agent-browser && agent-browser install 或 brew install agent-browser && agent-browser install,然後執行 npx skills add --skill agent-browser

整理重點

token 成本砍十倍的兩個設計

agent-browser 能夠將 token 成本降到 200-400,關鍵在於兩個設計。第一個係 element ref,佢將網頁上每個可交互元素都編一個號,例如 @e1、@e2,AI 只要睇到「點 @e7」就知點邊度,成個 DOM 唔使入上下文。

第二個係用 文本輸出代替 JSONPlaywright MCP 返回結構化 JSON,字段嵌套深、token 貴,複雜頁面一次可以到 5 萬 token;agent-browser 用純文本,信息密度更高,AI 讀起嚟反而更準。

整理重點

兩種打開方式與反爬策略

agent-browser 有兩種打開方式。第一種係 後台悄悄跑,佢自己開一個睇唔見嘅瀏覽器進程,跑得快、唔佔屏幕,適合做啲輕量任務。但弱點係太似爬蟲,好容易被 CloudflareGoogle、X 呢啲反爬系統 ban 咗。

第二種係 直接接管你日常用緊嗰個 Chrome。你嘅瀏覽器已經登曬賬號、裝曬插件、跳曬彈窗,agent-browser 直接接入嚟,喺你已經用緊嘅 Chrome 上面鬱手。反爬系統睇唔出分別,因為對佢嚟講,呢個就係一個真人喺度用瀏覽器,只係多咗隻 AI 手。

整理重點

解鎖 Electron 全家桶

agent-browser 自帶一個叫 electron 嘅子 skill。VS CodeSlackDiscordFigma 呢啲全部都係 Electron 應用,佢哋本質上都開咗一個 CDP 端口。

  • 裝咗 agent-browser,呢啲桌面應用可以一次性被 AI 接管,例如叫 agent 喺 Figma 改組件顏色、喺 VS Code 跑重構。
  • 以前要裝五個唔同嘅 MCP server,而家一個 skill 就全部覆蓋,效率提升好多。
整理重點

裝一次到處用

skill 係 Anthropic 官方嘅擴展機制,同一個 skill 可以畀多個 agent 調用。例如小龍蝦、愛馬仕、Claude Code 呢啲桌面 agent,只要裝一次 agent-browser,三個都同時擁有瀏覽器能力。

skill 比 MCP server 體驗更好

MCP server 每個 agent 要獨立配置,skill 放喺 .claude/skills/ 一個位置,所有支援嘅 agent 會自動識別,唔使逐個 setup。

整理重點

安裝指南

  1. 1 npm install -g agent-browser && agent-browser install
  2. 2 或者 macOS 用戶:brew install agent-browser && agent-browser install
  3. 3 agent-browser install 會下載一個隔離嘅 Chrome 畀 daemon 用,唔會影響你日常嘅 Chrome
  4. 4 然後執行 npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser,skill 文件會落到 .claude/skills/agent-browser/,Claude Code 即刻識別。

成個過程幾秒就搞掂,裝完即刻用得。記得用 npm install -g agent-browser 或者 brew install agent-browser 開始。

整理重點

固定 profile 避免登錄失效

CDP 默認每次開嘅係臨時 profile,關咗就清空,所以第二次用嘅時候登錄態會冇咗,要重新輸入密碼。

我賭呢三個插件,你嘅Obsidian一個都冇裝!
救命!我畀AI推演C-17現身首都機場對黃金嘅影響,竟然嘈到拆天。
Anthropic 開源咗10個金融Agent,華爾街大震。
· · ·
你敢唔敢信,一個skill一個禮拜之內就被裝咗18.7萬次。
agent-browser,呢個係Claude Skills生態裏面第一個出圈嘅爆款。
Anthropic 官方推skill呢套機制快一年咗,裝機量第一次衝到呢個量級,而且只係用咗一個禮拜。
但係佢爆紅嘅原因,唔係網上講嘅「畀AI用瀏覽器」。呢件事 Playwright MCPdev-browserClaude in Chrome 都做到,一早唔係新聞。
爆點唔係呢個,而係token成本。
同一個網頁操作,Playwright MCP 要喺AI上下文灌3000-5000個token,agent-browser 淨係用200-400。相差10到20倍。 長任務跑十幾步,差距直接累積成一個數量級。
token等於錢、等於上下文窗口、等於agent頂唔頂得耐。呢個就係點解 Vercel Labs 呢個項目GitHub攢到32.5k star。Claude CodeCodexCursorGemini CLIGitHub CopilotGooseOpenCodeWindsurf 八大agent客戶端全部支援佢。
PART 01
token減十倍靠兩個設計
第一個係element ref。
傳統瀏覽器自動化話畀AI知「點擊 div.container > button.primary呢個位置」,AI要將成頁DOM讀一次先至確認到個掣喺邊。agent-browser直接畀頁面上每個可交互元素一個編號,@e1、@e2、@e3。AI見到「點@e7」就知道點邊度。成頁DOM唔使入上下文。
第二個係用文本輸出代替JSON。
Playwright MCP返回嘅係結構化JSON,字段齊全、嵌套深、token貴,複雜頁面一次返回可以去到5萬token。agent-browser返回純文本,資訊密度更高、語義更緊湊。AI讀起上嚟反而更準。
200-400 token係官網原話,唔係測試出嚟嘅極限。兩邊唔係同一個量級。
PART 02
點樣至唔會被反爬識破?
agent-browser有兩種開啟方式。
一種係後台靜靜雞行。 佢自己開一個睇唔到嘅瀏覽器進程,行得快、唔佔屏幕,適合做輕啲嘅嘢。
弱點都好明顯。佢太似爬蟲。CloudflareGoogleX 呢啲反爬好犀利嘅網站,基本上你一開就被ban。
另一種係直接接管你平時用開嗰個Chrome。
你而家用緊嗰個瀏覽器,應該登嘅賬號都登咗,應該裝嘅插件都裝咗,應該跳嘅彈窗都點過咗。agent-browser直接接入嚟。喺你已經用緊嘅Chrome上面幫你撳嚟撳去。
反爬系統睇唔出。 因為對佢嚟講,呢個就係一個真人喺度用瀏覽器,只係多咗一隻AI嘅手喺入面操作。
PART 03
順便解鎖咗成個Electron全家桶。
最被低估嘅能力,藏喺子skill裏面。
agent-browser自帶一個叫 electron 嘅子skill。VS CodeSlackDiscordFigma,全部係Electron應用,Electron應用本質上都開咗一個CDP埠口。
意味住裝咗agent-browser,呢啲桌面應用一次過全部都可以被AI接管。
畀agent喺Figma度改一組組件顏色、喺VS Code度行一組重構。以前要裝五個唔同嘅MCP server,而家一個skill全部覆蓋。
PART 04
skill嘅設計,裝一次周圍都用得。
skill係 Anthropic 官方嘅擴展機制,同一個skill,多個agent都能夠呼叫
小龍蝦(OpenClaw)、愛馬仕(Hermes)、Claude Code呢類桌面agent,裝一次agent-browser,三個都得到瀏覽器能力。呢個係skill比MCP server體驗更好嘅地方。 MCP server每個agent要單獨配置,skill裝喺 .claude/skills/ 一處,所有支援嘅agent自動識別。
PART 05
怎麼裝
兩條路。
npm install -g agent-browser
agent-browser install
或者(macOS)。
brew install agent-browser
agent-browser install
agent-browser install 呢一步會下載一個隔離嘅Chrome畀daemon用,唔會污染你平時嘅Chrome。
然後將skill裝到agent入面。
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser
skill文件放到 .claude/skills/agent-browser/,Claude Code即刻識別。幾秒裝完就用得。
PART 06
仲有一個伏位
CDP裝完用第一次,體驗都幾順。再用第二次,登錄狀態冇咗,賬號密碼又要重新輸入。
CDP預設每次開嘅係臨時profile,熄咗就清空。
解決方法係將profile固定。 同佢咁講。
用 agent-browser CDP 打開瀏覽器的 profile,
要固定指定位置,保存到 tools.md 中,
後續都用這個位置。
佢會喺本機生成一個固定嘅profile目錄,以後每次都從呢度載入。登錄一次,之後就一直喺線。
PART 07
誰該裝
做AI資訊抓取、研究助理、日常瀏覽自動化、跨應用工作流程嘅,呢個skill而家即刻裝。
一個禮拜18.7萬次下載唔係噱頭,係壓抑咗太耐嘅需求一次過放出來。
唔做呢啲嘢嘅都建議裝一個擺喺度。AI會鬱手呢件事,用過就返唔到轉頭。
agent-browser係Claude Skills生態長出嘅第一隻手。後面仲會有第二隻、第三隻。但第一隻手頂唔頂得住,睇嘅就係呢啲細節有冇打磨到位。100% Rust、200-400 token、50+指令、Electron全家桶、八大客戶端兼容。
Vercel將呢隻手做到用得。
· · ·
以上,既然睇到呢度,如果覺得唔錯,順手點個讚、睇下、轉發三連啦,如果想第一時間收到推送,都可以畀我一個星標⭐~
多謝你睇我嘅文章,我哋,下次再見。
我賭這三個插件,你的obisidian一個都沒裝!
救命!我讓 AI 推演C-17現身首都機場對黃金的影響,竟然吵翻了天
Anthropic 開源了 10 個金融 Agent,華爾街巨震
· · ·
你敢不敢信,一個 skill 一週之內被裝了 18.7 萬次。
agent-browser,這是Claude Skills 生態裏第一個出圈的爆款。
Anthropic 官方推 skill 這套機制有快一年了,裝機量第一次衝到這個量級,而且只用了一週。
但它火的原因,不是網上說的「讓 AI 能用瀏覽器」。這事 Playwright MCPdev-browserClaude in Chrome 都能幹,早不是新聞。
爆點不是這個,而是 token 成本。
同一個網頁操作,Playwright MCP 要往 AI 上下文裏灌 3000-5000 個 token,agent-browser 只用 200-400。差 10 到 20 倍。 長任務跑十幾步,差距直接累成一個數量級。
token 等於錢、等於上下文窗口、等於 agent 能不能跑得久。這是為啥 Vercel Labs 這個項目 GitHub 攢到 32.5k star,Claude CodeCodexCursorGemini CLIGitHub CopilotGooseOpenCodeWindsurf 八大 agent 客戶端全部支持它。
PART 01
token 砍十倍靠兩個設計
第一個是 element ref。
傳統瀏覽器自動化告訴 AI「點 div.container > button.primary 這個位置」,AI 要把整頁 DOM 讀一遍才能驗證按鈕在哪。agent-browser 直接給頁面上每個可交互元素髮一個編號,@e1、@e2、@e3。AI 看到「點 @e7」就知道點哪,整頁 DOM 不用進上下文。
第二個是文本輸出代替 JSON。
Playwright MCP 返回的是結構化 JSON,字段全、嵌套深、token 貴,複雜頁面一次返回能到 5 萬 token。agent-browser 返回純文本,信息密度更高、語義更緊湊。AI 讀起來反而更準。
200-400 token 是官網原話,不是測出來的極限。兩邊不是一個量級。
PART 02
怎麼不被反爬識破
agent-browser 有兩種打開方式。
一種是後台悄悄跑。 它自己開一個看不見的瀏覽器進程,跑得快、不佔屏幕,適合幹輕活。
弱點也明顯。它太像爬蟲了。CloudflareGoogleX 這種反爬狠的網站,基本一打開就被 ban。
另一種是直接接管你日常用的那個 Chrome。
你正在用的那個瀏覽器,該登的賬號都登了,該裝的插件都裝了,該跳的彈窗都點過了。agent-browser 直接接進來,在你已經在用的 Chrome 上替你點點點。
反爬系統看不出來。 因為對它來說,這就是一個真人在用瀏覽器,只是多了一隻 AI 的手在裏面操作。
PART 03
順手解鎖了整個 Electron 全家桶
最被低估的能力,藏在子 skill 裏。
agent-browser 自帶一個叫 electron 的子 skill。VS CodeSlackDiscordFigma,全是 Electron 應用,Electron 應用本質上都開着一個 CDP 端口。
意味着裝上 agent-browser,這些桌面應用一次性全都能被 AI 接管。
讓 agent 在 Figma 裏改一組組件顏色、在 VS Code 裏跑一組重構。以前要裝五個不同的 MCP server,現在一個 skill 全部覆蓋。
PART 04
skill 的設計,裝一次到處用
skill 是 Anthropic 官方的擴展機制,同一個 skill,多個 agent 都能調
小龍蝦(OpenClaw)、愛馬仕(Hermes)、Claude Code 這一類桌面 agent,裝一次 agent-browser,三個都拿到了瀏覽器能力。這是 skill 比 MCP server 體驗更好的地方。 MCP server 每個 agent 要單獨配,skill 裝在 .claude/skills/ 一處,所有支持的 agent 自動識別。
PART 05
怎麼裝
兩條路。
npm install -g agent-browser
agent-browser install
或者(macOS)。
brew install agent-browser
agent-browser install
agent-browser install 這一步會下載一個隔離的 Chrome 給 daemon 用,不污染你日常的 Chrome。
接着把 skill 裝到 agent 裏。
npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser
skill 文件落到 .claude/skills/agent-browser/,Claude Code 立刻識別。幾秒裝完就能用。
PART 06
還有一個坑
CDP 裝完用第一次,體驗挺順。再用第二次,登錄態沒了,賬號密碼又要重輸。
CDP 默認每次開的是臨時 profile,關掉就清空。
解決辦法是把 profile 固定下來。 跟它這麼說。
用 agent-browser CDP 打開瀏覽器的 profile,
要固定指定位置,保存到 tools.md 中,
後續都用這個位置。
它會在本地生成一個固定的 profile 目錄,以後每次都從這裏加載。登錄一次,後面一直在線。
PART 07
誰該裝
做 AI 信息抓取、研究助理、日常瀏覽自動化、跨應用工作流的,這個 skill 現在就裝。
一週 18.7 萬次下載不是噱頭,是憋了太久的需求一次性放出來。
不做這些事的也建議裝一個放着。AI 會動手這件事,用過就回不去了。
agent-browser 是 Claude Skills 生態長出的第一隻手。後面還會有第二隻、第三隻。但第一隻手能不能撐得住,看的就是這些細節有沒有打磨到位。100% Rust、200-400 token、50+ 命令、Electron 全家桶、八大客戶端兼容。
Vercel 把這隻手做到了能用。
· · ·
以上,既然看到這裏了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標⭐~
謝謝你看我的文章,我們,下次再見。