這個SKILL,自動操作我的瀏覽器,扒出了我的網購記錄0.0!?
整理版優先睇
Vercel 開源 AgentBrowser SKILL,AI 可以自動操作瀏覽器,爬取網購記錄、處理登錄,效率驚人
呢篇文章係由 AI 編程驍哥分享嘅,佢介紹咗一個佢認為目前潛力最大嘅 SKILL — AgentBrowser SKILL。呢個 SKILL 係基於 Vercel 官方開源嘅瀏覽器自動化工具 agent-browser,採用 Snapshot + Refs 技術,徹底繞開傳統嘅 CSS/XPath 搜索,用更低 Token、更少步驟完成操作,首次成功率高達 95%。驍哥認為呢個 SKILL 對 AI 編程嚟講意義非凡,等於俾 Claude Code、Codex 呢啲 CLI 工具裝咗對眼。
安裝好簡單,只需三步:先全局安裝 agent-browser npm 包,再安裝 Chromium,然後將 SKILL.md 複製到 AI 編程工具嘅 SKILL 目錄就得。驍哥仲進行咗三個實戰測試:第一個係爬取網站嘅作品列表同詳情頁,輕鬆完成;第二個係需要登錄嘅飛書文檔,AI 會截圖 QR code 俾你掃,掃完就可以繼續;第三個係小紅書手機驗證碼登錄,AI 自己推理出要先點擊同意協議先可以發送驗證碼,最終成功獲取首頁內容。
驍哥小結話呢個 SKILL 只係展示咗冰山一角,仲有好多更深嘅場景可以挖掘,例如 AI 編程自動驗證結果。佢會繼續實踐,提升效率。總括嚟講,AgentBrowser SKILL 係一個極具潛力嘅工具,值得 AI 用家試玩。
- AgentBrowser SKILL 基於 Vercel 開源嘅 agent-browser,採用 Snapshot+Refs 技術,首次成功率達 95%,遠超傳統方法。
- 安裝只需三步:npm install -g agent-browser、agent-browser install、複製 SKILL.md 到工具目錄。
- 實戰測試涵蓋無需登錄爬取、掃碼登錄飛書、手機驗證碼登錄小紅書,全部成功,展示強大能力。
- 呢個 SKILL 對 AI 編程意義重大,可以實現「寫完代碼 → 自動操作瀏覽器驗證 → 自動調試」嘅閉環。
- 驍哥認為潛力極大,未來可應用於 UI 自動化測試、數據採集等場景,值得重點關注。
AgentBrowser SKILL
Vercel 開源嘅瀏覽器自動化 SKILL,可以直接用喺 Claude Code、Codex 等 AI 編程工具。
agent-browser
Snapshot+Refs 技術嘅瀏覽器自動化工具,首次成功率約 95%。
咩係 AgentBrowser SKILL?
呢個 SKILL 係 Vercel 官方開源嘅 agent-browser 嘅配套,用 Snapshot + Refs 技術,成功繞開傳統 CSS/XPath 搜索,大幅提升操作可靠性。
驍哥認為呢個係目前潛力最大嘅 SKILL,尤其適合 AI 編程場景。
安裝步驟:簡單三步搞掂
- 1 全局安裝 agent-browser npm 包:npm install -g agent-browser
- 2 安裝 Chromium:agent-browser install
- 3 複製 SKILL.md 到 AI 編程工具嘅 SKILL 目錄
之後可以用 <code>agent-browser open www.baidu.com</code> 驗證,成功就代表搞掂。
場景一:爬取網站作品(無需登錄)
驍哥俾 AI 一個任務:爬取某網站嘅作品列表,獲取作者、作品名、類型;點擊作品名進入詳情頁獲取作者公告,總共爬 100 條作品。
AI 好輕鬆就完成咗,結果令人滿意。
需要登錄嘅兩個挑戰
驍哥仲測試咗需要登錄嘅場景:一個係 飛書文檔,一個係 小紅書首頁。
- 飛書文檔:AI 遇到登錄頁,自動截圖 QR code,用戶掃碼後繼續,成功總結文檔內容。
- 小紅書:AI 需要處理手機驗證碼登錄,自己推理出要先 點擊同意協議 先可以發送驗證碼,最終獲取首頁推薦。
總結與展望
驍哥話呢個 SKILL 只係展示咗冰山一角,仲有更深場景,例如 AI 編程自動驗證結果。
佢會重點實踐,將「寫完代碼 → Agent 自己操作瀏覽器驗證 → 唔得就繼續跑」呢個流程變為現實。
呢個SKILL,將驍哥嘅網購歷史訂單,扒咗出嚟❗️😱

(驍哥俾團隊採購嘅活動小禮物,ps.驍哥揀咗跳舞🌵☝️🤓)
呢個SKILL,係驍哥而家覺得潛力最大嘅SKILL,冇之一
跟住落嚟,我哋就有請呢個神奇、好玩、充滿無限想像力嘅SKILL💁♀️
AgentBrowser SKILL:一個可以操作瀏覽器嘅SKILL
就喺上個禮拜,Vercel官方開源咗一款「Agent-friendly」嘅瀏覽器自動化工具:Agent-broswer

https://agent-browser.dev/
項目上線唔夠一個禮拜,已經獲得咗9K🌟
agent-broswer,採用 Snapshot + Refs(引用式交互),徹底繞開脆弱嘅 CSS/XPath 搜索,令 Agent 以更低 Token、更少步驟、更高確定性完成瀏覽器操作!
實測首次成功率高達 ~95%,顯著優於 Playwright MCP 同 Chrome DevTools MCP

此外,Vercel官方仲配套開發咗 agent-browser SKILL

尤其係對於AI編程,ClaudeCode、Codex呢啲CLI,真係意義非凡,直接相當於俾呢啲工具,裝咗對眼🤩
至於安裝步驟都好簡單💁♀️
點樣安裝:只需要3步
首先全域安裝 agent-browser 呢個cli
npm install -g agent-browser 然後用呢個指令安裝下Chromium,就OK㗎啦
agent-browser install 我哋可以驗證一下
agent-browser open www.baidu.com 咁樣就即係成功咗👌

然後我哋安裝 SKILL,都好簡單
去呢個地址👇
https://github.com/vercel-labs/agent-browser/blob/main/skills/agent-browser/SKILL.md
Copy一下

Copy到AI編程工具對應嘅SKILL目錄下就得㗎喇~

OK,跟住落嚟我哋進入最精彩嘅~😃
實戰演示環節
第一個場景,我哋先試嚇爬🐛
我哋觸發agent-broswer呢個SKILL,然後同AI講:
「爬取xxx呢個站點下面嘅作品。列表頁獲取作者、作品名、類型;點擊作品名可以進入詳情頁,喺詳情頁入面獲取作者公告,爬取100條作品」

好輕鬆咁完成咗😌

可以!結果非常滿意!👍😼

第二個場景,我哋加大難度,睇嚇「需要登入」嗰時,表現點樣?
呢度我掟咗一個非公開嘅飛書文檔,唔登入驍哥賬號嘅話,就打唔開
我喺呢度同AI講:
「總結嚇呢個飛書文檔,如果遇到登入,二維碼截個圖俾我掃一下”

驍哥應該係 全網第一個 知道仲可以咁玩嘅😎

掃完同AI講一聲(tips:AI有時因為執行任務時間太長,會令到二維碼過期,呢個時候叫AI重新截圖就得㗎喇)

係驍哥嘅年度🐮🐎總結,字裏行間全部係驍哥呢一年,辛勤勞作996修嘅福報🥲👇

我哋再拎京東驗證一下

嗯,可以!

掃完吱一聲

就係文章開頭嗰張圖🤓

第三個場景,我哋再上一層難度
呢個場景下,驍哥需要挑戰:令AI自行完成小紅書「手機驗證碼登入」
呢度有兩個挑戰難點:
☝️ 手機驗證碼登入,本身就係一個複雜嘅操作
✌️ 我對AI,隱瞞咗重要關鍵信息:想發送驗證碼,需要先點擊同意協議,呢點要靠AI自己推理

我跟AI發送以下信息:
「睇嚇我嘅小紅書首頁,俾我推薦咗啲咩內容,如果遇到登入,手機號xxx,發送驗證碼我話俾你知」

講真話,我一度認為AI會失敗㗎,呢個任務確實都耗費咗AI好多思考時間
結果,非常超出驍哥嘅預期👏

順利拎到咗驍哥嘅小紅書首頁推薦😆

小結
今日呢個agent-browser SKILL,驍哥展示嘅只係佢一點點表層能力
仲有更深嘅場景等我哋去挖掘
畢竟可以操作瀏覽器,呢個想象空間同可操作空間,真係太大喇🥸
例如可以應用喺AI編程,令ClaudeCode創始人所講嘅:「寫完代碼 → Agent自己操作瀏覽器驗證結果 → 唔得?→ 繼續跑」變為可能👉令AI編程效率提升2-3倍嘅秘密,Claude Code創始人嘅13個習慣
驍哥都會重點實踐下
往期SKILL具體場景解決方案👇
點樣喺Cursor、TRAE入面,用Skills 3分鐘製作精美PPT
咁今期就係咁,我係AI編程驍哥,下期見,88👋🤓

這個SKILL,把驍哥的網購歷史訂單,給扒出來了❗️😱

(驍哥給團隊,採購的活動小禮物,ps.驍哥選的是跳舞🌵☝️🤓)
這個SKILL,是驍哥目前覺得潛力最大的SKILL,沒有之一
接下來,我們就有請這個神奇、好玩、充滿無限想象力的 SKILL💁♀️
AgentBrowser SKILL:一個可以操作瀏覽器的SKILL
就在上週,Vercel官方開源了一款“Agent-friendly”的瀏覽器自動化工具:Agent-broswer

https://agent-browser.dev/
項目上線不到一週的時間,已經獲得了9K🌟
agent-broswer,採用 Snapshot + Refs(引用式交互),徹底繞開脆弱的 CSS/XPath 搜索,讓 Agent 以更低 Token、更少步驟、更高確定性完成瀏覽器操作!
實測首次成功率高達 ~95%,顯著優於 Playwright MCP 和 Chrome DevTools MCP

此外,Vercel官方還配套開發了 agent-browser SKILL

尤其是對於AI編程,ClaudeCode、Codex這種CLI,真的是意義非凡,直接相當於給這些工具,裝上了眼睛🤩
至於安裝步驟也很簡單💁♀️
如何安裝:只需3步
首先全局安裝 agent-browser 這個cli
npm install -g agent-browser 然後用這個指令安裝下Chromium,就OK啦
agent-browser install 我們可以驗證一下
agent-browser open www.baidu.com 這樣就說明成功了👌

然後我們安裝 SKILL,也很簡單
去這個地址👇
https://github.com/vercel-labs/agent-browser/blob/main/skills/agent-browser/SKILL.md
Copy一下

Copy到AI編程工具對應的SKILL目錄下就行~

OK,接下來我們進入最精彩的~😃
實戰演示環節
第一個場景,我們先來試試爬🐛
我們觸發agent-broswer這個SKILL,然後跟AI說:
“爬取下xxx這個站點下的作品。列表頁獲取作者、作品名、類型;點擊作品名可以進入詳情頁,在詳情頁中獲取作者公告,爬取100條作品”

很輕鬆的完成了😌

可以!結果非常滿意!👍😼

第二個場景,我們加大難度,看看「需要登錄」時,表現如何?
這裏我扔了一個非公開的飛書文檔,不登錄驍哥賬號的話,就打不開
我這裏和AI說:
“總結下這個飛書文檔,如果遇到登錄,二維碼截個圖讓我掃一下”

驍哥應該是 全網第一個 知道還能這麼玩的😎

掃完跟AI說一下(tips:AI有時由於執行任務時間過長,會導致二維碼過期,這時讓AI重新截圖就行了)

是驍哥的年度🐮🐎總結,字裏行間全是驍哥這一年,辛勤勞作996修的福報🥲👇

我們再拿京東驗證一下

嗯,可以!

掃完吱一聲

就是文章開頭那張圖🤓

第三個場景,我們再上一層難度
這個場景下,驍哥需要挑戰:讓AI自行完成小紅書「手機驗證碼登錄」
這裏有兩個挑戰難點:
☝️ 手機驗證碼登錄,本身就是一個複雜的操作
✌️ 我對AI,隱瞞了重要關鍵信息:想要發送驗證碼,需要先點擊同意協議,這點需要靠AI自己推理

我跟AI發送如下信息:
“看看我的小紅書首頁,給我推薦了哪些內容,如果遇到登錄,手機號xxx,發送驗證碼我告訴你”

說實話,我一度認為AI會失敗的,這個任務確實也耗費了AI非常多的思考時間
結果,非常超出驍哥的預期👏

順利拿到了驍哥的小紅書首頁推薦😆

小結
今天這個agent-browser SKILL,驍哥展示的只是其一點點表層能力
還有更深的場景等待我們去挖掘
畢竟能操作瀏覽器,這個想象空間和可操作空間,實在是太大了🥸
比如可以應用於AI編程,讓ClaudeCode創始人所說的:“寫完代碼 → Agent自己操作瀏覽器驗證結果 → 不行?→ 繼續跑” 變為可能👉讓AI編程效率提升2-3倍的秘密,Claude Code創始人的13個習慣
驍哥也會重點實踐下
往期SKILL具體場景解決方案👇
如何在Cursor、TRAE中,用Skills 3分鐘製作精美PPT
那本期就這樣,我是AI編程驍哥,下期見,88👋🤓
