從“會搜”到“會做”：web-access 可能代表了 Agent 聯網能力的下一步

作者：Nice哥聊AI

日期：2026年3月28日上午12:34

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

呢個項目唔係畀AI加聯網功能，而係教佢好似人咁上網做嘢：web-access 從策略到執行嘅完整設計

整理版摘要

呢篇文章係作者睇完一澤Eze嘅 web-access 項目之後嘅深度分析。佢指出好多AI聯網工具其實只係做到「搜」，而web-access真正解決嘅係「點樣判斷幾時搜、幾時抓、幾時開瀏覽器做互動」。作者認為呢個項目嘅核心唔係工具本身，而係一套 Agent 瀏覽策略系統，將聯網能力從「單點API」提升到「成個工作流程」。

整體結論係：未來Agent嘅競爭，唔止係模型強弱，而係似唔似得一個真係識得做嘢嘅聰明人。Web-access 通過「聯網策略+CDP瀏覽器+站點經驗積累+並行分治」呢四個層次，將Agent從「會查資料」推向「會上網做事」。

作者特別強調呢個項目嘅設計哲學：唔係預設用最強工具，而係知道幾時用最啱工具；唔係盲目執行，而係要識得懷疑平台錯誤信息；唔係每次從零開始，而係累積站點經驗跨session複用。呢啲思路對做Agent開發同工作流設計好有參考價值。

Web-access 唔係加一個搜索API，而係補齊 Claude Code 嘅聯網策略、CDP瀏覽器操作同站點經驗積累，令Agent真正識得「上網做事」
佢設計咗分層工具策略：WebSearch/WebFetch/curl/Jina/CDP瀏覽器按場景自動揀，簡單頁面唔用瀏覽器，複雜互動先升級
CDP Proxy 直接連用戶嘅Chrome，天然繼承登錄態，解決咗動態頁面、反爬、登錄平台呢啲常見死穴
項目明確指出：網站生成嘅URL比手動拼更可靠；平台顯示「內容不存在」可能係訪問方式錯，唔一定真係冇內容——呢個係高階判斷能力
並行分治機制可以同時處理多個獨立目標，減少串行時間，而且只回傳摘要，慳返好多token成本

值得記低

連結 github.com

GitHub 項目地址

web-access 項目首頁

Skill

SKILL.md 核心邏輯

項目內嘅 SKILL.md 定義咗聯網策略、CDP操作、站點經驗等能力

整理重點

唔係加功能，而係補策略

好多人畀Claude加聯網能力，只係做到「調用WebSearch」、「抓網頁文本」、「總結搜索結果」。一到真實場景就甩轆：動態頁面睇唔到、登錄態拎唔到、內容藏喺按鈕彈窗Shadow DOM裏面、平台反爬就話「內容不存在」。

web-access 最亮眼嘅地方係冇將「聯網」理解成API能力，而係理解成一整套 Agent 嘅瀏覽策略系統

呢個項目畀 Claude Code 用嘅 Skill，目標係補齊佢喺真實聯網任務嘅關鍵短板。核心定位係「聯網策略 + CDP瀏覽器操作 + 站點經驗積累」，而唔係做一個更強嘅搜索工具或者網頁解析器。

整理重點

分層工具策略：唔係一招打天下

作者冇話瀏覽器最強就所有任務都用佢，反而將工具分工講得好清楚。以下係唔同工具嘅適用場景：

WebSearch：發現信息源、搜關鍵詞結果
WebFetch：已知URL嘅定向提取
curl：拎原始HTML、meta、JSON-LD等結構化信息
Jina：將文章博客轉成更慳token嘅Markdown
CDP瀏覽器：登錄態、動態頁面、交互式操作、反爬嚴重平台

簡單頁面就唔好上瀏覽器；靜態抓取無效先升級；遇到小紅書、微信公眾號、需要登錄嘅平台就直接CDP

整理重點

CDP Proxy：直接繼承登錄態，似人咁操作瀏覽器

呢個項目嘅 CDP Proxy 唔係開一個隔離瀏覽器，而係直接連用戶日常用緊嘅 Chrome。最大好處係天然繼承曬所有登錄態，好多麻煩問題即刻唔再麻煩。

已登錄平台可以直接訪問、動態頁面可以真實渲染、按鈕可以真正點擊、視頻可以喺真實瀏覽器seek再截幀

而且佢仲區分咗三種交互方式：普通click、真實鼠標點擊、setFiles直接設定本地文件路徑。呢種設計好工程化，唔係炫功能，而係為咗覆蓋真實網站嘅各種古怪狀況。

整理重點

站點經驗積累：唔係次次由零開始

作者明白網頁自動化唔係純通用問題，唔同網站有唔同特性。所以佢將經驗做成按域名儲存嘅知識庫，包括平台特徵、有效URL模式、已知陷阱、邊啲方法會失敗、邊啲路徑驗證過。

呢啲經驗可以跨session複用，令Agent越來越似一個「老網民」，能力增長來自結構化經驗嘅沉澱

文章特別提到兩個「技術事實」：網站自己生成嘅URL比你手動拼嘅更可靠；平台話「內容不存在」可能只係你嘅訪問方式唔啱。呢啲判斷令Agent唔再只係接收信息，而係識得懷疑平台反饋嘅可信度。

整理重點

並行分治：真正面向複雜任務

當任務包含多個獨立目標，web-access 可以分畀多個子Agent並行處理。咁做有兩個好處：速度快咗（總耗時接近單個任務時長），同埋唔使將大量網頁內容塞入主Agent上下文，只回傳摘要就得。

呢個策略直接回應咗真正用Agent嘅人成日遇到嘅兩個痛點：串行太慢、上下文太貴

作者認為呢種工作流思維已經超越咗「小工具」，係為持續性、多目標、帶瀏覽器操作嘅複雜任務設計嘅可擴展系統。

最近出咗一個好好用嘅搜索工具，發佈咗短短幾日，就已經喺GitHub上攞到2k Star，作者係一澤Eze，我好認真咁睇咗呢個GitHub項目，作者採用咗一個幾巧妙嘅設計思路：Agent策略哲學+最小單元工具+必要且詳細嘅事實說明，充滿文學色彩嘅思路，為AI帶嚟咗全新嘅能力。大讚作者！

睇之前，我以為佢只係又一個「畀Claude加聯網能力」嘅工具。

睇完之後，我嘅判斷唔同咗：
佢真正解決嘅，唔係「令AI可以上網」，而係「令AI知道幾時應該搜、幾時應該抓、幾時應該好似人咁打開瀏覽器去做嘢」。

呢兩個層級，分別好大。

因為而家好多人話AI識得聯網，實際上只係：

• 可以調用WebSearch
• 可以抓一下網頁文本
• 可以總結一下搜索結果

聽落好勁，但一到真實場景就開始甩轆：

• 頁面係動態加載嘅，佢睇唔到
• 網站有登錄狀態，佢拎唔到
• 內容收埋喺按鈕、彈窗、摺疊區、Shadow DOM、iframe入面，佢唔識處理
• 平台反爬一下，佢就直接話你知「內容唔存在」
• 叫佢調研5個站點，佢就開始串行慢慢查，成本又高又蠢

而 web-access 最令我眼前一亮嘅地方，係佢冇將「聯網」理解成一個API能力，而係將佢理解成一整套 Agent嘅瀏覽策略系統。

講白啲：

呢個唔係畀Claude加一把槌仔，而係幫佢補一整套「上網做事嘅方法論」。

一、呢個項目到底係做啲咩嘅？

先講結論。

web-access 係一個畀 Claude Code 和OpenClaw本地版本用嘅Skill，目標係補返佢喺真實聯網任務入面嘅關鍵短板。

項目作者畀出嘅核心定位非常清楚：

Claude Code原本有WebSearch、WebFetch，但係欠缺調度策略同瀏覽器自動化能力。呢個skill補返嘅係：聯網策略 + CDP瀏覽器操作 + 站點經驗積累。

呢句話好重要。

因為佢唔係講：

• 我做咗一個更勁嘅搜索工具
• 我做咗一個網頁解析器
• 我做咗一個瀏覽器腳本

而係講：

我做嘅係「組合能力 + 決策能力 + 經驗複用能力」。

從README同SKILL.md入面可以睇到，呢個項目嘅能力大概分成6層：

1. 聯網工具自動選擇：WebSearch / WebFetch / curl / Jina / CDP 按場景自動揀
2. CDP Proxy瀏覽器操作：直接連用戶日常用嘅Chrome，天然帶住登錄狀態
3. 多種交互能力：普通點擊、真實鼠標點擊、檔案上傳
4. 並行分治：多個獨立目標嘅時候可以分發俾子Agent並行做
5. 站點經驗積累：唔同網站嘅伏位、模式、特徵按域名沉澱落嚟
6. 媒體提取與視頻分析：可以從DOM提取圖片、提取視頻URL，甚至對視頻按時間點截幀分析

如果你淨係睇功能表，會覺得佢好勁。

但真正令我覺得呢個項目有意思嘅，唔止係功能，而係佢背後嗰種好清醒嘅設計思路。

二、好多AI聯網工具，問題唔係「用唔到」，而係「唔似人」

我哋平時對「AI聯網」嘅期望，往往有個誤區：

覺得只要俾模型接上搜尋引擎，佢就會用。

其實唔係。

人類瀏覽網頁嗰陣，做嘅嘢好複雜，但我哋平時意識唔到：

• 先判斷目標係咩
• 再揀路徑：搜、點、跳轉、登入、翻頁、返回
• 睇到結果後不斷修正判斷
• 發現靜態頁面唔夠，就轉去真實頁面交互
• 發現報錯唔可信，就懷疑訪問方式而唔係即刻放棄

呢其實係一套動態決策系統。

而好多所謂嘅AI聯網，只係俾咗模型一個「抓文本」嘅入口。

所以一到複雜網站，佢就好似一個只係企喺門口張望嘅人：

睇到少少嘢，但唔會真正入去做嘢。

web-access 喺SKILL.md入面有一句話，我覺得幾乎可以當成佢嘅靈魂：

似人咁思考，兼顧高效同適應性咁完成任務。

呢句唔係空話。

佢後面真係將呢個理念拆成一個執行框架：

• 先明確任務成功標準
• 再揀最可能直達嘅起點
• 過程中持續校驗，而唔係機械式重複
• 達到目標後及時停手，唔做無意義嘅過度操作

你會發現，呢個已經唔係「工具說明書」喇。

佢更加似係教Agent：

唔好淨係識得調用工具，要學識圍繞目標做判斷。

呢件事，比多一個接口重要好多。

三、佢最聰明嘅一點：唔係默認用瀏覽器，而係知道幾時應該升級到瀏覽器

呢個項目最值得參考嘅部分之一，係佢冇走極端。

佢並唔係話：

瀏覽器最勁，所以所有任務都用瀏覽器。

不是。

相反，佢將唔同工具嘅分工講得好明確：

• WebSearch：適合發現資訊源、搜關鍵詞結果
• WebFetch：適合已知URL嘅定向提取
• curl：適合攞原始HTML、meta、JSON-LD等結構化資訊
• Jina：適合將文章、博客、文檔轉成更慳token嘅Markdown
• CDP瀏覽器：適合登入狀態、動態頁面、交互式操作、反爬嚴重嘅平台

咁就即係話，佢唔係「只係識一招」，而係有一套分層策略。

呢個思路太重要喇。

因為真實世界入面，最好嘅方案從來唔係「最勁嗰個工具」，而係「喺當前場景裏面成本最合適嗰個工具」。

簡單頁面就唔好用瀏覽器。

靜態抓取冇效，再升級。

遇到小紅書、微信公眾號、需要登入嘅平台，就唔好喺靜態層死磕，直接CDP。

咁先似一個成熟嘅Agent。

唔係捉住一個工具猛掄，而係會判斷代價、風險同成功率。

四、真正令我拍案叫絕嘅，係佢對「失敗信號」嘅理解

我覺得 web-access 最唔似普通項目README嘅地方，係佢寫得好詳細，揭露咗好多「技術事實」。

例如佢明確強調：

1. 網站自己生成嘅URL，比你手動砌嘅URL更可靠

呢句話聽落似常識，但好多Agent其實根本冇呢個意識。

好多時模型會自作聰明砌一個連結，結果缺參數、缺上下文、缺token，最後頁面報錯，佢就以為內容真係冇咗。

而 web-access 明確提醒：

站點喺DOM入面生成嘅連結，自帶完整上下文；手工構造URL可能缺失隱式必要參數。

呢個唔係「技巧」，呢個係經驗。

2. 平台話「內容唔存在」，未必真係唔存在

呢句更狼死。

好多平台嘅「頁面唔見咗」「內容唔存在」，並唔係真係冇，而係：

• 你嘅訪問方式唔啱
• 你冇登入狀態
• 你缺某個參數
• 你觸發咗反爬

如果Agent冇呢個意識，佢就會好容易喺錯誤嘅地方停低。

但呢個項目相當於喺告訴模型：

平台反饋都係需要被懷疑㗎，唔好將網站俾你嘅錯誤頁當成絕對事實。

呢個係非常進階嘅能力。

因為咁代表Agent唔再淨係「接收資訊」，而係判斷資訊嘅可信度。

五、佢唔係令AI更加識「讀網頁」，而係更加識「喺網頁入面行動」

好多人低估咗瀏覽器自動化喺Agent世界入面嘅意義。

佢哋會覺得：

咪又係襟襟掣、碌碌頁面？

但實際上，瀏覽器操作係AI從「識答問題」走向「識完成任務」嘅關鍵橋樑。

web-access 嘅CDP Proxy呢部分，核心思路好實用：

佢唔係啟動一個隔離瀏覽器，而係直接連用戶平時用緊嘅Chrome。

呢個有咩好處？

最大嘅好處得一個：

天然繼承登入狀態。

呢個意味住好多現實世界入面最麻煩嘅問題，突然間就冇咁麻煩喇：

• 已登入平台可以直接訪問
• 動態頁面可以真實渲染
• 頁面入面嘅交互按鈕可以真正點擊
• 視頻可以喺真實瀏覽器入面seek到任意時間點再截幀
• 檔案上傳可以通過真實點擊或setFiles完成

呢個已經唔係「查資料」喇。

呢個係令Agent 接近一個真正能夠工作嘅網頁執行者。

而且佢仲區分咗三種交互方式：

• /click：JS click，簡單又快
• /clickAt：真實鼠標事件，適合更嚴格嘅用戶手勢場景
• /setFiles：直接俾file input設置本地檔案路徑

呢種設計非常工程化。

唔係為咗炫耀功能，而係為咗覆蓋真實網站嗰啲亂七八糟但經常會遇到嘅問題。

六、呢個項目仲有一個好超前嘅點：佢開始認真對待「網站經驗」呢件事

如果你真係做過Agent瀏覽器自動化，就會知道一個現實：

唔同網站，唔係同一條題目。

• 有啲網站適合直接抓HTML。
• 有啲網站一定要行真實瀏覽器。
• 有啲網站URL可以手工構造。
• 有啲網站一定要從DOM拎完整連結。
• 有啲網站「內容唔存在」其實只係缺參數。
• 有啲網站要碌到底先，圖片先至真正加載出嚟。

即係話，網頁自動化唔係一個純通用問題，佢天然帶住大量站點特異性經驗。

而 web-access 好聰明嘅一點，係佢唔扮呢啲經驗唔存在。

佢直接將呢啲經驗做成：

按域名儲存嘅站點知識庫。

比如：

• 平台特徵
• 有效URL模式
• 已知陷阱
• 邊啲方式會失敗
• 邊啲路徑係驗證過嘅

更關鍵嘅係，呢啲經驗可以 跨session複用。

呢個意味住咩？

意味住佢唔係每次聯網都從零開始，而係積累緊一種越來越似「老網民」嘅能力。

我覺得呢件事特別有代表性。

因為呢個說明Agent嘅能力，唔一定只係靠更大嘅模型嚟提升。

好多時候，能力增長來自：結構化經驗嘅沉澱。

七、並行分治呢件事，先係佢真正面向「複雜任務」嘅證據

如果一個工具只係可以完成單點查詢，咁佢更加似增強版搜索。

但如果一個系統開始認真設計「多目標並行調研」，咁就說明佢瞄準嘅已經係更複雜嘅Agent工作流喇。

web-access 喺呢部分講得好清楚：

當任務包含多個獨立目標嗰陣，可以分俾多個子Agent並行處理。

佢強調嘅收益有兩個：

• 速度提升：多個目標同時查，總耗時接近單個任務時長
• 上下文保護：抓到嘅大量網頁內容唔直接塞入主Agent上下文，而係只回傳摘要

呢點非常關鍵。

因為真正將Agent用起嚟嘅人都會遇到兩個痛點：

1. 串行太慢
2. 上下文太貴

而 web-access 嘅分治策略，本質上就係喺回答：

如果聯網唔係一次性問答，而係持續性、多目標、帶瀏覽器操作嘅複雜任務，應該點樣將系統做得可擴展？

呢個已經唔係「小工具思維」喇。

呢個係工作流思維。

八、點解我覺得呢個項目值得寫一篇文章？

因為佢令我更明確咁睇到一件事：

下一代Agent嘅競爭，唔止係模型邊個更勁，而係邊個更加似一個真正會做嘢嘅聰明人。

會做嘢，唔止係會回答。

而是：

• 會判斷從邊度開始
• 會判斷幾時換工具
• 會判斷錯誤係咪假錯誤
• 會判斷應該串行定並行
• 會將經驗沉澱落嚟，下次唔再踩同一個坑

如果淨係睇表面，web-access 係一個Claude Code Skill。

但如果睇深一層，佢其實係試緊回答一個更大嘅問題：

Agent聯網能力，到底應該點樣設計，先唔會停留喺「識得搜」呢一步？

喺我嚟睇，呢個項目最有價值嘅，唔係某條API，亦唔係某個腳本。

而係佢將好多人模模糊糊感受到嘅問題，第一次講清楚咗：

• 點解單純WebSearch唔夠
• 點解瀏覽器能力唔係可選項，而係好多場景下嘅必要項
• 點解「工具調用」唔係關鍵，關鍵係「策略調度」
• 點解通用模型之外，仲需要「站點經驗」呢種外部記憶

呢啲判斷，先係佢真正厲害嘅地方。

九、如果你係呢幾類人，建議你一定要研究一下呢個項目

1）你做緊Claude Code / Agent Skill

呢個項目對Skill設計思路特別有參考價值，尤其係「哲學 + 技術事實」嘅寫法。

2）你做緊瀏覽器自動化或AI工作流

佢唔係傳統RPA思路，而係更加貼近Agent嘅動態決策邏輯。

3）你做緊社交媒體、內容平台、登入狀態網站嘅自動化

小紅書、微信公眾號呢類平台嘅伏位，佢明顯係認真踩過、總結過嘅。

4）你喺度思考Agent點解「表面睇好似識得聯網，但實際上唔多做到嘢」

呢個項目可以幫你將問題諗清楚。

十、最後一句話：佢令我更加肯定咗一件事

未來真正好用嘅Agent，唔會只係「知道好多嘢」。

佢要同時具備三種能力：

• 會揾資訊
• 會進入真實環境操作
• 會根據結果修正自己嘅路徑

而 web-access 呢個項目最有啟發嘅地方就係呢度：

佢嘗試將Agent從「識查資料」推前一大步，變成「識得上網做嘢」。

呢一步，可能比好多人想像中更加重要。

因為當AI真正開始似人咁瀏覽、判斷、試錯、切換路徑、積累經驗嗰陣——

佢離開「工具」呢個詞，就越來越遠喇。

佢開始有啲似一個真正嘅執行者喇。

附：項目關鍵資訊

• 項目地址：https://github.com/eze-is/web-access
• 項目定位：幫Claude Code補齊完整聯網能力嘅Skill
• 核心關鍵詞：聯網策略、CDP瀏覽器操作、站點經驗積累、並行分治、媒體提取
• 作者：一澤Eze
• 文章地址：https://mp.weixin.qq.com/s/rps5YVB6TchT9npAaIWKCw

最近出現了一個非常好用的搜索工具，發佈短短几天，就在GitHub上獲得2k Star，作者是一澤Eze，我非常認真地拜讀了這個 GitHub項目，作者採用了比較巧妙的設計思路：Agent策略哲學+最小單元工具+必要且詳細的事實說明，富有文學色彩的思路，給AI賦予了全新的能力。大讚作者！

看之前，我以為它只是又一個“給 Claude 加聯網能力”的工具。

看完之後，我的判斷變了：
它真正解決的，不是“讓 AI 能上網”，而是“讓 AI 知道什麼時候該搜、什麼時候該抓、什麼時候該像人一樣打開瀏覽器去做事”。

這兩個層級，差別非常大。

因為今天很多人說 AI 會聯網，實際上只是：

• 能調一下 WebSearch
• 能抓一下網頁文本
• 能總結一下搜索結果

聽起來很強，但一到真實場景就開始掉鏈子：

• 頁面是動態加載的，它看不見
• 網站有登錄態，它拿不到
• 內容藏在按鈕、彈窗、摺疊區、Shadow DOM、iframe 裏，它不會處理
• 平台反爬一下，它就直接告訴你“內容不存在”
• 讓它調研 5 個站點，它開始串行慢慢查，成本又高又笨

而 web-access 最讓我眼前一亮的地方，是它沒有把“聯網”理解成一個 API 能力，而是把它理解成一整套 Agent 的瀏覽策略系統。

說直白一點：

這不是在給 Claude 加一把錘子，而是在給它補一整套“上網做事的方法論”。

一、這個項目到底是幹什麼的？

先說結論。

web-access 是一個給 Claude Code 和OpenClaw本地版本使用的 Skill，目標是補齊它在真實聯網任務裏的關鍵短板。

項目作者給出的核心定位非常清楚：

Claude Code 原本有 WebSearch、WebFetch，但缺少調度策略和瀏覽器自動化能力。這個 skill 補上的是：聯網策略 + CDP 瀏覽器操作 + 站點經驗積累。

這句話很重要。

因為它不是在說：

• 我做了一個更強的搜索工具
• 我做了一個網頁解析器
• 我做了一個瀏覽器腳本

而是在說：

我做的是“組合能力 + 決策能力 + 經驗複用能力”。

從 README 和 SKILL.md 裏能看出，這個項目的能力大概分成 6 層：

1. 聯網工具自動選擇：WebSearch / WebFetch / curl / Jina / CDP 按場景自動選
2. CDP Proxy 瀏覽器操作：直連用戶日常 Chrome，天然攜帶登錄態
3. 多種交互能力：普通點擊、真實鼠標點擊、文件上傳
4. 並行分治：多個獨立目標時可分發給子 Agent 並行做
5. 站點經驗積累：不同網站的坑、模式、特徵按域名沉澱下來
6. 媒體提取與視頻分析：可以從 DOM 提圖、提視頻 URL，甚至對視頻按時間點截幀分析

如果你只看功能表，會覺得它很強。

但真正讓我覺得這個項目有意思的，不只是功能，而是它背後那種很清醒的設計思路。

二、很多 AI 聯網工具，問題不在“不能用”，而在“不像人”

我們平時對“AI 聯網”的期待，往往有個誤區：

覺得只要給模型接上搜索引擎，它就會用了。

其實不是。

人類瀏覽網頁時，做的事情非常複雜，但我們平時意識不到：

• 先判斷目標是什麼
• 再選路徑：搜、點、跳轉、登錄、翻頁、返回
• 看到結果後不斷修正判斷
• 發現靜態頁面不夠，就轉去真實頁面交互
• 發現報錯不可信，就懷疑訪問方式而不是立刻放棄

這其實是一套動態決策系統。

而很多所謂的 AI 聯網，只給了模型一個“抓文本”的入口。

所以一到複雜網站，它就像一個只會站在門口張望的人：

能看見一點東西，但不會真正進去辦事。

web-access 在 SKILL.md 裏有一句話，我覺得幾乎可以當成它的靈魂：

像人一樣思考，兼顧高效與適應性的完成任務。

這不是一句空話。

它後面真的把這個理念拆成了一個執行框架：

• 先明確任務成功標準
• 再選擇最可能直達的起點
• 過程中持續校驗，而不是機械重複
• 達到目標後及時停手，不做無意義過度操作

你會發現，這已經不是“工具說明書”了。

它更像是在教 Agent：

不要只會調用工具，要學會圍繞目標做判斷。

這件事，比多一個接口重要得多。

三、它最聰明的一點：不是默認用瀏覽器，而是知道什麼時候該升級到瀏覽器

這個項目最值得借鑑的部分之一，是它沒有走極端。

它並不是說：

瀏覽器最強，所以所有任務都用瀏覽器。

不是。

相反，它把不同工具的分工講得很明確：

• WebSearch：適合發現信息源、搜關鍵詞結果
• WebFetch：適合已知 URL 的定向提取
• curl：適合拿原始 HTML、meta、JSON-LD 等結構化信息
• Jina：適合把文章、博客、文檔轉成更省 token 的 Markdown
• CDP 瀏覽器：適合登錄態、動態頁面、交互式操作、反爬嚴重的平台

這就意味着，它不是“只會一個大招”，而是有一套分層策略。

這個思路太重要了。

因為真實世界裏，最好的方案從來不是“最強的那個工具”，而是“在當前場景裏成本最合適的那個工具”。

簡單頁面就別上瀏覽器。

靜態抓取無效，再升級。

遇到小紅書、微信公眾號、需要登錄的平台，就別在靜態層死磕，直接 CDP。

這才像一個成熟的 Agent。

不是逮着一個工具猛掄，而是會判斷代價、風險和成功率。

四、真正讓我拍案叫絕的，是它對“失敗信號”的理解

我覺得 web-access 最不像普通項目 README 的地方，是它寫得非常詳細，揭露了很多“技術事實”。

比如它明確強調：

1. 網站自己生成的 URL，比你手動拼的 URL 更可靠

這句話聽上去像常識，但很多 Agent 其實根本沒這個意識。

很多時候模型會自作聰明拼一個連結，結果缺參數、缺上下文、缺 token，最後頁面報錯，它就以為內容真的沒了。

而 web-access 明確提醒：

站點在 DOM 裏生成的連結，自帶完整上下文；手工構造 URL 可能缺失隱式必要參數。

這不是“技巧”，這是經驗。

2. 平台說“內容不存在”，不一定真的不存在

這句更狠。

很多平台的“頁面不見了”“內容不存在”，並不是真的沒有，而是：

• 你的訪問方式不對
• 你缺登錄態
• 你缺某個參數
• 你觸發了反爬

如果 Agent 沒有這個意識，它就會特別容易在錯誤的地方停下。

但這個項目相當於在告訴模型：

平台反饋也是需要被懷疑的，不要把網站給你的錯誤頁當成絕對事實。

這是非常高級的能力。

因為這意味着 Agent 不再只是“接收信息”，而是在判斷信息的可信度。

五、它不是讓 AI 更會“讀網頁”，而是更會“在網頁裏行動”

很多人低估了瀏覽器自動化在 Agent 世界裏的意義。

他們會覺得：

不就是點點按鈕、滾滾頁面嗎？

但實際上，瀏覽器操作是 AI 從“會回答問題”走向“會完成任務”的關鍵橋樑。

web-access 的 CDP Proxy 這部分，核心思路很實用：

它不是啓動一個隔離瀏覽器，而是直接連用戶平時正在用的 Chrome。

這有什麼好處？

最大的好處就一個：

天然繼承登錄態。

這意味着很多現實世界裏最麻煩的問題，突然就不那麼麻煩了：

• 已登錄平台可以直接訪問
• 動態頁面可以真實渲染
• 頁面裏的交互按鈕可以真正點擊
• 視頻可以在真實瀏覽器裏 seek 到任意時間點再截幀
• 文件上傳可以通過真實點擊或 setFiles 完成

這已經不是“查資料”了。

這是在讓 Agent 接近一個真正能工作的網頁執行者。

而且它還區分了三種交互方式：

• /click：JS click，簡單快
• /clickAt：真實鼠標事件，適合更嚴格的用戶手勢場景
• /setFiles：直接給 file input 設置本地文件路徑

這種設計非常工程化。

不是為了炫功能，而是為了覆蓋真實網站那些亂七八糟但經常會遇到的問題。

六、這個項目還有一個很超前的點：它開始認真對待“網站經驗”這件事

如果你真的做過 Agent 瀏覽器自動化，就會知道一個現實：

不同網站，不是同一道題。

• 有的網站適合直接抓 HTML。
• 有的網站必須走真實瀏覽器。
• 有的網站 URL 可以手工構造。
• 有的網站必須從 DOM 裏拿完整連結。
• 有的網站“內容不存在”其實只是缺參數。
• 有的網站要先滾動到底，圖片才真正加載出來。

也就是說，網頁自動化不是一個純通用問題，它天然帶着大量站點特異性經驗。

而 web-access 很聰明的一點，是它不假裝這些經驗不存在。

它直接把這些經驗做成：

按域名存儲的站點知識庫。

比如：

• 平台特徵
• 有效 URL 模式
• 已知陷阱
• 哪些方式會失敗
• 哪些路徑是驗證過的

更關鍵的是，這些經驗可以 跨 session 複用。

這意味着什麼？

意味着它不是每次聯網都從零開始，而是在積累一種越來越像“老網民”的能力。

我覺得這件事特別有代表性。

因為這說明 Agent 的能力，不一定只靠更大的模型來提升。

很多時候，能力增長來自：結構化經驗的沉澱。

七、並行分治這件事，才是它真正面向“複雜任務”的證據

如果一個工具只能完成單點查詢，那它更像增強版搜索。

但如果一個系統開始認真設計“多目標並行調研”，那說明它瞄準的已經是更復雜的 Agent 工作流了。

web-access 在這部分講得很清楚：

當任務包含多個獨立目標時，可以分給多個子 Agent 並行處理。

它強調的收益有兩個：

• 速度提升：多個目標同時查，總耗時接近單個任務時長
• 上下文保護：抓到的大量網頁內容不直接塞進主 Agent 上下文，而是隻回傳摘要

這點非常關鍵。

因為真正把 Agent 用起來的人都會遇到兩個痛點：

1. 串行太慢
2. 上下文太貴

而 web-access 的分治策略，本質上就是在回答：

如果聯網不是一次性問答，而是持續性、多目標、帶瀏覽器操作的複雜任務，該怎麼把系統做得可擴展？

這已經不是“小工具思維”了。

這是工作流思維。

八、我為什麼覺得這個項目值得寫一篇文章？

因為它讓我更明確地看到一件事：

下一代 Agent 的競爭，不只是模型誰更強，而是誰能更像一個真正會做事的聰明人。

會做事，不只是會回答。

而是：

• 會判斷從哪開始
• 會判斷什麼時候換工具
• 會判斷錯誤是不是假錯誤
• 會判斷應該串行還是並行
• 會把經驗沉澱下來，下一次不再踩同一個坑

如果只看表面，web-access 是一個 Claude Code Skill。

但如果往深一層看，它其實在試圖回答一個更大的問題：

Agent 聯網能力，到底應該怎麼設計，才不會停留在“能搜”這一步？

在我看來，這個項目最有價值的，不是某條 API，也不是某個腳本。

而是它把很多人模模糊糊感受到的問題，第一次講清楚了：

• 為什麼單純 WebSearch 不夠
• 為什麼瀏覽器能力不是可選項，而是很多場景下的必要項
• 為什麼“工具調用”不是關鍵，關鍵是“策略調度”
• 為什麼通用模型之外，還需要“站點經驗”這種外部記憶

這些判斷，才是它真正厲害的地方。

九、如果你是這幾類人，建議你一定研究一下這個項目

1）你在做 Claude Code / Agent Skill

這個項目對 Skill 設計思路特別有參考價值，尤其是“哲學 + 技術事實”的寫法。

2）你在做瀏覽器自動化或 AI 工作流

它不是傳統 RPA 思路，而是更貼近 Agent 的動態決策邏輯。

3）你在做社交媒體、內容平台、登錄態網站的自動化

小紅書、微信公眾號這類平台的坑，它明顯是認真踩過、總結過的。

4）你在思考 Agent 為什麼“看起來會聯網，實際上不太能辦事”

這個項目能幫你把問題想清楚。

十、最後一句話：它讓我更確定了一件事

未來真正好用的 Agent，不會只是“知道很多”。

它得同時具備三種能力：

• 會找信息
• 會進入真實環境操作
• 會根據結果修正自己的路徑

而 web-access 這個項目最有啓發的地方就在這裏：

它試圖把 Agent 從“會查資料”往“會上網做事”推進一大步。

這一步，可能比很多人想象得都重要。

因為當 AI 真正開始像人一樣瀏覽、判斷、試錯、切換路徑、積累經驗時——

它離“工具”這個詞，就已經越來越遠了。

它開始有點像一個真正的執行者了。

附：項目關鍵信息

• 項目地址：https://github.com/eze-is/web-access
• 項目定位：給 Claude Code 補齊完整聯網能力的 Skill
• 核心關鍵詞：聯網策略、CDP 瀏覽器操作、站點經驗積累、並行分治、媒體提取
• 作者：一澤 Eze
• 文章地址：https://mp.weixin.qq.com/s/rps5YVB6TchT9npAaIWKCw