從“會搜”到“會做”:web-access 可能代表了 Agent 聯網能力的下一步

作者:Nice哥聊AI
日期:2026年3月28日 上午12:34
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

呢個項目唔係畀AI加聯網功能,而係教佢好似人咁上網做嘢:web-access 從策略到執行嘅完整設計

整理版摘要

呢篇文章係作者睇完一澤Eze嘅 web-access 項目之後嘅深度分析。佢指出好多AI聯網工具其實只係做到「搜」,而web-access真正解決嘅係「點樣判斷幾時搜、幾時抓、幾時開瀏覽器做互動」。作者認為呢個項目嘅核心唔係工具本身,而係一套 Agent 瀏覽策略系統,將聯網能力從「單點API」提升到「成個工作流程」。

整體結論係:未來Agent嘅競爭,唔止係模型強弱,而係似唔似得一個真係識得做嘢嘅聰明人。Web-access 通過「聯網策略+CDP瀏覽器+站點經驗積累+並行分治」呢四個層次,將Agent從「會查資料」推向「會上網做事」。

作者特別強調呢個項目嘅設計哲學:唔係預設用最強工具,而係知道幾時用最啱工具;唔係盲目執行,而係要識得懷疑平台錯誤信息;唔係每次從零開始,而係累積站點經驗跨session複用。呢啲思路對做Agent開發同工作流設計好有參考價值。

  • Web-access 唔係加一個搜索API,而係補齊 Claude Code 嘅聯網策略、CDP瀏覽器操作同站點經驗積累,令Agent真正識得「上網做事
  • 佢設計咗分層工具策略WebSearch/WebFetch/curl/Jina/CDP瀏覽器按場景自動揀,簡單頁面唔用瀏覽器,複雜互動先升級
  • CDP Proxy 直接連用戶嘅Chrome,天然繼承登錄態,解決咗動態頁面、反爬、登錄平台呢啲常見死穴
  • 項目明確指出:網站生成嘅URL比手動拼更可靠;平台顯示「內容不存在」可能係訪問方式錯,唔一定真係冇內容——呢個係高階判斷能力
  • 並行分治機制可以同時處理多個獨立目標,減少串行時間,而且只回傳摘要,慳返好多token成本
值得記低
連結 github.com

GitHub 項目地址

web-access 項目首頁

Skill

SKILL.md 核心邏輯

項目內嘅 SKILL.md 定義咗聯網策略、CDP操作、站點經驗等能力

整理重點

唔係加功能,而係補策略

好多人畀Claude加聯網能力,只係做到「調用WebSearch」、「抓網頁文本」、「總結搜索結果」。一到真實場景就甩轆:動態頁面睇唔到、登錄態拎唔到、內容藏喺按鈕彈窗Shadow DOM裏面、平台反爬就話「內容不存在」。

web-access 最亮眼嘅地方係冇將「聯網」理解成API能力,而係理解成一整套 Agent 嘅瀏覽策略系統

呢個項目畀 Claude Code 用嘅 Skill,目標係補齊佢喺真實聯網任務嘅關鍵短板。核心定位係「聯網策略 + CDP瀏覽器操作 + 站點經驗積累」,而唔係做一個更強嘅搜索工具或者網頁解析器。

整理重點

分層工具策略:唔係一招打天下

作者冇話瀏覽器最強就所有任務都用佢,反而將工具分工講得好清楚。以下係唔同工具嘅適用場景:

  • WebSearch:發現信息源、搜關鍵詞結果
  • WebFetch:已知URL嘅定向提取
  • curl:拎原始HTML、meta、JSON-LD等結構化信息
  • Jina:將文章博客轉成更慳token嘅Markdown
  • CDP瀏覽器:登錄態、動態頁面、交互式操作、反爬嚴重平台

簡單頁面就唔好上瀏覽器;靜態抓取無效先升級;遇到小紅書、微信公眾號、需要登錄嘅平台就直接CDP

整理重點

CDP Proxy:直接繼承登錄態,似人咁操作瀏覽器

呢個項目嘅 CDP Proxy 唔係開一個隔離瀏覽器,而係直接連用戶日常用緊嘅 Chrome。最大好處係天然繼承曬所有登錄態,好多麻煩問題即刻唔再麻煩。

已登錄平台可以直接訪問、動態頁面可以真實渲染、按鈕可以真正點擊、視頻可以喺真實瀏覽器seek再截幀

而且佢仲區分咗三種交互方式:普通click、真實鼠標點擊、setFiles直接設定本地文件路徑。呢種設計好工程化,唔係炫功能,而係為咗覆蓋真實網站嘅各種古怪狀況。

整理重點

站點經驗積累:唔係次次由零開始

作者明白網頁自動化唔係純通用問題,唔同網站有唔同特性。所以佢將經驗做成按域名儲存嘅知識庫,包括平台特徵、有效URL模式、已知陷阱、邊啲方法會失敗、邊啲路徑驗證過。

呢啲經驗可以跨session複用,令Agent越來越似一個「老網民」,能力增長來自結構化經驗嘅沉澱

文章特別提到兩個「技術事實」:網站自己生成嘅URL比你手動拼嘅更可靠;平台話「內容不存在」可能只係你嘅訪問方式唔啱。呢啲判斷令Agent唔再只係接收信息,而係識得懷疑平台反饋嘅可信度。

整理重點

並行分治:真正面向複雜任務

當任務包含多個獨立目標,web-access 可以分畀多個子Agent並行處理。咁做有兩個好處:速度快咗(總耗時接近單個任務時長),同埋唔使將大量網頁內容塞入主Agent上下文,只回傳摘要就得。

呢個策略直接回應咗真正用Agent嘅人成日遇到嘅兩個痛點:串行太慢、上下文太貴

作者認為呢種工作流思維已經超越咗「小工具」,係為持續性、多目標、帶瀏覽器操作嘅複雜任務設計嘅可擴展系統。

 

圖片

最近出咗一個好好用嘅搜索工具,發佈咗短短幾日,就已經喺GitHub上攞到2k Star,作者係一澤Eze,我好認真咁睇咗呢個GitHub項目,作者採用咗一個幾巧妙嘅設計思路:Agent策略哲學+最小單元工具+必要且詳細嘅事實說明,充滿文學色彩嘅思路,為AI帶嚟咗全新嘅能力。大讚作者!

睇之前,我以為佢只係又一個「畀Claude加聯網能力」嘅工具。

睇完之後,我嘅判斷唔同咗:
佢真正解決嘅,唔係「令AI可以上網」,而係「令AI知道幾時應該搜、幾時應該抓、幾時應該好似人咁打開瀏覽器去做嘢」。

呢兩個層級,分別好大。

因為而家好多人話AI識得聯網,實際上只係:

  • • 可以調用WebSearch
  • • 可以抓一下網頁文本
  • • 可以總結一下搜索結果

聽落好勁,但一到真實場景就開始甩轆:

  • • 頁面係動態加載嘅,佢睇唔到
  • • 網站有登錄狀態,佢拎唔到
  • • 內容收埋喺按鈕、彈窗、摺疊區、Shadow DOM、iframe入面,佢唔識處理
  • • 平台反爬一下,佢就直接話你知「內容唔存在」
  • • 叫佢調研5個站點,佢就開始串行慢慢查,成本又高又蠢

而 web-access 最令我眼前一亮嘅地方,係佢冇將「聯網」理解成一個API能力,而係將佢理解成一整套 Agent嘅瀏覽策略系統

講白啲:

呢個唔係畀Claude加一把槌仔,而係幫佢補一整套「上網做事嘅方法論」。


一、呢個項目到底係做啲咩嘅?

先講結論。

web-access 係一個畀 Claude Code 和OpenClaw本地版本用嘅Skill,目標係補返佢喺真實聯網任務入面嘅關鍵短板。

項目作者畀出嘅核心定位非常清楚:

Claude Code原本有WebSearch、WebFetch,但係欠缺調度策略同瀏覽器自動化能力。呢個skill補返嘅係:聯網策略 + CDP瀏覽器操作 + 站點經驗積累

呢句話好重要。

因為佢唔係講:

  • • 我做咗一個更勁嘅搜索工具
  • • 我做咗一個網頁解析器
  • • 我做咗一個瀏覽器腳本

而係講:

我做嘅係「組合能力 + 決策能力 + 經驗複用能力」。

從README同SKILL.md入面可以睇到,呢個項目嘅能力大概分成6層:

  1. 1. 聯網工具自動選擇:WebSearch / WebFetch / curl / Jina / CDP 按場景自動揀
  2. 2. CDP Proxy瀏覽器操作:直接連用戶日常用嘅Chrome,天然帶住登錄狀態
  3. 3. 多種交互能力:普通點擊、真實鼠標點擊、檔案上傳
  4. 4. 並行分治:多個獨立目標嘅時候可以分發俾子Agent並行做
  5. 5. 站點經驗積累:唔同網站嘅伏位、模式、特徵按域名沉澱落嚟
  6. 6. 媒體提取與視頻分析:可以從DOM提取圖片、提取視頻URL,甚至對視頻按時間點截幀分析

如果你淨係睇功能表,會覺得佢好勁。

但真正令我覺得呢個項目有意思嘅,唔止係功能,而係佢背後嗰種好清醒嘅設計思路。


二、好多AI聯網工具,問題唔係「用唔到」,而係「唔似人」

我哋平時對「AI聯網」嘅期望,往往有個誤區:

覺得只要俾模型接上搜尋引擎,佢就會用。

其實唔係。

人類瀏覽網頁嗰陣,做嘅嘢好複雜,但我哋平時意識唔到:

  • • 先判斷目標係咩
  • • 再揀路徑:搜、點、跳轉、登入、翻頁、返回
  • • 睇到結果後不斷修正判斷
  • • 發現靜態頁面唔夠,就轉去真實頁面交互
  • • 發現報錯唔可信,就懷疑訪問方式而唔係即刻放棄

呢其實係一套動態決策系統

而好多所謂嘅AI聯網,只係俾咗模型一個「抓文本」嘅入口。

所以一到複雜網站,佢就好似一個只係企喺門口張望嘅人:

睇到少少嘢,但唔會真正入去做嘢。

web-access 喺SKILL.md入面有一句話,我覺得幾乎可以當成佢嘅靈魂:

似人咁思考,兼顧高效同適應性咁完成任務。

呢句唔係空話。

佢後面真係將呢個理念拆成一個執行框架:

  • • 先明確任務成功標準
  • • 再揀最可能直達嘅起點
  • • 過程中持續校驗,而唔係機械式重複
  • • 達到目標後及時停手,唔做無意義嘅過度操作

你會發現,呢個已經唔係「工具說明書」喇。

佢更加似係教Agent:

唔好淨係識得調用工具,要學識圍繞目標做判斷。

呢件事,比多一個接口重要好多。


三、佢最聰明嘅一點:唔係默認用瀏覽器,而係知道幾時應該升級到瀏覽器

呢個項目最值得參考嘅部分之一,係佢冇走極端。

佢並唔係話:

瀏覽器最勁,所以所有任務都用瀏覽器。

不是。

相反,佢將唔同工具嘅分工講得好明確:

  • • WebSearch:適合發現資訊源、搜關鍵詞結果
  • • WebFetch:適合已知URL嘅定向提取
  • • curl:適合攞原始HTML、meta、JSON-LD等結構化資訊
  • • Jina:適合將文章、博客、文檔轉成更慳token嘅Markdown
  • • CDP瀏覽器:適合登入狀態、動態頁面、交互式操作、反爬嚴重嘅平台

咁就即係話,佢唔係「只係識一招」,而係有一套分層策略。

呢個思路太重要喇。

因為真實世界入面,最好嘅方案從來唔係「最勁嗰個工具」,而係「喺當前場景裏面成本最合適嗰個工具」。

簡單頁面就唔好用瀏覽器。

靜態抓取冇效,再升級。

遇到小紅書、微信公眾號、需要登入嘅平台,就唔好喺靜態層死磕,直接CDP。

咁先似一個成熟嘅Agent。

唔係捉住一個工具猛掄,而係會判斷代價、風險同成功率。


四、真正令我拍案叫絕嘅,係佢對「失敗信號」嘅理解

我覺得 web-access 最唔似普通項目README嘅地方,係佢寫得好詳細,揭露咗好多「技術事實」。

例如佢明確強調:

1. 網站自己生成嘅URL,比你手動砌嘅URL更可靠

呢句話聽落似常識,但好多Agent其實根本冇呢個意識。

好多時模型會自作聰明砌一個連結,結果缺參數、缺上下文、缺token,最後頁面報錯,佢就以為內容真係冇咗。

而 web-access 明確提醒:

站點喺DOM入面生成嘅連結,自帶完整上下文;手工構造URL可能缺失隱式必要參數。

呢個唔係「技巧」,呢個係經驗。

2. 平台話「內容唔存在」,未必真係唔存在

呢句更狼死。

好多平台嘅「頁面唔見咗」「內容唔存在」,並唔係真係冇,而係:

  • • 你嘅訪問方式唔啱
  • • 你冇登入狀態
  • • 你缺某個參數
  • • 你觸發咗反爬

如果Agent冇呢個意識,佢就會好容易喺錯誤嘅地方停低。

但呢個項目相當於喺告訴模型:

平台反饋都係需要被懷疑㗎,唔好將網站俾你嘅錯誤頁當成絕對事實。

呢個係非常進階嘅能力。

因為咁代表Agent唔再淨係「接收資訊」,而係判斷資訊嘅可信度。


五、佢唔係令AI更加識「讀網頁」,而係更加識「喺網頁入面行動」

好多人低估咗瀏覽器自動化喺Agent世界入面嘅意義。

佢哋會覺得:

咪又係襟襟掣、碌碌頁面?

但實際上,瀏覽器操作係AI從「識答問題」走向「識完成任務」嘅關鍵橋樑。

web-access 嘅CDP Proxy呢部分,核心思路好實用:

佢唔係啟動一個隔離瀏覽器,而係直接連用戶平時用緊嘅Chrome。

呢個有咩好處?

最大嘅好處得一個:

天然繼承登入狀態。

呢個意味住好多現實世界入面最麻煩嘅問題,突然間就冇咁麻煩喇:

  • • 已登入平台可以直接訪問
  • • 動態頁面可以真實渲染
  • • 頁面入面嘅交互按鈕可以真正點擊
  • • 視頻可以喺真實瀏覽器入面seek到任意時間點再截幀
  • • 檔案上傳可以通過真實點擊或setFiles完成

呢個已經唔係「查資料」喇。

呢個係令Agent 接近一個真正能夠工作嘅網頁執行者

而且佢仲區分咗三種交互方式:

  • • /click:JS click,簡單又快
  • • /clickAt:真實鼠標事件,適合更嚴格嘅用戶手勢場景
  • • /setFiles:直接俾file input設置本地檔案路徑

呢種設計非常工程化。

唔係為咗炫耀功能,而係為咗覆蓋真實網站嗰啲亂七八糟但經常會遇到嘅問題。


六、呢個項目仲有一個好超前嘅點:佢開始認真對待「網站經驗」呢件事

如果你真係做過Agent瀏覽器自動化,就會知道一個現實:

唔同網站,唔係同一條題目。

  • • 有啲網站適合直接抓HTML。
  • • 有啲網站一定要行真實瀏覽器。
  • • 有啲網站URL可以手工構造。
  • • 有啲網站一定要從DOM拎完整連結。
  • • 有啲網站「內容唔存在」其實只係缺參數。
  • • 有啲網站要碌到底先,圖片先至真正加載出嚟。

即係話,網頁自動化唔係一個純通用問題,佢天然帶住大量站點特異性經驗

而 web-access 好聰明嘅一點,係佢唔扮呢啲經驗唔存在。

佢直接將呢啲經驗做成:

按域名儲存嘅站點知識庫。

比如:

  • • 平台特徵
  • • 有效URL模式
  • • 已知陷阱
  • • 邊啲方式會失敗
  • • 邊啲路徑係驗證過嘅

更關鍵嘅係,呢啲經驗可以 跨session複用

呢個意味住咩?

意味住佢唔係每次聯網都從零開始,而係積累緊一種越來越似「老網民」嘅能力。

我覺得呢件事特別有代表性。

因為呢個說明Agent嘅能力,唔一定只係靠更大嘅模型嚟提升。

好多時候,能力增長來自:結構化經驗嘅沉澱。


七、並行分治呢件事,先係佢真正面向「複雜任務」嘅證據

如果一個工具只係可以完成單點查詢,咁佢更加似增強版搜索。

但如果一個系統開始認真設計「多目標並行調研」,咁就說明佢瞄準嘅已經係更複雜嘅Agent工作流喇。

web-access 喺呢部分講得好清楚:

當任務包含多個獨立目標嗰陣,可以分俾多個子Agent並行處理。

佢強調嘅收益有兩個:

  • • 速度提升:多個目標同時查,總耗時接近單個任務時長
  • • 上下文保護:抓到嘅大量網頁內容唔直接塞入主Agent上下文,而係只回傳摘要

呢點非常關鍵。

因為真正將Agent用起嚟嘅人都會遇到兩個痛點:

  1. 1. 串行太慢
  2. 2. 上下文太貴

而 web-access 嘅分治策略,本質上就係喺回答:

如果聯網唔係一次性問答,而係持續性、多目標、帶瀏覽器操作嘅複雜任務,應該點樣將系統做得可擴展?

呢個已經唔係「小工具思維」喇。

呢個係工作流思維。


八、點解我覺得呢個項目值得寫一篇文章?

因為佢令我更明確咁睇到一件事:

下一代Agent嘅競爭,唔止係模型邊個更勁,而係邊個更加似一個真正會做嘢嘅聰明人。

會做嘢,唔止係會回答。

而是:

  • • 會判斷從邊度開始
  • • 會判斷幾時換工具
  • • 會判斷錯誤係咪假錯誤
  • • 會判斷應該串行定並行
  • • 會將經驗沉澱落嚟,下次唔再踩同一個坑

如果淨係睇表面,web-access 係一個Claude Code Skill。

但如果睇深一層,佢其實係試緊回答一個更大嘅問題:

Agent聯網能力,到底應該點樣設計,先唔會停留喺「識得搜」呢一步?

喺我嚟睇,呢個項目最有價值嘅,唔係某條API,亦唔係某個腳本。

而係佢將好多人模模糊糊感受到嘅問題,第一次講清楚咗:

  • • 點解單純WebSearch唔夠
  • • 點解瀏覽器能力唔係可選項,而係好多場景下嘅必要項
  • • 點解「工具調用」唔係關鍵,關鍵係「策略調度」
  • • 點解通用模型之外,仲需要「站點經驗」呢種外部記憶

呢啲判斷,先係佢真正厲害嘅地方。


九、如果你係呢幾類人,建議你一定要研究一下呢個項目

1)你做緊Claude Code / Agent Skill

呢個項目對Skill設計思路特別有參考價值,尤其係「哲學 + 技術事實」嘅寫法。

2)你做緊瀏覽器自動化或AI工作流

佢唔係傳統RPA思路,而係更加貼近Agent嘅動態決策邏輯。

3)你做緊社交媒體、內容平台、登入狀態網站嘅自動化

小紅書、微信公眾號呢類平台嘅伏位,佢明顯係認真踩過、總結過嘅。

4)你喺度思考Agent點解「表面睇好似識得聯網,但實際上唔多做到嘢」

呢個項目可以幫你將問題諗清楚。


十、最後一句話:佢令我更加肯定咗一件事

未來真正好用嘅Agent,唔會只係「知道好多嘢」。

佢要同時具備三種能力:

  • • 會揾資訊
  • • 會進入真實環境操作
  • • 會根據結果修正自己嘅路徑

而 web-access 呢個項目最有啟發嘅地方就係呢度:

佢嘗試將Agent從「識查資料」推前一大步,變成「識得上網做嘢」。

呢一步,可能比好多人想像中更加重要。

因為當AI真正開始似人咁瀏覽、判斷、試錯、切換路徑、積累經驗嗰陣——

佢離開「工具」呢個詞,就越來越遠喇。

佢開始有啲似一個真正嘅執行者喇。


附:項目關鍵資訊

  • • 項目地址:https://github.com/eze-is/web-access
  • • 項目定位:幫Claude Code補齊完整聯網能力嘅Skill
  • • 核心關鍵詞:聯網策略、CDP瀏覽器操作、站點經驗積累、並行分治、媒體提取
  • • 作者:一澤Eze
  • • 文章地址:https://mp.weixin.qq.com/s/rps5YVB6TchT9npAaIWKCw

 

 

圖片

最近出現了一個非常好用的搜索工具,發佈短短几天,就在GitHub上獲得2k Star,作者是一澤Eze,我非常認真地拜讀了這個 GitHub項目,作者採用了比較巧妙的設計思路:Agent策略哲學+最小單元工具+必要且詳細的事實說明,富有文學色彩的思路,給AI賦予了全新的能力。大讚作者!

看之前,我以為它只是又一個“給 Claude 加聯網能力”的工具。

看完之後,我的判斷變了:
它真正解決的,不是“讓 AI 能上網”,而是“讓 AI 知道什麼時候該搜、什麼時候該抓、什麼時候該像人一樣打開瀏覽器去做事”。

這兩個層級,差別非常大。

因為今天很多人說 AI 會聯網,實際上只是:

  • • 能調一下 WebSearch
  • • 能抓一下網頁文本
  • • 能總結一下搜索結果

聽起來很強,但一到真實場景就開始掉鏈子:

  • • 頁面是動態加載的,它看不見
  • • 網站有登錄態,它拿不到
  • • 內容藏在按鈕、彈窗、摺疊區、Shadow DOM、iframe 裏,它不會處理
  • • 平台反爬一下,它就直接告訴你“內容不存在”
  • • 讓它調研 5 個站點,它開始串行慢慢查,成本又高又笨

而 web-access 最讓我眼前一亮的地方,是它沒有把“聯網”理解成一個 API 能力,而是把它理解成一整套 Agent 的瀏覽策略系統

說直白一點:

這不是在給 Claude 加一把錘子,而是在給它補一整套“上網做事的方法論”。


一、這個項目到底是幹什麼的?

先說結論。

web-access 是一個給 Claude Code 和OpenClaw本地版本使用的 Skill,目標是補齊它在真實聯網任務裏的關鍵短板。

項目作者給出的核心定位非常清楚:

Claude Code 原本有 WebSearch、WebFetch,但缺少調度策略和瀏覽器自動化能力。這個 skill 補上的是:聯網策略 + CDP 瀏覽器操作 + 站點經驗積累

這句話很重要。

因為它不是在說:

  • • 我做了一個更強的搜索工具
  • • 我做了一個網頁解析器
  • • 我做了一個瀏覽器腳本

而是在說:

我做的是“組合能力 + 決策能力 + 經驗複用能力”。

從 README 和 SKILL.md 裏能看出,這個項目的能力大概分成 6 層:

  1. 1. 聯網工具自動選擇:WebSearch / WebFetch / curl / Jina / CDP 按場景自動選
  2. 2. CDP Proxy 瀏覽器操作:直連用戶日常 Chrome,天然攜帶登錄態
  3. 3. 多種交互能力:普通點擊、真實鼠標點擊、文件上傳
  4. 4. 並行分治:多個獨立目標時可分發給子 Agent 並行做
  5. 5. 站點經驗積累:不同網站的坑、模式、特徵按域名沉澱下來
  6. 6. 媒體提取與視頻分析:可以從 DOM 提圖、提視頻 URL,甚至對視頻按時間點截幀分析

如果你只看功能表,會覺得它很強。

但真正讓我覺得這個項目有意思的,不只是功能,而是它背後那種很清醒的設計思路。


二、很多 AI 聯網工具,問題不在“不能用”,而在“不像人”

我們平時對“AI 聯網”的期待,往往有個誤區:

覺得只要給模型接上搜索引擎,它就會用了。

其實不是。

人類瀏覽網頁時,做的事情非常複雜,但我們平時意識不到:

  • • 先判斷目標是什麼
  • • 再選路徑:搜、點、跳轉、登錄、翻頁、返回
  • • 看到結果後不斷修正判斷
  • • 發現靜態頁面不夠,就轉去真實頁面交互
  • • 發現報錯不可信,就懷疑訪問方式而不是立刻放棄

這其實是一套動態決策系統

而很多所謂的 AI 聯網,只給了模型一個“抓文本”的入口。

所以一到複雜網站,它就像一個只會站在門口張望的人:

能看見一點東西,但不會真正進去辦事。

web-access 在 SKILL.md 裏有一句話,我覺得幾乎可以當成它的靈魂:

像人一樣思考,兼顧高效與適應性的完成任務。

這不是一句空話。

它後面真的把這個理念拆成了一個執行框架:

  • • 先明確任務成功標準
  • • 再選擇最可能直達的起點
  • • 過程中持續校驗,而不是機械重複
  • • 達到目標後及時停手,不做無意義過度操作

你會發現,這已經不是“工具說明書”了。

它更像是在教 Agent:

不要只會調用工具,要學會圍繞目標做判斷。

這件事,比多一個接口重要得多。


三、它最聰明的一點:不是默認用瀏覽器,而是知道什麼時候該升級到瀏覽器

這個項目最值得借鑑的部分之一,是它沒有走極端。

它並不是說:

瀏覽器最強,所以所有任務都用瀏覽器。

不是。

相反,它把不同工具的分工講得很明確:

  • • WebSearch:適合發現信息源、搜關鍵詞結果
  • • WebFetch:適合已知 URL 的定向提取
  • • curl:適合拿原始 HTML、meta、JSON-LD 等結構化信息
  • • Jina:適合把文章、博客、文檔轉成更省 token 的 Markdown
  • • CDP 瀏覽器:適合登錄態、動態頁面、交互式操作、反爬嚴重的平台

這就意味着,它不是“只會一個大招”,而是有一套分層策略。

這個思路太重要了。

因為真實世界裏,最好的方案從來不是“最強的那個工具”,而是“在當前場景裏成本最合適的那個工具”。

簡單頁面就別上瀏覽器。

靜態抓取無效,再升級。

遇到小紅書、微信公眾號、需要登錄的平台,就別在靜態層死磕,直接 CDP。

這才像一個成熟的 Agent。

不是逮着一個工具猛掄,而是會判斷代價、風險和成功率。


四、真正讓我拍案叫絕的,是它對“失敗信號”的理解

我覺得 web-access 最不像普通項目 README 的地方,是它寫得非常詳細,揭露了很多“技術事實”。

比如它明確強調:

1. 網站自己生成的 URL,比你手動拼的 URL 更可靠

這句話聽上去像常識,但很多 Agent 其實根本沒這個意識。

很多時候模型會自作聰明拼一個連結,結果缺參數、缺上下文、缺 token,最後頁面報錯,它就以為內容真的沒了。

而 web-access 明確提醒:

站點在 DOM 裏生成的連結,自帶完整上下文;手工構造 URL 可能缺失隱式必要參數。

這不是“技巧”,這是經驗。

2. 平台說“內容不存在”,不一定真的不存在

這句更狠。

很多平台的“頁面不見了”“內容不存在”,並不是真的沒有,而是:

  • • 你的訪問方式不對
  • • 你缺登錄態
  • • 你缺某個參數
  • • 你觸發了反爬

如果 Agent 沒有這個意識,它就會特別容易在錯誤的地方停下。

但這個項目相當於在告訴模型:

平台反饋也是需要被懷疑的,不要把網站給你的錯誤頁當成絕對事實。

這是非常高級的能力。

因為這意味着 Agent 不再只是“接收信息”,而是在判斷信息的可信度。


五、它不是讓 AI 更會“讀網頁”,而是更會“在網頁裏行動”

很多人低估了瀏覽器自動化在 Agent 世界裏的意義。

他們會覺得:

不就是點點按鈕、滾滾頁面嗎?

但實際上,瀏覽器操作是 AI 從“會回答問題”走向“會完成任務”的關鍵橋樑。

web-access 的 CDP Proxy 這部分,核心思路很實用:

它不是啓動一個隔離瀏覽器,而是直接連用戶平時正在用的 Chrome。

這有什麼好處?

最大的好處就一個:

天然繼承登錄態。

這意味着很多現實世界裏最麻煩的問題,突然就不那麼麻煩了:

  • • 已登錄平台可以直接訪問
  • • 動態頁面可以真實渲染
  • • 頁面裏的交互按鈕可以真正點擊
  • • 視頻可以在真實瀏覽器裏 seek 到任意時間點再截幀
  • • 文件上傳可以通過真實點擊或 setFiles 完成

這已經不是“查資料”了。

這是在讓 Agent 接近一個真正能工作的網頁執行者

而且它還區分了三種交互方式:

  • • /click:JS click,簡單快
  • • /clickAt:真實鼠標事件,適合更嚴格的用戶手勢場景
  • • /setFiles:直接給 file input 設置本地文件路徑

這種設計非常工程化。

不是為了炫功能,而是為了覆蓋真實網站那些亂七八糟但經常會遇到的問題。


六、這個項目還有一個很超前的點:它開始認真對待“網站經驗”這件事

如果你真的做過 Agent 瀏覽器自動化,就會知道一個現實:

不同網站,不是同一道題。

  • • 有的網站適合直接抓 HTML。
  • • 有的網站必須走真實瀏覽器。
  • • 有的網站 URL 可以手工構造。
  • • 有的網站必須從 DOM 裏拿完整連結。
  • • 有的網站“內容不存在”其實只是缺參數。
  • • 有的網站要先滾動到底,圖片才真正加載出來。

也就是說,網頁自動化不是一個純通用問題,它天然帶着大量站點特異性經驗

而 web-access 很聰明的一點,是它不假裝這些經驗不存在。

它直接把這些經驗做成:

按域名存儲的站點知識庫。

比如:

  • • 平台特徵
  • • 有效 URL 模式
  • • 已知陷阱
  • • 哪些方式會失敗
  • • 哪些路徑是驗證過的

更關鍵的是,這些經驗可以 跨 session 複用

這意味着什麼?

意味着它不是每次聯網都從零開始,而是在積累一種越來越像“老網民”的能力。

我覺得這件事特別有代表性。

因為這說明 Agent 的能力,不一定只靠更大的模型來提升。

很多時候,能力增長來自:結構化經驗的沉澱。


七、並行分治這件事,才是它真正面向“複雜任務”的證據

如果一個工具只能完成單點查詢,那它更像增強版搜索。

但如果一個系統開始認真設計“多目標並行調研”,那說明它瞄準的已經是更復雜的 Agent 工作流了。

web-access 在這部分講得很清楚:

當任務包含多個獨立目標時,可以分給多個子 Agent 並行處理。

它強調的收益有兩個:

  • • 速度提升:多個目標同時查,總耗時接近單個任務時長
  • • 上下文保護:抓到的大量網頁內容不直接塞進主 Agent 上下文,而是隻回傳摘要

這點非常關鍵。

因為真正把 Agent 用起來的人都會遇到兩個痛點:

  1. 1. 串行太慢
  2. 2. 上下文太貴

而 web-access 的分治策略,本質上就是在回答:

如果聯網不是一次性問答,而是持續性、多目標、帶瀏覽器操作的複雜任務,該怎麼把系統做得可擴展?

這已經不是“小工具思維”了。

這是工作流思維。


八、我為什麼覺得這個項目值得寫一篇文章?

因為它讓我更明確地看到一件事:

下一代 Agent 的競爭,不只是模型誰更強,而是誰能更像一個真正會做事的聰明人。

會做事,不只是會回答。

而是:

  • • 會判斷從哪開始
  • • 會判斷什麼時候換工具
  • • 會判斷錯誤是不是假錯誤
  • • 會判斷應該串行還是並行
  • • 會把經驗沉澱下來,下一次不再踩同一個坑

如果只看表面,web-access 是一個 Claude Code Skill。

但如果往深一層看,它其實在試圖回答一個更大的問題:

Agent 聯網能力,到底應該怎麼設計,才不會停留在“能搜”這一步?

在我看來,這個項目最有價值的,不是某條 API,也不是某個腳本。

而是它把很多人模模糊糊感受到的問題,第一次講清楚了:

  • • 為什麼單純 WebSearch 不夠
  • • 為什麼瀏覽器能力不是可選項,而是很多場景下的必要項
  • • 為什麼“工具調用”不是關鍵,關鍵是“策略調度”
  • • 為什麼通用模型之外,還需要“站點經驗”這種外部記憶

這些判斷,才是它真正厲害的地方。


九、如果你是這幾類人,建議你一定研究一下這個項目

1)你在做 Claude Code / Agent Skill

這個項目對 Skill 設計思路特別有參考價值,尤其是“哲學 + 技術事實”的寫法。

2)你在做瀏覽器自動化或 AI 工作流

它不是傳統 RPA 思路,而是更貼近 Agent 的動態決策邏輯。

3)你在做社交媒體、內容平台、登錄態網站的自動化

小紅書、微信公眾號這類平台的坑,它明顯是認真踩過、總結過的。

4)你在思考 Agent 為什麼“看起來會聯網,實際上不太能辦事”

這個項目能幫你把問題想清楚。


十、最後一句話:它讓我更確定了一件事

未來真正好用的 Agent,不會只是“知道很多”。

它得同時具備三種能力:

  • • 會找信息
  • • 會進入真實環境操作
  • • 會根據結果修正自己的路徑

而 web-access 這個項目最有啓發的地方就在這裏:

它試圖把 Agent 從“會查資料”往“會上網做事”推進一大步。

這一步,可能比很多人想象得都重要。

因為當 AI 真正開始像人一樣瀏覽、判斷、試錯、切換路徑、積累經驗時——

它離“工具”這個詞,就已經越來越遠了。

它開始有點像一個真正的執行者了。


附:項目關鍵信息

  • • 項目地址:https://github.com/eze-is/web-access
  • • 項目定位:給 Claude Code 補齊完整聯網能力的 Skill
  • • 核心關鍵詞:聯網策略、CDP 瀏覽器操作、站點經驗積累、並行分治、媒體提取
  • • 作者:一澤 Eze
  • • 文章地址:https://mp.weixin.qq.com/s/rps5YVB6TchT9npAaIWKCw