你在瀏覽器上乾的那些重複破事,AI 可以全幫你做掉
整理版優先睇
數一數你昨天在瀏覽器裏做了什麼。打開一個網站,找到聯繫郵箱,複製,粘貼到表格裏,關掉,打開下一個。或者打開競品頁面,看看價格有沒有變,截個圖,寫個備註,關掉,打開下一個。這類事情,很多人每天要做幾十次。規則清晰,步驟固定,但就是得一次一次手動來。自動化?聽起來很好,但要寫爬蟲、寫腳本,技術門檻不低,一般人根本不知道從哪裏開始。所以大多數人就這樣,一直手動做着這些重複的事情,年復一年。但最近有一個東西讓這件事變得不一樣了。說人話就能控制瀏覽器阿里開源了一個工具,叫 Page Agent。核心能力只有一句話:用自然語言控制瀏覽器,AI 自動完成重複操作。不需要寫代碼,不需要懂爬蟲,不需要配置什麼 XPath 選擇器。你用中文告訴它你想做什麼,它就去做。這個描述可能太抽象,舉幾個具體的場景。場景一:批量提外鏈做 SEO 或者出海推廣的人都熟悉這件事。你需要找一批目標網站,看對方有沒有聯繫表單或者郵箱,然後一個個去填,說明你想建立連結合作。手動做:打開一個網站,找聯繫方式,填表,提交,換下一個。50 個網站,可能要花半天。用 Page Agent:給它一個網站列表,告訴它"幫我找每個網站的聯繫表單,然後填寫以下信息提交"——它就開始逐個處理。你可以去幹別的事。場景二:監控競品數據你有幾個競爭對手,想知道他們的定價什麼時候變了,哪些產品在促銷。手動做:每週打開他們的定價頁面,記錄價格,和上週的表格對比。用 Page Agent:設置定時任務,每天自動打開那幾個頁面,提取你需要的數據,存到表格裏。有變化自動通知你。場景三:批量抓取關鍵詞做內容運營或者 SEO 的,經常需要分析競品在寫什麼話題,用了哪些高頻詞。手動做:打開競品文章,一篇篇讀,記錄關鍵詞。用 Page Agent:給它一批 URL,告訴它"提取這些頁面裏出現頻率最高的關鍵詞",它輸出一張彙總表。為什麼這件事現在才變得容易瀏覽器自動化這件事本身不新鮮。Selenium、Puppeteer、Playwright——這些工具早就存在,功能也很強。問題是,用這些工具需要寫代碼。你得告訴機器:"找到這個頁面上 class 是 product-price 的 div,讀取裏面的文本,然後……"這種精確描述,需要懂 HTML 結構,需要懂 CSS 選擇器,需要能寫 JavaScript 或者 Python。這道門檻,把絕大多數非技術用戶擋在外面了。Page Agent 做的事情是:把這道門檻拆掉。它在底層還是瀏覽器自動化,但你和它對話的語言,從"告訴機器精確的操作步驟"變成了"告訴 AI 你想要什麼結果"。中間的翻譯工作,AI 來做。你說"幫我找這個頁面上的聯繫郵箱",AI 去識別頁面結構,找到郵箱所在的位置,提取出來。你不需要知道郵箱藏在哪個 HTML 標籤裏。這個轉變,讓瀏覽器自動化從"程序員的工具"變成了"普通人也能用的工具"。什麼工作最值得優先自動化不是所有瀏覽器操作都值得花時間去配置自動化。怎麼判斷?三個條件,滿足得越多,越值得。第一:操作步驟是否固定。同樣的動作每次都一模一樣,沒有臨時的判斷,沒有"這次有點不一樣"。批量填表可以自動化,因為表單字段是固定的;但如果每次都要根據對方網站的不同內容做判斷,配置成本就高很多。第二:是否高頻重複。一次性任務不值得自動化,配置的成本高於執行的成本。但如果這件事每週都要做,或者每次有幾十上百個對象要處理,自動化的收益就很明顯。第三:人工出錯成本是否高。有些重複操作,手動做雖然慢,但出錯影響不大,自動化的緊迫性就低。如果一旦做錯就要花很多時間修復,比如提交了錯誤的外鏈申請,或者記錄了錯誤的競品數據,那自動化同時也是在降低風險。滿足這三條的工作,多數人都有一兩件。仔細想想你上週做過的事,那些"每次都要重新做一遍"的瀏覽器操作,是什麼?工具會變,習慣要先建立Page Agent 只是一個當前的工具,類似的工具會越來越多,能力會越來越強。但這裏有一個更重要的事情:判斷哪些操作值得自動化的能力,比會用哪個具體工具更重要。很多人沒有這個意識,不是因為他們不知道自動化的好處,而是因為他們從來沒有認真審視過自己每天在瀏覽器裏在幹什麼。有一個簡單的方法:在接下來的一週,每次你在瀏覽器裏做重複操作的時候,記下來——是什麼操作,花了多久,這個月大概要做幾次。一週下來,你可能會發現有一兩件事的總時間讓你驚訝。那就是你應該先動手的地方。找一件你在瀏覽器裏每週重複做的事,這周試試讓 AI 接管。不一定要一次配置完美,先跑起來,看看能省多少時間,然後再慢慢優化。重複勞動最大的問題,不是每次花的時間太多,而是你習慣了它的存在,不再覺得它是問題。參考:1. alibaba/page-agent[1]2. page-agent introduction docs[2]2026.05.03 09:46滬·趙巷📌 聲明:本文由 AI 輔助完成引用連結[1] alibaba/page-agent: https://github.com/alibaba/page-agent
數一數你昨天在瀏覽器裏做了什麼。打開一個網站,找到聯繫郵箱,複製,粘貼到表格裏,關掉,打開下一個。或者打開競品頁面,看看價格有沒有變,截個圖,寫個備註,關掉,打開下一個。這類事情,很多人每天要做幾十次。規則清晰,步驟固定,但就是得一次一次手動來。自動化?聽起來很好,但要寫爬蟲、寫腳本,技術門檻不低,一般人根本不知道從哪裏開始。
所以大多數人就咁樣,一直手動做着呢啲重複的事情,年復一年。但最近有一個東西讓這件事變得不一樣了。說人話就能控制瀏覽器阿里開源了一個工具,叫 Page Agent。核心能力只有一句話:用自然語言控制瀏覽器,AI 自動完成重複操作。不需要寫代碼,不需要懂爬蟲,不需要配置什麼 XPath 選擇器。
你用中文告訴它你想做什麼,它就去做。呢個描述可能太抽象,舉幾個具體的場景。場景一:批量提外鏈做 SEO 或者出海推廣的人都熟悉這件事。你需要找一批目標網站,看對方有沒有聯繫表單或者郵箱,然後一個個去填,說明你想建立連結合作。手動做:打開一個網站,找聯繫方式,填表,提交,換下一個。50 個網站,可能要花半天。用 Page Agent:給它一個網站列表,告訴它"幫我找每個網站的聯繫表單,然後填寫以下信息提交"——它就開始逐個處理。你可以去幹別的事。場景二:監控競品數據你有幾個競爭對手,想知道他們的定價什麼時候變了,哪些產品在促銷。手動做:每週打開他們的定價頁面,記錄價格,和上週的表格對比。用 Page Age…
- [2] page-agent introduction docs: https://alibaba.github.io/…
- 你在瀏覽器上乾的嗰啲重複破事,AI 可以全幫你做掉|重點 2
- 你在瀏覽器上乾的嗰啲重複破事,AI 可以全幫你做掉|重點 3
- 你在瀏覽器上乾的嗰啲重複破事,AI 可以全幫你做掉|重點 4
- 你在瀏覽器上乾的嗰啲重複破事,AI 可以全幫你做掉|重點 5
可用資源
數一數你昨天在瀏覽器裏做了什麼。打開一個網站,找到聯繫郵箱,複製,粘貼到表格裏,關掉,打開下一個。或者打開競品頁面,看看價格有沒有變,截個圖,寫個備註,關掉,打開下一個。這類事情,很多人每天要做幾十次。規則清晰,步驟固定,但就是得一次一次手…
可用資源
[2] page-agent introduction docs:
整理版
數一數你昨天在瀏覽器裏做了什麼。打開一個網站,找到聯繫郵箱,複製,粘貼到表格裏,關掉,打開下一個。或者打開競品頁面,看看價格有沒有變,截個圖,寫個備註,關掉,打開下一個。這類事情,很多人每天要做幾十次。規則清晰,步驟固定,但就是得一次一次手動來。自動化?聽起來很好,但要寫爬蟲、寫腳本,技術門檻不低,一般人根本不知道從哪裏開始。所以大多數人就咁樣,一直手動做着呢啲重複的事情,年復一年。但最近有一個東西讓這件事變得不一樣了。說人話就能控制瀏覽器阿里開源了一個工具,叫 Page Agent。核心能力只有一句話:用自然語言控制瀏覽器,AI 自動完成重複操作。不需要寫代碼,不需要懂爬蟲,不需要配置什麼 XPath 選擇器。你用中文告訴它你想做什麼,它就去做。呢個描述可能太抽象,舉幾個具體的場景。場景一:批量提外鏈做 SEO 或者出海推廣的人都熟悉這件事。你需要找一批目標網站,看對方有沒有聯繫表單或者郵箱,然後一個個去填,說明你想建立連結合作。手動做:打開一個網站,找聯繫方式,填表,提交,換下一個。50 個網站,可能要花半天。用 Page Agent:給它一個網站列表,告訴它"幫我找每個網站的聯繫表單,然後填寫以下信息提交"——它就開始逐個處理。你可以去幹別的事。場景二:監控競品數據你有幾個競爭對手,想知道他們的定價什麼時候變了,哪些產品在促銷。手動做:每週打開他們的定價頁面,記錄價格,和上週的表格對比。用 Page Agent:設置定時任務,每天自動打開那幾個頁面,提取你需要的數據,存到表格裏。有變化自動通知你。場景三:批量抓取關鍵詞做內容運營或者 SEO 的,經常需要分析競品在寫什麼話題,用了哪些高頻詞。手動做:打開競品文章,一篇篇讀,記錄關鍵詞。用 Page Agent:給它一批 URL,告訴它"提取呢啲頁面裏出現頻率最高的關鍵詞",它輸出一張彙總表。為什麼這件事而家才變得容易瀏覽器自動化這件事本身不新鮮。Selenium、Puppeteer、Playwright——呢啲工具早就存在,功能也很強。問題是,用呢啲工具需要寫代碼。你得告訴機器:"找到呢個頁面上 class 是 product-price 的 div,讀取裏面的文本,然後……"這種精確描述,需要懂 HTML 結構,需要懂 CSS 選擇器,需要能寫 JavaScript 或者 Python。這道門檻,把絕大多數非技術用戶擋在外面了。Page Agent 做的事情是:把這道門檻拆掉。它在底層還是瀏覽器自動化,但你和它對話的語言,從"告訴機器精確的操作步驟"變成了"告訴 AI 你想要什麼結果"。中間的翻譯工作,AI 來做。你說"幫我找呢個頁面上的聯繫郵箱",AI 去識別頁面結構,找到郵箱所在的位置,提取出來。你不需要知道郵箱藏在哪個 HTML 標籤裏。呢個轉變,讓瀏覽器自動化從"程序員的工具"變成了"普通人也能用的工具"。什麼工作最值得優先自動化不是所有瀏覽器操作都值得花時間去配置自動化。怎麼判斷?三個條件,滿足得越多,越值得。第一:操作步驟是否固定。同樣的動作每次都一模一樣,沒有臨時的判斷,沒有"這次有點不一樣"。批量填表可以自動化,因為表單字段是固定的;但如果每次都要根據對方網站的不同內容做判斷,配置成本就高很多。第二:是否高頻重複。一次性任務不值得自動化,配置的成本高於執行的成本。但如果這件事每週都要做,或者每次有幾十上百個對象要處理,自動化的收益就很明顯。第三:人工出錯成本是否高。有些重複操作,手動做雖然慢,但出錯影響不大,自動化的緊迫性就低。如果一旦做錯就要花很多時間修復,比如提交了錯誤的外鏈申請,或者記錄了錯誤的競品數據,那自動化同時也是在降低風險。滿足這三條的工作,多數人都有一兩件。仔細想想你上週做過的事,嗰啲"每次都要重新做一遍"的瀏覽器操作,是什麼?工具會變,習慣要先建立Page Agent 只是一個當前的工具,類似的工具會越來越多,能力會越來越強。但這裏有一個更重要的事情:判斷哪些操作值得自動化的能力,比會用哪個具體工具更重要。很多人沒有呢個意識,不是因為他們不知道自動化的好處,而是因為他們從來沒有認真審視過自己每天在瀏覽器裏在幹什麼。有一個簡單的方法:在接下來的一週,每次你在瀏覽器裏做重複操作的時候,記下來——是什麼操作,花了多久,呢個月大概要做幾次。一週下來,你可能會發現有一兩件事的總時間讓你驚訝。那就是你應該先動手的地方。找一件你在瀏覽器裏每週重複做的事,這周試試讓 AI 接管。不一定要一次配置完美,先跑起來,看看能省多少時間,然後再慢慢優化。重複勞動最大的問題,不是每次花的時間太多,而是你習慣了它的存在,不再覺得它是問題。參考:1. alibaba/page-agent[1]2. page-agent introduction docs[2]2026.05.03 09:46滬·趙巷📌 聲明:本文由 AI 輔助完成引用連結[1] alibaba/page-agent: https://github.com/alibaba/page-agent
[2] page-agent introduction docs: https://alibaba.github.io/page-agent/docs/introduction/quick-start

數一數你昨天在瀏覽器裏做了什麼。
打開一個網站,找到聯繫郵箱,複製,粘貼到表格裏,關掉,打開下一個。或者打開競品頁面,看看價格有沒有變,截個圖,寫個備註,關掉,打開下一個。
這類事情,很多人每天要做幾十次。規則清晰,步驟固定,但就是得一次一次手動來。自動化?聽起來很好,但要寫爬蟲、寫腳本,技術門檻不低,一般人根本不知道從哪裏開始。
所以大多數人就這樣,一直手動做着這些重複的事情,年復一年。
但最近有一個東西讓這件事變得不一樣了。
說人話就能控制瀏覽器
阿里開源了一個工具,叫 Page Agent。
核心能力只有一句話:用自然語言控制瀏覽器,AI 自動完成重複操作。
不需要寫代碼,不需要懂爬蟲,不需要配置什麼 XPath 選擇器。你用中文告訴它你想做什麼,它就去做。
這個描述可能太抽象,舉幾個具體的場景。
場景一:批量提外鏈
做 SEO 或者出海推廣的人都熟悉這件事。你需要找一批目標網站,看對方有沒有聯繫表單或者郵箱,然後一個個去填,說明你想建立連結合作。
手動做:打開一個網站,找聯繫方式,填表,提交,換下一個。50 個網站,可能要花半天。
用 Page Agent:給它一個網站列表,告訴它"幫我找每個網站的聯繫表單,然後填寫以下信息提交"——它就開始逐個處理。你可以去幹別的事。
場景二:監控競品數據
你有幾個競爭對手,想知道他們的定價什麼時候變了,哪些產品在促銷。
手動做:每週打開他們的定價頁面,記錄價格,和上週的表格對比。
用 Page Agent:設置定時任務,每天自動打開那幾個頁面,提取你需要的數據,存到表格裏。有變化自動通知你。
場景三:批量抓取關鍵詞
做內容運營或者 SEO 的,經常需要分析競品在寫什麼話題,用了哪些高頻詞。
手動做:打開競品文章,一篇篇讀,記錄關鍵詞。
用 Page Agent:給它一批 URL,告訴它"提取這些頁面裏出現頻率最高的關鍵詞",它輸出一張彙總表。

為什麼這件事現在才變得容易
瀏覽器自動化這件事本身不新鮮。Selenium、Puppeteer、Playwright——這些工具早就存在,功能也很強。
問題是,用這些工具需要寫代碼。你得告訴機器:"找到這個頁面上 class 是 product-price 的 div,讀取裏面的文本,然後……"這種精確描述,需要懂 HTML 結構,需要懂 CSS 選擇器,需要能寫 JavaScript 或者 Python。
這道門檻,把絕大多數非技術用戶擋在外面了。
Page Agent 做的事情是:把這道門檻拆掉。
它在底層還是瀏覽器自動化,但你和它對話的語言,從"告訴機器精確的操作步驟"變成了"告訴 AI 你想要什麼結果"。中間的翻譯工作,AI 來做。
你說"幫我找這個頁面上的聯繫郵箱",AI 去識別頁面結構,找到郵箱所在的位置,提取出來。你不需要知道郵箱藏在哪個 HTML 標籤裏。
這個轉變,讓瀏覽器自動化從"程序員的工具"變成了"普通人也能用的工具"。

什麼工作最值得優先自動化
不是所有瀏覽器操作都值得花時間去配置自動化。怎麼判斷?
三個條件,滿足得越多,越值得。
第一:操作步驟是否固定。同樣的動作每次都一模一樣,沒有臨時的判斷,沒有"這次有點不一樣"。批量填表可以自動化,因為表單字段是固定的;但如果每次都要根據對方網站的不同內容做判斷,配置成本就高很多。
第二:是否高頻重複。一次性任務不值得自動化,配置的成本高於執行的成本。但如果這件事每週都要做,或者每次有幾十上百個對象要處理,自動化的收益就很明顯。
第三:人工出錯成本是否高。有些重複操作,手動做雖然慢,但出錯影響不大,自動化的緊迫性就低。如果一旦做錯就要花很多時間修復,比如提交了錯誤的外鏈申請,或者記錄了錯誤的競品數據,那自動化同時也是在降低風險。
滿足這三條的工作,多數人都有一兩件。仔細想想你上週做過的事,那些"每次都要重新做一遍"的瀏覽器操作,是什麼?

工具會變,習慣要先建立
Page Agent 只是一個當前的工具,類似的工具會越來越多,能力會越來越強。
但這裏有一個更重要的事情:判斷哪些操作值得自動化的能力,比會用哪個具體工具更重要。
很多人沒有這個意識,不是因為他們不知道自動化的好處,而是因為他們從來沒有認真審視過自己每天在瀏覽器裏在幹什麼。
有一個簡單的方法:在接下來的一週,每次你在瀏覽器裏做重複操作的時候,記下來——是什麼操作,花了多久,這個月大概要做幾次。
一週下來,你可能會發現有一兩件事的總時間讓你驚訝。那就是你應該先動手的地方。
找一件你在瀏覽器裏每週重複做的事,這周試試讓 AI 接管。
不一定要一次配置完美,先跑起來,看看能省多少時間,然後再慢慢優化。
重複勞動最大的問題,不是每次花的時間太多,而是你習慣了它的存在,不再覺得它是問題。
參考:
- 1. alibaba/page-agent[1]
- 2. page-agent introduction docs[2]
2026.05.03 09:46
滬·趙巷
📌 聲明:本文由 AI 輔助完成
引用連結
[1] alibaba/page-agent: https://github.com/alibaba/page-agent
[2] page-agent introduction docs: https://alibaba.github.io/page-agent/docs/introduction/quick-start