我是如何教 Hermes 在雲端自動發推特的?(內含翻車經歷)
整理版優先睇
部署 Hermes 到雲端:從翻車到穩定發推嘅實戰指南
呢篇文章係由大劉寫嘅,佢係Hermes Agent嘅推廣者。文章主要想解決一個問題:點解要將AI Agent由本地電腦搬去雲端VPS?大劉認為,本地運行雖然方便,但存在嚴重安全隱患(瀏覽器存放密碼同Cookies),而且好難做到7x24小時穩定運行。佢嘅整體結論係:如果追求長期、高頻嘅自動化生產力,雲端部署先係唯一出路。
文章詳細講解咗部署方案嘅三大支柱:用Tailscale建立安全隧道,防止公網掃描;用VNC加Fluxbox喺服務器內存模擬出一個顯示器,令AI可以「睇見」網頁;同埋開Chrome嘅CDP端口(9222),等Hermes可以遙控瀏覽器。大劉仲分享咗佢親身教Hermes發推嘅翻車經歷:第一次叫佢直接登錄X,結果要求畀密碼(唔安全);第二次手動登錄後,Hermes又話連唔上;第三次調整指令,明確話「我已經登好,你順住呢個窗口操作」,先成功發佈。之後重複執行發現流程唔穩定,要反覆溝通校正先得到成熟工作流。佢建議用Gemini或Claude呢類「高學歷大腦」可以減少調試次數。
最後,大劉指出未來「一人公司」嘅核心競爭力唔係寫代碼速度,而係麾下「數字員工」嘅穩定性。佢鼓勵讀者唔好死磕本地,要善用雲端工具,遇到錯誤直接將日誌畀Hermes,因為佢已經學識呢套SOP。文章整體係一篇實戰向嘅部署指南,適合想將AI Agent真正投入生產嘅讀者。
- 雲端部署係實現24小時自動化嘅唯一可靠方式,安全同效率都遠超本地。
- 方法:用Tailscale建立私密網絡、VNC+Fluxbox模擬顯示器、Chrome CDP端口俾AI遙控。
- 差異:本地易洩漏隱私、難以長時間運行;雲端物理隔離、IP穩定、7x24小時不間斷。
- 啟發:AI操作瀏覽器時,唔好畀佢自行處理登錄,應該人手登錄後先交控制權。
- 可行動點:遇錯誤直接將日誌貼畀Hermes,佢學過SOP就會識得點修;如果用Gemini或Claude呢類高學歷大腦,調試次數會少好多。
部署Hermes到雲端VPS
包括安裝Tailscale、TigerVNC Server、Fluxbox、Chrome;設定VNC密碼同xstartup腳本;開CDP端口;用ufw限制只畀Tailscale訪問VNC。
提示Hermes安裝軟件
『幫我裝 TigerVNC Server + fluxbox 輕量窗口管理器 + Google Chrome』
提示Hermes發推
『我連vnc登陸咗 x賬號,你發佈內容“hello”然後點post按鈕。可以考慮CDP HTTP API+WebSocket 直接操作。』
點解要搬去雲端?
如果你只係想短期跑個Demo,本地環境確實最香。但係如果你想讓Agent變成數字員工,24小時唔知疲倦咁幫你幹活,本地運行就唔單止效率低,甚至會洩漏你嘅密碼同Cookies。
核心科技:Tailscale + VNC + CDP
服務器得個黑框框(命令行),點樣令AI「睇見」網頁?呢套方案靠三根支柱:雲端基地(雲服務器+VNC)、安全層(Tailscale)、同埋天才的一公里(人工登錄+AI接管)。
服務器用 VNC 喺內存畫出一個顯示器,AI 透過 Chrome 嘅 CDP 端口(9222)遙控瀏覽器,咁就似真人一樣操作網頁。
Tailscale 為每部機分配一個內網IP,公網掃唔到,等於加咗把隱形鎖。而家你只係需要手動搞掂複雜嘅掃碼驗證,之後高頻重複勞動全部交畀 AI。
一步一步動手做
唔好怕啲命令,而家有Hermes幫手,直接吩咐佢就得。下面係部署嘅主要步驟:
- 1 用Tailscale打通安全隧道:向Hermes講「幫我喺服務器上裝Tailscale並加入我嘅網絡,完成後話畀我知呢部機嘅Tailscale IP」。
- 2 安裝VNC+Chrome:叫Hermes「幫我裝 TigerVNC Server + fluxbox 輕量窗口管理器 + Google Chrome」。
- 3 設定VNC密碼同默認參數:執行 vncpasswd 設定密碼,再寫入 ~/.vnc/config,包括分辨率1080P、允許遠程連接等。
- 4 創建啟動腳本 xstartup:內容係啟動Chrome(開CDP 9222端口)同Fluxbox。特別注意 --user-data-dir=/root/.chrome-debug 呢個參數,唔加嘅話AI會連唔上Chrome。
- 5 開機啟用VNC服務:sudo systemctl enable --now tigervncserver@:1.service,然後驗證 VNC 監聽5901、Chrome CDP回傳JSON。
- 6 加固安全:用ufw設定只允許來自tailscale0接口嘅5901端口,其他網卡一律拒絕。
#!/bin/bash
unset SESSION_MANAGER
unset DBUS_SESSION_BUS_ADDRESS
export XDG_SESSION_TYPE=x11
/opt/google/chrome/chrome \
--no-sandbox \
--disable-gpu \
--disable-software-rasterizer \
--start-maximized \
--no-first-run \
--no-default-browser-check \
--disable-sync \
--disable-translate \
--disable-default-apps \
--user-data-dir=/root/.chrome-debug \
--remote-debugging-port=9222 \
--remote-allow-origins=* \
>/root/.vnc/chrome.log 2>&1 &
exec fluxbox
翻車現場:教 Hermes 發推
一切準備就緒,我親身帶Hermes衝咗一波X(Twitter),過程真係一波三折。
- 第一次:叫Hermes幫我登錄X,結果佢問我要賬號密碼——呢個做法太危險,萬一模型智商掉線洩漏密碼就大件事。
- 第二次:我手動喺VNC登錄咗X,然後叫Hermes繼續,但佢反覆話連唔上。
- 第三次:我調整指令,講明「我已經手動登好,你順住呢個窗口,將Hello發出去就得」。結果秒成!
- 第四次:用同一指令重複執行,發現流程唔穩定,每次操作路徑都唔同。
- 第五次:繼續調試,終於可以簡單指令穩定發佈。
如果想得到成熟工作流,目前只能靠反覆溝通校正,慢慢培養Hermes能力。高學歷大腦(例如Gemini或Claude)可以減少調試次數,因為聰明啲嘅員工教一遍就領悟你嘅意圖。
一人公司嘅自動化兵團
未來嘅「一人公司」,拼嘅唔係寫代碼有幾快,而係你麾下數字員工有幾穩。當你幫Agent加上Tailscale呢把安全鎖同VNC呢扇監控窗,你就真正擁有一個可以隨時待命、不眠不休嘅自動化兵團。
遇到錯誤唔好硬扛,直接將錯誤日誌塞畀Hermes,佢已經學識呢套SOP,絕對比你自己摸索更識得點修。
你嘅第一個雲端數字員工,準備好叫佢幫你做啲咩?係自動抓取海外情報,定係去Reddit做個唔使瞓嘅運營官?喺評論區話畀大劉知,一齊碰撞AI出海嘅新玩法。
大家好,我係大劉。
最近喺後台,成日有粉絲私信問我:「大劉,我就喺自己電腦度行 Agent(AI 智能體)好順手,無論係寫 code 定係抓數據都好快。你點解一定要建議大家使錢、花心機去搞 Server 呢?」
講真,如果你只係想短期玩嚇、行個 Demo 試嚇新鮮,本地環境的確最正。
但如果你的野心大啲,想俾 Agent 真正好似一個「數碼員工」咁,24 小時唔知疲倦咁幫你做嘢(例如半夜幫你睇實海外市場、自動出 post 營運),咁本地行就唔只係效率低嘅問題,佢甚至係喺度幫你嘅私隱「挖坑」。
點解我勸你「搬屋」去雲端?
我哋要講啲真心說話。你嘅本地瀏覽器其實就係你個人數碼資產嘅「保險箱」:銀行卡密碼、各種帳號嘅 Cookies、支付資料全部喺入面。
一旦你行嘅 Agent 腳本有漏洞,或者執行嘅時候俾啲惡意嘢睇上咗,你嘅私隱數據幾乎就係處於「裸跑」狀態。
再加上,我哋嘅普通電腦設計初衷係攞嚟用,唔係攞嚟做「長工」嘅。你好難保證佢可以好似專業 Server 咁,成年唔熄機仲唔出錯。
所以,如果你追求嘅係長期、高頻咁嘅生產力,我強烈建議你將 Hermes Agent 部署到遠程 VPS(雲 Server)上。呢種從「本地」到「雲端」嘅遷移,對效率嘅提升簡直係「降維打擊」:
物理隔離:將做污糟嘢辛苦嘢嘅腳本鎖入雲端「小黑房」,離你嘅私人數據遠啲。
IP 防封:呢個對做「出海」生意嘅朋友嚟講好重要,雲端 IP 更穩定,唔易俾人封號。
硬核穩定性:Server 係 7x24 小時唔間斷運行嘅,呢個先係真正嘅自動化。
揭秘:AI 係點樣喺「無頭」Server 上面見到網頁嘅?
睇到呢度,好多新朋友肯定會頭痕:
「大劉,Server 就係一個黑框框(command line),連個 mon 都冇,AI 到底係點樣好似真人咁『見到』同操作瀏覽器㗎?」
呢個就係我今日要帶大家搞掂嘅核心科技。
我哋呢套方案主要有三條支柱:
雲端基地:雲 Server + VNC。既然 Server 冇 mon,我哋就用 VNC 喺記憶體裏面俾佢「畫」出一個顯示器出嚟。
安全層:Tailscale。俾你嘅 Server 加上一把「隱形鎖」,只有你自己可以遠程睇佢,黑客連門喺邊度都揾唔到。
天才嘅一公里:人手登入 + AI 接管。最聰明嘅位喺呢度:複雜嘅掃碼、驗證碼,你手動㩒一下,剩下嘅高頻重複勞動,全部交俾 AI。

各位觀眾,請繼續睇落去!
實戰手冊:跟住大劉鬱郁手
唔使擔心 code 或者設定,我哋而家有 Hermes 呢個好幫手,好多嘢直接「吩咐」佢就得。
第一步:打通安全隧道 (Tailscale)
點解一定要用 Tailscale?
為咗安全,我哋一定要用 Tailscale。佢俾每部機器分一個內網 IP,公網 scan 唔到。
呢個都係我一直鍾意 Tailscale 嘅原因,之前對佢都寫過一篇文章:我係點樣掉咗第二部電腦,教你用 Tailscale 穿透公網,遠程辦公自由
安裝 Tailscale
直接對 Hermes 講:
幫我在服務器上裝 Tailscale 並加入我的網絡,完成後告訴我這台機器的 Tailscale IP。

我哋見到喺安裝過程中,會提示你訪問 https://login.tailscale.com/admin/settings/keys ,跟要求 generate key,send 俾 Hermes,完成安裝。

我哋喺雲 Server 終端輸入tailscale status,得到 Tailscale 構建嘅網絡 IP 同機器名稱。

喺後續客戶端設定章節中,喺本地安裝設定 tailscale 之後,你嘅本地電腦同雲 Server 就喺一個「私密羣組」裏便了。
第二步:俾 Server 裝上「眼睛」
簡單介紹嚇涉及嘅兩款軟件。
TigerVNC佢係一款俾你可以遠程睇到同操作另一部電腦桌面嘅軟件。
佢分做兩部分,一個係 TigerVNC Server,一個係 TigerVNC Viewer。
TigerVNC Server 裝喺雲 Server 上,負責將電腦屏幕畫面推出來。
Fluxbox佢係 TigerVNC Server 啓動遠程桌面時,指定嘅圖形界面(session=fluxbox),本方案裏就係俾 Chrome 提供一個可以運行嘅「畫框」,好唔好睇唔重要,慳資源、行得快先係關鍵。
1. 安裝軟件
等我哋習慣安裝軟件,對 Server 嘅設定都俾 Hermes 嚟做,唔使再好似之前咁苦哈哈咁自己嚟做,俾 Hermes 嚟做,佢仲可以將過程 skill 化,你嘅 hermes 會越來越強,越用越順手。
幫我裝 TigerVNC Server + fluxbox 輕量窗口管理器 + Google Chrome

2. 設定 VNC 參數
為你嘅 VNC 遠程桌面連接設定登入密碼:
# 1) 設置 VNC 密碼(交互式,輸入兩遍)
vncpasswd
# 詢問 read-only 密碼時選 n

呢段 code 係喺當前用戶(root)嘅家目錄底下建立設定檔 ~/.vnc/config,設定 VNC 啓動時嘅各項默認參數,直接喺聊天視窗 send 俾 Hermes 就得。
咪俾下面呢堆符號嚇親,呢個其實就係同 Server 交代:「解像度要 1080P,密碼唔好set得太簡單,仲要記得開個門留俾 AI」。
執行下面命令:
把 root 登記為 :1 號顯示的用戶
sudo tee /etc/tigervnc/vncserver.users >/dev/null <<'EOF'
:1=root
EOF
# VNC server 默認參數
mkdir -p ~/.vnc
cat > ~/.vnc/config <<'EOF'
session=fluxbox
geometry=1920x1080
depth=24
localhost=no
alwaysshared
EOF
參數解釋: session=fluxbox:指定 VNC 連接後使用嘅圖形界面(視窗管理器)為fluxbox。呢個就係前面步驟中安裝嘅輕量級桌面環境。geometry=1920x1080:設定遠程桌面嘅解像度,呢度設為 1920x1080(1080P)。depth=24:設定顏色深度為 24位(真彩色),影響畫面嘅色彩顯示效果。localhost=no:允許非本機嘅客戶端連接。如果 set 做 yes,就只可以從 Server 本地連接,遠程就無法連入。alwaysshared:允許幾個用戶同時連接同查看同一個 VNC 桌面會話。如果唔 set,默認情況下一個用戶連入會將另一個用戶踢落線。

建立並俾執行權限俾 VNC 嘅自動啓動腳本( xstartup)
呢段 command 就係喺俾 VNC 遠程桌面寫一個「開機啓動清單」,並俾佢加上可執行嘅權限。
當你連上 VNC 時,佢會自動做兩件事:
第一,啓動一個專門俾 AI 留咗後門(CDP 9222 port)嘅 Chrome 瀏覽器;
第二,啓動 Fluxbox 俾 Chrome 提供一個可以顯示出來嘅「畫框」。
特別要注意嘅係,Chrome 啓動 command 裏面加咗 --user-data-dir=/root/.chrome-debug 呢個參數,呢個係避開 Chrome 新版大坑嘅關鍵,唔加嘅話瀏覽器雖然開到,但 AI 會點都連唔上
其他參數具體係咩意思,你可以直接問 Hermes!我唔佔用文章空間喇。
cat > ~/.vnc/xstartup <<'EOF'
#!/bin/bash
unset SESSION_MANAGER
unset DBUS_SESSION_BUS_ADDRESS
export XDG_SESSION_TYPE=x11
# 啓 Chrome,開 CDP 端口 9222 給龍蝦或Hermes
/opt/google/chrome/chrome \
--no-sandbox \
--disable-gpu \
--disable-software-rasterizer \
--start-maximized \
--no-first-run \
--no-default-browser-check \
--disable-sync \
--disable-translate \
--disable-default-apps \
--user-data-dir=/root/.chrome-debug \
--remote-debugging-port=9222 \
--remote-allow-origins=* \
>/root/.vnc/chrome.log 2>&1 &
# 啓窗口管理器(前台進程,不能放後台,否則會話會退出)
exec fluxbox
EOF
chmod +x ~/.vnc/xstartup

3. 開機啓動
sudo systemctl enable --now tigervncserver@:1.service
sudo systemctl status tigervncserver@:1.service --no-pager | head -15

4. 驗證 Server 端環境
喺 Server 上執行之後,兩個都 OK,Server 端就搞掂曬。
# VNC 應該監聽 5901
ss -tlnp | grep 5901
# Chrome 的 CDP 應該監聽 9222
curl -s http://localhost:9222/json/version | head -20
# 應該返回一坨 JSON,裏面有 "Browser": "Chrome/xxx"

5. 服務端加固安全
默認 localhost=no 會令 5901 對所有網卡監聽,從公網 IP 都可以 scan 到。用 ufw 將佢只留俾 tailscale0 接口:
將以下 command send 俾龍蝦:
sudo ufw allow in on tailscale0 to any port 5901 proto tcp
sudo ufw allow in on tailscale0 to any port 22 proto tcp # 放行本機SSH端口
sudo ufw deny 5901/tcp # 其他所有網卡一律拒絕
sudo ufw default deny incoming
sudo ufw --force enable
sudo ufw status verbose | grep 5901

第三步:本地客戶端連接
1. 裝 Tailscale
訪問官網:https://tailscale.com/download/mac 下載 Tailscale。

注意:登入嘅帳號要同Server 上嗰一部係用同一個,如果唔係兩部機器就唔喺同一張網裏面。
下圖係我打開 Mac 本嘅 Tailscale,可以見到雲 Server vm-0-7-ubuntu 嘅機器名,同上一節執行tailscale status 拎到個名係一致嘅。
即係我哋嘅 tailscale 網絡係搭好咗。

2. 裝 TigerVNC Viewer
TigerVNC Viewer 係裝喺我哋自己電腦上,負責接收同顯示畫面。
喺本方案中,佢主要用嚟幫你「睇實」AI 喺 Server 上操控瀏覽器,當 AI 遇到掃碼登入、過驗證碼等搞唔掂嘅場景時,你可以通過佢隨時切入桌面親手幫忙,實現「平時 AI 自動行,關鍵時刻你手動救返下」嘅人機協作。
vncviewer64-1.16.2.exe,綠色版雙擊就可以行 | |
brew install --cask tigervnc-viewervnc://100.x.x.x:5901 | |
sudo apt install tigervnc-viewer |
打開 TigerVNC Viewer,VNC server 度填你嘅雲 Server 嘅 Tailscale IP:
100.x.x.x:5901

彈密碼框輸入你 vncpasswd 設定嘅密碼。
連上之後你應該見到一個桌面 + 一個已經打開嘅 Chrome 視窗。

翻車現場:我係點樣教 Hermes 出 tweet 嘅
send 指令,驗證我哋呢套方案服務是否正常,send 俾 Hermes。
echo "=== 1) Tailscale 狀態 ==="
tailscale ip -4 || echo"❌ Tailscale 沒裝"
echo"=== 2) VNC 監聽 ==="
ss -tlnp | grep 5901 || echo"❌ VNC 沒起"
echo"=== 3) Chrome CDP ==="
curl -s http://localhost:9222/json/version | grep -q "Chrome" \
&& echo"✅ CDP OK" || echo"❌ Chrome CDP 沒起(先查 user-data-dir)"
echo"=== 4) Chrome 136+ user-data-dir 檢查 ==="
ps -ef | grep chrome | grep -v grep | grep -q "user-data-dir" \
&& echo"✅ 帶了 user-data-dir" || echo"❌ Chrome 沒帶 user-data-dir,CDP 會靜默失敗"
echo"=== 5) 防火牆只對 Tailscale 開 5901 ==="
sudo ufw status | grep "5901"
echo"=== 6) xstartup 可執行 ==="
test -x ~/.vnc/xstartup && echo"✅ OK" || echo"❌ xstartup 無執行權限"

一切 OK,等我哋開始實戰!
為咗幫大家測試穩定性,我親自帶 Hermes 衝咗一波 X (Twitter)。
第一次
上面提到過 VNC 啓動時,會啓動一個專門俾 AI 留咗後門(CDP 9222 port)嘅 Chrome 瀏覽器,其中 CDP 係 Chrome DevTools Protocol(Chrome 開發者工具協議) 嘅縮寫,佢就好似一條「遠程遙控線」,允許外部程式通過網絡 port(本方案中係 9222 port)直接向 Chrome send 指令。
於是 send 俾 Hermes 指令:
幫我通過 CDP 連上 localhost:9222 的 Chrome,打開 https://x.com/home,然後點發推按鈕。

第一次 Hermes 要我提供帳號密碼,結果佢揾我要帳號密碼,我心諗呢個太唔安全喇,萬一模型智商跌線將密碼洩漏咗點算?失敗!
第二次
我嘗試喺 VNC 裏面手動登入 X,然後俾 Hermes 繼續做。結果佢不停提示連唔上。再敗!

第三次:
我調整咗指令,講人話就係:「兄弟,唔好亂估喇,我已經手動登入好咗,你就跟我打開嘅呢個視窗,將 Hello send 出去就得!」結果?一秒搞掂!
具體指令如下:
我連vnc登陸了https://x.com/home x賬號,你發佈內容“hello”然後點post按鈕。 可以考慮CDP HTTP API+WebSocket 直接操作。

神奇嘅一幕出現咗:喺 TigerVNC Viewer 裏面,我清楚咁見到 Hermes 好似真人咁,熟練咁移動 mouse、㩒掣。推文出咗成功!

第四次:
相同嘅指令,重複執行,發現流程仲係唔係好穩定,雖然成功咗,明顯同上次成功嘅路徑唔一樣。


第五次
等我哋 send 簡單指令,都可以達到出 post 嘅預期喇!


最後
發現咗未?如果想得到一個成熟嘅 workflow,目前只可以通過同 Hermes 嘅不停溝通、校正,慢慢培養 Hermes 能力。
如果硬要講有捷徑,就係俾你嘅 Agent 揾個「高學歷大腦」(例如 Gemini 或者 Claude),畢竟聰明啲嘅員工,教一次就可以領略你嘅意圖。
好多人學 AI 編程,往往停喺行通一個簡單嘅腳本。見到 code 行起嚟固然爽,但嗰啲只可以叫「工具」。
我之所以學搞呢套方案,係因為我不嬲覺得:未來嘅「一人公司」,鬥嘅唔係你寫 code 有幾快,而係你手下嘅「數碼員工」有幾穩定。
當你俾 Agent 加上 Tailscale 呢把「安全鎖」同 VNC 呢扇「監控窗」時,你先算真正擁有咗一個可以隨時待命、唔使瞓嘅自動化兵團。
Hermes 已經幫你將最污糟最辛苦嘅嘢做曬,剩下嘅,就睇你點樣指揮佢去攻城掠地喇。
如果你喺設定過程中報咗錯,唔好死頂,記得將錯誤 log 直接塞俾你嘅 Hermes。佢而家已經學識咗呢套 SOP,佢絕對比我更識點樣整返好佢。
你嘅第一個雲端「數碼員工」,準備好俾佢幫你做啲乜?係自動抓取海外情報,定係去 Reddit 做個唔使瞓嘅營運官?
喺留言區話俾我知,我哋一齊碰撞嚇 AI 出海嘅新玩法。
我係大劉,關注唔會迷路,我哋下期見!

大家好,我是大劉。
最近在後台,經常有粉絲私信問我:“大劉,我就在自己電腦上跑 Agent(AI 智能體)挺順手的,不管是寫代碼還是抓數據都挺快。你為什麼非要建議大家花錢、花精力去折騰服務器呢?”
說實話,如果你只是想短期玩玩、跑個 Demo 嚐嚐鮮,本地環境確實最香。
但如果你的野心大一點,想讓 Agent 真正像個“數字員工” 一樣,24 小時不知疲倦地幫你幹活(比如半夜幫你盯着海外市場、自動發帖運營),那本地運行就不只是效率低的問題了,它甚至是在給你的隱私“挖坑”。
為什麼我勸你“搬家”到雲端?
咱們得聊點大實話。你的本地瀏覽器其實就是你個人數字資產的“保險櫃”:銀行卡密碼、各種賬號的 Cookies、支付信息全在裏頭。
一旦你跑的 Agent 腳本有個漏洞,或者運行中被什麼惡意東西盯上了,你的隱私數據幾乎就是處於“裸奔”狀態。
再加上,咱們的普通電腦設計初衷是拿來用的,不是拿來當“長工”的。你很難保證它能像專業服務器那樣,常年不關機還不出錯。
所以,如果你追求的是長期、高頻的生產力,我強烈建議你把 Hermes Agent 部署到遠程 VPS(雲服務器)上。這種從“本地”到“雲端”的遷移,對效率的提升簡直是“降維打擊”:
物理隔離:把幹髒活累活的腳本關進雲端“小黑屋”,離你的私人數據遠一點。
IP 防封:這對做“出海”業務的朋友太重要了,雲端 IP 更穩定,不容易被封號。
硬核穩定性:服務器是 7x24 小時不間斷運行的,這才是真正的自動化。
揭秘:AI 是怎麼在“無頭”服務器上看見網頁的?
看到這兒,很多新朋友肯定會撓頭:
“大劉,服務器就是個黑框框(命令行),連個顯示器都沒有,AI 到底是怎麼像真人一樣‘看見’並操作瀏覽器的?”
這就是我今天要帶大家搞定的核心科技。
咱們這套方案主要有三根支柱:
雲端基地:雲服務器 + VNC。既然服務器沒顯示器,我們就用 VNC 在內存裏給它“畫”出一個顯示器來。
安全層:Tailscale。給你的服務器加上一把“隱形鎖”,只有你自己能遠程看它,黑客連門在哪都找不到。
天才的一公里:人工登錄 + AI 接管。最聰明的點在這:複雜的掃碼、驗證碼,你手動點一下,剩下的高頻重複勞動,全部交給 AI。

眾客觀,請接着看!
實操手冊:跟着大劉動動手
別擔心代碼或配置,咱們現在有 Hermes 這個好幫手,很多活兒直接“吩咐”它就行。
第一步:打通安全隧道 (Tailscale)
為什麼必須走 Tailscale?
為了安全,我們必須用 Tailscale。它給每台機器分一個內網 IP,公網掃不到。
這也是我一直喜歡Tailscale的原因,之前針對它也寫過一篇文章:我是如何丟掉第二台電腦,教你用 Tailscale 穿透公網,遠程辦公自由的
安裝Tailscale
直接對hermes說:
幫我在服務器上裝 Tailscale 並加入我的網絡,完成後告訴我這台機器的 Tailscale IP。

我們看到在安裝過程中,提示你訪問 https://login.tailscale.com/admin/settings/keys ,按要求生成key,發給Hermes,完成安裝。

我們在雲服務器終端輸入tailscale status,得到Tailscale構建的網絡IP和機器名稱。

在後續客戶端配置章節中,在本地安裝配置tailscale後,你的本地電腦和雲服務器就在一個“私密羣聊”裏了。
第二步:給服務器裝上“眼睛”
簡單介紹下涉及到的兩款軟件。
TigerVNC它是一款讓你能遠程看到和操作另一台電腦桌面的軟件。
它分為兩部分,一個是TigerVNC Server,一個是 TigerVNC Viewer。
TigerVNC Server”裝在雲服務器上,負責把電腦屏幕畫面推出來。
Fluxbox它是 TigerVNC Server 啓動遠程桌面時,指定的圖形界面(session=fluxbox),本方案裏就是給Chrome提供一個能運行的“畫框”,好看不重要,省資源、跑得快才是關鍵。
1. 安裝軟件
讓我們習慣安裝軟件,對服務器的配置都讓Hermes來做,不用再像之前那樣苦哈哈的人來做,讓Hermes來做,他還能將過程skill化,你的hermes會越來越強,越用越順手。
幫我裝 TigerVNC Server + fluxbox 輕量窗口管理器 + Google Chrome

2. 設置VNC參數
為你的VNC遠程桌面連接設置登錄密碼:
# 1) 設置 VNC 密碼(交互式,輸入兩遍)
vncpasswd
# 詢問 read-only 密碼時選 n

這段代碼是在當前用戶(root)的家目錄下創建配置文件 ~/.vnc/config,設定 VNC 啓動時的各項默認參數,直接在聊天窗口中發給hermes就成。
別被下面這堆符號嚇到,這其實就是在給服務器交代:‘分辨率要 1080P,密碼別設太簡單,還要記得開個門留給 AI’。
執行下面命令:
把 root 登記為 :1 號顯示的用戶
sudo tee /etc/tigervnc/vncserver.users >/dev/null <<'EOF'
:1=root
EOF
# VNC server 默認參數
mkdir -p ~/.vnc
cat > ~/.vnc/config <<'EOF'
session=fluxbox
geometry=1920x1080
depth=24
localhost=no
alwaysshared
EOF
參數詳解: session=fluxbox:指定 VNC 連接後使用的圖形界面(窗口管理器)為fluxbox。這就是前面步驟中安裝的輕量級桌面環境。geometry=1920x1080:設置遠程桌面的分辨率,這裏設為 1920x1080(1080P)。depth=24:設置顏色深度為 24位(真彩色),影響畫面的色彩顯示效果。localhost=no:允許非本機的客戶端連接。如果設為 yes,則只能從服務器本地連接,遠程將無法連入。alwaysshared:允許多個用戶同時連接並查看同一個 VNC 桌面會話。如果不設置,默認情況下一個用戶連入會把另一個用戶踢下線。

創建並賦予執行權限給VNC的自動啓動腳本( xstartup)
這段命令就是在給VNC遠程桌面寫一個“開機啓動清單”,並給它加上可執行的權限。
當你連上VNC時,它會自動做兩件事:
第一,啓動一個專門給AI留了後門(CDP 9222端口)的Chrome瀏覽器;
第二,啓動Fluxbox給Chrome提供一個能顯示出來的“畫框”。
特別要注意的是,Chrome啓動命令里加了 --user-data-dir=/root/.chrome-debug 這個參數,這是避開Chrome新版大坑的關鍵,不加的話瀏覽器雖然能開,但AI會死活連不上
其它參數具體是什麼意思,你可以直接問Hermes! 我就不佔用文章空間了。
cat > ~/.vnc/xstartup <<'EOF'
#!/bin/bash
unset SESSION_MANAGER
unset DBUS_SESSION_BUS_ADDRESS
export XDG_SESSION_TYPE=x11
# 啓 Chrome,開 CDP 端口 9222 給龍蝦或Hermes
/opt/google/chrome/chrome \
--no-sandbox \
--disable-gpu \
--disable-software-rasterizer \
--start-maximized \
--no-first-run \
--no-default-browser-check \
--disable-sync \
--disable-translate \
--disable-default-apps \
--user-data-dir=/root/.chrome-debug \
--remote-debugging-port=9222 \
--remote-allow-origins=* \
>/root/.vnc/chrome.log 2>&1 &
# 啓窗口管理器(前台進程,不能放後台,否則會話會退出)
exec fluxbox
EOF
chmod +x ~/.vnc/xstartup

3. 開機啓動
sudo systemctl enable --now tigervncserver@:1.service
sudo systemctl status tigervncserver@:1.service --no-pager | head -15

4. 驗證服務器端環境
在服務器上執行後,兩個都 OK,服務器端就齊活了。
# VNC 應該監聽 5901
ss -tlnp | grep 5901
# Chrome 的 CDP 應該監聽 9222
curl -s http://localhost:9222/json/version | head -20
# 應該返回一坨 JSON,裏面有 "Browser": "Chrome/xxx"

5. 服務端加固安全
默認 localhost=no 會讓 5901 對所有網卡監聽,從公網 IP 也能掃到。用 ufw 把它只留給 tailscale0 接口:
把以下命令發給龍蝦:
sudo ufw allow in on tailscale0 to any port 5901 proto tcp
sudo ufw allow in on tailscale0 to any port 22 proto tcp # 放行本機SSH端口
sudo ufw deny 5901/tcp # 其他所有網卡一律拒絕
sudo ufw default deny incoming
sudo ufw --force enable
sudo ufw status verbose | grep 5901

第三步:本地客戶端連接
1. 裝 Tailscale
訪問官網:https://tailscale.com/download/mac 下載Tailscale。

注意:登錄的賬號要和服務器上那一台用的是同一個,不然兩台機器不在一張網裏。
下圖是我打開mac本的Tailscale,可以看到雲服務器vm-0-7-ubuntu的機器名,和上一節執行tailscale status 拿到名稱是一致的。
說明我們的tailscale網絡是搭建好了。

2. 裝 TigerVNC Viewer
TigerVNC Viewer是裝在我們自己電腦上,負責接收並顯示畫面。
在本方案中,它主要用來幫你“盯着”AI在服務器上操控瀏覽器,當AI遇到掃碼登錄、過驗證碼等搞不定的場景時,你可以通過它隨時切入桌面親自動手幫忙,實現“平時AI自動跑,關鍵時刻你手動救一下”的人機協作。
vncviewer64-1.16.2.exe,綠色版雙擊就能跑 | |
brew install --cask tigervnc-viewervnc://100.x.x.x:5901 | |
sudo apt install tigervnc-viewer |
打開 TigerVNC Viewer,VNC server 中填你的雲服務器的 Tailscale IP:
100.x.x.x:5901

彈密碼框輸你 vncpasswd 設的密碼。
連上後你應該看到一個桌面 + 一個已經打開的 Chrome 窗口。

翻車現場:我是怎麼教 Hermes 發推特的
發送指令,驗證我們的這套方案服務是否正常,發給Hermes。
echo "=== 1) Tailscale 狀態 ==="
tailscale ip -4 || echo"❌ Tailscale 沒裝"
echo"=== 2) VNC 監聽 ==="
ss -tlnp | grep 5901 || echo"❌ VNC 沒起"
echo"=== 3) Chrome CDP ==="
curl -s http://localhost:9222/json/version | grep -q "Chrome" \
&& echo"✅ CDP OK" || echo"❌ Chrome CDP 沒起(先查 user-data-dir)"
echo"=== 4) Chrome 136+ user-data-dir 檢查 ==="
ps -ef | grep chrome | grep -v grep | grep -q "user-data-dir" \
&& echo"✅ 帶了 user-data-dir" || echo"❌ Chrome 沒帶 user-data-dir,CDP 會靜默失敗"
echo"=== 5) 防火牆只對 Tailscale 開 5901 ==="
sudo ufw status | grep "5901"
echo"=== 6) xstartup 可執行 ==="
test -x ~/.vnc/xstartup && echo"✅ OK" || echo"❌ xstartup 無執行權限"

一切OK,讓我們開始實戰!
為了幫大家測試穩定性,我親自帶 Hermes 衝了一波 X (Twitter)。
第一次
上面提到過VNC啓動時,會啓動一個專門給AI留了後門(CDP 9222端口)的Chrome瀏覽器,其中CDP 是 Chrome DevTools Protocol(Chrome 開發者工具協議) 的縮寫,它就像是一根“遠程遙控線”,允許外部程序通過網絡端口(本方案中是 9222 端口)直接向 Chrome 發送指令。
於是發給hermes指令:
幫我通過 CDP 連上 localhost:9222 的 Chrome,打開 https://x.com/home,然後點發推按鈕。

第一次hermes要我提供賬號密碼,結果它找我要賬號密碼,我心想這太不安全了,萬一模型智商掉線把密碼泄露了怎麼辦?失敗!
第二次
我嘗試在 VNC 裏手動登錄 X,然後讓 Hermes 接着幹。結果它反覆提示連不上。再敗!

第三次:
我調整了指令,說人說就是:‘兄弟,別瞎猜了,我已經手動登好了,你就順着我打開的這個窗口,把 Hello 發出去就行!’ 結果?秒成!
具體指令如下:
我連vnc登陸了https://x.com/home x賬號,你發佈內容“hello”然後點post按鈕。 可以考慮CDP HTTP API+WebSocket 直接操作。

神奇的一幕出現了:在 TigerVNC Viewer 裏,我清晰地看到 Hermes 像個真人一樣,熟練地移動鼠標、點擊按鈕。推文發佈成功!

第四次:
相同的指令,重複執行,發現流程還不是很穩定,雖然成功了,明顯和上次成功的路徑不一樣。


第五次
讓我們發送簡單指令,也能達到發佈的預期了!


最後
發現沒?如果想得到一個成熟的工作流,目前只能通過和Hermes的反覆溝通,校正,慢慢培養Hermes能力。
如果非要說有捷徑,那就是給你的 Agent 找個‘高學歷大腦’(比如 Gemini 或者 Claude),畢竟聰明點的員工,教一遍就能領悟你的意圖。
很多人學 AI 編程,往往止步於跑通一個簡單的腳本。看着代碼動起來固然爽,但那隻能叫“工具”。
我之所以學習折騰這套方案,是因為我始終覺得:未來的“一人公司”,拼的不是你寫代碼有多快,而是你麾下的“數字員工”有多穩。
當你給 Agent 加上 Tailscale 這把“安全鎖”和 VNC 這扇“監控窗”時,你才算真正擁有了一個可以隨時待命、不眠不休的自動化兵團。
Hermes 已經幫你把最髒最累的活兒幹了,剩下的,就看你如何指揮它去攻城略地了。
如果你在配置過程中報錯了,別硬扛,記得把錯誤日誌直接塞給你的 Hermes。它現在已經學會了這套 SOP,它絕對比我更懂怎麼修好它。
你的第一個雲端“數字員工”,準備讓它幫你乾點什麼?是自動抓取海外情報,還是去 Reddit 當個不睡覺的運營官?
在評論區告訴我,咱們一起碰撞下 AI 出海的新玩法。
我是大劉,關注不迷路,咱們下期見!

