我是如何教 Hermes 在雲端自動發推特的?(內含翻車經歷)

作者:大劉AI編程
日期:2026年4月30日 上午12:30
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

部署 Hermes 到雲端:從翻車到穩定發推嘅實戰指南

整理版摘要

呢篇文章係由大劉寫嘅,佢係Hermes Agent嘅推廣者。文章主要想解決一個問題:點解要將AI Agent由本地電腦搬去雲端VPS?大劉認為,本地運行雖然方便,但存在嚴重安全隱患(瀏覽器存放密碼同Cookies),而且好難做到7x24小時穩定運行。佢嘅整體結論係:如果追求長期、高頻嘅自動化生產力,雲端部署先係唯一出路。

文章詳細講解咗部署方案嘅三大支柱:用Tailscale建立安全隧道,防止公網掃描;用VNC加Fluxbox喺服務器內存模擬出一個顯示器,令AI可以「睇見」網頁;同埋開Chrome嘅CDP端口(9222),等Hermes可以遙控瀏覽器。大劉仲分享咗佢親身教Hermes發推嘅翻車經歷:第一次叫佢直接登錄X,結果要求畀密碼(唔安全);第二次手動登錄後,Hermes又話連唔上;第三次調整指令,明確話「我已經登好,你順住呢個窗口操作」,先成功發佈。之後重複執行發現流程唔穩定,要反覆溝通校正先得到成熟工作流。佢建議用Gemini或Claude呢類「高學歷大腦」可以減少調試次數。

最後,大劉指出未來「一人公司」嘅核心競爭力唔係寫代碼速度,而係麾下「數字員工」嘅穩定性。佢鼓勵讀者唔好死磕本地,要善用雲端工具,遇到錯誤直接將日誌畀Hermes,因為佢已經學識呢套SOP。文章整體係一篇實戰向嘅部署指南,適合想將AI Agent真正投入生產嘅讀者。

  • 雲端部署係實現24小時自動化嘅唯一可靠方式,安全同效率都遠超本地。
  • 方法:用Tailscale建立私密網絡、VNC+Fluxbox模擬顯示器、Chrome CDP端口俾AI遙控。
  • 差異:本地易洩漏隱私、難以長時間運行;雲端物理隔離、IP穩定、7x24小時不間斷。
  • 啟發:AI操作瀏覽器時,唔好畀佢自行處理登錄,應該人手登錄後先交控制權。
  • 可行動點:遇錯誤直接將日誌貼畀Hermes,佢學過SOP就會識得點修;如果用Gemini或Claude呢類高學歷大腦,調試次數會少好多。
值得記低
流程

部署Hermes到雲端VPS

包括安裝Tailscale、TigerVNC Server、Fluxbox、Chrome;設定VNC密碼同xstartup腳本;開CDP端口;用ufw限制只畀Tailscale訪問VNC。

Prompt

提示Hermes安裝軟件

『幫我裝 TigerVNC Server + fluxbox 輕量窗口管理器 + Google Chrome』

Prompt x.com

提示Hermes發推

『我連vnc登陸咗 x賬號,你發佈內容“hello”然後點post按鈕。可以考慮CDP HTTP API+WebSocket 直接操作。』

整理重點

點解要搬去雲端?

如果你只係想短期跑個Demo,本地環境確實最香。但係如果你想讓Agent變成數字員工,24小時唔知疲倦咁幫你幹活,本地運行就唔單止效率低,甚至會洩漏你嘅密碼同Cookies

整理重點

核心科技:Tailscale + VNC + CDP

服務器得個黑框框(命令行),點樣令AI「睇見」網頁?呢套方案靠三根支柱:雲端基地(雲服務器+VNC)、安全層(Tailscale)、同埋天才的一公里(人工登錄+AI接管)。

服務器用 VNC 喺內存畫出一個顯示器,AI 透過 ChromeCDP 端口(9222)遙控瀏覽器,咁就似真人一樣操作網頁。

Tailscale 為每部機分配一個內網IP,公網掃唔到,等於加咗把隱形鎖。而家你只係需要手動搞掂複雜嘅掃碼驗證,之後高頻重複勞動全部交畀 AI。

整理重點

一步一步動手做

唔好怕啲命令,而家有Hermes幫手,直接吩咐佢就得。下面係部署嘅主要步驟:

  1. 1 用Tailscale打通安全隧道:向Hermes講「幫我喺服務器上裝Tailscale並加入我嘅網絡,完成後話畀我知呢部機嘅Tailscale IP」。
  2. 2 安裝VNC+Chrome:叫Hermes「幫我裝 TigerVNC Server + fluxbox 輕量窗口管理器 + Google Chrome」。
  3. 3 設定VNC密碼同默認參數:執行 vncpasswd 設定密碼,再寫入 ~/.vnc/config,包括分辨率1080P、允許遠程連接等。
  4. 4 創建啟動腳本 xstartup:內容係啟動Chrome(開CDP 9222端口)同Fluxbox。特別注意 --user-data-dir=/root/.chrome-debug 呢個參數,唔加嘅話AI會連唔上Chrome。
  5. 5 開機啟用VNC服務:sudo systemctl enable --now tigervncserver@:1.service,然後驗證 VNC 監聽5901、Chrome CDP回傳JSON
  6. 6 加固安全:用ufw設定只允許來自tailscale0接口嘅5901端口,其他網卡一律拒絕。
xstartup 腳本 bash
#!/bin/bash
unset SESSION_MANAGER
unset DBUS_SESSION_BUS_ADDRESS
export XDG_SESSION_TYPE=x11

/opt/google/chrome/chrome \
 --no-sandbox \
 --disable-gpu \
 --disable-software-rasterizer \
 --start-maximized \
 --no-first-run \
 --no-default-browser-check \
 --disable-sync \
 --disable-translate \
 --disable-default-apps \
 --user-data-dir=/root/.chrome-debug \
 --remote-debugging-port=9222 \
 --remote-allow-origins=* \
 >/root/.vnc/chrome.log 2>&1 &

exec fluxbox
整理重點

翻車現場:教 Hermes 發推

一切準備就緒,我親身帶Hermes衝咗一波X(Twitter),過程真係一波三折。

  • 第一次:叫Hermes幫我登錄X,結果佢問我要賬號密碼——呢個做法太危險,萬一模型智商掉線洩漏密碼就大件事。
  • 第二次:我手動喺VNC登錄咗X,然後叫Hermes繼續,但佢反覆話連唔上。
  • 第三次:我調整指令,講明「我已經手動登好,你順住呢個窗口,將Hello發出去就得」。結果秒成!
  • 第四次:用同一指令重複執行,發現流程唔穩定,每次操作路徑都唔同。
  • 第五次:繼續調試,終於可以簡單指令穩定發佈。

如果想得到成熟工作流,目前只能靠反覆溝通校正,慢慢培養Hermes能力。高學歷大腦(例如GeminiClaude)可以減少調試次數,因為聰明啲嘅員工教一遍就領悟你嘅意圖。

整理重點

一人公司嘅自動化兵團

未來嘅「一人公司」,拼嘅唔係寫代碼有幾快,而係你麾下數字員工有幾穩。當你幫Agent加上Tailscale呢把安全鎖同VNC呢扇監控窗,你就真正擁有一個可以隨時待命、不眠不休嘅自動化兵團。

遇到錯誤唔好硬扛,直接將錯誤日誌塞畀Hermes,佢已經學識呢套SOP,絕對比你自己摸索更識得點修。

你嘅第一個雲端數字員工,準備好叫佢幫你做啲咩?係自動抓取海外情報,定係去Reddit做個唔使瞓嘅運營官?喺評論區話畀大劉知,一齊碰撞AI出海嘅新玩法。

大家好,我係大劉。

最近喺後台,成日有粉絲私信問我:「大劉,我就喺自己電腦度行 Agent(AI 智能體)好順手,無論係寫 code 定係抓數據都好快。你點解一定要建議大家使錢、花心機去搞 Server 呢?」

講真,如果你只係想短期玩嚇、行個 Demo 試嚇新鮮,本地環境的確最正。

但如果你的野心大啲,想俾 Agent 真正好似一個「數碼員工」咁,24 小時唔知疲倦咁幫你做嘢(例如半夜幫你睇實海外市場、自動出 post 營運),咁本地行就唔只係效率低嘅問題,佢甚至係喺度幫你嘅私隱「挖坑」。

點解我勸你「搬屋」去雲端?

我哋要講啲真心說話。你嘅本地瀏覽器其實就係你個人數碼資產嘅「保險箱」:銀行卡密碼、各種帳號嘅 Cookies、支付資料全部喺入面。

一旦你行嘅 Agent 腳本有漏洞,或者執行嘅時候俾啲惡意嘢睇上咗,你嘅私隱數據幾乎就係處於「裸跑」狀態。

再加上,我哋嘅普通電腦設計初衷係攞嚟用,唔係攞嚟做「長工」嘅。你好難保證佢可以好似專業 Server 咁,成年唔熄機仲唔出錯。

所以,如果你追求嘅係長期、高頻咁嘅生產力,我強烈建議你將 Hermes Agent 部署到遠程 VPS(雲 Server)上。呢種從「本地」到「雲端」嘅遷移,對效率嘅提升簡直係「降維打擊」:

  • 物理隔離:將做污糟嘢辛苦嘢嘅腳本鎖入雲端「小黑房」,離你嘅私人數據遠啲。

  • IP 防封:呢個對做「出海」生意嘅朋友嚟講好重要,雲端 IP 更穩定,唔易俾人封號。

  • 硬核穩定性:Server 係 7x24 小時唔間斷運行嘅,呢個先係真正嘅自動化。

揭秘:AI 係點樣喺「無頭」Server 上面見到網頁嘅?

睇到呢度,好多新朋友肯定會頭痕:

「大劉,Server 就係一個黑框框(command line),連個 mon 都冇,AI 到底係點樣好似真人咁『見到』同操作瀏覽器㗎?」

呢個就係我今日要帶大家搞掂嘅核心科技

我哋呢套方案主要有三條支柱:

  1. 雲端基地:雲 Server + VNC。既然 Server 冇 mon,我哋就用 VNC 喺記憶體裏面俾佢「畫」出一個顯示器出嚟。

  2. 安全層:Tailscale。俾你嘅 Server 加上一把「隱形鎖」,只有你自己可以遠程睇佢,黑客連門喺邊度都揾唔到。

  3. 天才嘅一公里人手登入 + AI 接管。最聰明嘅位喺呢度:複雜嘅掃碼、驗證碼,你手動㩒一下,剩下嘅高頻重複勞動,全部交俾 AI。

    圖片


你係咪需要關於點樣設定 Tailscale 或者喺 Linux Server 上面搭建 VNC 環境嘅詳細步驟?

各位觀眾,請繼續睇落去!

實戰手冊:跟住大劉鬱郁手

唔使擔心 code 或者設定,我哋而家有 Hermes 呢個好幫手,好多嘢直接「吩咐」佢就得。

第一步:打通安全隧道 (Tailscale)

點解一定要用 Tailscale?

為咗安全,我哋一定要用 Tailscale。佢俾每部機器分一個內網 IP,公網 scan 唔到。

呢個都係我一直鍾意 Tailscale 嘅原因,之前對佢都寫過一篇文章:我係點樣掉咗第二部電腦,教你用 Tailscale 穿透公網,遠程辦公自由

安裝 Tailscale

直接對 Hermes 講:

幫我在服務器上裝 Tailscale 並加入我的網絡,完成後告訴我這台機器的 Tailscale IP。
圖片

我哋見到喺安裝過程中,會提示你訪問 https://login.tailscale.com/admin/settings/keys ,跟要求 generate key,send 俾 Hermes,完成安裝。

圖片

我哋喺雲 Server 終端輸入tailscale status,得到 Tailscale 構建嘅網絡 IP 同機器名稱。

圖片

喺後續客戶端設定章節中,喺本地安裝設定 tailscale 之後,你嘅本地電腦同雲 Server 就喺一個「私密羣組」裏便了。

第二步:俾 Server 裝上「眼睛」

簡單介紹嚇涉及嘅兩款軟件。

TigerVNC佢係一款俾你可以遠程睇到同操作另一部電腦桌面嘅軟件。

佢分做兩部分,一個係 TigerVNC Server,一個係 TigerVNC Viewer。

TigerVNC Server 裝喺雲 Server 上,負責將電腦屏幕畫面推出來。

Fluxbox佢係 TigerVNC Server 啓動遠程桌面時,指定嘅圖形界面(session=fluxbox),本方案裏就係俾 Chrome 提供一個可以運行嘅「畫框」,好唔好睇唔重要,慳資源、行得快先係關鍵。

1. 安裝軟件

等我哋習慣安裝軟件,對 Server 嘅設定都俾 Hermes 嚟做,唔使再好似之前咁苦哈哈咁自己嚟做,俾 Hermes 嚟做,佢仲可以將過程 skill 化,你嘅 hermes 會越來越強,越用越順手。

幫我裝 TigerVNC Server + fluxbox 輕量窗口管理器 + Google Chrome
圖片

2. 設定 VNC 參數

  1. 為你嘅 VNC 遠程桌面連接設定登入密碼:
# 1) 設置 VNC 密碼(交互式,輸入兩遍)
vncpasswd
# 詢問 read-only 密碼時選 n
圖片
  1. 呢段 code 係喺當前用戶(root)嘅家目錄底下建立設定檔 ~/.vnc/config,設定 VNC 啓動時嘅各項默認參數,直接喺聊天視窗 send 俾 Hermes 就得。

咪俾下面呢堆符號嚇親,呢個其實就係同 Server 交代:「解像度要 1080P,密碼唔好set得太簡單,仲要記得開個門留俾 AI」。

執行下面命令:

把 root 登記為 :1 號顯示的用戶

sudo tee /etc/tigervnc/vncserver.users >/dev/null <<'EOF'

:1=root

EOF

#  VNC server 默認參數

mkdir -p ~/.vnc

cat > ~/.vnc/config <<'EOF'

session=fluxbox

geometry=1920x1080

depth=24

localhost=no

alwaysshared

EOF
  • 參數解釋
    • session=fluxbox:指定 VNC 連接後使用嘅圖形界面(視窗管理器)為 fluxbox。呢個就係前面步驟中安裝嘅輕量級桌面環境。
    • geometry=1920x1080:設定遠程桌面嘅解像度,呢度設為 1920x1080(1080P)。
    • depth=24:設定顏色深度為 24位(真彩色),影響畫面嘅色彩顯示效果。
    • localhost=no:允許非本機嘅客戶端連接。如果 set 做 yes,就只可以從 Server 本地連接,遠程就無法連入。
    • alwaysshared:允許幾個用戶同時連接同查看同一個 VNC 桌面會話。如果唔 set,默認情況下一個用戶連入會將另一個用戶踢落線。
圖片
  1. 建立並俾執行權限俾 VNC 嘅自動啓動腳本(xstartup

呢段 command 就係喺俾 VNC 遠程桌面寫一個「開機啓動清單」,並俾佢加上可執行嘅權限。

當你連上 VNC 時,佢會自動做兩件事:

第一,啓動一個專門俾 AI 留咗後門(CDP 9222 port)嘅 Chrome 瀏覽器;

第二,啓動 Fluxbox 俾 Chrome 提供一個可以顯示出來嘅「畫框」。

特別要注意嘅係,Chrome 啓動 command 裏面加咗 --user-data-dir=/root/.chrome-debug 呢個參數,呢個係避開 Chrome 新版大坑嘅關鍵,唔加嘅話瀏覽器雖然開到,但 AI 會點都連唔上

其他參數具體係咩意思,你可以直接問 Hermes!我唔佔用文章空間喇。

cat > ~/.vnc/xstartup <<'EOF'
#!/bin/bash
unset SESSION_MANAGER
unset DBUS_SESSION_BUS_ADDRESS
export XDG_SESSION_TYPE=x11

# 啓 Chrome,開 CDP 端口 9222 給龍蝦或Hermes
/opt/google/chrome/chrome \
  --no-sandbox \
  --disable-gpu \
  --disable-software-rasterizer \
  --start-maximized \
  --no-first-run \
  --no-default-browser-check \
  --disable-sync \
  --disable-translate \
  --disable-default-apps \
  --user-data-dir=/root/.chrome-debug \
  --remote-debugging-port=9222 \
  --remote-allow-origins=* \
  >/root/.vnc/chrome.log 2>&1 &

# 啓窗口管理器(前台進程,不能放後台,否則會話會退出)
exec fluxbox
EOF
chmod +x ~/.vnc/xstartup
圖片

3. 開機啓動

sudo systemctl enable --now tigervncserver@:1.service
sudo systemctl status tigervncserver@:1.service --no-pager | head -15
圖片

4. 驗證 Server 端環境

喺 Server 上執行之後,兩個都 OK,Server 端就搞掂曬。

# VNC 應該監聽 5901
ss -tlnp | grep 5901

# Chrome 的 CDP 應該監聽 9222
curl -s http://localhost:9222/json/version | head -20
# 應該返回一坨 JSON,裏面有 "Browser": "Chrome/xxx"
圖片

5. 服務端加固安全

默認 localhost=no 會令 5901 對所有網卡監聽,從公網 IP 都可以 scan 到。用 ufw 將佢只留俾 tailscale0 接口

將以下 command send 俾龍蝦:

sudo ufw allow in on tailscale0 to any port 5901 proto tcp
sudo ufw allow in on tailscale0 to any port 22 proto tcp # 放行本機SSH端口
sudo ufw deny 5901/tcp       # 其他所有網卡一律拒絕
sudo ufw default deny incoming
sudo ufw --force enable
sudo ufw status verbose | grep 5901
圖片

第三步:本地客戶端連接

1. 裝 Tailscale

訪問官網:https://tailscale.com/download/mac 下載 Tailscale。

圖片

注意:登入嘅帳號要同Server 上嗰一部係用同一個,如果唔係兩部機器就唔喺同一張網裏面。

下圖係我打開 Mac 本嘅 Tailscale,可以見到雲 Server vm-0-7-ubuntu 嘅機器名,同上一節執行tailscale status 拎到個名係一致嘅。

即係我哋嘅 tailscale 網絡係搭好咗。

圖片

2. 裝 TigerVNC Viewer

TigerVNC Viewer 係裝喺我哋自己電腦上,負責接收同顯示畫面。

喺本方案中,佢主要用嚟幫你「睇實」AI 喺 Server 上操控瀏覽器,當 AI 遇到掃碼登入、過驗證碼等搞唔掂嘅場景時,你可以通過佢隨時切入桌面親手幫忙,實現「平時 AI 自動行,關鍵時刻你手動救返下」嘅人機協作。

系統
安裝方式
Windows
打開 https://sourceforge.net/projects/tigervnc/files/stable/1.16.2/ 下 vncviewer64-1.16.2.exe,綠色版雙擊就可以行
macOS
brew install --cask tigervnc-viewer
,或者系統自帶訪達 → 前往 → 連接 Server →vnc://100.x.x.x:5901
Linux
sudo apt install tigervnc-viewer

打開 TigerVNC Viewer,VNC server 度填你嘅雲 Server 嘅 Tailscale IP:

100.x.x.x:5901
圖片

彈密碼框輸入你 vncpasswd 設定嘅密碼。圖片

連上之後你應該見到一個桌面 + 一個已經打開嘅 Chrome 視窗。

圖片

翻車現場:我係點樣教 Hermes 出 tweet 嘅

send 指令,驗證我哋呢套方案服務是否正常,send 俾 Hermes。

echo "=== 1) Tailscale 狀態 ==="
tailscale ip -4 || echo"❌ Tailscale 沒裝"

echo"=== 2) VNC 監聽 ==="
ss -tlnp | grep 5901 || echo"❌ VNC 沒起"

echo"=== 3) Chrome CDP ==="
curl -s http://localhost:9222/json/version | grep -q "Chrome" \
  && echo"✅ CDP OK" || echo"❌ Chrome CDP 沒起(先查 user-data-dir)"

echo"=== 4) Chrome 136+ user-data-dir 檢查 ==="
ps -ef | grep chrome | grep -v grep | grep -q "user-data-dir" \
  && echo"✅ 帶了 user-data-dir" || echo"❌ Chrome 沒帶 user-data-dir,CDP 會靜默失敗"

echo"=== 5) 防火牆只對 Tailscale 開 5901 ==="
sudo ufw status | grep "5901"

echo"=== 6) xstartup 可執行 ==="
test -x ~/.vnc/xstartup && echo"✅ OK" || echo"❌ xstartup 無執行權限"
圖片

一切 OK,等我哋開始實戰!

為咗幫大家測試穩定性,我親自帶 Hermes 衝咗一波 X (Twitter)。

第一次

上面提到過 VNC 啓動時,會啓動一個專門俾 AI 留咗後門(CDP 9222 port)嘅 Chrome 瀏覽器,其中 CDP 係 Chrome DevTools Protocol(Chrome 開發者工具協議) 嘅縮寫,佢就好似一條「遠程遙控線」,允許外部程式通過網絡 port(本方案中係 9222 port)直接向 Chrome send 指令。

於是 send 俾 Hermes 指令:

幫我通過 CDP 連上 localhost:9222 的 Chrome,打開 https://x.com/home,然後點發推按鈕。
圖片

第一次 Hermes 要我提供帳號密碼,結果佢揾我要帳號密碼,我心諗呢個太唔安全喇,萬一模型智商跌線將密碼洩漏咗點算?失敗!

第二次

我嘗試喺 VNC 裏面手動登入 X,然後俾 Hermes 繼續做。結果佢不停提示連唔上。再敗!

圖片

第三次:

我調整咗指令,講人話就係:「兄弟,唔好亂估喇,我已經手動登入好咗,你就跟我打開嘅呢個視窗,將 Hello send 出去就得!」結果?一秒搞掂!

具體指令如下:

我連vnc登陸了https://x.com/home x賬號,你發佈內容“hello”然後點post按鈕。 可以考慮CDP HTTP API+WebSocket 直接操作。

圖片

神奇嘅一幕出現咗:喺 TigerVNC Viewer 裏面,我清楚咁見到 Hermes 好似真人咁,熟練咁移動 mouse、㩒掣。推文出咗成功!

圖片

第四次:

相同嘅指令,重複執行,發現流程仲係唔係好穩定,雖然成功咗,明顯同上次成功嘅路徑唔一樣。

圖片圖片

第五次

等我哋 send 簡單指令,都可以達到出 post 嘅預期喇!

圖片圖片

最後

發現咗未?如果想得到一個成熟嘅 workflow,目前只可以通過同 Hermes 嘅不停溝通、校正,慢慢培養 Hermes 能力。

如果硬要講有捷徑,就係俾你嘅 Agent 揾個「高學歷大腦」(例如 Gemini 或者 Claude),畢竟聰明啲嘅員工,教一次就可以領略你嘅意圖。

好多人學 AI 編程,往往停喺行通一個簡單嘅腳本。見到 code 行起嚟固然爽,但嗰啲只可以叫「工具」。

我之所以學搞呢套方案,係因為我不嬲覺得:未來嘅「一人公司」,鬥嘅唔係你寫 code 有幾快,而係你手下嘅「數碼員工」有幾穩定。

當你俾 Agent 加上 Tailscale 呢把「安全鎖」同 VNC 呢扇「監控窗」時,你先算真正擁有咗一個可以隨時待命、唔使瞓嘅自動化兵團。

Hermes 已經幫你將最污糟最辛苦嘅嘢做曬,剩下嘅,就睇你點樣指揮佢去攻城掠地喇。

如果你喺設定過程中報咗錯,唔好死頂,記得將錯誤 log 直接塞俾你嘅 Hermes。佢而家已經學識咗呢套 SOP,佢絕對比我更識點樣整返好佢。

你嘅第一個雲端「數碼員工」,準備好俾佢幫你做啲乜?係自動抓取海外情報,定係去 Reddit 做個唔使瞓嘅營運官?

喺留言區話俾我知,我哋一齊碰撞嚇 AI 出海嘅新玩法。

我係大劉,關注唔會迷路,我哋下期見!

圖片
更多文章:
由 OpenClaw 到 Hermes:點樣令幾個 AI 助手喺 Telegram 羣組入面幫你打工?
全流程圖文部署!將 Hermes 塞入你嘅微信、飛書同 TG,打造 24 小時在線嘅 AI 助手
8.7萬星神作!Hermes Agent 深度拆解(下):由「金魚腦」到「神助攻」,佢嘅手腳同大腦係點樣生嘅?
8.7萬星神作!Hermes Agent 深度拆解(上):好似職場精英咁自動進化
唔好再死磕 OpenClaw 喇!我點解勸你轉戰 Hermes?

大家好,我是大劉。

最近在後台,經常有粉絲私信問我:“大劉,我就在自己電腦上跑 Agent(AI 智能體)挺順手的,不管是寫代碼還是抓數據都挺快。你為什麼非要建議大家花錢、花精力去折騰服務器呢?”

說實話,如果你只是想短期玩玩、跑個 Demo 嚐嚐鮮,本地環境確實最香。

但如果你的野心大一點,想讓 Agent 真正像個“數字員工” 一樣,24 小時不知疲倦地幫你幹活(比如半夜幫你盯着海外市場、自動發帖運營),那本地運行就不只是效率低的問題了,它甚至是在給你的隱私“挖坑”。

為什麼我勸你“搬家”到雲端?

咱們得聊點大實話。你的本地瀏覽器其實就是你個人數字資產的“保險櫃”:銀行卡密碼、各種賬號的 Cookies、支付信息全在裏頭。

一旦你跑的 Agent 腳本有個漏洞,或者運行中被什麼惡意東西盯上了,你的隱私數據幾乎就是處於“裸奔”狀態。

再加上,咱們的普通電腦設計初衷是拿來用的,不是拿來當“長工”的。你很難保證它能像專業服務器那樣,常年不關機還不出錯。

所以,如果你追求的是長期、高頻的生產力,我強烈建議你把 Hermes Agent 部署到遠程 VPS(雲服務器)上。這種從“本地”到“雲端”的遷移,對效率的提升簡直是“降維打擊”:

  • 物理隔離:把幹髒活累活的腳本關進雲端“小黑屋”,離你的私人數據遠一點。

  • IP 防封:這對做“出海”業務的朋友太重要了,雲端 IP 更穩定,不容易被封號。

  • 硬核穩定性:服務器是 7x24 小時不間斷運行的,這才是真正的自動化。

揭秘:AI 是怎麼在“無頭”服務器上看見網頁的?

看到這兒,很多新朋友肯定會撓頭:

“大劉,服務器就是個黑框框(命令行),連個顯示器都沒有,AI 到底是怎麼像真人一樣‘看見’並操作瀏覽器的?”

這就是我今天要帶大家搞定的核心科技

咱們這套方案主要有三根支柱:

  1. 雲端基地:雲服務器 + VNC。既然服務器沒顯示器,我們就用 VNC 在內存裏給它“畫”出一個顯示器來。

  2. 安全層:Tailscale。給你的服務器加上一把“隱形鎖”,只有你自己能遠程看它,黑客連門在哪都找不到。

  3. 天才的一公里人工登錄 + AI 接管。最聰明的點在這:複雜的掃碼、驗證碼,你手動點一下,剩下的高頻重複勞動,全部交給 AI。

    圖片


你是否需要關於如何配置 Tailscale 或在 Linux 服務器上搭建 VNC 環境的詳細步驟?

眾客觀,請接着看!

實操手冊:跟着大劉動動手

別擔心代碼或配置,咱們現在有 Hermes 這個好幫手,很多活兒直接“吩咐”它就行。

第一步:打通安全隧道 (Tailscale)

為什麼必須走 Tailscale?

為了安全,我們必須用 Tailscale。它給每台機器分一個內網 IP,公網掃不到。

這也是我一直喜歡Tailscale的原因,之前針對它也寫過一篇文章:我是如何丟掉第二台電腦,教你用 Tailscale 穿透公網,遠程辦公自由的

安裝Tailscale

直接對hermes說:

幫我在服務器上裝 Tailscale 並加入我的網絡,完成後告訴我這台機器的 Tailscale IP。
圖片

我們看到在安裝過程中,提示你訪問 https://login.tailscale.com/admin/settings/keys ,按要求生成key,發給Hermes,完成安裝。

圖片

我們在雲服務器終端輸入tailscale status,得到Tailscale構建的網絡IP和機器名稱。

圖片

在後續客戶端配置章節中,在本地安裝配置tailscale後,你的本地電腦和雲服務器就在一個“私密羣聊”裏了。

第二步:給服務器裝上“眼睛”

簡單介紹下涉及到的兩款軟件。

TigerVNC它是一款讓你能遠程看到和操作另一台電腦桌面的軟件。

它分為兩部分,一個是TigerVNC Server,一個是 TigerVNC Viewer。

TigerVNC Server”裝在雲服務器上,負責把電腦屏幕畫面推出來。

Fluxbox它是 TigerVNC Server 啓動遠程桌面時,指定的圖形界面(session=fluxbox),本方案裏就是給Chrome提供一個能運行的“畫框”,好看不重要,省資源、跑得快才是關鍵。

1. 安裝軟件

讓我們習慣安裝軟件,對服務器的配置都讓Hermes來做,不用再像之前那樣苦哈哈的人來做,讓Hermes來做,他還能將過程skill化,你的hermes會越來越強,越用越順手。

幫我裝 TigerVNC Server + fluxbox 輕量窗口管理器 + Google Chrome
圖片

2. 設置VNC參數

  1. 為你的VNC遠程桌面連接設置登錄密碼:
# 1) 設置 VNC 密碼(交互式,輸入兩遍)
vncpasswd
# 詢問 read-only 密碼時選 n
圖片
  1. 這段代碼是在當前用戶(root)的家目錄下創建配置文件 ~/.vnc/config,設定 VNC 啓動時的各項默認參數,直接在聊天窗口中發給hermes就成。

別被下面這堆符號嚇到,這其實就是在給服務器交代:‘分辨率要 1080P,密碼別設太簡單,還要記得開個門留給 AI’。

執行下面命令:

把 root 登記為 :1 號顯示的用戶

sudo tee /etc/tigervnc/vncserver.users >/dev/null <<'EOF'

:1=root

EOF

#  VNC server 默認參數

mkdir -p ~/.vnc

cat > ~/.vnc/config <<'EOF'

session=fluxbox

geometry=1920x1080

depth=24

localhost=no

alwaysshared

EOF
  • 參數詳解
    • session=fluxbox:指定 VNC 連接後使用的圖形界面(窗口管理器)為 fluxbox。這就是前面步驟中安裝的輕量級桌面環境。
    • geometry=1920x1080:設置遠程桌面的分辨率,這裏設為 1920x1080(1080P)。
    • depth=24:設置顏色深度為 24位(真彩色),影響畫面的色彩顯示效果。
    • localhost=no:允許非本機的客戶端連接。如果設為 yes,則只能從服務器本地連接,遠程將無法連入。
    • alwaysshared:允許多個用戶同時連接並查看同一個 VNC 桌面會話。如果不設置,默認情況下一個用戶連入會把另一個用戶踢下線。
圖片
  1. 創建並賦予執行權限給VNC的自動啓動腳本(xstartup

這段命令就是在給VNC遠程桌面寫一個“開機啓動清單”,並給它加上可執行的權限。

當你連上VNC時,它會自動做兩件事:

第一,啓動一個專門給AI留了後門(CDP 9222端口)的Chrome瀏覽器;

第二,啓動Fluxbox給Chrome提供一個能顯示出來的“畫框”。

特別要注意的是,Chrome啓動命令里加了 --user-data-dir=/root/.chrome-debug 這個參數,這是避開Chrome新版大坑的關鍵,不加的話瀏覽器雖然能開,但AI會死活連不上

其它參數具體是什麼意思,你可以直接問Hermes! 我就不佔用文章空間了。

cat > ~/.vnc/xstartup <<'EOF'
#!/bin/bash
unset SESSION_MANAGER
unset DBUS_SESSION_BUS_ADDRESS
export XDG_SESSION_TYPE=x11

# 啓 Chrome,開 CDP 端口 9222 給龍蝦或Hermes
/opt/google/chrome/chrome \
  --no-sandbox \
  --disable-gpu \
  --disable-software-rasterizer \
  --start-maximized \
  --no-first-run \
  --no-default-browser-check \
  --disable-sync \
  --disable-translate \
  --disable-default-apps \
  --user-data-dir=/root/.chrome-debug \
  --remote-debugging-port=9222 \
  --remote-allow-origins=* \
  >/root/.vnc/chrome.log 2>&1 &

# 啓窗口管理器(前台進程,不能放後台,否則會話會退出)
exec fluxbox
EOF
chmod +x ~/.vnc/xstartup
圖片

3. 開機啓動

sudo systemctl enable --now tigervncserver@:1.service
sudo systemctl status tigervncserver@:1.service --no-pager | head -15
圖片

4. 驗證服務器端環境

在服務器上執行後,兩個都 OK,服務器端就齊活了。

# VNC 應該監聽 5901
ss -tlnp | grep 5901

# Chrome 的 CDP 應該監聽 9222
curl -s http://localhost:9222/json/version | head -20
# 應該返回一坨 JSON,裏面有 "Browser": "Chrome/xxx"
圖片

5. 服務端加固安全

默認 localhost=no 會讓 5901 對所有網卡監聽,從公網 IP 也能掃到。用 ufw 把它只留給 tailscale0 接口

把以下命令發給龍蝦:

sudo ufw allow in on tailscale0 to any port 5901 proto tcp
sudo ufw allow in on tailscale0 to any port 22 proto tcp # 放行本機SSH端口
sudo ufw deny 5901/tcp       # 其他所有網卡一律拒絕
sudo ufw default deny incoming
sudo ufw --force enable
sudo ufw status verbose | grep 5901
圖片

第三步:本地客戶端連接

1. 裝 Tailscale

訪問官網:https://tailscale.com/download/mac  下載Tailscale。

圖片

注意:登錄的賬號要和服務器上那一台用的是同一個,不然兩台機器不在一張網裏。

下圖是我打開mac本的Tailscale,可以看到雲服務器vm-0-7-ubuntu的機器名,和上一節執行tailscale status 拿到名稱是一致的。

說明我們的tailscale網絡是搭建好了。

圖片

2. 裝 TigerVNC Viewer

TigerVNC Viewer是裝在我們自己電腦上,負責接收並顯示畫面。

在本方案中,它主要用來幫你“盯着”AI在服務器上操控瀏覽器,當AI遇到掃碼登錄、過驗證碼等搞不定的場景時,你可以通過它隨時切入桌面親自動手幫忙,實現“平時AI自動跑,關鍵時刻你手動救一下”的人機協作。

系統
安裝方式
Windows
打開 https://sourceforge.net/projects/tigervnc/files/stable/1.16.2/ 下 vncviewer64-1.16.2.exe,綠色版雙擊就能跑
macOS
brew install --cask tigervnc-viewer
,或系統自帶訪達 → 前往 → 連接服務器 →vnc://100.x.x.x:5901
Linux
sudo apt install tigervnc-viewer

打開 TigerVNC Viewer,VNC server 中填你的雲服務器的 Tailscale IP:

100.x.x.x:5901
圖片

彈密碼框輸你 vncpasswd 設的密碼。圖片

連上後你應該看到一個桌面 + 一個已經打開的 Chrome 窗口。

圖片

翻車現場:我是怎麼教 Hermes 發推特的

發送指令,驗證我們的這套方案服務是否正常,發給Hermes。

echo "=== 1) Tailscale 狀態 ==="
tailscale ip -4 || echo"❌ Tailscale 沒裝"

echo"=== 2) VNC 監聽 ==="
ss -tlnp | grep 5901 || echo"❌ VNC 沒起"

echo"=== 3) Chrome CDP ==="
curl -s http://localhost:9222/json/version | grep -q "Chrome" \
  && echo"✅ CDP OK" || echo"❌ Chrome CDP 沒起(先查 user-data-dir)"

echo"=== 4) Chrome 136+ user-data-dir 檢查 ==="
ps -ef | grep chrome | grep -v grep | grep -q "user-data-dir" \
  && echo"✅ 帶了 user-data-dir" || echo"❌ Chrome 沒帶 user-data-dir,CDP 會靜默失敗"

echo"=== 5) 防火牆只對 Tailscale 開 5901 ==="
sudo ufw status | grep "5901"

echo"=== 6) xstartup 可執行 ==="
test -x ~/.vnc/xstartup && echo"✅ OK" || echo"❌ xstartup 無執行權限"
圖片

一切OK,讓我們開始實戰!

為了幫大家測試穩定性,我親自帶 Hermes 衝了一波 X (Twitter)。

第一次

上面提到過VNC啓動時,會啓動一個專門給AI留了後門(CDP 9222端口)的Chrome瀏覽器,其中CDP 是 Chrome DevTools Protocol(Chrome 開發者工具協議) 的縮寫,它就像是一根“遠程遙控線”,允許外部程序通過網絡端口(本方案中是 9222 端口)直接向 Chrome 發送指令。

於是發給hermes指令:

幫我通過 CDP 連上 localhost:9222 的 Chrome,打開 https://x.com/home,然後點發推按鈕。
圖片

第一次hermes要我提供賬號密碼,結果它找我要賬號密碼,我心想這太不安全了,萬一模型智商掉線把密碼泄露了怎麼辦?失敗!

第二次

我嘗試在 VNC 裏手動登錄 X,然後讓 Hermes 接着幹。結果它反覆提示連不上。再敗!

圖片

第三次:

我調整了指令,說人說就是:‘兄弟,別瞎猜了,我已經手動登好了,你就順着我打開的這個窗口,把 Hello 發出去就行!’ 結果?秒成!

具體指令如下:

我連vnc登陸了https://x.com/home x賬號,你發佈內容“hello”然後點post按鈕。 可以考慮CDP HTTP API+WebSocket 直接操作。

圖片

神奇的一幕出現了:在 TigerVNC Viewer 裏,我清晰地看到 Hermes 像個真人一樣,熟練地移動鼠標、點擊按鈕。推文發佈成功!

圖片

第四次:

相同的指令,重複執行,發現流程還不是很穩定,雖然成功了,明顯和上次成功的路徑不一樣。

圖片圖片

第五次

讓我們發送簡單指令,也能達到發佈的預期了!

圖片圖片

最後

發現沒?如果想得到一個成熟的工作流,目前只能通過和Hermes的反覆溝通,校正,慢慢培養Hermes能力。

如果非要說有捷徑,那就是給你的 Agent 找個‘高學歷大腦’(比如 Gemini  或者 Claude),畢竟聰明點的員工,教一遍就能領悟你的意圖。

很多人學 AI 編程,往往止步於跑通一個簡單的腳本。看着代碼動起來固然爽,但那隻能叫“工具”。

我之所以學習折騰這套方案,是因為我始終覺得:未來的“一人公司”,拼的不是你寫代碼有多快,而是你麾下的“數字員工”有多穩。

當你給 Agent 加上 Tailscale 這把“安全鎖”和 VNC 這扇“監控窗”時,你才算真正擁有了一個可以隨時待命、不眠不休的自動化兵團。

Hermes 已經幫你把最髒最累的活兒幹了,剩下的,就看你如何指揮它去攻城略地了。

如果你在配置過程中報錯了,別硬扛,記得把錯誤日誌直接塞給你的 Hermes。它現在已經學會了這套 SOP,它絕對比我更懂怎麼修好它。

你的第一個雲端“數字員工”,準備讓它幫你乾點什麼?是自動抓取海外情報,還是去 Reddit 當個不睡覺的運營官?

在評論區告訴我,咱們一起碰撞下 AI 出海的新玩法。

我是大劉,關注不迷路,咱們下期見!

圖片
更多文章:
從 OpenClaw 到 Hermes:如何讓多個 AI 助手在 Telegram 羣裏為你打工?
全流程圖文部署!把 Hermes 塞進你的微信、飛書和 TG,打造 24 小時在線的 AI 助手
8.7萬星神作!Hermes Agent 深度拆解(下):從“金魚腦”到“神助攻”,他的手腳和大腦是怎麼長的?
8.7萬星神作!Hermes Agent 深度拆解(上):像職場精英一樣自動進化
別再死磕 OpenClaw 了!我為什麼勸你轉戰 Hermes?