我的 OpenClaw 養蝦記:3 個 Agent 跑通 100% 自動化閉環
整理版優先睇
用 OpenClaw 搭 3 個 Agent,跑通 100% 自動化閉環,一人團隊不再係口號
作者 Jason 係一個獨立開發者,平時要兼顧產品開發、寫文案同埋客戶溝通。佢受 Elvis 嘅 Agent Swarm 方法論啟發,喺自己部 Mac 上用 OpenClaw 搭咗 3 個 Agent——編排器、編碼助手 Winnie、文案助手 Amy——成功實現由任務派發到交付審核嘅全自動化閉環。佢發現關鍵突破唔係「Agent 識得寫代碼」,而係監控腳本加自動重試加 Telegram 通知構成咗一條零人工幹預嘅生產線,就算佢唔喺電腦前面,Agent 都會繼續開工。
呢篇文章詳細記錄咗佢嘅實戰經驗,包括 3 隻蝦嘅分工配置、100% 自動化閉環嘅運作機制(派發、執行、巡檢、狀態流轉)、喺真實項目 Voice Real-time Translation 上嘅效率提升數據、技術架構用蝦塘比喻拆解、月成本約 $50-80(參考 Elvis 約 $190),仲有佢踩過嘅 4 個大坑。佢強調「養蝦」嘅本質係維護一個可持續運轉嘅生態,而唔係追求單次調用嘅驚豔。
總結嚟講,一個人加 AI Agent Swarm 就等於一個團隊,但前提係要花時間「養」好呢個生態——分層上下文、專業化分工、賬號隔離、零 Token 監控、遞歸改進同人在迴路,呢 6 條原則係成功嘅基石。
- 3 個 Agent(編排器 + Winnie + Amy)可以跑通由任務派發到 PR 提交嘅全自動閉環,人只需做最後 5-10 分鐘嘅決策同審查。
- 關鍵方法係用 OpenClaw 做編排層,每個 Agent 喺獨立 tmux session 同 worktree 執行,配合 check-agents.sh 零 Token 巡檢同自動重試。
- 同直接使用 Codex 或 Claude Code 最大嘅差異係分層上下文:編排器持有業務全局,Agent 專注執行,避免上下文窗口被填滿。
- 實戰中 Voice Real-time Translation 項目嘅開發效率由 2-3 日一個功能提升到 2-4 小時,可以並行處理 3-5 個任務。
- 想複製呢套做法,首先要搭建基礎設施(OpenClaw + tmux + git worktrees),再按專業配置 Agent(Winnie 編碼、Amy 文案),最後完善巡檢同賬號隔離機制。
OpenClaw 官方文檔
Agent 編排平台嘅完整安裝同配置教學。
Elvis 嘅 Agent Swarm 方法論原文
Elvis 喺 Twitter 分享嘅 Agent Swarm 完整方法論,包括 8 步工作流同成本數據。
OpenAI Codex 官方文檔
Codex API 嘅使用指南同限額說明。
Anthropic Claude API 文檔
Claude Sonnet 4-5 等模型嘅 API 參考。
結構示例
# 派 Winnie 修 Bug~/.openclaw/swarm/spawn-agent.sh winnie fix-auth-bug \ "Fix the login validation bug in auth.ts"# 派 Amy 寫文案~/.openclaw/swarm/spawn-agent.sh amy blog-launch \ "寫一篇產品發佈博客,目標讀者:開發者"
一場需求評審會後嘅驚喜
作者開咗兩個半鐘頭需求評審會,返到 Mac 前面發現 Telegram 刷咗一屏——唔係羣組吹水,而係佢兩隻「蝦」Winnie 同 Amy 自動彙報工作進度:Winnie 修好咗 Voice Real-time Translation 嘅 bug 並提咗 PR,Amy 出咗微信公眾號文案初稿。佢用 15 分鐘就搞掂 review 同發佈。
呢件事嘅起點係作者讀到 Elvis(@elvissun)嘅一篇深度分享——Elvis 透過 OpenClaw 做編排層,由 AI 助手統一調度多個編碼 Agent,稱之為 Agent Swarm。Elvis 嘅公開數據令人坐唔住:單日最高 commit 94 次,30 分鐘內完成 7 個 PR,月成本約 $190。
上下文窗口係零和遊戲
Elvis 嘅核心觀點係:填滿代碼就冇空間放業務上下文,填滿客戶歷史就冇空間放代碼。解決方案唔係揾更大嘅窗口,而係分層——編排層持有業務全局,編碼層專注執行。呢個方向同作者之前提出嘅「Architect/Coder/QA 三角色協同」一樣,只不過 Elvis 已經喺生產環境跑通咗。
我嘅 3 隻蝦:邊個做咩
作者將搭 Agent Swarm 比喻為養蝦:搭好蝦塘(基礎設施)、放蝦苗(配置 Agent)、投飼料(派任務)、巡塘(監控腳本)、收蝦(收 PR 同內容)。核心唔係某一次操作嘅精彩,而係維護一個可持續運轉嘅生態。
- 編排器(Main Orchestrator)——塘主:接收意圖、拆解任務、決定派俾邊個,仲可以讓 Agent 之間協作,例如 Winnie 做完功能後自動叫 Amy 寫更新日誌。
- Winnie(coding-assistant)——編碼蝦:人設係「先結論後步驟,優先可執行方案,唔做大規模重構」。用 openai-codex/gpt-5.3-codex 模型,擅長後端邏輯、全棧開發、重構、Bug 修復同測試。
- Amy(copywriting-assistant)——文案蝦:人設係「輸出可直接發佈,擅長新媒體文案,A/B 兩版,避免空話」。主力模型同 Winnie,fallback 用 claude-sonnet-4-5,擅長中英雙語、短視頻、SEO、小紅書、微信、Twitter。
專業化分工比通用 Agent 更有效
三者分工明確:Bug 修復、新功能開發、代碼重構、API 文檔交俾 Winnie;博客文章、社交媒體、用戶指南交俾 Amy。關鍵係先將「可標準化派發」嘅任務跑通,再逐步擴展。
100% 自動化閉環點樣跑通
呢個係文章嘅核心部分,分為派發、執行、巡檢同狀態機四個環節。
- 1 派發:可以透過 CLI 腳本(spawn-agent.sh)或者 Telegram Bot 消息觸發,系統會寫入 active-tasks.json、創建獨立 tmux session、啓動 Agent 並記錄日誌。
- 2 執行:Agent 喺自己嘅 tmux session 入面讀取任務、拉取代碼到獨立 worktree、自主編碼或寫作、運行測試,完成後自動 gh pr create --fill。
- 3 巡檢:check-agents.sh 係 100% 確定性 Shell 腳本,零 LLM token 消耗,每 10 分鐘 cron 運行一次,檢查 session 存活、PR 狀態、CI 結果,自動重試最多 3 次。
- 4 狀態機:任務狀態可追蹤,例如 running → done、running → blocked、running → ci-failed → respawning → running,只有最後 review 需要人工介入。
整條鏈路唯一需要人嘅環節係最後 5-10 分鐘嘅 review。其餘全部自動化。呢個就係「100% 自動化閉環」嘅含義——人只做決策,唔做執行。
實戰驗證:Voice Real-time Translation
作者用呢套 Swarm 實際管理嘅項目之一係 Voice Translation(macOS 實時語音翻譯器),解決 Teams 標準版有字幕冇翻譯嘅痛點。項目由 2025 年 8 月開始,已經穩定運行半年。
效率從 2-3 日一個功能提升到 2-4 小時
引入 Swarm 後工作方式發生質變:早期作者自己寫代碼,一個功能要 2-3 日;重構後 Winnie 寫代碼,作者做 review,一個功能 2-4 小時;Swarm 接入後可以並行處理 3-5 個任務。
真人案例:作者開需求評審會期間,喺 Telegram 叫 Winnie 修復藍牙設備切換時嘅音頻丟幀問題。兩個半鐘頭後會議結束,Winnie 已經提咗 PR 並附上通過嘅測試用例。與此同時,Amy 喺另一個 session 完成咗一篇微信公眾號文案初稿。一個下午,兩個交付,人工介入總共 15 分鐘。
蝦塘技術架構同成本
- 基礎設施:OpenClaw 2026.2.25 做框架,tmux sessions 做隔離,git worktrees 提供獨立代碼副本,Telegram Bots 做通訊,SQLite + Gemini Embedding 做記憶庫。
- 模型配置:Winnie 同 Amy 主力用 openai-codex/gpt-5.3-codex,Amy fallback 用 claude-sonnet-4-5,記憶用 gemini-embedding-001。兩個 Codex 賬號輪換避免限額觸頂。
- 監控工具鏈:active-tasks.json 做任務註冊表,check-agents.sh 每 10 分鐘 cron 巡檢,logs/ 目錄記錄全部輸出。
- 賬號隔離:作者本地開發用一個賬號,Agent 用另外兩個賬號,避免爭奪限額。自建代理統一管理 API 調用。
Token 消耗遠超人類手動使用,必須賬號隔離
成本方面,Elvis 公開月費約 $190(Claude $100 + Codex $90),作者現階段每月 $50-80,因為任務密度冇咁高。但重點係產出比——一個初級開發者月薪遠超 $190,而呢兩隻蝦 7×24 在線,冇社保、唔請假、唔需要管理。硬件方面,RAM 係瓶頸,16GB Mac 可支持 4-5 個併發 Agent,128GB Mac Studio M4 Max 先係 Elvis 推薦配置。
- 1 網絡代理幹擾:本地 Stash 代理劫持 DNS,要 bypass *.argotunnel.com 或強制 HTTP2。
- 2 Codex Device Auth 失敗:用 https_proxy="" codex login --device-auth 繞過代理。
- 3 Token 過期:Codex OAuth token 約 10 日有效,需 check-agents.sh 加入 token 檢查並定期刷新備份。
- 4 新舊版本共存:統一用 ~/.openclaw/,清乾淨舊版 ~/.clawdbot/ 避免端口衝突。
最後作者總結咗 6 條核心理念:分層上下文、專業化分工、賬號隔離、零 Token 監控、遞歸改進、人在迴路。佢強調 Agent 做 80% 執行,人做 20% 決策,完全無人介入唔係目標,高效協作先係。
尋日下午,我開咗兩個半鐘嘅需求評審會。
等我返到 Mac 前面,發現 Telegram 已經刷咗一版 message——唔係 group 吹水,而係我兩隻「蝦」喺度匯報工作進度:Winnie 話 Voice Real-time Translation 有個 bug 已經修好咗仲提咗 PR;Amy 話微信公眾號嘅文案初稿已生成,等我過目。
我衝咗杯咖啡,用咗 10 分鐘 review Winnie 嘅 PR,再用 5 分鐘執咗 Amy 啲措辭,merge、publish,搞掂。
一句講曬:當你用到 3 個 Agent 跑通由派 task 到交貨審核嘅完整閉環時,「一人團隊」就唔再係口號,而係每日都在發生嘅事。

如果你得 30 秒,先睇呢 3 句:
1. 我用 OpenClaw 喺本地 Mac 上起咗 3 個 Agent(orchestrator + coding 助手 Winnie + copywriting 助手 Amy),佢哋可以自主接收任務、執行工作、提交 PR、互相協作。 2. 關鍵突破唔係「Agent 識寫 code」,而係監控 script + 自動 retry + Telegram 通知構成咗一條零人手幹預嘅閉環——我唔喺電腦前面,佢哋都仲喺度做嘢。 3. 每個月成本大約 $190,等於請咗一個 7×24 嘅兩人小團隊。但前提係:你要花時間「養」好呢個生態。
件事嘅起點,係我喺 Twitter 上讀到 Elvis(@elvissun)嘅一篇深度分享。
Elvis 唔再直接用 Codex 或者 Claude Code 寫 code,而係用 OpenClaw 作為編排層,由 AI 助手統一調度多個 coding Agent。佢叫呢套系統做 Agent Swarm。佢公開嘅數據令我坐唔住:
佢嘅 8 步 workflow 涵蓋咗由客戶需求到 merge 上線嘅完整週期:需求收集 → orchestrator 確定範圍 → 生成 Agent(獨立 worktree + tmux session) → cron 循環監控(零 token) → Agent 開 PR → 三路 AI Code Review(Codex + Gemini + Claude) → 自動化測試 → 人手審核查 merge。
但真正令我決定動手嘅,係佢提出嘅一個核心觀點:
Context window 係零和嘅。塞滿 code,就冇位放業務 context;塞滿客戶歷史,就冇位放 code。解決方法唔係揀更大嘅 window,而係分層——編排層 hold 住業務全局,編碼層專注執行。
呢個同我之前喺《開工第一日你一定要睇明嘅 AI Coding 新秩序》入面寫嘅「Architect/Coder/QA 三角色協作」係同一個方向——只不過 Elvis 已經喺 production 環境跑通咗。

二、我嘅 3 隻蝦:邊個係邊個,做咩嘢
「養蝦」呢個比喻唔係我發明嘅,但的確好貼切。
起 Agent Swarm 嘅過程就好似養蝦:整好蝦塘(基礎設施)、放蝦苗(配置 Agent)、俾飼料(派 task)、巡塘(監控 script)、收蝦(收 PR 同內容)。核心唔係某次操作有幾精彩,而係 maintain 一個可持續運作嘅生態。
我而家個蝦塘有 3 隻蝦:
2.1 Orchestrator(Main Orchestrator)——塘主
佢係成個 Swarm 嘅中樞,負責接收我嘅意圖、拆解任務、決定派俾邊個。
更重要嘅係,佢可以令 Agent 之間協作:例如 Winnie 做完一個新功能之後,orchestrator 可以自動叫 Amy 寫更新日誌同發佈文案——成條鏈路唔需要我手動駁。
2.2 Winnie(coding-assistant)——編碼蝦
佢嘅人設係「先講結論再講步驟,優先揀可行方案,唔做大規模重構」。
~/.openclaw/agents/coding-assistant/workspace | |
2.3 Amy(copywriting-assistant)——文案蝦
佢嘅人設係「輸出可以直接出街,擅長新媒體文案,A/B 兩個版本,避免廢話」。
~/.openclaw/agents/copywriting-assistant/workspace | |
三者之間嘅分工邏輯好明確:
唔係所有任務都適合自動化。關鍵係先將「可以標準化派發」嘅任務跑通,再逐步擴展。
三、100% 自動化閉環:到底點樣跑通
呢篇文嘅核心。我先畫一張全景圖,再逐步拆解每個環節。

3.1 派發:一個 message 觸發一個 Agent
派發有兩種方式。
方式一:CLI 派發(適合批量或 script 觸發)
# 派 Winnie 修 Bug
~/.openclaw/swarm/spawn-agent.sh winnie fix-auth-bug \
"Fix the login validation bug in auth.ts"
# 派 Amy 寫文案
~/.openclaw/swarm/spawn-agent.sh amy blog-launch \
"寫一篇產品發佈博客,目標讀者:開發者"方式二:Telegram message 派發(適合隨時隨地)
喺 Telegram 度 send message 俾對應嘅 Bot,orchestrator 會自動 routing。呢個亦係我最常用嘅方式——開會空隙、地鐵上、湊仔時,拎出電話 send 一個 message 就得。
每次派發,系統內部會做 4 樣嘢:
1. 寫入 active-tasks.json(task registry)2. 創建獨立 tmux session(互不幹擾) 3. 通過 openclaw agent --agent <id> --message '<prompt>' --local啟動 Agent4. 日誌輸出到 ~/.openclaw/swarm/logs/<session>.log
3.2 執行:Agent 喺 tmux 入面自主工作
呢個係最關鍵嘅一步,亦係「養蝦」同「用工具」嘅本質分別。
Agent 啟動後,喺自己嘅 tmux session 入面獨立運行:
• 讀取 task context 同相關記憶 • 拉 code 到獨立 worktree(唔影響主 branch) • 自主編碼或寫作 • 自主跑 test • 完成後自動 gh pr create --fill
成個過程唔使我睇住個 mon。我可以去開會、煮飯、湊仔——佢哋喺 background 不停做。呢個就係由「操作工具」到「管理團隊」嘅躍進。
3.3 巡檢:零 Token 嘅確定性監控
好多人會問:你點知 Agent 做曬未?做啱唔啱?卡住咗點算?
答案是 check-agents.sh——一個 100% 確定性嘅 Shell script,零 LLM token 消耗。
佢嘅邏輯好簡單(正因為簡單,所以穩定):
1. 讀取 active-tasks.json入面所有活躍 task2. 逐一檢查 tmux session 仲喺唔喺度 3. 通過 gh pr list檢查 PR 同 CI status4. 自動標記失敗 task,觸發 retry 5. 超過 3 次 retry 就標記為 failed 並 send alert 6. 淨係需要人手介入先 send notification
配合 cron 每 10 分鐘 run 一次,呢套巡檢就好似蝦塘裏面嘅自動增氧機——你唔使 24 小時睇住,但佢一直喺度運作。
3.4 狀態機:由 running 到 review-ready
Task 嘅狀態流轉係可以追蹤嘅:
running → done (成功完成)
running → blocked (需要人工輸入)
running → ci-failed → respawning → running (自動重試)
running → session-dead → respawning (tmux 掛了,自動恢復)
running → failed (超過 3 次重試,人工介入)
done → review-ready (CI + review 全過)成條鏈路入面,唯一需要人嘅環節係最後 5-10 分鐘嘅 review。其餘全部自動化。呢個就係「100% 自動化閉環」嘅意思——唔係「零人手」,而係「人淨係做決策,唔做執行」。
四、實戰驗證:Voice Real-time Translation 項目
齋講架構冇用,要用真實項目驗證。
我用呢套 Swarm 實際有份管理嘅項目之一,就係之前文章寫過嘅 Voice Real-time Translation(macOS app 叫 VoiceTranslation)——一個專門解決 Teams 標準版「有字幕冇翻譯」呢個痛點嘅 macOS 實時語音翻譯器。
呢個項目由 2025 年 8 月 11 日第一次 commit,到而家已經穩定運行咗半年,經歷過兩次關鍵重構(API Provider 管理重構 + 權限處理同音頻質素監控重構)。引入 Agent Swarm 之後,工作方式有咗質嘅變化:
上星期嘅一個真實 case:
我喺開需求評審會,順手喺 Telegram send 咗一個 message 俾 Winnie:
「VoiceTranslation 嘅 Core Audio Tap 喺藍牙裝置切換時偶爾會 drop frame,check 嚇 AudioStreamBasicDescription 嘅採樣率同步 logic,修復之後跑 unit test。」
兩個半鐘之後會議結束,Winnie 已經開咗 PR,附帶咗修復 code 同通過咗嘅 test case。我 review 咗 5 分鐘,merge。
同一時間,Amy 喺另一個 tmux session 入面完成咗一篇微信公眾號文案嘅初稿。我改咗幾處措辭,都 publish 咗。
一個下晝,兩個 delivery,人手介入總共 15 分鐘。

五、蝦塘嘅水電同增氧:技術架構全解
為咗令冇咁技術嘅讀者都明,我用「蝦塘」嘅比喻來對照每一層 component。
5.1 蝦塘本體(基礎設施)
5.2 飼料(模型配置)
兩個 Codex 帳號輪住用,避免單一帳號限額爆煲:
"order": {
"openai-codex": [
"openai-codex:second",
"openai-codex:default",
"anthropic:manual"
]
}5.3 增氧系統(監控工具鏈)
active-tasks.json | ||
spawn-agent.sh | ||
check-agents.sh | ||
logs/ |
5.4 帳號隔離策略
呢個係好易忽略但極之重要嘅細節:
點解要隔離?因為 Agent 嘅 token 消耗量遠超人類手動使用。如果共用一個帳號,Agent 用爆限額之後我自己就用唔到了。
5.5 自建 proxy:成本控制嘅隱藏關鍵
我嘅 Anthropic 同 Gemini API 唔係直接 call 官方 endpoint,而係經自建 proxy 訪問(BaseURL: https://cc.junxinzhang.com)。好處係:統一管理所有 API call 嘅 log、實時監控成本、有異常時可以快速切換。
六、成本帳:養蝦到底要幾多錢
6.1 參考數據:Elvis 嘅公開成本
| 合計 | ~$190/月 |
6.2 我嘅實際成本
我而家仲喺測試同 tune 嘅階段,task 密度冇 Elvis 嗰種「日均 50 commit」嘅 level。目前月成本大約 $50-80。
但核心唔係「用幾多錢」,而係產出比。一個初級 developer 嘅月薪遠遠超過 $190。而呢兩隻蝦 7×24 在線,冇社保、唔請假、唔使 management。當然,佢哋唔會主動提出需求——呢個就係「人在 loop」嘅價值所在。
6.3 硬件限制
瓶頸係 RAM,唔係 CPU。每個 Agent 嘅 tmux session + worktree + model context 都會食 RAM。
七、踩過嘅坑(幫你慳返啲冤枉路)
唔講踩坑記錄嘅文章係唔完整嘅。以下係我搭建過程中最痛嘅幾個:
7.1 網絡 proxy 幹擾 Cloudflare Tunnel
問題:cloudflared 不停報錯「there are no free edge addresses left to resolve to」,QUIC timeout 不斷。
根因:本地 Stash proxy(port 7890)hijack 咗 DNS,將 Cloudflare edge 解析到假 IP 198.18.0.x。QUIC 用 UDP,proxy 冇辦法正確 forwarding。
解法:喺 Stash config 入面 bypass *.argotunnel.com;或者喺 cloudflared 加 --protocol http2 強制 TCP。
教訓:本地有行 proxy 嘅朋友要特別注意——任何需要 UDP/QUIC 嘅服務都可能俾 proxy 幹擾。
7.2 Codex Device Auth 喺 proxy 環境下失敗
問題:執行 codex login --device-auth 點都做唔完 authentication 流程。
解法:https_proxy="" codex login --device-auth,繞過 proxy 就掂。Business workspace 仲要 admin enable 咗 device code auth 先得。
7.3 Token 過期令 Agent 靜默失敗
問題:Codex OAuth token 有效期大約 10 日。過期之後 Agent 唔會報錯,只會靜靜雞停咗——呢個係最陰濕嘅 bug,因為你以為蝦仲做緊嘢,其實已經罷咗工。
解法:喺 check-agents.sh 入面加 token 有效性檢查。定期 refresh token 並 sync 去 OpenClaw。Backup 機制:~/.codex/auth.json.kiyo.bak。
7.4 新舊版本共存搞到 CLI 衝突
問題:本地同時有 ~/.clawdbot/(舊版 Clawdbot 2026.1.24-3)同 ~/.openclaw/(新版 OpenClaw 2026.2.25),兩套 CLI、兩套 Memory DB、兩個 Gateway port,互相干擾。
解法:統一以 ~/.openclaw/ 為準,唔再用舊版。記住要清乾淨,如果唔係 background process 可能霸住 port。
八、由「用工具」到「養生態」:6 條核心理念

總結呢段實踐,我提煉咗 6 條核心原則:
1. 分層 context:Orchestrator hold 住業務全局,Agent 專注執行。唔好俾一個 Agent 又識業務又寫 code——咁會好快食曬 context window。 2. 專業化分工:Winnie 寫 code,Amy 寫文案,各有各做。撈亂用一個通用 Agent 做曬所有嘢,效果遠差過專業化配置。 3. 帳號隔離:我本地開發用一個帳號,Agent 跑 task 用另外嘅帳號,互不幹擾、互不搶限額。 4. 零 Token 監控:確定性 script 巡檢,淨係需要時先消耗 API。監控本身唔應該係 LLM task——呢個係好多人容易犯嘅錯。 5. 遞迴改進:成功嘅 prompt pattern 記錄入 memory,失敗嘅都記錄原因同修復方案。每一次執行都係為下一次累積經驗。 6. 人在 loop:Agent 做 80% 嘅執行工作,人做 20% 嘅決策同審查。完全無人介入唔係目標,高效協作先係。
寫在最後
「養蝦」唔係一個精確嘅技術詞,但佢捉到一個本質:
AI Agent 嘅價值唔係在於單次 call 有幾驚豔,而在於持續運作嘅生態。
整好蝦塘、揀好蝦苗、配好飼料、裝好增氧機——然後你可以去做更重要嘅事:諗業務方向、同客戶對齊需求、做技術決策。嗰啲可以標準化拆解同重複執行嘅工作,交俾蝦去做。
我而家個 Swarm 仲喺早期階段,接下來會繼續推幾樣嘢:
• 設定 cron 定時 run check-agents.sh • 測試 Winnie → Amy 嘅跨 Agent 自動協作鏈路 • 引入三路 AI Code Review(Codex + Gemini + Claude) • 擴展更多 Agent 角色:SEO 專家、數據分析 • 持續累積 memory,令每隻蝦越養越聰明
如果你都喺度研究 Agent Swarm,或者對 OpenClaw 有實戰經驗,歡迎交流。
一個人 + AI Agent Swarm = 一個團隊。呢個唔再係願景,而係每日都在發生嘅事。
相關閲讀
OpenClaw 系列
• 用 OpenClaw 做 A 股量化?我試咗,講嚇真實感受 • Mac Mini 俾 AI 圈搶曬,真係值得買?我嘅 OpenClaw 實測體驗 • OpenClaw 試用報告:呢款爆紅嘅 AI 工具,而家用得未?
AI 工程系列
• Teams 得字幕冇翻譯?我喺 macOS 做咗一個實時語音翻譯器 • 由 GLM-5、MiniMax 到「利是戰爭」:開工第一日你一定要睇明嘅 AI Coding 新秩序 • AI 訂閲收緊潮:由 Anthropic 到 Google、GLM,免費午餐真係完咗
參考資料(官網/官方)
1. OpenClaw 官方文檔
https://docs.openclaw.ai/2. Elvis(@elvissun):Agent Swarm 方法論原文
https://x.com/elvissun/article/20259205218717165623. OpenAI Codex 官方文檔
https://openai.com/codex4. Anthropic Claude API 文檔
https://docs.anthropic.com/5. Google Gemini Embedding API
https://ai.google.dev/gemini-api/docs/embeddings6. Apple WWDC24 - Core Audio Taps(VoiceTranslation 項目參考)
https://developer.apple.com/videos/play/wwdc2024/10153/
昨天下午,我開了兩個半小時的需求評審會。
等我回到 Mac 前面,發現 Telegram 已經刷了一屏消息——不是羣聊灌水,而是我的兩隻"蝦"在彙報工作進度:Winnie 說 Voice Real-time Translation 的一個 bug 已修復並提了 PR;Amy 說微信公眾號的文案初稿已生成,等我過目。
我泡了杯咖啡,花了 10 分鐘 review 了 Winnie 的 PR,又花 5 分鐘調了 Amy 的措辭,合併、發佈,完事。
一句話結論:當你能用 3 個 Agent 跑通從任務派發到交付審核的完整閉環時,"一人團隊"就不再是口號,而是每天在發生的事。

如果你只有 30 秒,先看這 3 句:
1. 我用 OpenClaw 在本地 Mac 上搭了 3 個 Agent(編排器 + 編碼助手 Winnie + 文案助手 Amy),它們能自主接收任務、執行工作、提交 PR、互相協作。 2. 關鍵突破不是"Agent 能寫代碼",而是監控腳本 + 自動重試 + Telegram 通知構成了一條零人工干預的閉環——我不在電腦前,它們也在幹活。 3. 月成本約 $190,相當於僱了一個 7×24 小時的兩人小團隊。但前提是:你得花時間"養"好這個生態。
這件事的起點,是我在推特上讀到了 Elvis(@elvissun)的一篇深度分享。
Elvis 不再直接使用 Codex 或 Claude Code 寫代碼,而是通過 OpenClaw 作為編排層,由 AI 助手統一調度多個編碼 Agent。他管這套體系叫 Agent Swarm。他的公開數據讓我坐不住了:
他的 8 步工作流覆蓋了從客戶需求到合併上線的完整週期:需求收集 → 編排器確定範圍 → 生成 Agent(獨立 worktree + tmux session) → cron 循環監控(零 token) → Agent 創建 PR → 三路 AI Code Review(Codex + Gemini + Claude) → 自動化測試 → 人工審查合併。
但真正讓我決定動手的,是他提出的一個核心觀點:
上下文窗口是零和的。填滿代碼,就沒空間放業務上下文;填滿客戶歷史,就沒空間放代碼。解決方案不是找更大的窗口,而是分層——編排層持有業務全局,編碼層專注執行。
這和我之前在《開工第一天你必須看懂的 AI Coding 新秩序》裏寫的"Architect/Coder/QA 三角色協同"是同一個方向——只不過 Elvis 已經在生產環境跑通了。

二、我的 3 只蝦:誰是誰,幹什麼
"養蝦"這個比喻不是我發明的,但確實很貼切。
搭 Agent Swarm 的過程就像養蝦:搭好蝦塘(基礎設施)、放蝦苗(配置 Agent)、投飼料(派任務)、巡塘(監控腳本)、收蝦(收 PR 和內容)。核心不在某一次操作的精彩,而是維護一個可持續運轉的生態。
我目前的蝦塘裏有 3 只蝦:
2.1 編排器(Main Orchestrator)——塘主
它是整個 Swarm 的中樞,負責接收我的意圖、拆解任務、決定派給誰。
更關鍵的是,它能讓 Agent 之間協作:比如 Winnie 做完一個新功能後,編排器可以自動讓 Amy 寫更新日誌和發佈文案——整條鏈路不需要我手動銜接。
2.2 Winnie(coding-assistant)——編碼蝦
它的人設是"先結論後步驟,優先可執行方案,不做大規模重構"。
~/.openclaw/agents/coding-assistant/workspace | |
2.3 Amy(copywriting-assistant)——文案蝦
它的人設是"輸出可直接發佈,擅長新媒體文案,A/B 兩版,避免空話"。
~/.openclaw/agents/copywriting-assistant/workspace | |
三者之間的分工邏輯很明確:
不是所有任務都適合自動化。關鍵是先把"可標準化派發"的任務跑通,再逐步擴展。
三、100% 自動化閉環:到底怎麼跑通的
這是這篇文章的核心。我先畫一張全景圖,再逐步拆解每個環節。

3.1 派發:一條消息觸發一個 Agent
派發有兩種方式。
方式一:CLI 派發(適合批量或腳本觸發)
# 派 Winnie 修 Bug
~/.openclaw/swarm/spawn-agent.sh winnie fix-auth-bug \
"Fix the login validation bug in auth.ts"
# 派 Amy 寫文案
~/.openclaw/swarm/spawn-agent.sh amy blog-launch \
"寫一篇產品發佈博客,目標讀者:開發者"方式二:Telegram 消息派發(適合隨時隨地)
在 Telegram 裏發消息給對應的 Bot,編排器自動路由。這也是我最常用的方式——開會間隙、地鐵上、帶孩子時,掏出手機發一條消息就行。
每次派發,系統內部會做 4 件事:
1. 寫入 active-tasks.json(任務註冊表)2. 創建獨立 tmux session(互不干擾) 3. 通過 openclaw agent --agent <id> --message '<prompt>' --local啓動 Agent4. 日誌輸出到 ~/.openclaw/swarm/logs/<session>.log
3.2 執行:Agent 在 tmux 裏自主工作
這是最關鍵的一步,也是"養蝦"和"用工具"的本質區別。
Agent 啓動後,在自己的 tmux session 裏獨立運行:
• 讀取任務上下文和相關記憶 • 拉取代碼到獨立 worktree(不影響主分支) • 自主編碼或寫作 • 自主運行測試 • 完成後自動 gh pr create --fill
整個過程不需要我盯屏幕。我可以去開會、做飯、帶孩子——它們在後台持續工作。這就是從"操作工具"到"管理團隊"的躍遷。
3.3 巡檢:零 Token 的確定性監控
很多人會問:你怎麼知道 Agent 幹完了?幹得對不對?卡住了怎麼辦?
答案是 check-agents.sh——一個 100% 確定性的 Shell 腳本,零 LLM token 消耗。
它的邏輯非常簡單(也正因為簡單,才穩定):
1. 讀取 active-tasks.json中所有活躍任務2. 逐一檢查 tmux session 是否存活 3. 通過 gh pr list檢查 PR 和 CI 狀態4. 自動標記失敗任務,觸發重試 5. 超過 3 次重試則標記為 failed 並告警 6. 只在需要人工介入時才發通知
配合 cron 每 10 分鐘運行一次,這套巡檢就像蝦塘裏的自動增氧機——你不需要 24 小時盯着,但它一直在工作。
3.4 狀態機:從 running 到 review-ready
任務的狀態流轉是可追蹤的:
running → done (成功完成)
running → blocked (需要人工輸入)
running → ci-failed → respawning → running (自動重試)
running → session-dead → respawning (tmux 掛了,自動恢復)
running → failed (超過 3 次重試,人工介入)
done → review-ready (CI + review 全過)整條鏈路裏,唯一需要人的環節是最後 5-10 分鐘的 review。其餘全部自動化。這就是"100% 自動化閉環"的含義——不是"零人工",而是"人只做決策,不做執行"。
四、實戰驗證:Voice Real-time Translation 項目
光說架構沒用,得拿真實項目驗證。
我用這套 Swarm 實際參與管理的項目之一,就是之前文章裏寫過的 Voice Real-time Translation(macOS 應用名 VoiceTranslation)——一個專門解決 Teams 標準版"有字幕無翻譯"痛點的 macOS 實時語音翻譯器。
這個項目從 2025 年 8 月 11 日首次提交,到現在已經穩定運行半年,經歷了兩次關鍵重構(API Provider 管理重構 + 權限處理與音頻質量監控重構)。在引入 Agent Swarm 後,工作方式發生了質變:
上週的一個真實案例:
我在開需求評審會,順手在 Telegram 給 Winnie 發了一條消息:
"VoiceTranslation 的 Core Audio Tap 在藍牙設備切換時偶爾丟幀,查一下 AudioStreamBasicDescription 的採樣率同步邏輯,修復後跑 unit test。"
兩個半小時後會議結束,Winnie 已經提了 PR,附帶了修復代碼和通過的測試用例。我 review 了 5 分鐘,合併。
與此同時,Amy 在另一個 tmux session 裏完成了一篇微信公眾號文案的初稿。我調整了幾處措辭,也發了。
一個下午,兩個交付,人工介入總共 15 分鐘。

五、蝦塘的水電和增氧:技術架構全解
為了讓不那麼技術的讀者也能理解,我用"蝦塘"的比喻來對照每一層組件。
5.1 蝦塘本體(基礎設施)
5.2 飼料(模型配置)
兩個 Codex 賬號輪換使用,避免單賬號限額觸頂:
"order": {
"openai-codex": [
"openai-codex:second",
"openai-codex:default",
"anthropic:manual"
]
}5.3 增氧系統(監控工具鏈)
active-tasks.json | ||
spawn-agent.sh | ||
check-agents.sh | ||
logs/ |
5.4 賬號隔離策略
這是一個容易被忽略但極其重要的細節:
為什麼要隔離?因為 Agent 的 token 消耗量遠超人類手動使用。如果共用一個賬號,Agent 跑滿限額後我自己就用不了了。
5.5 自建代理:成本控制的隱藏關鍵
我的 Anthropic 和 Gemini API 不是直接調用官方端點,而是通過自建代理訪問(BaseURL: https://cc.junxinzhang.com)。好處是:統一管理所有 API 調用日誌、實時監控成本、異常時可快速切換。
六、成本賬:養蝦到底花多少錢
6.1 參考數據:Elvis 的公開成本
| 合計 | ~$190/月 |
6.2 我的實際成本
我目前還在測試和調優階段,任務密度沒有 Elvis 那種"日均 50 commit"的級別。當前月成本大約 $50-80。
但核心不是"花多少錢",而是產出比。一個初級開發者的月薪遠不止 $190。而這兩隻蝦 7×24 小時在線,沒有社保、不請假、不需要管理。當然,它們不會主動提需求——這也是"人在迴路"的價值所在。
6.3 硬件邊界
瓶頸是 RAM,不是 CPU。每個 Agent 的 tmux session + worktree + 模型上下文都在吃內存。
七、踩過的坑(省你走彎路)
不說踩坑記錄的文章是不完整的。以下是我搭建過程中最痛的幾個:
7.1 網絡代理干擾 Cloudflare Tunnel
問題:cloudflared 持續報錯 "there are no free edge addresses left to resolve to",QUIC timeout 不斷。
根因:本地 Stash 代理(端口 7890)劫持了 DNS,將 Cloudflare edge 解析到假 IP 198.18.0.x。QUIC 使用 UDP,代理無法正確轉發。
解法:在 Stash 配置中 bypass *.argotunnel.com;或者在 cloudflared 中添加 --protocol http2 強制 TCP。
教訓:本地跑代理工具的同學特別注意——任何需要 UDP/QUIC 的服務都可能被代理干擾。
7.2 Codex Device Auth 在代理環境下失敗
問題:執行 codex login --device-auth 始終無法完成認證流程。
解法:https_proxy="" codex login --device-auth,繞過代理即可。Business 工作空間還需管理員啓用 device code auth。
7.3 Token 過期導致 Agent 靜默失敗
問題:Codex OAuth token 有效期約 10 天。過期後 Agent 不報錯,只是靜默停止工作——這是最陰險的 bug,因為你以為蝦還在幹活,其實已經罷工了。
解法:在 check-agents.sh 中增加 token 有效性檢查。定期刷新 token 並同步到 OpenClaw。備份機制:~/.codex/auth.json.kiyo.bak。
7.4 新舊版本共存導致 CLI 衝突
問題:本地同時存在 ~/.clawdbot/(舊版 Clawdbot 2026.1.24-3)和 ~/.openclaw/(新版 OpenClaw 2026.2.25),兩套 CLI、兩套 Memory DB、兩個 Gateway 端口,互相干擾。
解法:統一以 ~/.openclaw/ 為準,舊版不再使用。切記清理乾淨,否則後台進程可能佔端口。
八、從"用工具"到"養生態":6 條核心理念

總結這段實踐,我提煉了 6 條核心原則:
1. 分層上下文:編排器持有業務全局,Agent 專注執行。不要讓一個 Agent 又懂業務又寫代碼——這會快速吃光上下文窗口。 2. 專業化分工:Winnie 寫代碼,Amy 寫文案,各司其職。混用一個通用 Agent 做所有事的效果遠不如專業化配置。 3. 賬號隔離:我本地開發用一個賬號,Agent 跑任務用另外的賬號,互不干擾、互不搶限額。 4. 零 Token 監控:確定性腳本巡檢,只在需要時消耗 API。監控本身不應該是 LLM 任務——這是很多人容易犯的錯。 5. 遞歸改進:成功的 prompt 模式記入 memory,失敗的也記錄原因和修復方案。每一次執行都在為下一次積累經驗。 6. 人在迴路:Agent 做 80% 的執行工作,人做 20% 的決策和審查。完全無人介入不是目標,高效協作才是。
寫在最後
"養蝦"不是一個精確的技術詞,但它抓住了一個本質:
AI Agent 的價值不在單次調用的驚豔,而在持續運轉的生態。
搭好蝦塘、選好蝦苗、配好飼料、裝好增氧機——然後你可以去做更重要的事:思考業務方向、和客戶對齊需求、做技術決策。那些能被標準化拆解和重複執行的工作,交給蝦去做。
我目前的 Swarm 還在早期階段,接下來會繼續推進幾件事:
• 配置 cron 定時運行 check-agents.sh • 測試 Winnie → Amy 的跨 Agent 自動協作鏈路 • 引入三路 AI Code Review(Codex + Gemini + Claude) • 擴展更多 Agent 角色:SEO 專家、數據分析 • 持續積累 memory,讓每隻蝦越養越聰明
如果你也在琢磨 Agent Swarm,或者對 OpenClaw 有實操經驗,歡迎交流。
一個人 + AI Agent Swarm = 一個團隊。這不再是願景,而是每天在發生的事。
相關閲讀
OpenClaw 系列
• 用 OpenClaw 做 A 股量化?我試了試,聊聊真實感受 • Mac Mini 被 AI 圈搶光了,真的值得買嗎?我的 OpenClaw 實測體驗 • OpenClaw 嚐鮮報告:這款爆火的 AI 工具,現在能用嗎?
AI 工程系列
• Teams 只有字幕沒有翻譯?我在 macOS 做了一個實時語音翻譯器 • 從 GLM-5、MiniMax 到"紅包大戰":開工第一天你必須看懂的 AI Coding 新秩序 • AI 訂閲收緊潮:從 Anthropic 到 Google、GLM,免費午餐真的結束了
參考資料(官網/官方)
1. OpenClaw 官方文檔
https://docs.openclaw.ai/2. Elvis(@elvissun):Agent Swarm 方法論原文
https://x.com/elvissun/article/20259205218717165623. OpenAI Codex 官方文檔
https://openai.com/codex4. Anthropic Claude API 文檔
https://docs.anthropic.com/5. Google Gemini Embedding API
https://ai.google.dev/gemini-api/docs/embeddings6. Apple WWDC24 - Core Audio Taps(VoiceTranslation 項目參考)
https://developer.apple.com/videos/play/wwdc2024/10153/