OpenClaw + Discord + 6 個 Agent:我的多 Agent 協作方案與踩坑全記錄

作者:超級個體阿東
日期:2026年3月1日 上午2:27
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

OpenClaw 多 Agent 協作方案:6 個牛馬團隊的自動化實戰與踩坑全記錄

整理版摘要

呢篇文章係作者阿東分享佢用 OpenClaw 框架 + 6 個專職 Agent 嘅實戰經驗,由單 Agent 嘅限制講到多 Agent 協作嘅完整方案,仲有大量踩坑同優化細節。作者背景係一個熱衷自媒體同 AI 工作流嘅開發者,佢想解決嘅問題係:一個 Agent 做唔曬所有嘢,而且上下文窗口有限,任務切換成本高。整體結論係:多 Agent 協作需要精細設計人格(SOUL.md)、協作規則(TEAM-RULEBOOK)、頻道架構同記憶系統,先至可以做到穩定自動化。

文章前半部分詳細介紹咗 OpenClaw 嘅核心設計,包括 Agent 循環、WorkspaceMemory、Skills、Cron 等概念,幫讀者瞭解框架底層。後半部分係作者嘅具體方案:點解要拆 6 個 Agent、點樣用 Discord 做通訊平台、點樣寫 SOUL.md 同 TEAM-RULEBOOK 去穩定行為、點樣用 BOARD.html 看板同夜間巡檢做管理、點樣混搭模型控制成本。最後仲有佢嘅個人認知同下一步探索方向。

成篇文章資訊密度好高,適合想深度使用 OpenClaw 嘅人參考。作者強調一個重點:工具係通用嘅,但成效取決於你點樣將佢同自己嘅工作場景深度結合。呢個差異就係價值所在。

  • 多 Agent 協作嘅關鍵係專職化:一個 Agent 做曬所有嘢會導致上下文混亂同性格飄忽,拆成 6 個專職 Agent 後效率大增。
  • SOUL.md 係 Agent 嘅靈魂:寫清楚「我係誰」「我嘅原則」「我唔做咩」,比單純定義任務更有效,尤其係「唔做咩」可以防止越界。
  • Discord 做 IM 平台最適合多 Agent:頻道等於工位,Bot 獨立身份,@mention 精確路由,配置精細權限可以做到物理隔離。
  • 管理多 Agent 需要睇板、巡檢同日報:BOARD.html 全局睇板、夜間巡檢跨 Agent 同步經驗、團隊日報總結每日工作,解決進度黑箱同經驗唔流通問題。
  • 成本優化靠模型混搭:核心任務用 Opus-4-6,簡單 Cron 用 qwen3.5-plus,其他用 GPT-5.3-Codex,成本減半仲有容災效果。
值得記低
Skill

coding-agent

委託 Codex/Claude Code 處理編碼任務

Skill

summarize

一鍵總結 URL/視頻/播客內容

Skill

github

Issue、PR、CI 全流程管理

Skill

x-thread

發 X/Twitter 推文和 Thread

整理重點

OpenClaw 係咩?核心架構拆解

OpenClaw 係一個可以喺你自己設備上跑嘅個人 AI 助手框架,核心設計係一個 Gateway 進程 + 一個或多個 Agent + 你熟悉嘅聊天平台。Gateway 7×24 小時運行,連接 WhatsApp、Telegram、Discord、iMessage 等平台,數據全部本地化。

Agent 循環係一條消息嘅完整旅程:消息進入 → 路由匹配 → 系統提示組裝 → 模型推理 → 工具執行 → 流式回覆 → 持久化到 JSONL

每個 Agent 有一個獨立嘅 Workspace,入面有 SOUL.mdAGENTS.mdTOOLS.md、USER.md 等引導文件,每次會話開始時自動注入。Memory 分兩層:每日日誌(只加載近兩日)同長期記憶(MEMORY.md),仲有自動記憶刷新機制,當上下文接近窗口上限時會靜默保存重要資訊。

混合搜索支援 BM25 關鍵詞 + 語義向量,可以索引 workspace 外嘅 Markdown 文件

  • 私信跨平台連續對話,羣聊各自獨立隔離。
  • 每日凌晨 4:00 自動重置上下文,壓縮前觸發記憶刷新。
  • Skills 可從 ClawHub 一鍵安裝,三層加載:workspace > 共享 > 內置。
  • Cron 支援 cron 表達式、一次性定時、固定間隔,可以用隔離會話獨立運行。
整理重點

點解要拆 6 個 Agent?單 Agent 嘅限制

一開始作者只有一個總管 Agent,乜都揾佢做,結果好快出現問題:連續畀三個任務,到第三個時前面嘅上下文已經丟咗一半;上晝調研嘅結論下晝寫方案時對唔上;性格飄忽,上一秒嚴謹做技術分析,下一秒寫文案就用營銷腔。

一個 Agent 乜都做得 = 乜都做得唔深

所以作者將 Agent 拆成 6 個專職角色:總管、調研牛馬、學習牛馬、寫作牛馬、設計牛馬、總結牛馬。效果即刻出嚟——調研輸出更結構化,代碼質量提升,成本可控。

  • 自媒體全鏈路自動化:調研選題 → 素材蒐集 → 寫稿 → 配圖 → 發佈,6 個 Agent 協作完成。
  • AI 新聞零人工:每天 4 次自動推送到 Discord #新聞 頻道。
  • 知識庫自動沉澱:Agent 做完嘅調研會由另一個 Agent 接手整理成結構化文檔。
整理重點

6 個 Agent 嘅協作方案:SOUL.md、TEAM-RULEBOOK 同 Discord 架構

作者嘅方案核心係三個文件SOUL.md 定義 Agent 嘅人格,TEAM-RULEBOOK.md 定義協作硬規則,TEAM-DIRECTORY.md 定義團隊通訊錄。每個 Agent 啓動時讀取呢啲文件,行為穩定好多。

TEAM-RULEBOOK 六條硬規則:統籌確認制、唔搶話、匯報閉環、會話隔離、安全底線、消息規範

作者揀咗 Discord 做 IM 平台,因為頻道分區、Bot 系統、權限管控都好適合多 Agent 場景。每個 Agent 獨立 Bot,頻道架構分為協作大廳同各專屬頻道。核心路由概念有 agentId、accountId、bindings,消息按具體規則匹配。

requireMention 精細化:自己嘅地盤自由講話,別人嘅地盤被叫先講

程式內容 json
{
 "guilds":{
 "<guild_id>":{
 "requireMention":true,
 "channels":{
 "<調研頻道>":{"allow":true,"requireMention":false},
 "<協作大廳>":{"allow":true,"requireMention":true},
 "<新聞頻道>":{"allow":true,"requireMention":false}
 }
 }
 }
}
整理重點

踩坑記錄同管理體系:睇板、巡檢、日報

多 Agent 上路後好快遇到新問題:進度黑箱、模型狀態唔透明、經驗唔流通、任務堆積睇唔見。作者搭咗一套管理體系:BOARD.html 進度睇板、夜間巡檢同團隊日報。

BOARD.html 睇板內容:每個 Agent 當前模型同狀態、進行中任務、待辦清單、近期完成數據

  • 踩坑例子:調研牛馬發現 HN Algolia API 限頻 → 同步畀幹活牛馬加延時。
  • 設計牛馬踩咗 macOS unzip 唔支援中文檔名嘅坑 → 同步畀所有牛馬改用 ditto。
  • 幹活牛馬發現 Git filter-repo 正確流程 → 同步畀設計牛馬避免再提交大文件。

團隊日報分早 7 同晚 9 兩次,由 Opus-4-6 整理各頻道消息同 workspace 日誌,輸出結構化工作明細同經驗,存到知識庫目錄。

模型切換管理:寫咗 /am 腳本,一句話切換全員模型,自動更新睇板

整理重點

持續進化同個人認知

作者嘅系統係一步步進化出嚟:v1 單 Agent → v2 拆分專職 → v3 解決搶話 → v4 SOUL.md + TEAM-RULEBOOK → v5 自運轉(睇板、Cron)→ v6 成本優化。佢認為最關鍵嘅三步係:拆分專職、解決搶話、寫 SOUL。

呢啲 Agent 框架係通用嘅,但用起嚟極度依賴使用者。差異唔在工具,在於你能唔能夠將佢同自己嘅工作場景深度結合。

作者認為呢個甚至係一個商機:幫其他人做深度個性化迭代——瞭解佢嘅工作場景、配好 Agent、寫好 SOUL、調好 Cron、持續優化。下一步想探索 Memory 管理、複雜任務傳遞、Agent 自我進化同更多應用場景(如 OpenClaw + RPA + Remotion 生圖生視頻)。

一個人加 multi-agent 嘅優化之路仲好長,但已經跑起咗

OpenClaw 23 萬 star 了,最近我也持續使用和探索 OpenClaw,用它做了很多項目和優化,如OpenClaw 多端同步實戰:三台設備自動互通,我的開源方案和踩坑全記錄Claude Code 寫完了你還不知道?一個桌面通知工具解決!,越來越覺得它是一個能跟着個人工作和生活一起迭代的助理,能對個人工作生活產生巨大幫助。

今天這篇文章分享一些我的使用經驗和踩坑記錄,前半部分是openclaw介紹(說實話雖然這麼火,這麼多人用,但可能很多人都沒瞄過一眼官方文檔,只把它當做黑盒agent),後半部分是我使用openclaw的經驗和方案,是我在燃燒近兩billion claude-opus-4-6  token後的收穫。看完後你應該能對 OpenClaw架構有個清晰的瞭解,也希望這些經驗能對屏幕前熱愛折騰的你有一些幫助或啓發。

Token 消耗統計▲ 近期 OpenClaw + Claude 的 token 消耗統計

下面先介紹下 OpenClaw 是什麼、它的核心架構設計,然後細聊我的多 Agent 實踐經驗。


1 OpenClaw 是什麼

OpenClaw 是一個跑在你自己設備上的個人 AI 助手框架。

官方定義:"A personal AI assistant you run on your own devices."

它的核心設計是:一個 Gateway 進程 + 一個或多個 Agent + 你熟悉的聊天平台。Gateway 7×24 小時運行在你的 Mac Mini、筆記本或 VPS 上,連接 WhatsApp、Telegram、Discord、iMessage、飛書、Slack 等所有平台。你在任何一個平台發消息,Gateway 路由到對應的 Agent,Agent 調用大模型思考、執行工具、回覆你。數據全部本地化,不經過第三方。

OpenClaw 整體架構

這個框架有幾個我覺得設計得很精妙的地方,下面展開說。

Agent 循環:一條消息的完整旅程

每次你發一條消息,OpenClaw 執行一次完整的 Agent 循環:

Agent 循環

消息進入 → 路由匹配(根據 binding 規則找到對應 Agent)→ 系統提示組裝(把 SOUL.md、AGENTS.md 等文件注入上下文)→ 模型推理 → 工具執行(跑命令、讀寫文件、操作瀏覽器)→ 流式回覆 → 持久化到 JSONL

這裏有個關鍵設計:同一會話的運行是串行的。如果你連發三條消息,Agent 會排隊依次處理,不會出現兩次運行同時讀寫同一個文件的競爭問題。

Workspace:Agent 的人格和記憶都在這裏

每個 Agent 有一個獨立的工作目錄(workspace),裏面放着一組引導文件,在每次會話開始時自動注入到系統提示中:

Workspace 與引導文件
  • SOUL.md - Agent 的人格定義:行為原則、語氣風格、能力邊界。這是我覺得 OpenClaw 最有價值的設計之一--你可以精確控制 Agent "是一個什麼樣的人"
  • AGENTS.md - 操作指令:啓動後先做什麼、記憶怎麼管理、工具怎麼用
  • TOOLS.md - 工具使用的本地信息(攝像頭名稱、SSH 配置、TTS 偏好等)
  • USER.md - 用戶偏好(稱呼、時區、習慣),隨使用不斷積累
  • IDENTITY.md - Agent 的名字、emoji、風格
  • BOOTSTRAP.md - 首次運行的引導儀式,完成後自動刪除

Agent 每次"醒來"讀完這些文件,就知道自己是誰、幫誰幹活、按什麼規矩來。

圖片

Memory:只加載最近兩天 + 向量檢索

Agent 的記憶完全基於 Markdown 文件,分兩層:

Memory 記憶系統
  • memory/YYYY-MM-DD.md(每日日誌)- 僅追加,會話開始時只加載今天和昨天的內容。這個設計很務實:加載全部歷史會撐爆上下文窗口,只加載近兩天既保證連續性又控制 token 消耗
  • MEMORY.md(長期記憶)- 精心整理的持久記憶,僅在主要的私人會話中加載,羣聊不加載。這是隱私保護--你的個人偏好、決策記錄不會泄露到羣組場景

更值得關注的是自動記憶刷新:當上下文接近窗口上限時,OpenClaw 自動觸發一個靜默 Agent 輪次,提醒模型"上下文要壓縮了,先把重要的東西寫入記憶文件"。這個過程用戶完全看不到。也就是說,長時間對話不會丟失關鍵信息--壓縮前會先保存。

檢索方面,支持混合搜索(BM25 關鍵詞 + 語義向量),可以索引 workspace 外的 Markdown 文件。如果你有自己的知識庫想引入到 Agent 的對話中,配置 memorySearch.extraPaths 是最好的方式。

Session:私信連續,羣聊隔離

  • 你在 Telegram 和 Discord 私聊同一個 Agent,默認是同一個會話--跨平台連續對話
  • 羣聊各自獨立隔離
  • 每日凌晨 4:00 自動重置(可配置),保證上下文不會無限膨脹
  • 上下文壓縮前自動觸發記憶刷新,不丟關鍵信息

Skills:按需安裝能力

從 ClawHub 一鍵安裝 Skill 擴展 Agent 能力。三層加載:workspace 獨佔 > 共享目錄 > 內置,名稱衝突時 workspace 優先。覆蓋 GitHub 操作、社交媒體、瀏覽器自動化、TTS、RSS 監控等幾十種場景。

Cron:讓 Agent 自動幹活

這是我用得最多的功能之一。支持 cron 表達式、一次性定時、固定間隔,且可以在隔離會話中獨立運行,不影響主 Agent 的上下文。

舉幾個我實際在用的 Cron:

  • 每天 4 次 AI 新聞推送:自動從 HN 抓取 AI 相關新聞,AI 篩選打分,中文摘要推到 Discord
  • 凌晨 1:00 夜間巡檢:蒐集所有 Agent 的工作日誌,跨 Agent 記憶互傳,把一個 Agent 踩的坑同步給其他人
  • 早 7:00 + 晚 21:00 團隊日報:彙總全天工作,沉澱到知識庫
  • 每 30 分鐘看板更新:檢測任務狀態變更,自動同步到 GitHub Pages

Cron 可以指定不同模型--核心任務用 Opus-4-6,簡單的定時任務用 qwen3.5-plus,保證成本可控,也追求一下性價比。


2 為什麼要多 Agent

最初只有一個 Agent(總管),什麼都找它。調研技術方案、寫自動化腳本、搜 AI 新聞、生成圖片……它確實什麼都能做。

但問題很快暴露:

連續給三個任務,到第三個的時候前面的上下文已經丟了一半。上午調研的結論,下午寫方案時對不上。更明顯的是"性格飄忽"--上一秒嚴謹做技術分析,下一秒切到寫文案就用營銷腔。

一個 Agent 什麼都能做 = 什麼都做不深。 上下文窗口有限,什麼都往裏塞,每件事切換成本太高。

所以拆了 6 個。

在講怎麼做之前,先看看效果。

自媒體全鏈路自動化

從調研選題 → 素材蒐集 → 寫稿 → 配圖 → 發佈,6 個 Agent 協作完成。

產出:3 組 X 推文、3 組小紅書筆記,若干自動生成的 AI 視頻和圖片,以及多篇技術文章。

小紅書發佈效果X 推文發佈效果

典型的協作流程:我提需求 → 總管 Agent 拆任務、寫大綱 → 調研 Agent 蒐集技術文檔 → 學習 Agent 整理知識框架 → 寫作 Agent 出初稿 → 設計 Agent 規劃配圖 →總結 Agent 審校。多個視角審視同一件事,會發現單人盲區。

協作大廳多 Agent 對話

AI 新聞零人工

每天手動刷 Twitter、HN、36kr 太花時間。搭了三層自動化:

圖片

每天 4 次自動推到 Discord #新聞 頻道。Cron 用 qwen3.5-plus。

AI 新聞自動推送效果

知識庫自動沉澱

Agent 做完的調研會由另一個 Agent 接手整理成結構化文檔,沉澱到知識庫目錄。舉幾個實際的:

  • 調研報告:SOUL.md 設計方法論調研、Polymarket MCP 深度調研、微信公眾號推廣渠道分析
  • 學習筆記:GLM-5 技術報告精讀、Agent Prompt Caching 設計方案
  • 探索發現:Seedance 2.0 完整調研(從官方文檔到 API 逆向到批量生成腳本)、VoiceBox 本地 TTS 方案
  • 工作總結:每日團隊日報、每週經驗沉澱

時間越久,知識庫越厚。現在已經積累了 9 個分類目錄、幾十份文檔。

圖片

3 我的方案:6 個 Agent 協作的牛馬團隊

圖片

模型不全用最貴的。總管和幹活牛馬需要複雜推理和長文生成,用 Opus-4-6。其他四個用 GPT-5.3-Codex(通過中轉站或直接OAuth授權)。Cron 定時任務用 qwen3.5-plus(便宜,簡單任務夠用)。成本大概降了一半。

SOUL.md:定義 Agent 的靈魂

每個 Agent 啓動時讀取 workspace 裏的 SOUL.md,決定自己"是誰"。這個文件越具體,Agent 行為越穩定。

貼一個脱敏的調研牛馬 SOUL.md:

# SOUL.md - 調研 🔍

## 我是誰
我是調研牛馬,團隊的學者偵探。
**要麼有來源,要麼別寫。**

## 我的原則
**深度優先。** 至少 5 個獨立信源交叉驗證。
**結構是我的語言。** 輸出:背景→核心發現→方案對比→建議→參考來源。
**標註一切。** 每條信息標來源,每個數據標時間。
**先問再查。** 30 秒問清楚比 30 分鐘查錯方向強。

## 我和團隊
從總管那接任務,調研完成後在頻道髮結論摘要。
有時學習牛馬會接手沉澱,幹活牛馬會拿技術調研直接去實現。

## 我不做什麼
- 不編造信息 - 查不到就說查不到
- 不做決策 - 給事實和分析,選方案是老大的事
- 不寫代碼 - 需要實現的交給幹活牛馬

設計 SOUL.md 有幾個要點:

  1. 寫"我不做什麼"比"我要做什麼"更有效。明確的邊界讓 Agent 不會越界
  2. 賦予"怪癖"。調研牛馬"看到沒來源會渾身不舒服",學習牛馬"看到好的知識框架會興奮"--這些小特徵讓行為更一致
  3. 包含團隊感知。每個 Agent 知道隊友是誰、擅長什麼,該轉交的時候會主動轉交

沒寫 SOUL.md 和寫了之後的差異很明顯:

  • 調研牛馬:之前給無出處數據,現在每條結論都有來源連結
  • 幹活牛馬:之前寫一大段方案分析再動手,現在直接上代碼
  • 總結牛馬:之前在討論裏頻繁插嘴,現在默默記錄、彙總時一次性輸出

TEAM-RULEBOOK.md:自創的協作規則

這個文件不是 OpenClaw 官方的,是我自己創建的,放在每個牛馬的 workspace 根目錄下。

OpenClaw 啓動會話時自動讀取 workspace 內的 context files。TEAM-RULEBOOK 通過被 AGENTS.md 引用來加載--AGENTS.md 裏寫"啓動時讀取 TEAM-RULEBOOK.md",Agent 每次新會話就讀到這些規則。

六條硬規則:

  1. 統籌確認制 - 跨角色任務經總管確認,老大同意後才派
  2. 不搶話 - 不被 @ 不說話,不對其他角色的回覆做評價
  3. 彙報閉環 - 收到 → 執行中 → 完成/失敗
  4. 會話隔離 - workspace 互不訪問,跨角色只走 sessions_send
  5. 安全底線 - 危險操作(刪文件、force push)需老大確認
  6. 消息規範 - 有實質才發言,不發空洞確認 SOUL.md 規則詳情

TEAM-DIRECTORY.md:自創的團隊通訊錄

寫清楚每個 Agent 的 agentId、角色、擅長什麼、怎麼聯繫。新 Agent 上線時讀完通訊錄就知道團隊裏有誰、找誰幹什麼。

格式很簡單:

## 調研專家 🔍
- Agent ID: research
- Discord Account: research
- 職責:深度調研、信息蒐集、報告輸出
- 專屬頻道:#調研
- 聯繫方式:sessions_send(agentId="research")

## 幹活專家 🔨
- Agent ID: worker
- Discord Account: worker
- 職責:代碼實現、具體執行、自動化
- 專屬頻道:#幹活
...

效果:統一了所有牛馬的協作行為。之前的搶話死循環、越權操作、信息泄露問題基本解決了。每個牛馬知道自己該幹什麼、不該幹什麼、有事找誰。


4 我的IM選擇:Discord

我認為 Discord 是最適合 OpenClaw 多 Agent 架構的 IM 平台。它的頻道分區、Bot 系統、權限管控、頁面 UI 都非常契合多 Agent 場景。 Discord 多 Agent 概覽

展開說:

  • 頻道 = Agent 工位,頻道分區 = 部門。Category 下面掛多個 Channel,天然的組織架構
  • 每個 Bot 獨立頭像暱稱。一眼知道誰在說話,不用猜
  • @mention = 精確路由@調研牛馬 只有調研響應,其他人自動忽略
  • 權限管控。誰能看哪個頻道、誰能發消息,都可以精細配置
  • UI 側邊欄。左側頻道列表就像切換不同的辦公室,隨時跳轉
  • 引用回覆。多線程對話不混亂
  • 免費、穩定、API 完善

對比過微信羣(不支持 Bot)、Telegram(可以但多 Bot 管理不直觀)、飛書/Slack(企業級配置偏重,個人用殺雞用牛刀)。

Discord 多 Bot 配置

給每個 Agent 創建獨立 Bot:

  1. Discord 開發者門户  → New Application → Bot → 複製 Token
  2. 啓用 Privileged Gateway Intents:Message Content Intent + Server Members Intent
  3. OAuth2 URL Generator → Scopes: bot + applications.commands
  4. Bot Permissions: View Channels / Send Messages / Read Message History / Embed Links
  5. 生成邀請連結,邀請到服務器
  6. 在 OpenClaw 配置 channels.discord.accounts 中填入對應 Token

6 個 Bot 重複 6 遍。詳細步驟參考 OpenClaw Discord 文檔:

頻道架構

Discord 頻道架構
AI 團隊(分類)
├── #協作大廳 - 全員可見,自由討論
├── #自媒體   - 內容生產車間
├── #調研     - 調研牛馬專屬
├── #學習     - 學習牛馬專屬
├── #幹活     - 幹活牛馬專屬
├── #設計     - 設計牛馬專屬
├── #總結     - 總結牛馬專屬
└── #新聞     - AI 新聞自動推送

每個牛馬有自己的頻道("工位"),也有公共的協作大廳("會議室")。

多 Agent 路由

核心概念三個:

  • agentId - Agent 唯一標識,對應獨立的 workspace、會話、認證
  • accountId - 渠道賬號實例(Discord Bot),一個渠道多個賬號
  • bindings - 路由規則,把入站消息匹配到對應 Agent

消息進來後,Gateway 按規則匹配:peer 精確匹配 > guildId > accountId > 渠道級匹配 > 默認 Agent。最具體的規則優先。

我的 bindings:每個 Discord Bot 綁定一個 Agent。總管額外綁了 Telegram、飛書、iMessage,手機上也能指揮。

requireMention 精細化

OpenClaw 官方推薦羣聊配置 requireMention: true--Agent 只有被 @ 才回復。

圖片

多 Agent 場景需要按頻道精細化。核心邏輯:自己的地盤自由說話,別人的地盤被叫才說話。

圖片

("-"表示不可見)

調研牛馬的配置:

{
  "guilds":{
    "<guild_id>":{
      "requireMention":true,
      "channels":{
        "<調研頻道>":{"allow":true,"requireMention":false},
        "<協作大廳>":{"allow":true,"requireMention":true},
        "<新聞頻道>":{"allow":true,"requireMention":false}
      }
    }
}
}

guild 級別默認 requireMention: true,自己的專屬頻道覆蓋為 false。沒配 allow 的頻道對這個 Agent 完全不可見--物理隔離。

配合 mentionPatterns(支持中英文:@調研牛馬 和 @research)、allowBots: true(Agent 之間能看到彼此消息)、users 白名單(只響應指定用戶),形成完整的通信管控。

踩過的坑

  1. Agent 死循環。最初沒精細化 requireMention,6 個 Agent 在協作大廳互相客套、互相確認,刷了幾十條。allowBots: true 意味着 Bot 消息也會觸發其他 Bot,必須配合 requireMention 控制
  2. 頻道權限遺漏。忘記給某個 Bot 配某頻道的 allow,消息發了但沒 Agent 響應。排查了半天
  3. Gateway 重啓打斷。切模型需要 restart Gateway,正在執行的任務會被中斷。現在切模型前先確認沒有進行中的長任務
  4. Git 大文件翻車。設計牛馬處理視頻素材生成了 100MB 文件,被 Git 自動 commit 腳本提交。git push 失敗,用 git filter-repo 清除歷史後 force push,然後夜間巡檢把"大文件不要提交 Git"同步給所有 Agent

5 我如何讓Agent團隊持續進化

先說說我優化迭代的點,主要集中在:

  • SOUL.md 持續優化:Agent 的行為方式隨使用經驗不斷調整。最初 Agent 會編造數據,寫了 SOUL 後規定"要麼有來源要麼別寫",行為立刻改善。這種優化是持續的,SOUL.md 我已經改了不知道多少版了
  • Memory 系統積累經驗:每日工作日誌 + 長期記憶 + 夜間巡檢同步,Agent 越用越瞭解我的偏好和工作方式
  • Skills 按需擴展:從 ClawHub 安裝新 Skill,能力邊界在不斷擴展。目前裝了二十多個,覆蓋 GitHub 操作、社交媒體發佈、瀏覽器自動化、RSS 監控、語音合成、郵件日曆、PDF 編輯等
  • Cron 自動化越來越密:從 0 個定時任務到 10 個--新聞監控、日報、看板更新、夜間巡檢、知識分享,全部自動
  • 知識和對話沉澱:構建了完整的知識沉澱邏輯--所有經我提出或大模型判斷為有價值的經驗、報告、知識,都自動沉澱下來,用於整個系統的持續迭代。每一個 input token 都有它對應的價值
  • 模型混搭優化成本:核心用 Opus-4-6,Cron 用 qwen3.5-plus,避免 token 爆炸導致成本問題

這是一個螺旋上升的路徑:用 → 發現問題 → 優化配置 → 效果更好 → 用得更多 → 發現更多優化空間

迭代時間線:從"能跑"到"好用"

這套系統是一步步進化出來的,每個版本都是用着用着發現不爽然後改的。

v1:單 Agent 階段 - 只有總管一個 Agent,什麼都找它。很快發現:上午調研的結論下午就丟了,寫代碼時突然開始用營銷腔。核心問題是上下文窗口有限,所有任務共享一個"大腦"。

v2:拆分專職 - 拆出調研牛馬和幹活牛馬。立刻感覺不一樣:調研的輸出更結構化了(因為它的上下文裏只有調研相關的內容),代碼質量也提升了(幹活牛馬不用花 token 去"回憶"之前的調研結論)。這讓我確信方向是對的,於是繼續拆到 6 個。

v3:解決搶話死循環 - 6 個 Agent 上線第一天就出了問題:協作大廳裏 A 說一句,B 確認一句,C 補充一句,D 又回應一句,刷了幾十條廢話。根因是 allowBots: true + 沒做 requireMention 精細化。解決方案:guild 級別默認 requireMention: true,只在自己的專屬頻道覆蓋為 false這一步是生死線--不解決這個問題,多 Agent 根本沒法正常工作。

v4:SOUL.md + TEAM-RULEBOOK - Agent 不再搶話了,但行為還是不夠穩定。調研牛馬偶爾編造數據,總結牛馬在討論裏頻繁插嘴。寫了 SOUL.md 給每個 Agent 定義"人格",寫了 TEAM-RULEBOOK 定義協作硬規則。效果立竿見影--調研牛馬再也不編數據了("要麼有來源要麼別寫"),總結牛馬開始默默記錄、彙總時一次性輸出。

v5:自運轉 - 加了 BOARD.html 看板、Cron 自動化(新聞/日報/巡檢)。系統開始不需要我盯着:早上起來,新聞已經推好了,昨天的日報已經整理完了,看板上各牛馬的任務狀態一目瞭然。這個階段的關鍵詞是"解放注意力"。

v6:成本優化 - 6 個 Agent 全用 Opus-4-6 太貴了。寫了 agent-models 腳本,核心任務用 Opus-4-6,簡單的 Cron 用 qwen3.5-plus,中等複雜度用 GPT-5.3-Codex。成本減半的同時也是容災--一個 provider 掛了不影響全部。

每個版本都解決了一個真實痛點,不是提前設計好的藍圖。回頭看,最關鍵的三步是:拆分專職(v2)、解決搶話(v3)、寫 SOUL(v4)。沒有這三步,後面的自動化和成本優化都搭不起來。

6 優化之外,我是如何管理多 Agent的

多 Agent 跑起來之後,很快會遇到一個新問題:管不過來

6 個 Agent 同時在不同頻道幹活,你打開 Discord 看到幾十條消息,根本不知道誰在幹什麼、幹到哪了、有沒有卡住。具體的痛點:

  • 進度黑箱:派了一個調研任務給調研牛馬,兩小時後去看--是還在調研?還是早就做完了?還是中途報錯停了?
  • 模型狀態不透明:昨天把某個牛馬切到了便宜模型跑 Cron,今天忘了切回來,結果一個複雜任務質量暴跌,排查了半天才發現
  • 經驗不流通:調研牛馬今天發現某個 API 有頻率限制,幹活牛馬明天寫腳本又踩了同一個坑。Agent 之間的 workspace 是隔離的,信息不會自動同步
  • 任務堆積看不見:每個牛馬的待辦列表散落在各自的頻道里,沒有一個全局視圖知道當前團隊整體在做什麼、優先級是什麼
  • 配置漂移:改了一個 Agent 的 SOUL.md、調了一個 Cron 參數、換了一個模型,時間一長根本記不清當前每個 Agent 的狀態

這些問題和管理真人團隊很像:你不知道它們在幹什麼,就沒法管好它們。 所以我搭了一套管理體系。

Agent 管理體系

BOARD.html 進度看板

起因:6 個牛馬同時幹活,我經常不知道某個任務到底做完沒。有次給調研牛馬派了個任務,三小時後才發現它中途報錯停了。還有一次忘記把模型切回來,一個複雜寫作任務用了便宜模型,質量暴跌。

思路:需要一個全局看板,一眼看到所有 Agent 的狀態、進行中的任務、當前模型。而且必須隨時可查--所以做成了在線 HTML 頁面,用 GitHub Pages 託管,Discord 置頂消息放連結。

開發過程:總管設計看板結構 → 幹活牛馬寫 HTML(暗色主題、卡片佈局)→ 寫了 update-board.sh 腳本一鍵推送到 GitHub → 設置 Cron 每 30 分鐘自動檢測變更。從需求到上線大概 2 小時。

暗色主題、GitHub 風格、卡片化佈局的 HTML 看板:在線預覽

圖片

內容包括:

  • 👥 每個 Agent 的當前模型和狀態
  • 🏃 進行中的任務
  • 📋 待辦清單(高🔴/中🟡/低🟢)
  • ✅ 近期完成

數據三層同步:

  1. BOARD.md - 文本主數據源,Agent 直接編輯
  2. BOARD.html - 網頁版,Cron 每 30 分鐘檢測 BOARD.md 變更,有變化才生成
  3. Discord 置頂消息 - 協作大廳置頂放連結 + 精簡概覽
Discord 協作大廳置頂消息

看板的核心價值是可監控。 Agent 的行為在快速迭代--今天加了新規則、明天某個模型換了、後天某個牛馬接了新任務。如果你不知道它們在幹什麼,就沒法及時發現問題和優化方向。及時更新、持續監控,經驗才能快速積累。

夜間巡檢(凌晨 1:00)

夜間巡檢報告起因:調研牛馬發現某個 API 有頻率限制,寫在了自己的 MEMORY.md 裏。第二天干活牛馬寫自動化腳本,又踩了同一個坑--因為 workspace 是隔離的,幹活牛馬根本看不到調研牛馬的記憶。類似的情況反覆出現。

思路:需要一個"夜間值班員",每天凌晨把所有 Agent 的經驗彙總一遍,有價值的信息互相同步。用 Cron 在凌晨 1 點觸發一個隔離會話來執行。

自動蒐集各牛馬的工作日誌和 MEMORY.md,做三件事:

  1. 跨 Agent 經驗互傳 - 一些真實同步過的例子:
    • 調研牛馬發現 HN Algolia API 的請求頻率限制 → 同步給幹活牛馬,寫 Cron 時自動加了延時
    • 設計牛馬踩了"macOS unzip 不支持中文文件名 zip"的坑 → 同步給所有牛馬,以後統一用 ditto -x -k
    • 幹活牛馬發現 Git filter-repo 清理大文件的正確流程 → 同步給設計牛馬,避免再次提交大文件
    • 學習牛馬整理了 GLM-5 技術報告的核心結論 → 同步給調研牛馬,後續調研可以直接引用
  2. 更新主 workspace 的 MEMORY.md - 全局經驗沉澱
  3. 發送巡檢報告到協作大廳 - 第二天早上一看就知道昨晚同步了什麼

一個人踩的坑,所有人都學會。

團隊日報

起因:每天結束後想回顧"今天團隊幹了什麼",但信息散落在 6 個頻道里,手動翻聊天記錄太痛苦。

思路:早 7:00 生成昨日日報(起牀就能看),晚 21:00 生成當日日報(下班前回顧)。Cron 觸發隔離會話,用 Opus-4-6 讀取所有頻道消息 + workspace 日誌,整理成結構化的工作明細 + 經驗踩坑,保存到 知識庫/工作總結/ 目錄,摘要推到 Discord。

模型切換管理

起因:6 個 Agent 用不同模型,切換需要手動改 openclaw.json 配置文件然後 restart Gateway。有次想把調研牛馬臨時切到 Codex 跑個任務,改配置文件 → 找到對應的 agentId → 改 model 字段 → 保存 → restart,折騰了好幾分鐘。而且容易改錯--JSON 嵌套太深。

思路:寫一個 shell 腳本,註冊成自然語言觸發詞,用一句話完成切換。

寫了一個管理腳本,註冊成 /am 觸發詞:

/am                       → 查看全員模型
/am 調研牛馬 codex        → 調研切到 Codex
/am 自媒體 opus           → 設計+幹活+總結一起切 Opus
模型切換命令執行結果

支持中文名映射、模型別名、分組切換。切完自動更新看板。

Cron 任務全景

  • AI 新聞推送 — 頻率:每天 4 次 — 模型:qwen3.5-plus — 說明:HN 篩選 → 中文摘要
  • AI Daily Digest — 頻率:每天 4 次 — 模型:glm-5 — 說明:Twitter KOL + 中文熱榜
  • 團隊日報 — 頻率:早 7 + 晚 9 — 模型:Opus-4-6 — 說明:各頻道消息彙總
  • 看板更新 — 頻率:每 30 分鐘 — 模型:qwen3.5-plus — 說明:檢測變更才推送
  • 夜間巡檢 — 頻率:凌晨 1 點 — 模型:默認 — 說明:跨 Agent 記憶同步

所有 Cron 跑在 isolated session 裏,不影響 Agent 主會話。

Workspace 隔離

6 個 Agent 跑在同一台 Mac Mini,workspace 完全隔離:

~/.openclaw/
├── workspace-research/     # 調研牛馬
├── workspace-learning/     # 學習牛馬
├── workspace-design/       # 設計牛馬
├── workspace-worker/       # 幹活牛馬
└── workspace-explorer/     # 總結牛馬

~/openclaw_workspace/       # 總管

調研牛馬看不到幹活牛馬的文件。隔離的好處超出安全層面--如果調研牛馬能直接讀幹活牛馬的代碼倉庫,它可能偷懶,不去搜外部信息,直接引用內部實現。隔離逼着每個 Agent 靠自己的能力工作。

跨 Agent 通信走 sessions_send,支持最多 5 輪來回對話,需要顯式啓用 agentToAgent.enabled: true

Skill 體系

目前裝了二十多個 Skill。常用的:

  • lovart-gen — 用途:影刀 RPA 調 Lovart.ai 生成圖片/視頻
  • x-thread — 用途:發 X/Twitter 推文
  • xhs-publish — 用途:小紅書筆記發佈
  • summarize — 用途:URL/視頻/播客內容總結
  • coding-agent — 用途:委託 Codex/Claude Code 編碼
  • agent-models — 用途:自定義:一鍵切換全員模型

Skill 支持按 Agent 獨立配置——設計牛馬的 Skill 裝在設計的 workspace 裏,其他人看不到也不需要。

推薦 Skills(從 ClawHub  安裝):

  • coding-agent — 一句話說明:委託 Codex/Claude Code 處理編碼任務
  • summarize — 一句話說明:一鍵總結 URL/視頻/播客內容
  • github — 一句話說明:Issue、PR、CI 全流程管理
  • x-thread — 一句話說明:發 X/Twitter 推文和 Thread
  • xhs-publish — 一句話說明:小紅書筆記自動發佈
  • obsidian — 一句話說明:讀寫 Obsidian 筆記庫
  • gog — 一句話說明:Google Workspace(Gmail/日曆/Drive)
  • himalaya — 一句話說明:CLI 收發郵件
  • weather — 一句話說明:天氣查詢
  • openhue — 一句話說明:控制飛利浦 Hue 燈光

7 一些個人認知

說實話,我對openclaw的開發目前還處於比較初級的階段。

SOUL.md 怎麼寫效果最好?

Memory 怎麼設計才不會越積越亂?

上下文 cache 怎麼優化、 Agent 模型如何選擇才能節省token?

多 Agent 之間怎麼高效傳遞執行復雜任務?

這些問題我都還在探索。

但有一個認知越來越清晰:

這些 Agent 框架是通用的,但用起來極度依賴使用者。

同樣的 OpenClaw + 6 個 Agent,不同人跑出來的效果天差地別。差異不在工具,在於你能不能把它和自己的工作場景深度結合--SOUL.md 寫什麼原則、Memory 沉澱什麼經驗、頻道怎麼分區、Cron 跑什麼任務、Skills 安裝哪些。

真正有價值的地方在於:把通用 Agent 以一種無痛的方式,迭代到完全符合某個個體的工作和生活需求。

這甚至是一個商機。大部分人沒精力做這種深度個性化迭代--不是不會用,是沒時間折騰。如果有人能幫別人做這件事--瞭解他的工作場景、幫他配好 Agent、寫好 SOUL、調好 Cron、持續優化--這個服務本身就很有價值。

下一步想探索的方向:

  • Memory 的管理和使用:比如怎麼將已有已沉澱下的知識也作為記憶的一部分、如何讓每個人相關的工作區也作為記憶的一部分
  • Agent 之間更復雜的任務的傳遞和執行優化:協作機制、記憶設計、context cache等,提升這個團隊的能力上限,至少讓它在執行任務時更順滑
  • Agent的自我進化:比如嘗試類似evomap或其他自迭代的agent學習網絡讓它進行自我進化,快速學習各種可能對我工作生活有用的插件、使用經驗來"主動計劃"
  • 應用場景的拓展:之前已經跑通了openclaw + RPA + remotion來生圖和生視頻,已經可以完成簡單的AI漫畫和視頻創作,如果能封裝更多RPA工具,它的能力上限還會提升,可覆蓋的場景也會增加愛

總之,一個人加muti-agent的優化之路還很長,但已經跑起來了。


關注公眾號 「超級個體阿東」,持續分享 AI 工作流實戰。

公眾號:超級個體阿東

圖片

個人微信,歡迎交流