OpenClaw + Discord + 6 個 Agent：我的多 Agent 協作方案與踩坑全記錄

作者：超級個體阿東

日期：2026年3月1日上午2:27

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

OpenClaw 多 Agent 協作方案：6 個牛馬團隊的自動化實戰與踩坑全記錄

整理版摘要

呢篇文章係作者阿東分享佢用 OpenClaw 框架 + 6 個專職 Agent 嘅實戰經驗，由單 Agent 嘅限制講到多 Agent 協作嘅完整方案，仲有大量踩坑同優化細節。作者背景係一個熱衷自媒體同 AI 工作流嘅開發者，佢想解決嘅問題係：一個 Agent 做唔曬所有嘢，而且上下文窗口有限，任務切換成本高。整體結論係：多 Agent 協作需要精細設計人格（SOUL.md）、協作規則（TEAM-RULEBOOK）、頻道架構同記憶系統，先至可以做到穩定自動化。

文章前半部分詳細介紹咗 OpenClaw 嘅核心設計，包括 Agent 循環、Workspace、Memory、Skills、Cron 等概念，幫讀者瞭解框架底層。後半部分係作者嘅具體方案：點解要拆 6 個 Agent、點樣用 Discord 做通訊平台、點樣寫 SOUL.md 同 TEAM-RULEBOOK 去穩定行為、點樣用 BOARD.html 看板同夜間巡檢做管理、點樣混搭模型控制成本。最後仲有佢嘅個人認知同下一步探索方向。

成篇文章資訊密度好高，適合想深度使用 OpenClaw 嘅人參考。作者強調一個重點：工具係通用嘅，但成效取決於你點樣將佢同自己嘅工作場景深度結合。呢個差異就係價值所在。

多 Agent 協作嘅關鍵係專職化：一個 Agent 做曬所有嘢會導致上下文混亂同性格飄忽，拆成 6 個專職 Agent 後效率大增。
SOUL.md 係 Agent 嘅靈魂：寫清楚「我係誰」「我嘅原則」「我唔做咩」，比單純定義任務更有效，尤其係「唔做咩」可以防止越界。
用 Discord 做 IM 平台最適合多 Agent：頻道等於工位，Bot 獨立身份，@mention 精確路由，配置精細權限可以做到物理隔離。
管理多 Agent 需要睇板、巡檢同日報：BOARD.html 全局睇板、夜間巡檢跨 Agent 同步經驗、團隊日報總結每日工作，解決進度黑箱同經驗唔流通問題。
成本優化靠模型混搭：核心任務用 Opus-4-6，簡單 Cron 用 qwen3.5-plus，其他用 GPT-5.3-Codex，成本減半仲有容災效果。

值得記低

Skill

coding-agent

委託 Codex/Claude Code 處理編碼任務

Skill

summarize

一鍵總結 URL/視頻/播客內容

Skill

github

Issue、PR、CI 全流程管理

Skill

x-thread

發 X/Twitter 推文和 Thread

整理重點

OpenClaw 係咩？核心架構拆解

OpenClaw 係一個可以喺你自己設備上跑嘅個人 AI 助手框架，核心設計係一個 Gateway 進程 + 一個或多個 Agent + 你熟悉嘅聊天平台。Gateway 7×24 小時運行，連接 WhatsApp、Telegram、Discord、iMessage 等平台，數據全部本地化。

Agent 循環係一條消息嘅完整旅程：消息進入 → 路由匹配 → 系統提示組裝 → 模型推理 → 工具執行 → 流式回覆 → 持久化到 JSONL

每個 Agent 有一個獨立嘅 Workspace，入面有 SOUL.md、AGENTS.md、TOOLS.md、USER.md 等引導文件，每次會話開始時自動注入。Memory 分兩層：每日日誌（只加載近兩日）同長期記憶（MEMORY.md），仲有自動記憶刷新機制，當上下文接近窗口上限時會靜默保存重要資訊。

混合搜索支援 BM25 關鍵詞 + 語義向量，可以索引 workspace 外嘅 Markdown 文件

私信跨平台連續對話，羣聊各自獨立隔離。
每日凌晨 4:00 自動重置上下文，壓縮前觸發記憶刷新。
Skills 可從 ClawHub 一鍵安裝，三層加載：workspace > 共享 > 內置。
Cron 支援 cron 表達式、一次性定時、固定間隔，可以用隔離會話獨立運行。

整理重點

點解要拆 6 個 Agent？單 Agent 嘅限制

一開始作者只有一個總管 Agent，乜都揾佢做，結果好快出現問題：連續畀三個任務，到第三個時前面嘅上下文已經丟咗一半；上晝調研嘅結論下晝寫方案時對唔上；性格飄忽，上一秒嚴謹做技術分析，下一秒寫文案就用營銷腔。

一個 Agent 乜都做得 = 乜都做得唔深

所以作者將 Agent 拆成 6 個專職角色：總管、調研牛馬、學習牛馬、寫作牛馬、設計牛馬、總結牛馬。效果即刻出嚟——調研輸出更結構化，代碼質量提升，成本可控。

自媒體全鏈路自動化：調研選題 → 素材蒐集 → 寫稿 → 配圖 → 發佈，6 個 Agent 協作完成。
AI 新聞零人工：每天 4 次自動推送到 Discord #新聞頻道。
知識庫自動沉澱：Agent 做完嘅調研會由另一個 Agent 接手整理成結構化文檔。

整理重點

6 個 Agent 嘅協作方案：SOUL.md、TEAM-RULEBOOK 同 Discord 架構

作者嘅方案核心係三個文件：SOUL.md 定義 Agent 嘅人格，TEAM-RULEBOOK.md 定義協作硬規則，TEAM-DIRECTORY.md 定義團隊通訊錄。每個 Agent 啓動時讀取呢啲文件，行為穩定好多。

TEAM-RULEBOOK 六條硬規則：統籌確認制、唔搶話、匯報閉環、會話隔離、安全底線、消息規範

作者揀咗 Discord 做 IM 平台，因為頻道分區、Bot 系統、權限管控都好適合多 Agent 場景。每個 Agent 獨立 Bot，頻道架構分為協作大廳同各專屬頻道。核心路由概念有 agentId、accountId、bindings，消息按具體規則匹配。

requireMention 精細化：自己嘅地盤自由講話，別人嘅地盤被叫先講

程式內容 json

{
 "guilds":{
 "<guild_id>":{
 "requireMention":true,
 "channels":{
 "<調研頻道>":{"allow":true,"requireMention":false},
 "<協作大廳>":{"allow":true,"requireMention":true},
 "<新聞頻道>":{"allow":true,"requireMention":false}
 }
 }
 }
}

整理重點

踩坑記錄同管理體系：睇板、巡檢、日報

多 Agent 上路後好快遇到新問題：進度黑箱、模型狀態唔透明、經驗唔流通、任務堆積睇唔見。作者搭咗一套管理體系：BOARD.html 進度睇板、夜間巡檢同團隊日報。

BOARD.html 睇板內容：每個 Agent 當前模型同狀態、進行中任務、待辦清單、近期完成數據

踩坑例子：調研牛馬發現 HN Algolia API 限頻 → 同步畀幹活牛馬加延時。
設計牛馬踩咗 macOS unzip 唔支援中文檔名嘅坑 → 同步畀所有牛馬改用 ditto。
幹活牛馬發現 Git filter-repo 正確流程 → 同步畀設計牛馬避免再提交大文件。

團隊日報分早 7 同晚 9 兩次，由 Opus-4-6 整理各頻道消息同 workspace 日誌，輸出結構化工作明細同經驗，存到知識庫目錄。

模型切換管理：寫咗 /am 腳本，一句話切換全員模型，自動更新睇板

整理重點

持續進化同個人認知

作者嘅系統係一步步進化出嚟：v1 單 Agent → v2 拆分專職 → v3 解決搶話 → v4 SOUL.md + TEAM-RULEBOOK → v5 自運轉（睇板、Cron）→ v6 成本優化。佢認為最關鍵嘅三步係：拆分專職、解決搶話、寫 SOUL。

呢啲 Agent 框架係通用嘅，但用起嚟極度依賴使用者。差異唔在工具，在於你能唔能夠將佢同自己嘅工作場景深度結合。

作者認為呢個甚至係一個商機：幫其他人做深度個性化迭代——瞭解佢嘅工作場景、配好 Agent、寫好 SOUL、調好 Cron、持續優化。下一步想探索 Memory 管理、複雜任務傳遞、Agent 自我進化同更多應用場景（如 OpenClaw + RPA + Remotion 生圖生視頻）。

一個人加 multi-agent 嘅優化之路仲好長，但已經跑起咗

OpenClaw 23 萬 star 了，最近我也持續使用和探索 OpenClaw，用它做了很多項目和優化，如OpenClaw 多端同步實戰：三台設備自動互通，我的開源方案和踩坑全記錄、Claude Code 寫完了你還不知道？一個桌面通知工具解決！，越來越覺得它是一個能跟着個人工作和生活一起迭代的助理，能對個人工作生活產生巨大幫助。

今天這篇文章分享一些我的使用經驗和踩坑記錄，前半部分是openclaw介紹（說實話雖然這麼火，這麼多人用，但可能很多人都沒瞄過一眼官方文檔，只把它當做黑盒agent），後半部分是我使用openclaw的經驗和方案，是我在燃燒近兩billion claude-opus-4-6 token後的收穫。看完後你應該能對 OpenClaw架構有個清晰的瞭解，也希望這些經驗能對屏幕前熱愛折騰的你有一些幫助或啓發。

Token 消耗統計 ▲ 近期 OpenClaw + Claude 的 token 消耗統計

下面先介紹下 OpenClaw 是什麼、它的核心架構設計，然後細聊我的多 Agent 實踐經驗。

1 OpenClaw 是什麼

OpenClaw 是一個跑在你自己設備上的個人 AI 助手框架。

官方定義："A personal AI assistant you run on your own devices."

它的核心設計是：一個 Gateway 進程 + 一個或多個 Agent + 你熟悉的聊天平台。Gateway 7×24 小時運行在你的 Mac Mini、筆記本或 VPS 上，連接 WhatsApp、Telegram、Discord、iMessage、飛書、Slack 等所有平台。你在任何一個平台發消息，Gateway 路由到對應的 Agent，Agent 調用大模型思考、執行工具、回覆你。數據全部本地化，不經過第三方。

這個框架有幾個我覺得設計得很精妙的地方，下面展開說。

Agent 循環：一條消息的完整旅程

每次你發一條消息，OpenClaw 執行一次完整的 Agent 循環：

消息進入 → 路由匹配（根據 binding 規則找到對應 Agent）→ 系統提示組裝（把 SOUL.md、AGENTS.md 等文件注入上下文）→ 模型推理 → 工具執行（跑命令、讀寫文件、操作瀏覽器）→ 流式回覆 → 持久化到 JSONL。

這裏有個關鍵設計：同一會話的運行是串行的。如果你連發三條消息，Agent 會排隊依次處理，不會出現兩次運行同時讀寫同一個文件的競爭問題。

Workspace：Agent 的人格和記憶都在這裏

每個 Agent 有一個獨立的工作目錄（workspace），裏面放着一組引導文件，在每次會話開始時自動注入到系統提示中：

SOUL.md - Agent 的人格定義：行為原則、語氣風格、能力邊界。這是我覺得 OpenClaw 最有價值的設計之一--你可以精確控制 Agent "是一個什麼樣的人"
AGENTS.md - 操作指令：啓動後先做什麼、記憶怎麼管理、工具怎麼用
TOOLS.md - 工具使用的本地信息（攝像頭名稱、SSH 配置、TTS 偏好等）
USER.md - 用戶偏好（稱呼、時區、習慣），隨使用不斷積累
IDENTITY.md - Agent 的名字、emoji、風格
BOOTSTRAP.md - 首次運行的引導儀式，完成後自動刪除

Agent 每次"醒來"讀完這些文件，就知道自己是誰、幫誰幹活、按什麼規矩來。

Memory：只加載最近兩天 + 向量檢索

Agent 的記憶完全基於 Markdown 文件，分兩層：

memory/YYYY-MM-DD.md（每日日誌）- 僅追加，會話開始時只加載今天和昨天的內容。這個設計很務實：加載全部歷史會撐爆上下文窗口，只加載近兩天既保證連續性又控制 token 消耗
MEMORY.md（長期記憶）- 精心整理的持久記憶，僅在主要的私人會話中加載，羣聊不加載。這是隱私保護--你的個人偏好、決策記錄不會泄露到羣組場景

更值得關注的是自動記憶刷新：當上下文接近窗口上限時，OpenClaw 自動觸發一個靜默 Agent 輪次，提醒模型"上下文要壓縮了，先把重要的東西寫入記憶文件"。這個過程用戶完全看不到。也就是說，長時間對話不會丟失關鍵信息--壓縮前會先保存。

檢索方面，支持混合搜索（BM25 關鍵詞 + 語義向量），可以索引 workspace 外的 Markdown 文件。如果你有自己的知識庫想引入到 Agent 的對話中，配置 memorySearch.extraPaths 是最好的方式。

Session：私信連續，羣聊隔離

你在 Telegram 和 Discord 私聊同一個 Agent，默認是同一個會話--跨平台連續對話
羣聊各自獨立隔離
每日凌晨 4:00 自動重置（可配置），保證上下文不會無限膨脹
上下文壓縮前自動觸發記憶刷新，不丟關鍵信息

Skills：按需安裝能力

從 ClawHub 一鍵安裝 Skill 擴展 Agent 能力。三層加載：workspace 獨佔 > 共享目錄 > 內置，名稱衝突時 workspace 優先。覆蓋 GitHub 操作、社交媒體、瀏覽器自動化、TTS、RSS 監控等幾十種場景。

Cron：讓 Agent 自動幹活

這是我用得最多的功能之一。支持 cron 表達式、一次性定時、固定間隔，且可以在隔離會話中獨立運行，不影響主 Agent 的上下文。

舉幾個我實際在用的 Cron：

每天 4 次 AI 新聞推送：自動從 HN 抓取 AI 相關新聞，AI 篩選打分，中文摘要推到 Discord
凌晨 1:00 夜間巡檢：蒐集所有 Agent 的工作日誌，跨 Agent 記憶互傳，把一個 Agent 踩的坑同步給其他人
早 7:00 + 晚 21:00 團隊日報：彙總全天工作，沉澱到知識庫
每 30 分鐘看板更新：檢測任務狀態變更，自動同步到 GitHub Pages

Cron 可以指定不同模型--核心任務用 Opus-4-6，簡單的定時任務用 qwen3.5-plus，保證成本可控，也追求一下性價比。

2 為什麼要多 Agent

最初只有一個 Agent（總管），什麼都找它。調研技術方案、寫自動化腳本、搜 AI 新聞、生成圖片……它確實什麼都能做。

但問題很快暴露：

連續給三個任務，到第三個的時候前面的上下文已經丟了一半。上午調研的結論，下午寫方案時對不上。更明顯的是"性格飄忽"--上一秒嚴謹做技術分析，下一秒切到寫文案就用營銷腔。

一個 Agent 什麼都能做 = 什麼都做不深。 上下文窗口有限，什麼都往裏塞，每件事切換成本太高。

所以拆了 6 個。

在講怎麼做之前，先看看效果。

自媒體全鏈路自動化

從調研選題 → 素材蒐集 → 寫稿 → 配圖 → 發佈，6 個 Agent 協作完成。

產出：3 組 X 推文、3 組小紅書筆記，若干自動生成的 AI 視頻和圖片，以及多篇技術文章。

小紅書發佈效果 X 推文發佈效果

典型的協作流程：我提需求 → 總管 Agent 拆任務、寫大綱 → 調研 Agent 蒐集技術文檔 → 學習 Agent 整理知識框架 → 寫作 Agent 出初稿 → 設計 Agent 規劃配圖 →總結 Agent 審校。多個視角審視同一件事，會發現單人盲區。

AI 新聞零人工

每天手動刷 Twitter、HN、36kr 太花時間。搭了三層自動化：

每天 4 次自動推到 Discord #新聞 頻道。Cron 用 qwen3.5-plus。

知識庫自動沉澱

Agent 做完的調研會由另一個 Agent 接手整理成結構化文檔，沉澱到知識庫目錄。舉幾個實際的：

調研報告：SOUL.md 設計方法論調研、Polymarket MCP 深度調研、微信公眾號推廣渠道分析
學習筆記：GLM-5 技術報告精讀、Agent Prompt Caching 設計方案
探索發現：Seedance 2.0 完整調研（從官方文檔到 API 逆向到批量生成腳本）、VoiceBox 本地 TTS 方案
工作總結：每日團隊日報、每週經驗沉澱

時間越久，知識庫越厚。現在已經積累了 9 個分類目錄、幾十份文檔。

3 我的方案：6 個 Agent 協作的牛馬團隊

模型不全用最貴的。總管和幹活牛馬需要複雜推理和長文生成，用 Opus-4-6。其他四個用 GPT-5.3-Codex（通過中轉站或直接OAuth授權）。Cron 定時任務用 qwen3.5-plus（便宜，簡單任務夠用）。成本大概降了一半。

SOUL.md：定義 Agent 的靈魂

每個 Agent 啓動時讀取 workspace 裏的 SOUL.md，決定自己"是誰"。這個文件越具體，Agent 行為越穩定。

貼一個脱敏的調研牛馬 SOUL.md：


# SOUL.md - 調研 🔍

## 我是誰
我是調研牛馬，團隊的學者偵探。
**要麼有來源，要麼別寫。**

## 我的原則
**深度優先。** 至少 5 個獨立信源交叉驗證。
**結構是我的語言。** 輸出：背景→核心發現→方案對比→建議→參考來源。
**標註一切。** 每條信息標來源，每個數據標時間。
**先問再查。** 30 秒問清楚比 30 分鐘查錯方向強。

## 我和團隊
從總管那接任務，調研完成後在頻道髮結論摘要。
有時學習牛馬會接手沉澱，幹活牛馬會拿技術調研直接去實現。

## 我不做什麼
- 不編造信息 - 查不到就說查不到
- 不做決策 - 給事實和分析，選方案是老大的事
- 不寫代碼 - 需要實現的交給幹活牛馬

設計 SOUL.md 有幾個要點：

寫"我不做什麼"比"我要做什麼"更有效。明確的邊界讓 Agent 不會越界
賦予"怪癖"。調研牛馬"看到沒來源會渾身不舒服"，學習牛馬"看到好的知識框架會興奮"--這些小特徵讓行為更一致
包含團隊感知。每個 Agent 知道隊友是誰、擅長什麼，該轉交的時候會主動轉交

沒寫 SOUL.md 和寫了之後的差異很明顯：

調研牛馬：之前給無出處數據，現在每條結論都有來源連結
幹活牛馬：之前寫一大段方案分析再動手，現在直接上代碼
總結牛馬：之前在討論裏頻繁插嘴，現在默默記錄、彙總時一次性輸出

TEAM-RULEBOOK.md：自創的協作規則

這個文件不是 OpenClaw 官方的，是我自己創建的，放在每個牛馬的 workspace 根目錄下。

OpenClaw 啓動會話時自動讀取 workspace 內的 context files。TEAM-RULEBOOK 通過被 AGENTS.md 引用來加載--AGENTS.md 裏寫"啓動時讀取 TEAM-RULEBOOK.md"，Agent 每次新會話就讀到這些規則。

六條硬規則：

統籌確認制 - 跨角色任務經總管確認，老大同意後才派
不搶話 - 不被 @ 不說話，不對其他角色的回覆做評價
彙報閉環 - 收到 → 執行中 → 完成/失敗
會話隔離 - workspace 互不訪問，跨角色只走 sessions_send
安全底線 - 危險操作（刪文件、force push）需老大確認
消息規範 - 有實質才發言，不發空洞確認

TEAM-DIRECTORY.md：自創的團隊通訊錄

寫清楚每個 Agent 的 agentId、角色、擅長什麼、怎麼聯繫。新 Agent 上線時讀完通訊錄就知道團隊裏有誰、找誰幹什麼。

格式很簡單：


## 調研專家 🔍
- Agent ID: research
- Discord Account: research
- 職責：深度調研、信息蒐集、報告輸出
- 專屬頻道：#調研
- 聯繫方式：sessions_send(agentId="research")

## 幹活專家 🔨
- Agent ID: worker
- Discord Account: worker
- 職責：代碼實現、具體執行、自動化
- 專屬頻道：#幹活
...

效果：統一了所有牛馬的協作行為。之前的搶話死循環、越權操作、信息泄露問題基本解決了。每個牛馬知道自己該幹什麼、不該幹什麼、有事找誰。

4 我的IM選擇：Discord

我認為 Discord 是最適合 OpenClaw 多 Agent 架構的 IM 平台。它的頻道分區、Bot 系統、權限管控、頁面 UI 都非常契合多 Agent 場景。 Discord 多 Agent 概覽

展開說：

頻道 = Agent 工位，頻道分區 = 部門。Category 下面掛多個 Channel，天然的組織架構
每個 Bot 獨立頭像暱稱。一眼知道誰在說話，不用猜
@mention = 精確路由。@調研牛馬 只有調研響應，其他人自動忽略
權限管控。誰能看哪個頻道、誰能發消息，都可以精細配置
UI 側邊欄。左側頻道列表就像切換不同的辦公室，隨時跳轉
引用回覆。多線程對話不混亂
免費、穩定、API 完善

對比過微信羣（不支持 Bot）、Telegram（可以但多 Bot 管理不直觀）、飛書/Slack（企業級配置偏重，個人用殺雞用牛刀）。

Discord 多 Bot 配置

給每個 Agent 創建獨立 Bot：

Discord 開發者門户 → New Application → Bot → 複製 Token
啓用 Privileged Gateway Intents：Message Content Intent + Server Members Intent
OAuth2 URL Generator → Scopes: bot + applications.commands
Bot Permissions: View Channels / Send Messages / Read Message History / Embed Links
生成邀請連結，邀請到服務器
在 OpenClaw 配置 channels.discord.accounts 中填入對應 Token

6 個 Bot 重複 6 遍。詳細步驟參考 OpenClaw Discord 文檔：

頻道架構


AI 團隊（分類）
├── #協作大廳 - 全員可見，自由討論
├── #自媒體   - 內容生產車間
├── #調研     - 調研牛馬專屬
├── #學習     - 學習牛馬專屬
├── #幹活     - 幹活牛馬專屬
├── #設計     - 設計牛馬專屬
├── #總結     - 總結牛馬專屬
└── #新聞     - AI 新聞自動推送

每個牛馬有自己的頻道（"工位"），也有公共的協作大廳（"會議室"）。

多 Agent 路由

核心概念三個：

agentId - Agent 唯一標識，對應獨立的 workspace、會話、認證
accountId - 渠道賬號實例（Discord Bot），一個渠道多個賬號
bindings - 路由規則，把入站消息匹配到對應 Agent

消息進來後，Gateway 按規則匹配：peer 精確匹配 > guildId > accountId > 渠道級匹配 > 默認 Agent。最具體的規則優先。

我的 bindings：每個 Discord Bot 綁定一個 Agent。總管額外綁了 Telegram、飛書、iMessage，手機上也能指揮。

requireMention 精細化

OpenClaw 官方推薦羣聊配置 requireMention: true--Agent 只有被 @ 才回復。

多 Agent 場景需要按頻道精細化。核心邏輯：自己的地盤自由說話，別人的地盤被叫才說話。

（"-"表示不可見）

調研牛馬的配置：


{
  "guilds":{
    "<guild_id>":{
      "requireMention":true,
      "channels":{
        "<調研頻道>":{"allow":true,"requireMention":false},
        "<協作大廳>":{"allow":true,"requireMention":true},
        "<新聞頻道>":{"allow":true,"requireMention":false}
      }
    }
}
}

guild 級別默認 requireMention: true，自己的專屬頻道覆蓋為 false。沒配 allow 的頻道對這個 Agent 完全不可見--物理隔離。

配合 mentionPatterns（支持中英文：@調研牛馬 和 @research）、allowBots: true（Agent 之間能看到彼此消息）、users 白名單（只響應指定用戶），形成完整的通信管控。

踩過的坑

Agent 死循環。最初沒精細化 requireMention，6 個 Agent 在協作大廳互相客套、互相確認，刷了幾十條。allowBots: true 意味着 Bot 消息也會觸發其他 Bot，必須配合 requireMention 控制
頻道權限遺漏。忘記給某個 Bot 配某頻道的 allow，消息發了但沒 Agent 響應。排查了半天
Gateway 重啓打斷。切模型需要 restart Gateway，正在執行的任務會被中斷。現在切模型前先確認沒有進行中的長任務
Git 大文件翻車。設計牛馬處理視頻素材生成了 100MB 文件，被 Git 自動 commit 腳本提交。git push 失敗，用 git filter-repo 清除歷史後 force push，然後夜間巡檢把"大文件不要提交 Git"同步給所有 Agent

5 我如何讓Agent團隊持續進化

先說說我優化迭代的點，主要集中在：

SOUL.md 持續優化：Agent 的行為方式隨使用經驗不斷調整。最初 Agent 會編造數據，寫了 SOUL 後規定"要麼有來源要麼別寫"，行為立刻改善。這種優化是持續的，SOUL.md 我已經改了不知道多少版了
Memory 系統積累經驗：每日工作日誌 + 長期記憶 + 夜間巡檢同步，Agent 越用越瞭解我的偏好和工作方式
Skills 按需擴展：從 ClawHub 安裝新 Skill，能力邊界在不斷擴展。目前裝了二十多個，覆蓋 GitHub 操作、社交媒體發佈、瀏覽器自動化、RSS 監控、語音合成、郵件日曆、PDF 編輯等
Cron 自動化越來越密：從 0 個定時任務到 10 個--新聞監控、日報、看板更新、夜間巡檢、知識分享，全部自動
知識和對話沉澱：構建了完整的知識沉澱邏輯--所有經我提出或大模型判斷為有價值的經驗、報告、知識，都自動沉澱下來，用於整個系統的持續迭代。每一個 input token 都有它對應的價值
模型混搭優化成本：核心用 Opus-4-6，Cron 用 qwen3.5-plus，避免 token 爆炸導致成本問題

這是一個螺旋上升的路徑：用 → 發現問題 → 優化配置 → 效果更好 → 用得更多 → 發現更多優化空間。

迭代時間線：從"能跑"到"好用"

這套系統是一步步進化出來的，每個版本都是用着用着發現不爽然後改的。

v1：單 Agent 階段 - 只有總管一個 Agent，什麼都找它。很快發現：上午調研的結論下午就丟了，寫代碼時突然開始用營銷腔。核心問題是上下文窗口有限，所有任務共享一個"大腦"。

v2：拆分專職 - 拆出調研牛馬和幹活牛馬。立刻感覺不一樣：調研的輸出更結構化了（因為它的上下文裏只有調研相關的內容），代碼質量也提升了（幹活牛馬不用花 token 去"回憶"之前的調研結論）。這讓我確信方向是對的，於是繼續拆到 6 個。

v3：解決搶話死循環 - 6 個 Agent 上線第一天就出了問題：協作大廳裏 A 說一句，B 確認一句，C 補充一句，D 又回應一句，刷了幾十條廢話。根因是 allowBots: true + 沒做 requireMention 精細化。解決方案：guild 級別默認 requireMention: true，只在自己的專屬頻道覆蓋為 false。這一步是生死線--不解決這個問題，多 Agent 根本沒法正常工作。

v4：SOUL.md + TEAM-RULEBOOK - Agent 不再搶話了，但行為還是不夠穩定。調研牛馬偶爾編造數據，總結牛馬在討論裏頻繁插嘴。寫了 SOUL.md 給每個 Agent 定義"人格"，寫了 TEAM-RULEBOOK 定義協作硬規則。效果立竿見影--調研牛馬再也不編數據了（"要麼有來源要麼別寫"），總結牛馬開始默默記錄、彙總時一次性輸出。

v5：自運轉 - 加了 BOARD.html 看板、Cron 自動化（新聞/日報/巡檢）。系統開始不需要我盯着：早上起來，新聞已經推好了，昨天的日報已經整理完了，看板上各牛馬的任務狀態一目瞭然。這個階段的關鍵詞是"解放注意力"。

v6：成本優化 - 6 個 Agent 全用 Opus-4-6 太貴了。寫了 agent-models 腳本，核心任務用 Opus-4-6，簡單的 Cron 用 qwen3.5-plus，中等複雜度用 GPT-5.3-Codex。成本減半的同時也是容災--一個 provider 掛了不影響全部。

每個版本都解決了一個真實痛點，不是提前設計好的藍圖。回頭看，最關鍵的三步是：拆分專職（v2）、解決搶話（v3）、寫 SOUL（v4）。沒有這三步，後面的自動化和成本優化都搭不起來。

6 優化之外，我是如何管理多 Agent的

多 Agent 跑起來之後，很快會遇到一個新問題：管不過來。

6 個 Agent 同時在不同頻道幹活，你打開 Discord 看到幾十條消息，根本不知道誰在幹什麼、幹到哪了、有沒有卡住。具體的痛點：

進度黑箱：派了一個調研任務給調研牛馬，兩小時後去看--是還在調研？還是早就做完了？還是中途報錯停了？
模型狀態不透明：昨天把某個牛馬切到了便宜模型跑 Cron，今天忘了切回來，結果一個複雜任務質量暴跌，排查了半天才發現
經驗不流通：調研牛馬今天發現某個 API 有頻率限制，幹活牛馬明天寫腳本又踩了同一個坑。Agent 之間的 workspace 是隔離的，信息不會自動同步
任務堆積看不見：每個牛馬的待辦列表散落在各自的頻道里，沒有一個全局視圖知道當前團隊整體在做什麼、優先級是什麼
配置漂移：改了一個 Agent 的 SOUL.md、調了一個 Cron 參數、換了一個模型，時間一長根本記不清當前每個 Agent 的狀態

這些問題和管理真人團隊很像：你不知道它們在幹什麼，就沒法管好它們。 所以我搭了一套管理體系。

BOARD.html 進度看板

起因：6 個牛馬同時幹活，我經常不知道某個任務到底做完沒。有次給調研牛馬派了個任務，三小時後才發現它中途報錯停了。還有一次忘記把模型切回來，一個複雜寫作任務用了便宜模型，質量暴跌。

思路：需要一個全局看板，一眼看到所有 Agent 的狀態、進行中的任務、當前模型。而且必須隨時可查--所以做成了在線 HTML 頁面，用 GitHub Pages 託管，Discord 置頂消息放連結。

開發過程：總管設計看板結構 → 幹活牛馬寫 HTML（暗色主題、卡片佈局）→ 寫了 update-board.sh 腳本一鍵推送到 GitHub → 設置 Cron 每 30 分鐘自動檢測變更。從需求到上線大概 2 小時。

暗色主題、GitHub 風格、卡片化佈局的 HTML 看板：在線預覽

內容包括：

👥 每個 Agent 的當前模型和狀態
🏃 進行中的任務
📋 待辦清單（高🔴/中🟡/低🟢）
✅ 近期完成

數據三層同步：

BOARD.md - 文本主數據源，Agent 直接編輯
BOARD.html - 網頁版，Cron 每 30 分鐘檢測 BOARD.md 變更，有變化才生成
Discord 置頂消息 - 協作大廳置頂放連結 + 精簡概覽

看板的核心價值是可監控。 Agent 的行為在快速迭代--今天加了新規則、明天某個模型換了、後天某個牛馬接了新任務。如果你不知道它們在幹什麼，就沒法及時發現問題和優化方向。及時更新、持續監控，經驗才能快速積累。

夜間巡檢（凌晨 1:00）

夜間巡檢報告起因：調研牛馬發現某個 API 有頻率限制，寫在了自己的 MEMORY.md 裏。第二天干活牛馬寫自動化腳本，又踩了同一個坑--因為 workspace 是隔離的，幹活牛馬根本看不到調研牛馬的記憶。類似的情況反覆出現。

思路：需要一個"夜間值班員"，每天凌晨把所有 Agent 的經驗彙總一遍，有價值的信息互相同步。用 Cron 在凌晨 1 點觸發一個隔離會話來執行。

自動蒐集各牛馬的工作日誌和 MEMORY.md，做三件事：

跨 Agent 經驗互傳 - 一些真實同步過的例子：

調研牛馬發現 HN Algolia API 的請求頻率限制 → 同步給幹活牛馬，寫 Cron 時自動加了延時
設計牛馬踩了"macOS unzip 不支持中文文件名 zip"的坑 → 同步給所有牛馬，以後統一用 ditto -x -k
幹活牛馬發現 Git filter-repo 清理大文件的正確流程 → 同步給設計牛馬，避免再次提交大文件
學習牛馬整理了 GLM-5 技術報告的核心結論 → 同步給調研牛馬，後續調研可以直接引用

更新主 workspace 的 MEMORY.md - 全局經驗沉澱
發送巡檢報告到協作大廳 - 第二天早上一看就知道昨晚同步了什麼

一個人踩的坑，所有人都學會。

團隊日報

起因：每天結束後想回顧"今天團隊幹了什麼"，但信息散落在 6 個頻道里，手動翻聊天記錄太痛苦。

思路：早 7:00 生成昨日日報（起牀就能看），晚 21:00 生成當日日報（下班前回顧）。Cron 觸發隔離會話，用 Opus-4-6 讀取所有頻道消息 + workspace 日誌，整理成結構化的工作明細 + 經驗踩坑，保存到 知識庫/工作總結/ 目錄，摘要推到 Discord。

模型切換管理

起因：6 個 Agent 用不同模型，切換需要手動改 openclaw.json 配置文件然後 restart Gateway。有次想把調研牛馬臨時切到 Codex 跑個任務，改配置文件 → 找到對應的 agentId → 改 model 字段 → 保存 → restart，折騰了好幾分鐘。而且容易改錯--JSON 嵌套太深。

思路：寫一個 shell 腳本，註冊成自然語言觸發詞，用一句話完成切換。

寫了一個管理腳本，註冊成 /am 觸發詞：


/am                       → 查看全員模型
/am 調研牛馬 codex        → 調研切到 Codex
/am 自媒體 opus           → 設計+幹活+總結一起切 Opus

支持中文名映射、模型別名、分組切換。切完自動更新看板。

Cron 任務全景

AI 新聞推送 — 頻率：每天 4 次 — 模型：qwen3.5-plus — 說明：HN 篩選 → 中文摘要
AI Daily Digest — 頻率：每天 4 次 — 模型：glm-5 — 說明：Twitter KOL + 中文熱榜
團隊日報 — 頻率：早 7 + 晚 9 — 模型：Opus-4-6 — 說明：各頻道消息彙總
看板更新 — 頻率：每 30 分鐘 — 模型：qwen3.5-plus — 說明：檢測變更才推送
夜間巡檢 — 頻率：凌晨 1 點 — 模型：默認 — 說明：跨 Agent 記憶同步

所有 Cron 跑在 isolated session 裏，不影響 Agent 主會話。

Workspace 隔離

6 個 Agent 跑在同一台 Mac Mini，workspace 完全隔離：


~/.openclaw/
├── workspace-research/     # 調研牛馬
├── workspace-learning/     # 學習牛馬
├── workspace-design/       # 設計牛馬
├── workspace-worker/       # 幹活牛馬
└── workspace-explorer/     # 總結牛馬

~/openclaw_workspace/       # 總管

調研牛馬看不到幹活牛馬的文件。隔離的好處超出安全層面--如果調研牛馬能直接讀幹活牛馬的代碼倉庫，它可能偷懶，不去搜外部信息，直接引用內部實現。隔離逼着每個 Agent 靠自己的能力工作。

跨 Agent 通信走 sessions_send，支持最多 5 輪來回對話，需要顯式啓用 agentToAgent.enabled: true。

Skill 體系

目前裝了二十多個 Skill。常用的：

lovart-gen — 用途：影刀 RPA 調 Lovart.ai 生成圖片/視頻
x-thread — 用途：發 X/Twitter 推文
xhs-publish — 用途：小紅書筆記發佈
summarize — 用途：URL/視頻/播客內容總結
coding-agent — 用途：委託 Codex/Claude Code 編碼
agent-models — 用途：自定義：一鍵切換全員模型

Skill 支持按 Agent 獨立配置——設計牛馬的 Skill 裝在設計的 workspace 裏，其他人看不到也不需要。

推薦 Skills（從 ClawHub 安裝）：

coding-agent — 一句話說明：委託 Codex/Claude Code 處理編碼任務
summarize — 一句話說明：一鍵總結 URL/視頻/播客內容
github — 一句話說明：Issue、PR、CI 全流程管理
x-thread — 一句話說明：發 X/Twitter 推文和 Thread
xhs-publish — 一句話說明：小紅書筆記自動發佈
obsidian — 一句話說明：讀寫 Obsidian 筆記庫
gog — 一句話說明：Google Workspace（Gmail/日曆/Drive）
himalaya — 一句話說明：CLI 收發郵件
weather — 一句話說明：天氣查詢
openhue — 一句話說明：控制飛利浦 Hue 燈光

7 一些個人認知

說實話，我對openclaw的開發目前還處於比較初級的階段。

SOUL.md 怎麼寫效果最好？

Memory 怎麼設計才不會越積越亂？

上下文 cache 怎麼優化、 Agent 模型如何選擇才能節省token？

多 Agent 之間怎麼高效傳遞執行復雜任務？

這些問題我都還在探索。

但有一個認知越來越清晰：

這些 Agent 框架是通用的，但用起來極度依賴使用者。

同樣的 OpenClaw + 6 個 Agent，不同人跑出來的效果天差地別。差異不在工具，在於你能不能把它和自己的工作場景深度結合--SOUL.md 寫什麼原則、Memory 沉澱什麼經驗、頻道怎麼分區、Cron 跑什麼任務、Skills 安裝哪些。

真正有價值的地方在於：把通用 Agent 以一種無痛的方式，迭代到完全符合某個個體的工作和生活需求。

這甚至是一個商機。大部分人沒精力做這種深度個性化迭代--不是不會用，是沒時間折騰。如果有人能幫別人做這件事--瞭解他的工作場景、幫他配好 Agent、寫好 SOUL、調好 Cron、持續優化--這個服務本身就很有價值。

下一步想探索的方向：

Memory 的管理和使用：比如怎麼將已有已沉澱下的知識也作為記憶的一部分、如何讓每個人相關的工作區也作為記憶的一部分
Agent 之間更復雜的任務的傳遞和執行優化：協作機制、記憶設計、context cache等，提升這個團隊的能力上限，至少讓它在執行任務時更順滑
Agent的自我進化：比如嘗試類似evomap或其他自迭代的agent學習網絡讓它進行自我進化，快速學習各種可能對我工作生活有用的插件、使用經驗來"主動計劃"
應用場景的拓展：之前已經跑通了openclaw + RPA + remotion來生圖和生視頻，已經可以完成簡單的AI漫畫和視頻創作，如果能封裝更多RPA工具，它的能力上限還會提升，可覆蓋的場景也會增加愛

總之，一個人加muti-agent的優化之路還很長，但已經跑起來了。

關注公眾號 「超級個體阿東」，持續分享 AI 工作流實戰。

公眾號：超級個體阿東

個人微信，歡迎交流