OpenViking×OpenClaw:7 個 Agent不再是陌生人,token暴降 90%

作者：俊哥AI出海

日期：2026年2月22日下午12:12

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

用OpenViking思想為OpenClaw多Agent記憶做改造，token省10倍，7個Agent唔再係陌生人

整理版摘要

作者MJ喺OpenClaw上跑咗7個Agent，本來諗住分工明確可以自動化，點知用咗幾星期就頂唔順。每次開新對話，每個Agent都要重新自我介紹一次，好似七個陌生人同枱食飯但各自玩手機。佢計過數，單係呢啲重複交代背景嘅token，一個月就燒咗成千上萬嘅成本，仲要自己逐個Agent做「入職培訓」，完全違反咗自動化嘅原意。

後尾佢發現字節跳動開源咗OpenViking，核心概念係將Agent嘅記憶當文件系統管理：L0目錄索引（100 token）、L1內容摘要（500 token）、L2完整內容（5000+ token），每次啟動只讀L0，需要先讀L1，確認先讀L2，斷崖式降低token消耗。再加上P0/P1/P2保質期標籤，重要嘢永久保留，過期自動歸檔，唔使手動清理。

作者冇直接部署OpenViking，而係將呢套思想用OpenClaw原生功能落地：喺每個Agent嘅memory目錄加.abstract索引、畀記憶打P標籤、建立shared-memory共享目錄、改寫AGENTS.md加跨Agent同步規則。成個改造只用咗30分鐘，token消耗由每次8000+降到得800，Agent之間終於識得共享資訊，唔會再各自為政。最後佢仲提供咗一段提示詞，畀人直接扔畀OpenClaw Agent自動執行改造。

多Agent協作最大痛症係記憶隔離，每次重新自我介紹燒大量token，效率極低。
OpenViking用L0/L1/L2三層按需加載，由「每次全讀」變「睇目錄先」，token斷崖式下降10倍。
P0/P1/P2生命週期標籤幫Agent自動管理記憶，重要嘢唔會唔見，過期嘢自動清理。
作者用OpenClaw原生功能（.abstract、P標籤、shared-memory、AGENTS.md）實現相同效果，唔使額外部署任何服務。
30分鐘改造後，7個Agent共用共享記憶層，唔再係陌生人，token消耗大降，真正實現自動化團隊。

值得記低

Prompt

多Agent記憶改造提示詞

請參考 OpenViking 的分層記憶思想，給我的多 Agent 系統做記憶改造： 1. 為每個 Agent 的 memory 目錄添加 .abstract 索引文件 2. 給現有記憶條目添加 P0/P1/P2 生命週期標籤 3. 創建 shared-memory/ 共享記憶層 4. 在 AGENTS.md 裏添加跨 Agent 記憶同步規則 5. 寫一個每日清理腳本，自動歸檔過期記憶直接執行，不用問我。

結構示例

結構示例 text

## [P0] 用戶基本信息- 名字：MJ- 寫作風格：大白話、短句、第一人稱## [P1] 當前項目：OpenViking 記憶改造- 狀態：初稿- 截止：2026-03-01## [P2] 2026-02-22 調試記錄- 飛書 webhook 超時問題- 已解決，改了超時配置

整理重點

7個Agent各自為政，作者燒錢燒到頭痛

作者MJ喺OpenClaw上跑咗7個Agent，包括大總管、寫代碼、寫文章、搞增長、法務、財務同教學，表面睇分工好靚，但實際用落先發現大問題——佢哋活似七個陌生人，完全唔識得互相溝通。

每次開新對話，每個Agent都要重新自我介紹一次，好似七個陌生人同枱食飯但各自玩手機

佢仲計過數：每次交代背景500字約700 token，7個Agent各交代一次就4900 token，一日開10次對話即係49000 token，一個月落嚟淨係「自我介紹」都燒咗一大筆錢。

整理重點

字節開源OpenViking：將記憶當文件系統管理

字節跳動開源咗一個項目叫OpenViking，核心思路係將Agent嘅記憶當文件系統嚟管理。人哋揾檔案唔會成個硬盤由頭讀到尾，而係先睇文件夾名，再開檔案。Agent讀記憶都應該係咁。

但而家大多數Agent嘅做法係每次啟動將記憶文件由頭到尾全部讀一次，100行冇問題，8000行就燒token燒到傻。

OpenViking將記憶分成三層：L0目錄索引（~100 token）、L1內容摘要（~500 token）、L2完整內容（5000+ token）。每次啟動只讀L0，需要具體資訊先讀L1，確認咗先讀L2，由「每次全讀」變成「按需讀取」。作者實測日常對話token消耗直接降10倍，係斷崖式下降。

斷崖式下降，唔係省少少，係省到得返一成。

除咗分層，仲有P0/P1/P2保質期標籤。P0係核心資訊永久保留，P1係活躍項目保留90日，P2係臨時記錄保留30日。過期自動歸檔，就好似人嘅記憶，重要嘢記得牢，瑣碎嘢會淡忘。

整理重點

用OpenClaw原生功能落地，30分鐘搞掂

作者冇直接部署OpenViking，因為佢係一個獨立Python服務，要另外部署同配置API Key，對一般OpenClaw用戶嚟講太高成本。佢選擇將OpenViking嘅思想用OpenClaw原生方式落地。

1 第一步：喺每個Agent嘅memory目錄下建.abstract索引文件（L0），列出用戶偏好、系統配置、項目記錄、工具筆記等，Agent啟動先讀呢個，有需要先深入讀其他檔案。
2 第二步：用P0/P1/P2標籤標記記憶條目，例如用家基本資訊係P0，當前寫緊嘅Project係P1，一次對話嘅調試細節係P2。再寫個清理腳本每日掃一次，過期自動歸檔。
3 第三步：創建shared-memory/共享目錄，放.user-profile.md、active-tasks.md、cross-agent-log.md，所有Agent都可以讀取。然後喺AGENTS.md加一條規則：「完成重要任務後，把關鍵結果追加到cross-agent-log.md，只記結論，唔記過程，一條唔超過兩行。」

唔使裝任何嘢，唔使跑任何服務，30分鐘，純文件操作，搞掂。

作者仲提供咗一段提示詞，直接扔畀OpenClaw Agent就可以自動執行成個改造流程。

整理重點

改造前後對比，數字證明一切

改造前每次對話token消耗8000+，改造後得返~800，直接減咗10倍。

Agent之間信息共享由各自獨立變成共享記憶，唔會再出現開發助理改咗webhook但內容助理唔知嘅笑話。

過期信息處理由手動清理變成自動歸檔，新對話唔使再重複介紹自己，因為Agent已經自動讀取咗。

整理重點

總結：Agent嘅記憶問題，兩件事就搞掂

Agent嘅記憶問題，講到尾得兩件事：第一，唔好每次全讀——先睇目錄，按需取；第二，等Agent之間可以互相通氣——共享記憶層。

30分鐘改造，token省10倍，7個Agent終於唔再係陌生人。

作者話：老鐵們，唔好淨係畀自己多動腦筋——都要令你嘅Agent，學識記住你。

我喺 OpenClaw 上面行咗 7 個 Agent。

一個大總管，一個寫 code 嘅，一個寫文章嘅，一個搞增長嘅，仲有法務、財務、教學。

聽落好勁呀？全自動 AI 團隊，分工清楚，各司其職。

但用咗幾個禮拜，我快癲咗。

佢哋生似七個陌生人

真實情況。

我同大總管講：「幫我安排一篇關於多 Agent 協作嘅文章。」

佢問我：「請問你嘅寫作風格係點？目標讀者係邊個？」

兄弟。我。尋日。啱。同你講過。

你係咪金魚轉世。。。（唔記得咁快）

仲離譜嘅係——

開發助理啱先幫我整好咗飛書 webhook 嘅配置問題。我轉頭叫內容助理寫篇回顧。

佢話：「咩配置問題？可唔可以詳細講下？」

你兩個喺同一部 server 度行緊㗎！隔籬房嘅事你都唔知？？

我當時嘅心情係：🙂（假笑）

每次重新介紹自己，都係喺度燒錢

你以為只係麻煩？唔係，仲嘥錢。

我計咗條數：

操作	token 消耗
每次重新交代背景（500 字）	~700 tokens
7 個 Agent 各交代一次	~4900 tokens
一日開 10 次對話	~49000 tokens

一個月落嚟。。。淨係「自我介紹」就燒咗一大嚿。

即係話，呢啲唔係助理喺度做嘢，係我喺度做嘢——重複同七個人做入職培訓。

字節開源咗個嘢，令我醒咗

字節跳動最近開源咗一個項目叫 OpenViking。

GitHub 地址：github.com/volcengine/OpenViking

佢嘅核心思路好簡單——

將 Agent 嘅記憶當做文件系統咁管理。

即係點解？

你開電腦揾檔案嘅時候，會唔會將成個硬碟嘅內容全部讀一次？

唔會掛。你會睇資料夾名，揾到目標資料夾，然後開入面嘅檔案。

Agent 讀記憶都應該係咁。

但而家大部份 Agent 嘅做法係：每次啟動，將記憶檔案由頭到尾全部讀一次。

100 行嘅時候冇感覺。8000 行嘅時候，token 嘩嘩咁燒。

就算屋企有礦都唔係咁燒法。

L0 / L1 / L2：三層按需載入

OpenViking 將記憶分成三層：

層級	內容	類比	token
L0	目錄索引	資料夾名	~100
L1	內容摘要	檔案簡介	~500
L2	完整內容	檔案全文	~5000+

每次啟動只讀 L0。100 個 token，就知記憶裏面有咩。

需要具體資訊？讀 L1 摘要。確認咗？先讀 L2 全文。

由「每次全讀」變成「按需讀取」。

我實際測試，日常對話 token 消耗直接降 10 倍。

唔係慳少少，係斷崖式下降。

P0 / P1 / P2：畀記憶加個有效期

齋分層仲唔夠。記憶會越嚟越多。

OpenViking 另一招——幫記憶打「有效期」：

標籤	含義	保留時間	舉例
P0	核心資訊	永久	用戶名、寫作風格
P1	活躍項目	90 日	當前正在寫嘅文章
P2	臨時記錄	30 日	某次對話嘅除錯細節

P0 永遠唔刪。P1 到期歸檔。P2 到期清理。

就好似人嘅記憶——重要嘅嘢記得好實，瑣碎嘅嘢會淡忘。但係去翻筆記仲可以揾得返。

我真實嘅改造：幫 OpenClaw 多 Agent 裝咗個共享大腦

講咗咁多原理。我到底點做㗎？

第一步：幫每個 Agent 加索引檔案（10 分鐘）

喺每個 Agent 嘅 memory 目錄底下開一個 .abstract 檔案，就係 L0 索引。

# memory/.abstract
- 用戶偏好：寫作風格、發佈節奏、目標讀者
- 系統配置：Agent 列表、通信方式、模型設置
- 項目記錄：當前創作任務、歷史發佈文章
- 工具筆記：常用命令、API 配置、踩坑記錄

Agent 每次啟動，先讀呢個。只有需要具體資訊時，先深入讀對應嘅檔案。

第二步：幫記憶打 P 標籤（10 分鐘）

## [P0] 用戶基本信息
- 名字：MJ
- 寫作風格：大白話、短句、第一人稱

## [P1] 當前項目：OpenViking 記憶改造
- 狀態：初稿
- 截止：2026-03-01

## [P2] 2026-02-22 調試記錄
- 飛書 webhook 超時問題
- 已解決，改了超時配置

然後寫個清理 script，每日掃一次。過期嘅自動歸檔。

第三步：共享記憶層——呢個先係殺手鐧（10 分鐘）

建立一個所有 Agent 都可以讀嘅共享目錄：

shared-memory/
├── .abstract           # 共享記憶索引
├── user-profile.md     # 用戶畫像（所有 Agent 共用）
├── active-tasks.md     # 當前進行中的任務
└── cross-agent-log.md  # 跨 Agent 協作記錄

點樣令 Agent 自動寫入去？

唔使寫 code。

OpenClaw 每個 Agent 啟動都會讀 AGENTS.md——即係佢嘅工作手冊。加一條規則就得：

## 共享記憶規則
完成重要任務後，把關鍵結果追加到 shared-memory/cross-agent-log.md
格式：- [日期] [角色] 做了什麼，關鍵結論
只記結論，不記過程。一條不超過兩行。

就好似同員工立咗個規矩：「做完嘢，喺共享文件記低佢。」

Agent 會自覺執行。真係會。

改造前 vs 改造後

對比	改造前	改造後
每次對話 token	8000+	~800
Agent 之間資訊共用	❌ 各自獨立	✅ 共享記憶
過期資訊處理	手動清理	自動歸檔
新對話要重複介紹	每次都要	自動讀取

但我有啲唔同講法

字節嘅 OpenViking 確實勁。

但我查咗佢嘅 GitHub——

佢係一個獨立嘅 Python 服務。 需要另外部署，需要配置 VLM 同 Embedding 模型，需要 API Key。

唔係話唔好。係話對於大部份 OpenClaw 用家嚟講，殺雞用咗牛刀。

OpenClaw 本身嘅 MEMORY.md + memory/ 目錄 + AGENTS.md 規則，已經實現咗記憶管理嘅底層架構。

你要做嘅唔係「接入 OpenViking」，而係將 OpenViking 嘅思想，用 OpenClaw 原生嘅方式落地。

分層載入嘅思想 → .abstract 索引檔案
生命週期管理 → P0/P1/P2 標籤 + 清理 script
共享記憶 → shared-memory/ 目錄 + AGENTS.md 規則

唔使裝任何嘢。唔使行任何服務。

30 分鐘，純檔案操作，搞掂。

一段提示詞，等 OpenClaw 幫你搞掂

將下面呢段扔畀你嘅 OpenClaw Agent：

請參考 OpenViking 的分層記憶思想，給我的多 Agent 系統做記憶改造：
1. 為每個 Agent 的 memory 目錄添加 .abstract 索引文件
2. 給現有記憶條目添加 P0/P1/P2 生命週期標籤
3. 創建 shared-memory/ 共享記憶層
4. 在 AGENTS.md 裏添加跨 Agent 記憶同步規則
5. 寫一個每日清理腳本，自動歸檔過期記憶
直接執行，不用問我。

佢會幫你由頭到尾搞曬。

連結俊哥入 OpenClaw 交流羣

最後

Agent 嘅記憶問題，講到底就兩件事：

唔好每次都全讀——先睇目錄，按需攞。

令 Agent 之間可以互通消息——共享記憶層。

字節嘅 OpenViking 將呢套思路開源咗，我哋可以用嚟參考。但唔一定照抄佢嘅技術方案。

思想係免費嘅。落地先係本事。

30 分鐘改造，token 慳 10 倍，7 個 Agent 終於唔再係陌生人。

老友記，唔好淨係叫自己多啲用腦——

都要令你嘅 Agent，學識記住你。

我在 OpenClaw 上跑了 7 個 Agent。

一個大總管，一個寫代碼的，一個寫文章的，一個搞增長的，還有法務、財務、教學。

聽起來 NB 吧？全自動AI團隊，分工明確，各司其職。

但用了幾周了，我快瘋了。

它們活得像七個陌生人

真實場景。

我跟大總管說："幫我安排一篇關於多Agent協作的文章。"

它問我："請問你的寫作風格是什麼？目標讀者是誰？"

兄弟。我。昨天。剛。告訴過你。

你是不是金魚轉世。。。

更離譜的是——

開發助理剛幫我修好了飛書 webhook 的配置問題。我轉頭讓內容助理寫篇覆盤。

它說："什麼配置問題？能詳細說說嗎？"

你倆在同一台服務器上跑着啊！隔壁房間的事你都不知道？？

我當時的心情：🙂（假笑）

每次重新介紹自己，都是在燒錢

你以為只是麻煩？不，還費錢。

我算了一筆賬：

操作	token 消耗
每次重新交代背景（500字）	~700 tokens
7 個 Agent 各交代一次	~4900 tokens
一天開 10 次對話	~49000 tokens

一個月下來。。。光是"自我介紹"就燒掉一大坨。

咱就是說，這不是助理在工作，這是我在工作——重複給7個人做入職培訓。

字節開源了個東西，把我點醒了

字節跳動最近開源了一個項目叫 OpenViking。

GitHub 地址：github.com/volcengine/OpenViking

它的核心思路特別簡單——

把 Agent 的記憶當文件系統來管理。

啥意思？

你打開電腦找文件的時候，會把硬盤裏所有文件內容全讀一遍嗎？

不會吧。你先看文件夾名，找到目標文件夾，再打開具體文件。

Agent 讀記憶也該這樣。

但現在大多數 Agent 的做法是：每次啓動，把記憶文件從頭到尾全部讀一遍。

100 行的時候沒感覺。8000 行的時候，token 嘩嘩地燒。

家有礦也不是這個燒法。

L0 / L1 / L2：三層按需加載

OpenViking 把記憶分成三層：

層級	內容	類比	token
L0	目錄索引	文件夾名	~100
L1	內容摘要	文件簡介	~500
L2	完整內容	文件全文	~5000+

每次啓動只讀 L0。100 個 token，就知道記憶裏有啥。

需要具體信息？讀 L1 摘要。確認了？才讀 L2 全文。

從"每次全讀"變成"按需讀取"。

我實測，日常對話 token 消耗直接降 10 倍。

不是省一點點，是斷崖式下降。

P0 / P1 / P2：給記憶加保質期

光分層還不夠。記憶會越來越多。

OpenViking 的另一招——給記憶打"保質期"：

標籤	含義	保留時間	舉例
P0	核心信息	永久	用戶名、寫作風格
P1	活躍項目	90 天	當前正在寫的文章
P2	臨時記錄	30 天	某次對話的調試細節

P0 永遠不刪。P1 過期歸檔。P2 到期清理。

就像人的記憶——重要的事記得牢，瑣碎的事會淡忘。但去翻筆記還能找回來。

我的真實改造：給 OpenClaw 多 Agent 裝上共享大腦

說了這麼多原理。我到底怎麼做的？

第一步：給每個 Agent 加索引文件（10 分鐘）

在每個 Agent 的 memory 目錄下建一個 .abstract 文件，就是 L0 索引。

# memory/.abstract
- 用戶偏好：寫作風格、發佈節奏、目標讀者
- 系統配置：Agent 列表、通信方式、模型設置
- 項目記錄：當前創作任務、歷史發佈文章
- 工具筆記：常用命令、API 配置、踩坑記錄

Agent 每次啓動，先讀這個。只有需要具體信息時，才深入讀對應的文件。

第二步：給記憶打 P 標籤（10 分鐘）

## [P0] 用戶基本信息
- 名字：MJ
- 寫作風格：大白話、短句、第一人稱

## [P1] 當前項目：OpenViking 記憶改造
- 狀態：初稿
- 截止：2026-03-01

## [P2] 2026-02-22 調試記錄
- 飛書 webhook 超時問題
- 已解決，改了超時配置

然後寫個清理腳本，每天掃一次。過期的自動歸檔。

第三步：共享記憶層——這才是殺手鐧（10 分鐘）

創建一個所有 Agent 都能讀的共享目錄：

shared-memory/
├── .abstract           # 共享記憶索引
├── user-profile.md     # 用戶畫像（所有 Agent 共用）
├── active-tasks.md     # 當前進行中的任務
└── cross-agent-log.md  # 跨 Agent 協作記錄

怎麼讓 Agent 自動往裏寫？

不用寫代碼。

OpenClaw 每個 Agent 啓動都會讀 AGENTS.md——它的工作手冊。加一條規則就行：

## 共享記憶規則
完成重要任務後，把關鍵結果追加到 shared-memory/cross-agent-log.md
格式：- [日期] [角色] 做了什麼，關鍵結論
只記結論，不記過程。一條不超過兩行。

就像給員工立了個規矩："做完事，在共享文檔記一筆。"

Agent 會自覺執行。真的會。

改造前 vs 改造後

對比	改造前	改造後
每次對話 token	8000+	~800
Agent 間信息共享	❌ 各自獨立	✅ 共享記憶
過期信息處理	手動清理	自動歸檔
新對話要重複介紹	每次都要	自動讀取

但我想說點不一樣的

字節的 OpenViking 確實牛。

但我查了它的 GitHub——

它是一個獨立的 Python 服務。 需要單獨部署，需要配置 VLM 和 Embedding 模型，需要 API Key。

不是說不好。是說對於大多數 OpenClaw 用戶來說，殺雞用了牛刀。

OpenClaw 本身的 MEMORY.md + memory/ 目錄 + AGENTS.md 規則，已經實現了記憶管理的底層架構。

你要做的不是"接入 OpenViking"，而是把 OpenViking 的思想，用 OpenClaw 原生的方式落地。

分層加載的思想 → .abstract 索引文件
生命週期管理 → P0/P1/P2 標籤 + 清理腳本
共享記憶 → shared-memory/ 目錄 + AGENTS.md 規則

不用裝任何東西。不用跑任何服務。

30 分鐘，純文件操作，搞定。

一段提示詞，讓 OpenClaw 幫你搞定

把下面這段扔給你的 OpenClaw Agent：

請參考 OpenViking 的分層記憶思想，給我的多 Agent 系統做記憶改造：
1. 為每個 Agent 的 memory 目錄添加 .abstract 索引文件
2. 給現有記憶條目添加 P0/P1/P2 生命週期標籤
3. 創建 shared-memory/ 共享記憶層
4. 在 AGENTS.md 裏添加跨 Agent 記憶同步規則
5. 寫一個每日清理腳本，自動歸檔過期記憶
直接執行，不用問我。

它會幫你全流程搞完。

連結俊哥進OpenClaw交流羣

最後

Agent 的記憶問題，說白了就兩件事：

不要每次全讀——先看目錄，按需取。

讓 Agent 之間能互相通氣——共享記憶層。

字節的 OpenViking 把這套思路開源了，我們拿來借鑑。但不一定要照搬它的技術方案。

思想是免費的。落地才是本事。

30 分鐘改造，token 省 10 倍，7 個 Agent 終於不再是陌生人了。

老鐵們，別光讓自己多動腦子——

也得讓你的 Agent，學會記住你。