OpenViking×OpenClaw:7 個 Agent不再是陌生人,token暴降 90%

作者:俊哥AI出海
日期:2026年2月22日 下午12:12
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

OpenViking思想為OpenClaw多Agent記憶做改造,token省10倍,7個Agent唔再係陌生人

整理版摘要

作者MJ喺OpenClaw上跑咗7個Agent,本來諗住分工明確可以自動化,點知用咗幾星期就頂唔順。每次開新對話,每個Agent都要重新自我介紹一次,好似七個陌生人同枱食飯但各自玩手機。佢計過數,單係呢啲重複交代背景嘅token,一個月就燒咗成千上萬嘅成本,仲要自己逐個Agent做「入職培訓」,完全違反咗自動化嘅原意。

後尾佢發現字節跳動開源咗OpenViking,核心概念係將Agent嘅記憶當文件系統管理:L0目錄索引(100 token)、L1內容摘要(500 token)、L2完整內容(5000+ token),每次啟動只讀L0,需要先讀L1,確認先讀L2,斷崖式降低token消耗。再加上P0/P1/P2保質期標籤,重要嘢永久保留,過期自動歸檔,唔使手動清理。

作者冇直接部署OpenViking,而係將呢套思想用OpenClaw原生功能落地:喺每個Agent嘅memory目錄加.abstract索引、畀記憶打P標籤、建立shared-memory共享目錄、改寫AGENTS.md加跨Agent同步規則。成個改造只用咗30分鐘,token消耗由每次8000+降到得800,Agent之間終於識得共享資訊,唔會再各自為政。最後佢仲提供咗一段提示詞,畀人直接扔畀OpenClaw Agent自動執行改造。

  • 多Agent協作最大痛症係記憶隔離,每次重新自我介紹燒大量token,效率極低。
  • OpenViking用L0/L1/L2三層按需加載,由「每次全讀」變「睇目錄先」,token斷崖式下降10倍。
  • P0/P1/P2生命週期標籤幫Agent自動管理記憶,重要嘢唔會唔見,過期嘢自動清理。
  • 作者用OpenClaw原生功能(.abstract、P標籤、shared-memory、AGENTS.md)實現相同效果,唔使額外部署任何服務。
  • 30分鐘改造後,7個Agent共用共享記憶層,唔再係陌生人,token消耗大降,真正實現自動化團隊。
值得記低
Prompt

多Agent記憶改造提示詞

請參考 OpenViking 的分層記憶思想,給我的多 Agent 系統做記憶改造: 1. 為每個 Agent 的 memory 目錄添加 .abstract 索引文件 2. 給現有記憶條目添加 P0/P1/P2 生命週期標籤 3. 創建 shared-memory/ 共享記憶層 4. 在 AGENTS.md 裏添加跨 Agent 記憶同步規則 5. 寫一個每日清理腳本,自動歸檔過期記憶 直接執行,不用問我。

結構示例

結構示例

結構示例 text
## [P0] 用戶基本信息- 名字:MJ- 寫作風格:大白話、短句、第一人稱## [P1] 當前項目:OpenViking 記憶改造- 狀態:初稿- 截止:2026-03-01## [P2] 2026-02-22 調試記錄- 飛書 webhook 超時問題- 已解決,改了超時配置
整理重點

7個Agent各自為政,作者燒錢燒到頭痛

作者MJ喺OpenClaw上跑咗7個Agent,包括大總管、寫代碼、寫文章、搞增長、法務、財務同教學,表面睇分工好靚,但實際用落先發現大問題——佢哋活似七個陌生人,完全唔識得互相溝通。

每次開新對話,每個Agent都要重新自我介紹一次,好似七個陌生人同枱食飯但各自玩手機

佢仲計過數:每次交代背景500字約700 token,7個Agent各交代一次就4900 token,一日開10次對話即係49000 token,一個月落嚟淨係「自我介紹」都燒咗一大筆錢。

整理重點

字節開源OpenViking:將記憶當文件系統管理

字節跳動開源咗一個項目叫OpenViking,核心思路係將Agent嘅記憶當文件系統嚟管理。人哋揾檔案唔會成個硬盤由頭讀到尾,而係先睇文件夾名,再開檔案。Agent讀記憶都應該係咁。

但而家大多數Agent嘅做法係每次啟動將記憶文件由頭到尾全部讀一次,100行冇問題,8000行就燒token燒到傻。

OpenViking將記憶分成三層:L0目錄索引(~100 token)、L1內容摘要(~500 token)、L2完整內容(5000+ token)。每次啟動只讀L0,需要具體資訊先讀L1,確認咗先讀L2,由「每次全讀」變成「按需讀取」。作者實測日常對話token消耗直接降10倍,係斷崖式下降。

斷崖式下降,唔係省少少,係省到得返一成。

除咗分層,仲有P0/P1/P2保質期標籤。P0係核心資訊永久保留,P1係活躍項目保留90日,P2係臨時記錄保留30日。過期自動歸檔,就好似人嘅記憶,重要嘢記得牢,瑣碎嘢會淡忘。

整理重點

用OpenClaw原生功能落地,30分鐘搞掂

作者冇直接部署OpenViking,因為佢係一個獨立Python服務,要另外部署同配置API Key,對一般OpenClaw用戶嚟講太高成本。佢選擇將OpenViking嘅思想用OpenClaw原生方式落地。

  1. 1 第一步:喺每個Agent嘅memory目錄下建.abstract索引文件(L0),列出用戶偏好、系統配置、項目記錄、工具筆記等,Agent啟動先讀呢個,有需要先深入讀其他檔案。
  2. 2 第二步:用P0/P1/P2標籤標記記憶條目,例如用家基本資訊係P0,當前寫緊嘅Project係P1,一次對話嘅調試細節係P2。再寫個清理腳本每日掃一次,過期自動歸檔。
  3. 3 第三步:創建shared-memory/共享目錄,放.user-profile.md、active-tasks.md、cross-agent-log.md,所有Agent都可以讀取。然後喺AGENTS.md加一條規則:「完成重要任務後,把關鍵結果追加到cross-agent-log.md,只記結論,唔記過程,一條唔超過兩行。」

唔使裝任何嘢,唔使跑任何服務,30分鐘,純文件操作,搞掂。

作者仲提供咗一段提示詞,直接扔畀OpenClaw Agent就可以自動執行成個改造流程。

整理重點

改造前後對比,數字證明一切

改造前每次對話token消耗8000+,改造後得返~800,直接減咗10倍。

Agent之間信息共享由各自獨立變成共享記憶,唔會再出現開發助理改咗webhook但內容助理唔知嘅笑話。

過期信息處理由手動清理變成自動歸檔,新對話唔使再重複介紹自己,因為Agent已經自動讀取咗。

整理重點

總結:Agent嘅記憶問題,兩件事就搞掂

Agent嘅記憶問題,講到尾得兩件事:第一,唔好每次全讀——先睇目錄,按需取;第二,等Agent之間可以互相通氣——共享記憶層。

30分鐘改造,token省10倍,7個Agent終於唔再係陌生人。

作者話:老鐵們,唔好淨係畀自己多動腦筋——都要令你嘅Agent,學識記住你。

我喺 OpenClaw 上面行咗 7 個 Agent。

一個大總管,一個寫 code 嘅,一個寫文章嘅,一個搞增長嘅,仲有法務、財務、教學。

聽落好勁呀?全自動 AI 團隊,分工清楚,各司其職。

但用咗幾個禮拜,我快癲咗。

佢哋生似七個陌生人

真實情況。

我同大總管講:「幫我安排一篇關於多 Agent 協作嘅文章。」

佢問我:「請問你嘅寫作風格係點?目標讀者係邊個?」

兄弟。我。尋日。啱。同你講過。

你係咪金魚轉世。。。(唔記得咁快)

仲離譜嘅係——

開發助理啱先幫我整好咗飛書 webhook 嘅配置問題。我轉頭叫內容助理寫篇回顧。

佢話:「咩配置問題?可唔可以詳細講下?」

你兩個喺同一部 server 度行緊㗎!隔籬房嘅事你都唔知??

我當時嘅心情係:🙂(假笑)

每次重新介紹自己,都係喺度燒錢

你以為只係麻煩?唔係,仲嘥錢。

我計咗條數:

操作
token 消耗
每次重新交代背景(500 字)
~700 tokens
7 個 Agent 各交代一次
~4900 tokens
一日開 10 次對話
~49000 tokens

一個月落嚟。。。淨係「自我介紹」就燒咗一大嚿。

即係話,呢啲唔係助理喺度做嘢,係我喺度做嘢——重複同七個人做入職培訓。

字節開源咗個嘢,令我醒咗

字節跳動最近開源咗一個項目叫 OpenViking

GitHub 地址:github.com/volcengine/OpenViking

佢嘅核心思路好簡單——

將 Agent 嘅記憶當做文件系統咁管理。

即係點解?

你開電腦揾檔案嘅時候,會唔會將成個硬碟嘅內容全部讀一次?

唔會掛。你會睇資料夾名,揾到目標資料夾,然後開入面嘅檔案。

Agent 讀記憶都應該係咁。

但而家大部份 Agent 嘅做法係:每次啟動,將記憶檔案由頭到尾全部讀一次。

100 行嘅時候冇感覺。8000 行嘅時候,token 嘩嘩咁燒。

就算屋企有礦都唔係咁燒法。

L0 / L1 / L2:三層按需載入

OpenViking 將記憶分成三層:

層級
內容
類比
token
L0
目錄索引
資料夾名
~100
L1
內容摘要
檔案簡介
~500
L2
完整內容
檔案全文
~5000+

每次啟動只讀 L0。100 個 token,就知記憶裏面有咩。

需要具體資訊?讀 L1 摘要。確認咗?先讀 L2 全文。

由「每次全讀」變成「按需讀取」。

我實際測試,日常對話 token 消耗直接降 10 倍。

唔係慳少少,係斷崖式下降。

P0 / P1 / P2:畀記憶加個有效期

齋分層仲唔夠。記憶會越嚟越多。

OpenViking 另一招——幫記憶打「有效期」:

標籤
含義
保留時間
舉例
P0
核心資訊
永久
用戶名、寫作風格
P1
活躍項目
90 日
當前正在寫嘅文章
P2
臨時記錄
30 日
某次對話嘅除錯細節

P0 永遠唔刪。P1 到期歸檔。P2 到期清理。

就好似人嘅記憶——重要嘅嘢記得好實,瑣碎嘅嘢會淡忘。但係去翻筆記仲可以揾得返。

我真實嘅改造:幫 OpenClaw 多 Agent 裝咗個共享大腦

講咗咁多原理。我到底點做㗎?

第一步:幫每個 Agent 加索引檔案(10 分鐘)

喺每個 Agent 嘅 memory 目錄底下開一個 .abstract 檔案,就係 L0 索引。

# memory/.abstract
- 用戶偏好:寫作風格、發佈節奏、目標讀者
- 系統配置:Agent 列表、通信方式、模型設置
- 項目記錄:當前創作任務、歷史發佈文章
- 工具筆記:常用命令、API 配置、踩坑記錄

Agent 每次啟動,先讀呢個。只有需要具體資訊時,先深入讀對應嘅檔案。

第二步:幫記憶打 P 標籤(10 分鐘)

## [P0] 用戶基本信息
- 名字:MJ
- 寫作風格:大白話、短句、第一人稱

## [P1] 當前項目:OpenViking 記憶改造
- 狀態:初稿
- 截止:2026-03-01

## [P2] 2026-02-22 調試記錄
- 飛書 webhook 超時問題
- 已解決,改了超時配置

然後寫個清理 script,每日掃一次。過期嘅自動歸檔。

第三步:共享記憶層——呢個先係殺手鐧(10 分鐘)

建立一個所有 Agent 都可以讀嘅共享目錄:

shared-memory/
├── .abstract           # 共享記憶索引
├── user-profile.md     # 用戶畫像(所有 Agent 共用)
├── active-tasks.md     # 當前進行中的任務
└── cross-agent-log.md  # 跨 Agent 協作記錄

點樣令 Agent 自動寫入去?

唔使寫 code。

OpenClaw 每個 Agent 啟動都會讀 AGENTS.md——即係佢嘅工作手冊。加一條規則就得:

## 共享記憶規則
完成重要任務後,把關鍵結果追加到 shared-memory/cross-agent-log.md
格式:- [日期] [角色] 做了什麼,關鍵結論
只記結論,不記過程。一條不超過兩行。

就好似同員工立咗個規矩:「做完嘢,喺共享文件記低佢。」

Agent 會自覺執行。真係會。

改造前 vs 改造後

對比
改造前
改造後
每次對話 token
8000+
~800
Agent 之間資訊共用
❌ 各自獨立
✅ 共享記憶
過期資訊處理
手動清理
自動歸檔
新對話要重複介紹
每次都要
自動讀取

但我有啲唔同講法

字節嘅 OpenViking 確實勁。

但我查咗佢嘅 GitHub——

佢係一個獨立嘅 Python 服務。 需要另外部署,需要配置 VLM 同 Embedding 模型,需要 API Key。

唔係話唔好。係話對於大部份 OpenClaw 用家嚟講,殺雞用咗牛刀。

OpenClaw 本身嘅 MEMORY.md + memory/ 目錄 + AGENTS.md 規則,已經實現咗記憶管理嘅底層架構。

你要做嘅唔係「接入 OpenViking」,而係將 OpenViking 嘅思想,用 OpenClaw 原生嘅方式落地。

分層載入嘅思想 → .abstract 索引檔案
生命週期管理 → P0/P1/P2 標籤 + 清理 script
共享記憶 → shared-memory/ 目錄 + AGENTS.md 規則

唔使裝任何嘢。唔使行任何服務。

30 分鐘,純檔案操作,搞掂。

一段提示詞,等 OpenClaw 幫你搞掂

將下面呢段扔畀你嘅 OpenClaw Agent:

請參考 OpenViking 的分層記憶思想,給我的多 Agent 系統做記憶改造:
1. 為每個 Agent 的 memory 目錄添加 .abstract 索引文件
2. 給現有記憶條目添加 P0/P1/P2 生命週期標籤
3. 創建 shared-memory/ 共享記憶層
4. 在 AGENTS.md 裏添加跨 Agent 記憶同步規則
5. 寫一個每日清理腳本,自動歸檔過期記憶
直接執行,不用問我。

佢會幫你由頭到尾搞曬。

連結俊哥 入 OpenClaw 交流羣

圖片

最後

Agent 嘅記憶問題,講到底就兩件事:

唔好每次都全讀——先睇目錄,按需攞。

令 Agent 之間可以互通消息——共享記憶層。

字節嘅 OpenViking 將呢套思路開源咗,我哋可以用嚟參考。但唔一定照抄佢嘅技術方案。

思想係免費嘅。落地先係本事。

30 分鐘改造,token 慳 10 倍,7 個 Agent 終於唔再係陌生人。

老友記,唔好淨係叫自己多啲用腦——

都要令你嘅 Agent,學識記住你。

我在 OpenClaw 上跑了 7 個 Agent。

一個大總管,一個寫代碼的,一個寫文章的,一個搞增長的,還有法務、財務、教學。

聽起來 NB 吧?全自動AI團隊,分工明確,各司其職。

但用了幾周了,我快瘋了。

它們活得像七個陌生人

真實場景。

我跟大總管說:"幫我安排一篇關於多Agent協作的文章。"

它問我:"請問你的寫作風格是什麼?目標讀者是誰?"

兄弟。我。昨天。剛。告訴過你。

你是不是金魚轉世。。。

更離譜的是——

開發助理剛幫我修好了飛書 webhook 的配置問題。我轉頭讓內容助理寫篇覆盤。

它說:"什麼配置問題?能詳細說說嗎?"

你倆在同一台服務器上跑着啊!隔壁房間的事你都不知道??

我當時的心情:🙂(假笑)

每次重新介紹自己,都是在燒錢

你以為只是麻煩?不,還費錢。

我算了一筆賬:

操作
token 消耗
每次重新交代背景(500字)
~700 tokens
7 個 Agent 各交代一次
~4900 tokens
一天開 10 次對話
~49000 tokens

一個月下來。。。光是"自我介紹"就燒掉一大坨。

咱就是說,這不是助理在工作,這是我在工作——重複給7個人做入職培訓。

字節開源了個東西,把我點醒了

字節跳動最近開源了一個項目叫 OpenViking

GitHub 地址:github.com/volcengine/OpenViking

它的核心思路特別簡單——

把 Agent 的記憶當文件系統來管理。

啥意思?

你打開電腦找文件的時候,會把硬盤裏所有文件內容全讀一遍嗎?

不會吧。你先看文件夾名,找到目標文件夾,再打開具體文件。

Agent 讀記憶也該這樣。

但現在大多數 Agent 的做法是:每次啓動,把記憶文件從頭到尾全部讀一遍。

100 行的時候沒感覺。8000 行的時候,token 嘩嘩地燒。

家有礦也不是這個燒法。

L0 / L1 / L2:三層按需加載

OpenViking 把記憶分成三層:

層級
內容
類比
token
L0
目錄索引
文件夾名
~100
L1
內容摘要
文件簡介
~500
L2
完整內容
文件全文
~5000+

每次啓動只讀 L0。100 個 token,就知道記憶裏有啥。

需要具體信息?讀 L1 摘要。確認了?才讀 L2 全文。

從"每次全讀"變成"按需讀取"。

我實測,日常對話 token 消耗直接降 10 倍。

不是省一點點,是斷崖式下降。

P0 / P1 / P2:給記憶加保質期

光分層還不夠。記憶會越來越多。

OpenViking 的另一招——給記憶打"保質期":

標籤
含義
保留時間
舉例
P0
核心信息
永久
用戶名、寫作風格
P1
活躍項目
90 天
當前正在寫的文章
P2
臨時記錄
30 天
某次對話的調試細節

P0 永遠不刪。P1 過期歸檔。P2 到期清理。

就像人的記憶——重要的事記得牢,瑣碎的事會淡忘。但去翻筆記還能找回來。

我的真實改造:給 OpenClaw 多 Agent 裝上共享大腦

說了這麼多原理。我到底怎麼做的?

第一步:給每個 Agent 加索引文件(10 分鐘)

在每個 Agent 的 memory 目錄下建一個 .abstract 文件,就是 L0 索引。

# memory/.abstract
- 用戶偏好:寫作風格、發佈節奏、目標讀者
- 系統配置:Agent 列表、通信方式、模型設置
- 項目記錄:當前創作任務、歷史發佈文章
- 工具筆記:常用命令、API 配置、踩坑記錄

Agent 每次啓動,先讀這個。只有需要具體信息時,才深入讀對應的文件。

第二步:給記憶打 P 標籤(10 分鐘)

## [P0] 用戶基本信息
- 名字:MJ
- 寫作風格:大白話、短句、第一人稱

## [P1] 當前項目:OpenViking 記憶改造
- 狀態:初稿
- 截止:2026-03-01

## [P2] 2026-02-22 調試記錄
- 飛書 webhook 超時問題
- 已解決,改了超時配置

然後寫個清理腳本,每天掃一次。過期的自動歸檔。

第三步:共享記憶層——這才是殺手鐧(10 分鐘)

創建一個所有 Agent 都能讀的共享目錄:

shared-memory/
├── .abstract           # 共享記憶索引
├── user-profile.md     # 用戶畫像(所有 Agent 共用)
├── active-tasks.md     # 當前進行中的任務
└── cross-agent-log.md  # 跨 Agent 協作記錄

怎麼讓 Agent 自動往裏寫?

不用寫代碼。

OpenClaw 每個 Agent 啓動都會讀 AGENTS.md——它的工作手冊。加一條規則就行:

## 共享記憶規則
完成重要任務後,把關鍵結果追加到 shared-memory/cross-agent-log.md
格式:- [日期] [角色] 做了什麼,關鍵結論
只記結論,不記過程。一條不超過兩行。

就像給員工立了個規矩:"做完事,在共享文檔記一筆。"

Agent 會自覺執行。真的會。

改造前 vs 改造後

對比
改造前
改造後
每次對話 token
8000+
~800
Agent 間信息共享
❌ 各自獨立
✅ 共享記憶
過期信息處理
手動清理
自動歸檔
新對話要重複介紹
每次都要
自動讀取

但我想說點不一樣的

字節的 OpenViking 確實牛。

但我查了它的 GitHub——

它是一個獨立的 Python 服務。 需要單獨部署,需要配置 VLM 和 Embedding 模型,需要 API Key。

不是說不好。是說對於大多數 OpenClaw 用戶來說,殺雞用了牛刀。

OpenClaw 本身的 MEMORY.md + memory/ 目錄 + AGENTS.md 規則,已經實現了記憶管理的底層架構。

你要做的不是"接入 OpenViking",而是把 OpenViking 的思想,用 OpenClaw 原生的方式落地。

分層加載的思想 → .abstract 索引文件
生命週期管理 → P0/P1/P2 標籤 + 清理腳本
共享記憶 → shared-memory/ 目錄 + AGENTS.md 規則

不用裝任何東西。不用跑任何服務。

30 分鐘,純文件操作,搞定。

一段提示詞,讓 OpenClaw 幫你搞定

把下面這段扔給你的 OpenClaw Agent:

請參考 OpenViking 的分層記憶思想,給我的多 Agent 系統做記憶改造:
1. 為每個 Agent 的 memory 目錄添加 .abstract 索引文件
2. 給現有記憶條目添加 P0/P1/P2 生命週期標籤
3. 創建 shared-memory/ 共享記憶層
4. 在 AGENTS.md 裏添加跨 Agent 記憶同步規則
5. 寫一個每日清理腳本,自動歸檔過期記憶
直接執行,不用問我。

它會幫你全流程搞完。

連結俊哥 進OpenClaw交流羣

圖片

最後

Agent 的記憶問題,說白了就兩件事:

不要每次全讀——先看目錄,按需取。

讓 Agent 之間能互相通氣——共享記憶層。

字節的 OpenViking 把這套思路開源了,我們拿來借鑑。但不一定要照搬它的技術方案。

思想是免費的。落地才是本事。

30 分鐘改造,token 省 10 倍,7 個 Agent 終於不再是陌生人了。

老鐵們,別光讓自己多動腦子——

也得讓你的 Agent,學會記住你。