OpenViking×OpenClaw:7 個 Agent不再是陌生人,token暴降 90%
整理版優先睇
用OpenViking思想為OpenClaw多Agent記憶做改造,token省10倍,7個Agent唔再係陌生人
作者MJ喺OpenClaw上跑咗7個Agent,本來諗住分工明確可以自動化,點知用咗幾星期就頂唔順。每次開新對話,每個Agent都要重新自我介紹一次,好似七個陌生人同枱食飯但各自玩手機。佢計過數,單係呢啲重複交代背景嘅token,一個月就燒咗成千上萬嘅成本,仲要自己逐個Agent做「入職培訓」,完全違反咗自動化嘅原意。
後尾佢發現字節跳動開源咗OpenViking,核心概念係將Agent嘅記憶當文件系統管理:L0目錄索引(100 token)、L1內容摘要(500 token)、L2完整內容(5000+ token),每次啟動只讀L0,需要先讀L1,確認先讀L2,斷崖式降低token消耗。再加上P0/P1/P2保質期標籤,重要嘢永久保留,過期自動歸檔,唔使手動清理。
作者冇直接部署OpenViking,而係將呢套思想用OpenClaw原生功能落地:喺每個Agent嘅memory目錄加.abstract索引、畀記憶打P標籤、建立shared-memory共享目錄、改寫AGENTS.md加跨Agent同步規則。成個改造只用咗30分鐘,token消耗由每次8000+降到得800,Agent之間終於識得共享資訊,唔會再各自為政。最後佢仲提供咗一段提示詞,畀人直接扔畀OpenClaw Agent自動執行改造。
- 多Agent協作最大痛症係記憶隔離,每次重新自我介紹燒大量token,效率極低。
- OpenViking用L0/L1/L2三層按需加載,由「每次全讀」變「睇目錄先」,token斷崖式下降10倍。
- P0/P1/P2生命週期標籤幫Agent自動管理記憶,重要嘢唔會唔見,過期嘢自動清理。
- 作者用OpenClaw原生功能(.abstract、P標籤、shared-memory、AGENTS.md)實現相同效果,唔使額外部署任何服務。
- 30分鐘改造後,7個Agent共用共享記憶層,唔再係陌生人,token消耗大降,真正實現自動化團隊。
多Agent記憶改造提示詞
請參考 OpenViking 的分層記憶思想,給我的多 Agent 系統做記憶改造: 1. 為每個 Agent 的 memory 目錄添加 .abstract 索引文件 2. 給現有記憶條目添加 P0/P1/P2 生命週期標籤 3. 創建 shared-memory/ 共享記憶層 4. 在 AGENTS.md 裏添加跨 Agent 記憶同步規則 5. 寫一個每日清理腳本,自動歸檔過期記憶 直接執行,不用問我。
結構示例
## [P0] 用戶基本信息- 名字:MJ- 寫作風格:大白話、短句、第一人稱## [P1] 當前項目:OpenViking 記憶改造- 狀態:初稿- 截止:2026-03-01## [P2] 2026-02-22 調試記錄- 飛書 webhook 超時問題- 已解決,改了超時配置
7個Agent各自為政,作者燒錢燒到頭痛
作者MJ喺OpenClaw上跑咗7個Agent,包括大總管、寫代碼、寫文章、搞增長、法務、財務同教學,表面睇分工好靚,但實際用落先發現大問題——佢哋活似七個陌生人,完全唔識得互相溝通。
每次開新對話,每個Agent都要重新自我介紹一次,好似七個陌生人同枱食飯但各自玩手機
佢仲計過數:每次交代背景500字約700 token,7個Agent各交代一次就4900 token,一日開10次對話即係49000 token,一個月落嚟淨係「自我介紹」都燒咗一大筆錢。
字節開源OpenViking:將記憶當文件系統管理
字節跳動開源咗一個項目叫OpenViking,核心思路係將Agent嘅記憶當文件系統嚟管理。人哋揾檔案唔會成個硬盤由頭讀到尾,而係先睇文件夾名,再開檔案。Agent讀記憶都應該係咁。
但而家大多數Agent嘅做法係每次啟動將記憶文件由頭到尾全部讀一次,100行冇問題,8000行就燒token燒到傻。
OpenViking將記憶分成三層:L0目錄索引(~100 token)、L1內容摘要(~500 token)、L2完整內容(5000+ token)。每次啟動只讀L0,需要具體資訊先讀L1,確認咗先讀L2,由「每次全讀」變成「按需讀取」。作者實測日常對話token消耗直接降10倍,係斷崖式下降。
斷崖式下降,唔係省少少,係省到得返一成。
除咗分層,仲有P0/P1/P2保質期標籤。P0係核心資訊永久保留,P1係活躍項目保留90日,P2係臨時記錄保留30日。過期自動歸檔,就好似人嘅記憶,重要嘢記得牢,瑣碎嘢會淡忘。
用OpenClaw原生功能落地,30分鐘搞掂
作者冇直接部署OpenViking,因為佢係一個獨立Python服務,要另外部署同配置API Key,對一般OpenClaw用戶嚟講太高成本。佢選擇將OpenViking嘅思想用OpenClaw原生方式落地。
- 1 第一步:喺每個Agent嘅memory目錄下建.abstract索引文件(L0),列出用戶偏好、系統配置、項目記錄、工具筆記等,Agent啟動先讀呢個,有需要先深入讀其他檔案。
- 2 第二步:用P0/P1/P2標籤標記記憶條目,例如用家基本資訊係P0,當前寫緊嘅Project係P1,一次對話嘅調試細節係P2。再寫個清理腳本每日掃一次,過期自動歸檔。
- 3 第三步:創建shared-memory/共享目錄,放.user-profile.md、active-tasks.md、cross-agent-log.md,所有Agent都可以讀取。然後喺AGENTS.md加一條規則:「完成重要任務後,把關鍵結果追加到cross-agent-log.md,只記結論,唔記過程,一條唔超過兩行。」
唔使裝任何嘢,唔使跑任何服務,30分鐘,純文件操作,搞掂。
作者仲提供咗一段提示詞,直接扔畀OpenClaw Agent就可以自動執行成個改造流程。
改造前後對比,數字證明一切
改造前每次對話token消耗8000+,改造後得返~800,直接減咗10倍。
Agent之間信息共享由各自獨立變成共享記憶,唔會再出現開發助理改咗webhook但內容助理唔知嘅笑話。
過期信息處理由手動清理變成自動歸檔,新對話唔使再重複介紹自己,因為Agent已經自動讀取咗。
總結:Agent嘅記憶問題,兩件事就搞掂
Agent嘅記憶問題,講到尾得兩件事:第一,唔好每次全讀——先睇目錄,按需取;第二,等Agent之間可以互相通氣——共享記憶層。
30分鐘改造,token省10倍,7個Agent終於唔再係陌生人。
作者話:老鐵們,唔好淨係畀自己多動腦筋——都要令你嘅Agent,學識記住你。
我喺 OpenClaw 上面行咗 7 個 Agent。
一個大總管,一個寫 code 嘅,一個寫文章嘅,一個搞增長嘅,仲有法務、財務、教學。
聽落好勁呀?全自動 AI 團隊,分工清楚,各司其職。
但用咗幾個禮拜,我快癲咗。
佢哋生似七個陌生人
真實情況。
我同大總管講:「幫我安排一篇關於多 Agent 協作嘅文章。」
佢問我:「請問你嘅寫作風格係點?目標讀者係邊個?」
兄弟。我。尋日。啱。同你講過。
你係咪金魚轉世。。。(唔記得咁快)
仲離譜嘅係——
開發助理啱先幫我整好咗飛書 webhook 嘅配置問題。我轉頭叫內容助理寫篇回顧。
佢話:「咩配置問題?可唔可以詳細講下?」
你兩個喺同一部 server 度行緊㗎!隔籬房嘅事你都唔知??
我當時嘅心情係:🙂(假笑)
每次重新介紹自己,都係喺度燒錢
你以為只係麻煩?唔係,仲嘥錢。
我計咗條數:
一個月落嚟。。。淨係「自我介紹」就燒咗一大嚿。
即係話,呢啲唔係助理喺度做嘢,係我喺度做嘢——重複同七個人做入職培訓。
字節開源咗個嘢,令我醒咗
字節跳動最近開源咗一個項目叫 OpenViking。
GitHub 地址:github.com/volcengine/OpenViking
佢嘅核心思路好簡單——
將 Agent 嘅記憶當做文件系統咁管理。
即係點解?
你開電腦揾檔案嘅時候,會唔會將成個硬碟嘅內容全部讀一次?
唔會掛。你會睇資料夾名,揾到目標資料夾,然後開入面嘅檔案。
Agent 讀記憶都應該係咁。
但而家大部份 Agent 嘅做法係:每次啟動,將記憶檔案由頭到尾全部讀一次。
100 行嘅時候冇感覺。8000 行嘅時候,token 嘩嘩咁燒。
就算屋企有礦都唔係咁燒法。
L0 / L1 / L2:三層按需載入
OpenViking 將記憶分成三層:
每次啟動只讀 L0。100 個 token,就知記憶裏面有咩。
需要具體資訊?讀 L1 摘要。確認咗?先讀 L2 全文。
由「每次全讀」變成「按需讀取」。
我實際測試,日常對話 token 消耗直接降 10 倍。
唔係慳少少,係斷崖式下降。
P0 / P1 / P2:畀記憶加個有效期
齋分層仲唔夠。記憶會越嚟越多。
OpenViking 另一招——幫記憶打「有效期」:
P0 永遠唔刪。P1 到期歸檔。P2 到期清理。
就好似人嘅記憶——重要嘅嘢記得好實,瑣碎嘅嘢會淡忘。但係去翻筆記仲可以揾得返。
我真實嘅改造:幫 OpenClaw 多 Agent 裝咗個共享大腦
講咗咁多原理。我到底點做㗎?
第一步:幫每個 Agent 加索引檔案(10 分鐘)
喺每個 Agent 嘅 memory 目錄底下開一個 .abstract 檔案,就係 L0 索引。
# memory/.abstract
- 用戶偏好:寫作風格、發佈節奏、目標讀者
- 系統配置:Agent 列表、通信方式、模型設置
- 項目記錄:當前創作任務、歷史發佈文章
- 工具筆記:常用命令、API 配置、踩坑記錄Agent 每次啟動,先讀呢個。只有需要具體資訊時,先深入讀對應嘅檔案。
第二步:幫記憶打 P 標籤(10 分鐘)
## [P0] 用戶基本信息
- 名字:MJ
- 寫作風格:大白話、短句、第一人稱
## [P1] 當前項目:OpenViking 記憶改造
- 狀態:初稿
- 截止:2026-03-01
## [P2] 2026-02-22 調試記錄
- 飛書 webhook 超時問題
- 已解決,改了超時配置然後寫個清理 script,每日掃一次。過期嘅自動歸檔。
第三步:共享記憶層——呢個先係殺手鐧(10 分鐘)
建立一個所有 Agent 都可以讀嘅共享目錄:
shared-memory/
├── .abstract # 共享記憶索引
├── user-profile.md # 用戶畫像(所有 Agent 共用)
├── active-tasks.md # 當前進行中的任務
└── cross-agent-log.md # 跨 Agent 協作記錄點樣令 Agent 自動寫入去?
唔使寫 code。
OpenClaw 每個 Agent 啟動都會讀 AGENTS.md——即係佢嘅工作手冊。加一條規則就得:
## 共享記憶規則
完成重要任務後,把關鍵結果追加到 shared-memory/cross-agent-log.md
格式:- [日期] [角色] 做了什麼,關鍵結論
只記結論,不記過程。一條不超過兩行。就好似同員工立咗個規矩:「做完嘢,喺共享文件記低佢。」
Agent 會自覺執行。真係會。
改造前 vs 改造後
但我有啲唔同講法
字節嘅 OpenViking 確實勁。
但我查咗佢嘅 GitHub——
佢係一個獨立嘅 Python 服務。 需要另外部署,需要配置 VLM 同 Embedding 模型,需要 API Key。
唔係話唔好。係話對於大部份 OpenClaw 用家嚟講,殺雞用咗牛刀。
OpenClaw 本身嘅 MEMORY.md + memory/ 目錄 + AGENTS.md 規則,已經實現咗記憶管理嘅底層架構。
你要做嘅唔係「接入 OpenViking」,而係將 OpenViking 嘅思想,用 OpenClaw 原生嘅方式落地。
分層載入嘅思想 → .abstract 索引檔案
生命週期管理 → P0/P1/P2 標籤 + 清理 script
共享記憶 → shared-memory/ 目錄 + AGENTS.md 規則
唔使裝任何嘢。唔使行任何服務。
30 分鐘,純檔案操作,搞掂。
一段提示詞,等 OpenClaw 幫你搞掂
將下面呢段扔畀你嘅 OpenClaw Agent:
請參考 OpenViking 的分層記憶思想,給我的多 Agent 系統做記憶改造:
1. 為每個 Agent 的 memory 目錄添加 .abstract 索引文件
2. 給現有記憶條目添加 P0/P1/P2 生命週期標籤
3. 創建 shared-memory/ 共享記憶層
4. 在 AGENTS.md 裏添加跨 Agent 記憶同步規則
5. 寫一個每日清理腳本,自動歸檔過期記憶
直接執行,不用問我。佢會幫你由頭到尾搞曬。
連結俊哥 入 OpenClaw 交流羣

最後
Agent 嘅記憶問題,講到底就兩件事:
唔好每次都全讀——先睇目錄,按需攞。
令 Agent 之間可以互通消息——共享記憶層。
字節嘅 OpenViking 將呢套思路開源咗,我哋可以用嚟參考。但唔一定照抄佢嘅技術方案。
思想係免費嘅。落地先係本事。
30 分鐘改造,token 慳 10 倍,7 個 Agent 終於唔再係陌生人。
老友記,唔好淨係叫自己多啲用腦——
都要令你嘅 Agent,學識記住你。
我在 OpenClaw 上跑了 7 個 Agent。
一個大總管,一個寫代碼的,一個寫文章的,一個搞增長的,還有法務、財務、教學。
聽起來 NB 吧?全自動AI團隊,分工明確,各司其職。
但用了幾周了,我快瘋了。
它們活得像七個陌生人
真實場景。
我跟大總管說:"幫我安排一篇關於多Agent協作的文章。"
它問我:"請問你的寫作風格是什麼?目標讀者是誰?"
兄弟。我。昨天。剛。告訴過你。
你是不是金魚轉世。。。
更離譜的是——
開發助理剛幫我修好了飛書 webhook 的配置問題。我轉頭讓內容助理寫篇覆盤。
它說:"什麼配置問題?能詳細說說嗎?"
你倆在同一台服務器上跑着啊!隔壁房間的事你都不知道??
我當時的心情:🙂(假笑)
每次重新介紹自己,都是在燒錢
你以為只是麻煩?不,還費錢。
我算了一筆賬:
一個月下來。。。光是"自我介紹"就燒掉一大坨。
咱就是說,這不是助理在工作,這是我在工作——重複給7個人做入職培訓。
字節開源了個東西,把我點醒了
字節跳動最近開源了一個項目叫 OpenViking。
GitHub 地址:github.com/volcengine/OpenViking
它的核心思路特別簡單——
把 Agent 的記憶當文件系統來管理。
啥意思?
你打開電腦找文件的時候,會把硬盤裏所有文件內容全讀一遍嗎?
不會吧。你先看文件夾名,找到目標文件夾,再打開具體文件。
Agent 讀記憶也該這樣。
但現在大多數 Agent 的做法是:每次啓動,把記憶文件從頭到尾全部讀一遍。
100 行的時候沒感覺。8000 行的時候,token 嘩嘩地燒。
家有礦也不是這個燒法。
L0 / L1 / L2:三層按需加載
OpenViking 把記憶分成三層:
每次啓動只讀 L0。100 個 token,就知道記憶裏有啥。
需要具體信息?讀 L1 摘要。確認了?才讀 L2 全文。
從"每次全讀"變成"按需讀取"。
我實測,日常對話 token 消耗直接降 10 倍。
不是省一點點,是斷崖式下降。
P0 / P1 / P2:給記憶加保質期
光分層還不夠。記憶會越來越多。
OpenViking 的另一招——給記憶打"保質期":
P0 永遠不刪。P1 過期歸檔。P2 到期清理。
就像人的記憶——重要的事記得牢,瑣碎的事會淡忘。但去翻筆記還能找回來。
我的真實改造:給 OpenClaw 多 Agent 裝上共享大腦
說了這麼多原理。我到底怎麼做的?
第一步:給每個 Agent 加索引文件(10 分鐘)
在每個 Agent 的 memory 目錄下建一個 .abstract 文件,就是 L0 索引。
# memory/.abstract
- 用戶偏好:寫作風格、發佈節奏、目標讀者
- 系統配置:Agent 列表、通信方式、模型設置
- 項目記錄:當前創作任務、歷史發佈文章
- 工具筆記:常用命令、API 配置、踩坑記錄Agent 每次啓動,先讀這個。只有需要具體信息時,才深入讀對應的文件。
第二步:給記憶打 P 標籤(10 分鐘)
## [P0] 用戶基本信息
- 名字:MJ
- 寫作風格:大白話、短句、第一人稱
## [P1] 當前項目:OpenViking 記憶改造
- 狀態:初稿
- 截止:2026-03-01
## [P2] 2026-02-22 調試記錄
- 飛書 webhook 超時問題
- 已解決,改了超時配置然後寫個清理腳本,每天掃一次。過期的自動歸檔。
第三步:共享記憶層——這才是殺手鐧(10 分鐘)
創建一個所有 Agent 都能讀的共享目錄:
shared-memory/
├── .abstract # 共享記憶索引
├── user-profile.md # 用戶畫像(所有 Agent 共用)
├── active-tasks.md # 當前進行中的任務
└── cross-agent-log.md # 跨 Agent 協作記錄怎麼讓 Agent 自動往裏寫?
不用寫代碼。
OpenClaw 每個 Agent 啓動都會讀 AGENTS.md——它的工作手冊。加一條規則就行:
## 共享記憶規則
完成重要任務後,把關鍵結果追加到 shared-memory/cross-agent-log.md
格式:- [日期] [角色] 做了什麼,關鍵結論
只記結論,不記過程。一條不超過兩行。就像給員工立了個規矩:"做完事,在共享文檔記一筆。"
Agent 會自覺執行。真的會。
改造前 vs 改造後
但我想說點不一樣的
字節的 OpenViking 確實牛。
但我查了它的 GitHub——
它是一個獨立的 Python 服務。 需要單獨部署,需要配置 VLM 和 Embedding 模型,需要 API Key。
不是說不好。是說對於大多數 OpenClaw 用戶來說,殺雞用了牛刀。
OpenClaw 本身的 MEMORY.md + memory/ 目錄 + AGENTS.md 規則,已經實現了記憶管理的底層架構。
你要做的不是"接入 OpenViking",而是把 OpenViking 的思想,用 OpenClaw 原生的方式落地。
分層加載的思想 → .abstract 索引文件
生命週期管理 → P0/P1/P2 標籤 + 清理腳本
共享記憶 → shared-memory/ 目錄 + AGENTS.md 規則
不用裝任何東西。不用跑任何服務。
30 分鐘,純文件操作,搞定。
一段提示詞,讓 OpenClaw 幫你搞定
把下面這段扔給你的 OpenClaw Agent:
請參考 OpenViking 的分層記憶思想,給我的多 Agent 系統做記憶改造:
1. 為每個 Agent 的 memory 目錄添加 .abstract 索引文件
2. 給現有記憶條目添加 P0/P1/P2 生命週期標籤
3. 創建 shared-memory/ 共享記憶層
4. 在 AGENTS.md 裏添加跨 Agent 記憶同步規則
5. 寫一個每日清理腳本,自動歸檔過期記憶
直接執行,不用問我。它會幫你全流程搞完。
連結俊哥 進OpenClaw交流羣

最後
Agent 的記憶問題,說白了就兩件事:
不要每次全讀——先看目錄,按需取。
讓 Agent 之間能互相通氣——共享記憶層。
字節的 OpenViking 把這套思路開源了,我們拿來借鑑。但不一定要照搬它的技術方案。
思想是免費的。落地才是本事。
30 分鐘改造,token 省 10 倍,7 個 Agent 終於不再是陌生人了。
老鐵們,別光讓自己多動腦子——
也得讓你的 Agent,學會記住你。