我的 OpenClaw 一天燒掉 1140 萬 tokens，問題出在一個我沒當回事的設置

作者：ai-kim

日期：2026年5月6日上午1:01

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

自動化系統的幻覺：日記假自動化與心跳token黑洞

整理版摘要

呢篇文章係作者分享自己用 OpenClaw 嘅真實經驗。佢本身想知今日日記有冇寫，點知一查就發現兩個大問題。第一，日記機製表面自動化，但 agent 根本冇真係覆盤，只係心跳嗰陣補一句「系統正常」。第二，心跳巡檢每30分鐘跑一次，每次帶曬成個工作區上下文，7日燒咗3430萬 tokens，成本65.6美元，但九成以上都係無效回覆。

作者發現呢兩個問題之後，即刻做咗止血動作。日記方面，佢寫咗個新腳本 generate-diary-context.py，負責收集證據（session、logs、reports、handoff、git commits），再俾 agent 根據證據寫日記。心跳方面，佢將頻率由30分鐘改做4小時，仲用 lightContext 同 isolatedSession，令每次成本由約100K tokens 降到2-5K tokens。佢仲加咗 token 審計腳本 token-usage-audit.py，每日檢查有冇超支。

整體結論係：自動化系統最危險嘅唔係完全壞，而係「喺度行但冇用」。作者提出三條土規則：有日誌唔等於有覆盤，有心跳唔等於系統健康，所有後台任務都要算賬。AI 員工需要制度、日報、預算、驗收標準，否則再聰明都會變成成本中心。

日記機制看似自動，但 agent 只根據心跳補一句「正常」，完全冇真正覆盤。
心跳巡檢每次帶大量上下文，7日燒咗3430萬 tokens，成本65.6美元，92%係無效。
修復方法：日記改用證據收集腳本 generate-diary-context.py，心跳改低頻+輕上下文+隔離 session。
教訓：自動化跑唔等於有用，必須有產出驗證、成本監控、可追溯。
行動點：所有後台任務都要算賬，AI員工需要制度、日報、預算、驗收標準。

值得記低

工具

generate-diary-context.py

收集 OpenClaw session、cron logs、reports、team handoff、git commits，生成證據文件 logs/diary-context-YYYY-MM-DD.md，讓 agent 根據證據寫日記。

工具

token-usage-audit.py

每天23:30自動跑，如果一天超過200萬 tokens，就發 Telegram 告警。

流程

心跳優化配置

{"every": "4h", "lightContext": true, "isolatedSession": true, "timeoutSeconds": 45}

整理重點

一個問題，挖出兩個坑

今晚我隨口問咗句：「今日日記有記錄嗎？」點知一路查落去，翻出兩個坑。一個坑好細：昨日日記基本等於冇寫。另一個坑有啲離譜：最近7日，OpenClaw食咗大約3430萬 tokens，估算成本65.6美元。更心痛嘅係，真正嘅業務任務冇花幾多，主要係心跳巡檢燒掉嘅。

我隱約覺得唔對路。昨日系統明明跑咗好多嘢：自動選題、AI Builders Digest、Grok 日報、Agent 團隊日報、飛書 token 續期、自動更新提交。點解最後日記只剩一句「巡檢正常」？於是我叫佢繼續查：昨日到底有冇攞到所有 session 對話？有冇睇 logs？有冇睇 reports？查完結論好明確：昨日唔係完整覆盤寫出嚟嘅。佢只係心跳嘅時候讀咗 HEARTBEAT.md，發現日記唔存在，然後直接補咗一句。

整理重點

第一個坑：日記假自動化

我本來以為，日記 cron 每日跑，就等於每日有覆盤。後尾發現唔係。原來嘅 daily-diary-cron.sh 邏輯大概係：如果今日日記唔存在，就叫主 agent 回顧今日嘅 session，然後寫日記。聽講冇問題，但真實跑起嚟有兩個問題。

1 Agent 唔一定會真係去查 logs、reports、sessions；
2 心跳補日記嘅時候更偷懶，可能只根據當前上下文寫一行。

所以我今日改咗一下。新增咗一個腳本 scripts/generate-diary-context.py，佢唔負責寫日記，只負責收集證據：OpenClaw session 記錄、cron logs、reports 文件、team handoff、git commits。然後生成一個證據文件 logs/diary-context-YYYY-MM-DD.md，最後再叫 agent 基於呢個證據寫日記。呢一步好關鍵：以前係「你回憶下今日發生咗咩」，而家係「呢啲係今日嘅證據，請根據證據寫日記」。差別好大。一個似憑感覺寫總結，一個似揸住會議紀要寫覆盤。

我順手補返5月4日嘅日記。補完之後，昨日真正該記錄嘅事至少有：AI Builders Digest 自動生成、熱點選題、日報生成、X/Web 搜索429、Grok 日報基本為None、Agent 團隊日報顯示多數員工無產出、飛書token多次續期成功、自動更新提交咗 reports 同 handoff。呢啲唔係流水賬，而係AI員工嘅工作記錄。

整理重點

第二個坑：心跳 token 黑洞

日記問題修完之後，我又睇咗一眼 token。冇諗到更心痛。我叫佢統計最近7日各個環節嘅 token 消耗。結果大致係咁：最誇張係心跳。最近7日，心跳巡檢跑咗424次，平均每次大約7.4萬 tokens。佢好多時只係回一句 HEARTBEAT_OK，但每次回覆之前都要帶上一大坨上下文。呢個真係離曬譜。

睇落好似好輕嘅動作，實際成本好重。好似你叫員工每半個鐘匯報一次「我冇事」，但每次匯報前佢都要重新讀一次公司所有文檔、會議記錄、歷史任務。

我今日做咗兩個止血動作。第一個，將心跳由高頻改成低頻。原本大約每30分鐘跑一次，而家改成每4小時。第二個，令心跳用輕上下文同隔離 session。配置大概係：{"lightContext": true, "isolatedSession": true, "timeoutSeconds": 45}。lightContext 嘅意思係心跳唔好加載完整工作區上下文，只保留必要嘅 HEARTBEAT.md。isolatedSession 嘅意思係每次心跳唔好用越嚟越長嘅主 session，而係用一個乾淨嘅細 session 嚟跑。

我仲加咗一個 token 審計腳本 scripts/token-usage-audit.py，每日23:30自動跑。如果一日超過200萬 tokens，就發 Telegram 告警。今日試跑咗一次，結果好難睇：今日總 tokens 約1140萬，估算成本約31.43美元，心跳佔比約99%。不過呢個數字主要係優化前產生嘅。真正要睇嘅係聽日。

整理重點

真正嘅教訓：自動化系統嘅三條土規則

表面上睇，今日係喺度修兩個腳本。一個日記腳本，一個 token 審計腳本。但我覺得真正嘅問題唔係腳本，而係自動化系統好容易產生一種幻覺：「佢喺度行，所以佢有用。」唔一定。今日呢兩個問題都屬於呢種。日記系統喺度行，但寫出嚟嘅係廢日記。心跳系統喺度行，但燒掉嘅係無效 token。

自動化最危險嘅地方，唔係佢完全壞咗。完全壞咗反而容易發現。最危險係佢睇落正常：cron 有執行，log 有輸出，Telegram 有消息，文件有更新，git 有提交。但最後產出對業務冇幫助。呢種先至最容易温水煮青蛙。

1 有日誌，唔等於有覆盤。覆盤至少要答：今日完成咗咩？邊個環節失敗咗？聽日要改咩？如果日記只寫「系統正常」，就係冇覆盤。
2 有心跳，唔等於系統健康。心跳只能夠證明 agent 被喚醒過，唔能夠證明自動選題有冇價值、文章有冇寫出嚟、token 有冇超支、員工 agent 有冇產出。所以心跳必須輕量。
3 所有後台任務都要算賬。以前我更關心任務有冇跑，而家我會多睇一個問題：呢個任務每日花幾多錢？尤其是後台任務，用戶睇唔到，收入亦唔直接來自佢。如果佢每日靜靜雞燒幾十美元，就算功能係啱嘅，商業上亦未必啱。

今日 Agent 團隊日報都有一個信號：多數員工無產出，只有增長/GTM 生成了選題。呢個提醒我，AI 員工唔可以淨係睇有冇在線，要睇有冇交付。一個真實員工如果每日日報寫「我在」，老細一定唔滿意。AI 員工需要制度、日報、預算、驗收標準，冇呢啲嘢，再聰明都會變成成本中心。

今天晚上，我本來只是隨口問了一句：

「今天日記有記錄嗎？」

結果一路查下去，翻出兩個坑。

一個坑很小：昨天的日記基本等於沒寫。

另一個坑有點離譜：最近 7 天，OpenClaw 吃掉了大約 3430 萬 tokens，估算成本 65.6 美元。

更扎心的是，真正的業務任務沒花多少,主要是心跳巡檢燒掉的。

不是因為 65 美元多誇張，而是因為這 65 美元大部分沒有換來真正的產出。說白了，我花錢買了一堆「我還活着」的回覆。

事情是怎麼暴露的

就這。

但我隱約覺得不對。

昨天系統明明跑了很多東西：自動選題、AI Builders Digest、Grok 日報、Agent 團隊日報、飛書 token 續期、自動更新提交。

怎麼最後日記只剩一句「巡檢正常」？

於是我讓它繼續查：昨天到底有沒有拿到所有 session 對話？有沒有看 logs？有沒有看 reports？

查完結論很明確：

昨天不是完整覆盤寫出來的。

它只是心跳的時候讀了 `HEARTBEAT.md`，發現日記不存在，然後直接補了一句。

這就像員工下班前寫日報：

「今天上班了，公司還在。」

不能說錯，但基本沒用…………哈哈哈

第一個坑：日記機制看起來自動化，其實只是提醒

我之前以為，日記 cron 每天跑，就等於每天有覆盤。

後來發現不是。

原來的 `daily-diary-cron.sh` 邏輯大概是：

如果今天日記不存在，就讓主 agent 回顧今天的 session，然後寫日記。

聽起來沒問題。

但真實跑起來有兩個坑。

第一，agent 不一定真的去查 logs、reports、sessions。

第二，心跳補日記的時候更偷懶，可能只根據當前上下文寫一行。

所以今天我改了一下。

新增了一個腳本：

scripts/generate-diary-context.py

它不負責寫日記，只負責收集證據：

1. OpenClaw session 記錄

2. cron logs

3. reports 文件

4. team handoff

5. git commits

然後生成一個證據文件：

logs/diary-context-YYYY-MM-DD.md

最後再讓 agent 基於這個證據寫日記。

這一步很關鍵。

以前是：你回憶一下今天發生了什麼。

現在是：這是今天的證據，請根據證據寫日記。

差別很大。

一個像憑感覺寫總結，一個像拿着會議紀要寫覆盤。

後來我順手把 5 月 4 日的日記補了一版。

補完以後，昨天真正該記錄的事情至少有這些：

AI Builders Digest 自動生成
熱點選題日報生成
X/Web 搜索 429
Grok 日報基本為 None
Agent 團隊日報顯示多數員工無產出
飛書 token 多次續期成功
自動更新提交了 reports 和 handoff

這不是流水賬的日記，而是 AI 員工的工作記錄。

第二個坑：心跳巡檢燒掉了 92% 的 token

日記問題修完以後，我又看了一眼 token。

沒想到更扎心。

我讓它統計最近 7 天各個環節的 token 消耗。

結果大概是這樣：

最誇張的是心跳。

最近 7 天，心跳巡檢跑了 424 次，平均每次大概 7.4 萬 tokens。

它很多時候只是回一句：

HEARTBEAT_OK

但每次回覆之前，都要帶上一大坨上下文。

這就很坑爹。

看起來是一個很輕的動作，實際成本很重。

像你讓員工每半小時彙報一次：

「我沒事」但每次彙報前，他都要重新讀一遍公司所有文檔、會議記錄、歷史任務，真就離譜。

我怎麼修的

今天我做了兩個止血動作。

第一個，把心跳從高頻改成低頻。

原來差不多每 30 分鐘跑一次。

現在改成：

{
  "every": "4h"
}

第二個，讓心跳用輕上下文和隔離 session。

配置大概是：

{
  "lightContext": true,
  "isolatedSession": true,
  "timeoutSeconds": 45
}

`lightContext` 的意思是，心跳不要加載完整工作區上下文，只保留必要的 `HEARTBEAT.md`。

`isolatedSession` 的意思是，每次心跳不要沿用越來越長的主 session，而是用一個乾淨的小 session 跑。

OpenClaw 文檔裏也寫得很直接：隔離心跳可以把單次成本從約 100K tokens 降到 2-5K tokens。

如果這個預期成立，心跳成本會直接從黑洞變成正常後台任務。

我還加了一個 token 審計腳本：

scripts/token-usage-audit.py

每天 23:30 自動跑。

如果一天超過 200 萬 tokens，就發 Telegram 告警。

今天試跑了一次，結果很難看：

今日總 tokens：約 1140 萬
估算成本：約 31.43 美元
心跳佔比：99% 左右

不過這個數字主要是優化前產生的。

真正要看的是明天。

如果明天還這樣，那說明我修錯地方了。

如果明天下來，說明這次判斷是對的。

這裏面真正的教訓

表面上看，今天是在修兩個腳本。

一個日記腳本，一個 token 審計腳本。

但我覺得真正的問題不是腳本，而是自動化系統很容易產生一種幻覺：

「它在跑，所以它有用。」

不一定。

今天這兩個問題都屬於這種。

日記系統在跑，但寫出來的是廢日記。

心跳系統在跑，但燒掉的是無效 token。

自動化最危險的地方，不是它完全壞了。

完全壞了反而好發現。

最危險的是它看起來正常：

cron 有執行
log 有輸出
Telegram 有消息
文件有更新
git 有提交

但最後產出的東西對業務沒幫助。

這種才最容易温水煮青蛙。

📍今天之後，我給自己立了三條土規則。

第一，有日誌，不等於有覆盤。

覆盤至少要回答：今天完成了什麼，哪個環節失敗了，明天要改什麼。

如果日記只寫「系統正常」，那就是沒覆盤。

第二，有心跳，不等於系統健康。

心跳只能說明 agent 被喚醒過。

它不能說明自動選題有沒有價值，文章有沒有寫出來，token 有沒有超支，員工 agent 有沒有產出。

所以心跳必須輕量。

第三，所有後台任務都要算賬。

以前我更關心任務有沒有跑。

現在我會多看一個問題：

這個任務每天花多少錢？

尤其是這種後台任務。

用戶看不到，收入也不直接來自它。

如果它每天默默燒幾十美元，就算功能是對的，商業上也不一定對。

AI 員工不能只會“在崗”

今天 Agent 團隊日報也有個信號：多數員工無產出，只有增長/GTM 生成了選題。

這就提醒我，AI 員工不能只看有沒有在線。

要看有沒有交付。

一個真實員工如果每天日報寫「我在」，老闆肯定不滿意。

我自己的 OpenClaw 系統，怎麼從一個小問題查出兩個坑。

一個是日記假自動化。

一個是心跳 token 黑洞。

它不一定是最性感的熱點，但它是真的。

而且對正在搭 AI Agent 工作流的人來說，可能更有用。

因為大家遲早都會遇到類似問題：

自動化跑了，但產出質量很差
Agent 很勤奮，但成本爆了
日誌很多，但沒有人真正覆盤
工具越來越多，但系統越來越亂

說白了，AI Agent 不是裝上就完事，它更像一個員工，員工需要制度、日報、預算、驗收標準，沒有這些東西，再聰明也會變成成本中心。

不要迷信“自動運行”。

自動運行只是開始。

真正重要的是：

自動化有沒有產出？
產出有沒有被記錄？
成本有沒有被監控？
出問題能不能追溯？

這四個問題答不上來，系統跑得越久，坑可能越大。

👉 關注 ai-kimi，記錄真實的AI學習和創業探索

📚 精選推薦：

一個問題，挖出兩個坑

第一個坑：日記假自動化

第二個坑：心跳 token 黑洞

真正嘅教訓：自動化系統嘅三條土規則

不是因為 65 美元多誇張，而是因為這 65 美元大部分沒有換來真正的產出。說白了，我花錢買了一堆「我還活着」的回覆。

事情是怎麼暴露的

「今天上班了，公司還在。」

第一個坑：日記機制看起來自動化，其實只是提醒

1. OpenClaw session 記錄

2. cron logs

3. reports 文件

4. team handoff

5. git commits

這不是流水賬的日記，而是 AI 員工的工作記錄。

第二個坑：心跳巡檢燒掉了 92% 的 token

「我沒事」 但每次彙報前，他都要重新讀一遍公司所有文檔、會議記錄、歷史任務，真就離譜。

我怎麼修的

這裏面真正的教訓

第一，有日誌，不等於有覆盤。

第二，有心跳，不等於系統健康。

第三，所有後台任務都要算賬。

AI 員工不能只會“在崗”

一個是日記假自動化。

一個是心跳 token 黑洞。

「我沒事」但每次彙報前，他都要重新讀一遍公司所有文檔、會議記錄、歷史任務，真就離譜。