Claude Code的/usage命令,讓token消耗從玄學變工程

作者:知識藥丸
日期:2026年5月22日 上午7:20
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Claude Code 嘅 /usage 命令:token 消耗由玄學變工程

整理版摘要

呢篇文章係 Claude Code 嘅重度用戶嘅學習體會。作者見到 AnthropicBoris Cherny 喺 X 度公佈下一版 Claude Code 會有 /usage 命令,可以按 Skills、Agents、MCPs、Plugins 四個維度拆開 token 消耗。作者想藉呢個機會,梳理嚇自己對 token 消耗透明化嘅理解。

文章首先指出一個普遍困擾:用 Claude Code 嗰陣掛咗好多 MCP、Agent、Plugin,但 token 消耗得一塌糊塗,冇人知邊個組件食得最多。呢種體驗就好似電費單得個總數,冇明細,焗住你逐個拔插頭試。作者形容呢啲「隱形房客」喺 context 入麪霸佔曬資源。

跟住文章介紹 /usage 嘅功能:佢將糊塗賬拆成明細賬,按 Skills、Agents、MCPsPlugins 逐項報數。呢個命令就好似 Linux 嘅 htop,畀你可以一眼睇到邊個食資源最多,然後果斷優化。作者認為呢個工具將上下文從玄學變成了工程,價值唔只係 debug,而係生態複雜化之後嘅必需品。最後作者提出三個即刻可以養成嘅習慣:做減法唔好掛咁多工具、精煉工具描述、將上下文當有限內存管。總結嚟講,/usage 嘅最大意義係令 token 透明化,提醒用家「用得清楚比裝得多更重要」。

  • /usage 命令按 Skills、Agents、MCPsPlugins 四個維度拆解 token 消耗,令消耗透明化。
  • 好似 htop 監控系統資源,/usage 可以一眼睇到邊個組件食最多 token,然後精準優化。
  • 以前 context 消耗係黑盒,而家變成明細賬,可以逐項審視。
  • 可觀測性係複雜系統嘅必需品,生態越繁榮越需要活動監視器級別工具。
  • 實際行動:做減法唔好掛咁多工具、精煉工具描述、將 context 當有限內存管。
值得記低
連結 x.com

原推文 - Boris Cherny

Anthropic 的 Boris Cherny 宣佈下一版 Claude Code 會帶 /usage 命令

連結 docs.claude.com

Claude Code 官方文檔

Claude Code 官方使用文檔

整理重點

一份沒有明細嘅賬單

打開 Claude Code,掛幾個 MCP,配幾個 Agent,再裝倆 Plugin,爽係真係爽。但明明冇講幾句話,上下文就快滿咗,token 喺度燒,但冇人知邊個喺度燒。

一份沒有明細的賬單

token 在燒,但不知道誰在燒

空調?冰箱?還是那台老烘乾機?

呢啲「隱形房客」喺你敲第一個字之前就開始啃預算,掛得越多啃得越狠。電費單得個總數,焗住你逐個拔插頭試,呢個就係冇 /usage 嘅寫照。

整理重點

/usage 登場:將糊塗賬拆成明細賬

/usage 解決的事情很簡單:把糊塗賬拆成明細賬

/usage 按 Skills、Agents、MCPsPlugins 四個維度報賬,邊個喺度食 token 一目瞭然。呢個命令就好似 Linux 嘅 htop,一眼睇到邊個 CPU 飆到 100%,然後果斷 kill。

Claude Code 的 htop

四個維度分別係:Skills(按需上崗嘅專項技能)、Agents(能獨立跑腿嘅小弟)、MCPs(插上就食電嘅外接設備)、Plugins(打包好嘅大禮包)。

整理重點

四個 token 大户嘅脾氣

按需上崗的專項技能

能獨立跑腿的小弟

插上就吃電的外接設備

Skills 一旦上崗,描述同指令就賴喺 context 唔走;Agent 每件都要帶齊系統提示、目標、人設,呢啲全部係 token;MCP 所有工具嘅名、描述、參數都要提前塞入 context,就算未用過都要佔位;Plugin 就係以上三者嘅疊加。掛得越多,前置成本越高。

  • Skills:按需加載,但上崗後描述指令長期霸佔 context。
  • Agents:每個子代理自帶名片(系統提示、目標、人設),數量越多成本越高。
  • MCPs:工具描述必須提前塞入 context,用唔用都佔位,掛十幾個嘅同學應該深有體會。
  • Plugins:Skills、Agents、MCPs 嘅打包組合,消耗係疊加態。

認清呢四個大户,先至可以對症下藥。

整理重點

可觀測性唔係錦上添花

可觀測性不是錦上添花

Claude Code 已經從對話框加寫代碼長成一個有 Skills、Agents、MCPPlugin 嘅小型操作系統。生態越繁榮,越需要活動監視器級別嘅工具。複雜到一定程度,可觀測性就係必需品。

用 AI 工具,不是裝得越多越好,是用得越清楚越好

  1. 1 做減法:掛一堆用唔上嘅工具,純屬負優化。
  2. 2 摳工具描述:自己寫 MCP 或 Skill 時,描述要精煉,令模型睇得明但唔囉嗦。
  3. 3 將 context 當有限內存管:佢唔係無限嘅,要慳住用。

總結嚟講,/usage 技術上雖然樸素,但解決咗一個黑盒問題,將上下文帶返工程領域。期待桌面版盡快上線。

 

🌟星標 + 👆關注,第一時間知最新、最有用嘅AI編程姿勢

《賈傑嘅AI編程秘笈》付費合集,共10篇,現已完結。30蚊交個朋友,學唔到真嘢揾我退錢;)

 

 

以及我最新嘅付費合集《又100個思維碎片》墨問,把我返一日工,AI自己喺屋企寫一日代碼嘅秘訣,分享俾你


 

寫喺前面

刷推(Twitter)嗰時見到 Anthropic 嘅 Boris Cherny(@bcherny)發咗條短消息:下一版 Claude Code 會帶一個 /usage 命令,可以將今日燒咗嘅 token 按 Skills、Agents、MCPs、Plugins 拆開嚟睇,CLI 先上,桌面版緊跟。

消息好短,但係戳到我。

最近好常用 Claude Code,所以想以學習者嘅角度,將呢條更新背後嘅事情梳理一次。

P.S. 大部分內容係我自己補課補出嚟嘅理解,有偏差歡迎指正。

token 俾邊個食咗?

一份冇明細嘅帳單

我哋先諗個場景。

打開 Claude Code,掛幾個 MCP,配幾個 Agent,再裝兩個 Plugin。爽係真係爽。

但你有冇發現一個詭異的現象:明明冇講幾句說話,上下文就快滿喇?

token 喺度燒,但係唔知邊個喺度燒。

呢個就好似電費帳單得一個總數,冇明細。冷氣?雪櫃?定係嗰部舊乾衣機?你只能逐個拔插頭試。糟糕的體驗。

上下文裏面住住一班「睇唔見嘅房客」

其實你打開 Claude Code 嗰一刻,上下文裏面就已經塞滿咗人。

系統提示、MCP 工具描述、加載好嘅 Skill、待命嘅 Agent……佢哋喺你打第一個字之前,就已經開始咬你嘅預算。

掛得越多,咬得越狠。

/usage 登場

佢做咗一件樸素但重要嘅事

/usage 解決嘅嘢好簡單:將糊塗帳拆成明細帳

按四個維度報帳:邊啲 Skills 喺度佔位、邊啲 Agents 喺度駐留、邊啲 MCPs 嘅描述喺度咬 context、邊啲 Plugins 喺度搞事。

聽落唔複雜,但係咁一拆,上下文就從「玄學」變咗做「工程」。

呢個就係 Claude Code 嘅 htop

打個比喻,/usage 對 Claude Code 嚟講,就好似 htop 對 Linux 咁。

電腦窒嘅時候,冇 htop 你只能眼睜睜;有咗之後,一眼就睇到係邊個將 CPU 扯到 100%,然後果斷 kill

/usage 都係呢個套路:先觀測,再優化。優雅。

四個房客,各有各嘅脾氣

要看懂 /usage 輸出,要先認識呢四個 token 大户。

Skills:按需要上崗嘅「專項技能」

Skill 係將一段指令、一組工具打包成嘅「技能包」。

特點是按需要加載——但一旦上崗,描述同指令就賴喺 context 度唔走。

Agents:可以獨立跑腿嘅「小弟」

Agent 係可以被調度去做嘢嘅子代理。

每個小弟都要自帶名片:系統提示、目標、人設。呢啲都係 token。小弟越多,前置成本越高。

MCPs:插上就食電嘅「外接設備」

MCP(Model Context Protocol)係 Anthropic 嘅協議,等 Claude 可以連外部工具——讀數據庫、調 API、操作文件。

但呢度有個致命細節:每接一個 MCP,佢所有工具嘅名、描述、參數都要提前塞入上下文,同模型講「呢啲你可以用」。

工具用唔用係一回事,描述塞唔塞得入係另一回事。掛十幾個 MCP 嘅同學應該明。

Plugins:打包好嘅「大禮包」

Plugin 將 Skills、Agents、MCPs 打包埋一齊,方便分發。

消耗結構基本上係上面三者疊加。一個 Plugin,一整套能力,一整套 token。

點解咁一個小命令值得專登寫一篇

可觀測性唔係錦上添花

我一開始以為 /usage 就係個 debug 小工具。

但越想越覺得唔啱。

Claude Code 已經從「對話框+寫代碼」成長為一個有 Skills、Agents、MCP、Plugin 嘅小型操作系統。生態越繁榮,越需要「活動監視器」級別嘅工具。

複雜到一定程度,可觀測性就係必需品。

佢會改變我哋用 AI 嘅姿勢

講大啲,/usage 等我哋從「開盒即用」變成「精打細算」。

以前係裝得越多越爽——MCP 接十個,Plugin 裝一打。裝完發現:開兩句就善忘,怪我囉?

有了 /usage,可以優雅地做減法。某個 MCP 平時根本用唔到,但工具描述食咗 8000 token?卸載。

P.S. 呢個其實呼應咗 Anthropic 最近成日提嘅 Context Engineering(上下文工程)。未來 prompt 工程嘅重點唔再係「指令寫得靚」,而係「上下文管好」。/usage 係呢個理念落地嘅工具。

而家就可以養成嘅習慣

/usage 仲未上線,但思路可以先用住先。

第一,做減法。掛一堆自己用唔到嘅工具,純屬負優化。

第二,慳工具描述。自己寫 MCP 或 Skill,描述要精煉。令模型睇得明嘅同時,唔好囉嗦。一門相當微妙嘅手藝。

第三,將上下文當內存管。佢唔係無限㗎,要慳啲用。

總結

返轉頭睇 Boris 嗰條推文,傳達嘅信號其實得一個:token 要透明化喇

/usage 技術上甚至有啲樸素——遍歷 session,按來源統計,排序輸出。

但佢解決嘅係一個長期被忽略嘅黑盒問題,將上下文從玄學帶返去工程。

對我呢啲學習者嚟講,呢條更新最大嘅價值唔係工具本身,而係佢提醒我:用 AI 工具,唔係裝得越多越好,係用得越清楚越好

期待桌面版都快啲上線。

參考資料

原推文:[https://x.com/bcherny/status/2057476878110261587]__URL0__

MCP 協議官方文檔:Model Context Protocol

Claude Code 官方文檔:[https://docs.claude.com/en/docs/claude-code]__URL0__

           

 


 

 

 

堅持創作唔容易,求個一鍵三連,多謝你~❤️

以及「AI Coding技術交流羣」,聯絡 ayqywx 我拉你入羣,一齊交流學習~

 

 

 

 

 

🌟星標 + 👆關注,第一時間知道最新、最有用的AI編程姿勢

《賈傑的AI編程秘籍》付費合集,共10篇,現已完結。30元交個朋友,學不到真東西找我退錢;)

 

 

以及我最新的付費合集《又100個思維碎片》墨問,把我上一天班,AI自己在家寫一天代碼的焚訣,分享給你


 

寫在前面

刷推時看到 Anthropic 的 Boris Cherny(@bcherny)發了條短消息:下一版 Claude Code 會帶一個 /usage 命令,能把今天燒掉的 token 按 Skills、Agents、MCPs、Plugins 拆開看,CLI 先上,桌面端緊跟。

消息很短,但戳到我了。

最近在重度用 Claude Code,所以想以學習者的視角,把這條更新背後的事情捋一遍。

P.S. 大部分內容是我自己補課補出來的理解,有偏差歡迎指正。

token 都被誰吃了?

一份沒有明細的賬單

我們先想個場景。

打開 Claude Code,掛幾個 MCP,配幾個 Agent,再裝倆 Plugin。爽是真的爽。

但你有沒有發現一個詭異的現象:明明沒說幾句話,上下文就快滿了?

token 在燒,但不知道誰在燒。

這就像電費賬單隻有一個總數,沒有明細。空調?冰箱?還是那台老烘乾機?你只能挨個拔插頭試。糟糕的體驗。

上下文裏住着一羣"看不見的房客"

其實你打開 Claude Code 那一刻,上下文裏就已經擠滿了人。

系統提示、MCP 工具描述、加載好的 Skill、待命的 Agent……它們在你敲第一個字之前,就開始啃你的預算了。

掛得越多,啃得越狠。

/usage 登場

它幹了一件樸素但重要的事

/usage 解決的事情很簡單:把糊塗賬拆成明細賬

按四個維度報賬:哪些 Skills 在佔位、哪些 Agents 在駐留、哪些 MCPs 的描述在啃 context、哪些 Plugins 在搞事情。

聽起來不復雜,但這一拆,上下文就從“玄學”變成了“工程”。

這就是 Claude Code 的 htop

打個比方,/usage 之於 Claude Code,就像 htop 之於 Linux。

電腦卡的時候,沒 htop 你只能乾瞪眼;有了之後,一眼就能看到是誰把 CPU 飆到 100%,然後果斷 kill

/usage 也是這個套路:先觀測,再優化。優雅。

四個房客,各有各的脾氣

要看懂 /usage 輸出,得先認識這四個 token 大户。

Skills:按需上崗的"專項技能"

Skill 是把一段指令、一組工具打包成的“技能包”。

特點是按需加載——但一旦上崗,描述和指令就賴在 context 裏不走了。

Agents:能獨立跑腿的"小弟"

Agent 是可以被調度去幹活的子代理。

每個小弟都得自帶名片:系統提示、目標、人設。這些都是 token。小弟越多,前置成本越高。

MCPs:插上就吃電的"外接設備"

MCP(Model Context Protocol)是 Anthropic 的協議,讓 Claude 能連外部工具——讀數據庫、調 API、操作文件。

但這裏有個致命細節:每接一個 MCP,它所有工具的名字、描述、參數都得提前塞進上下文,告訴模型“這些你能用”。

工具用沒用是一回事,描述塞沒塞進去是另一回事。掛十幾個 MCP 的同學應該懂。

Plugins:打包好的"大禮包"

Plugin 把 Skills、Agents、MCPs 打包在一起,方便分發。

消耗結構基本是上面三者疊加。一個 Plugin,一整套能力,一整套 token。

為什麼這麼個小命令值得專門寫一篇

可觀測性不是錦上添花

我一開始以為 /usage 就是個 debug 小工具。

但越想越覺得不對。

Claude Code 已經從“對話框+寫代碼”長成了一個有 Skills、Agents、MCP、Plugin 的小型操作系統。生態越繁榮,越需要“活動監視器”級別的工具。

複雜到一定程度,可觀測性就是必需品。

它會改變我們用 AI 的姿勢

往大了說,/usage 讓我們從“開盒即用”變成“精打細算”。

以前是裝得越多越爽——MCP 接十個,Plugin 裝一打。裝完發現:開兩句就健忘,怪我咯?

有了 /usage,可以優雅地做減法。某個 MCP 平時根本用不到,但工具描述吃了 8000 token?卸。

P.S. 這其實呼應了 Anthropic 最近反覆在提的 Context Engineering(上下文工程)。未來 prompt 工程的重點不再是“指令寫漂亮”,而是“上下文管好”。/usage 是這個理念落地的工具。

現在就能養成的習慣

/usage 還沒上線,但思路可以先用起來。

第一,做減法。掛一堆自己用不上的工具,純屬負優化。

第二,摳工具描述。自己寫 MCP 或 Skill,描述要精煉。讓模型看懂的同時,別囉嗦。一門相當微妙的手藝。

第三,把上下文當內存管。它不是無限的,要省着用。

總結

回過頭看 Boris 那條推文,傳的信號其實就一個:token 要透明化了

/usage 技術上甚至有點樸素——遍歷 session,按來源統計,排序輸出。

但它解決的是一個被長期忽略的黑盒問題,把上下文從玄學帶回了工程。

對我這種學習者來說,這條更新最大的價值不是工具本身,而是它在提醒我:用 AI 工具,不是裝得越多越好,是用得越清楚越好

期待桌面端也儘快上線。

參考資料

原推文:[https://x.com/bcherny/status/2057476878110261587]__URL0__

MCP 協議官方文檔:Model Context Protocol

Claude Code 官方文檔:[https://docs.claude.com/en/docs/claude-code]__URL0__

           

 


 

 

 

堅持創作不易,求個一鍵三連,謝謝你~❤️

以及「AI Coding技術交流羣」,聯繫 ayqywx 我拉你進羣,共同交流學習~