MCP is Dead:一個保險科技團隊用實測數據說明為什麼 CLI 優先比全連 MCP 更實際

作者:傑森AI出海
日期:2026年5月30日 下午2:00
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Quandri實測發現MCP token消耗高達上下文窗口10-16%,首次調用慢9.4倍,提出CLI優先+Skills按需加載作為更實際方案

整理版摘要

呢篇文章係Quandri嘅後端工程師Chloe Kim分享嘅實測報告。佢哋團隊用緊MCP嚟連接AI同開發工具,但發現實際表現同宣傳差好遠。佢哋測咗四個MCP Server嘅token消耗,結果發現單係工具定義就已經佔咗Claude 10.5%嘅上下文,GPT-4o更高達16.5%。仲有首次調用慢9.4倍嘅問題。

為咗改善呢個情況,Chloe提出兩個替代策略:CLI優先同Skills模式。CLI優先即係直接用現成嘅命令行工具(例如curl、psql),唔經MCP中間層;Skills模式就係按需加載工具定義,唔係一次過攤曬所有工具出嚟。佢哋團隊實際採用咗混合方案,日常用Bash/CLI,複雜工作流用Skills,只有冇CLI替代嘅服務先用MCP。

文章結論係MCP並冇完全死,但適用場景好窄,例如冇CLI嘅服務、非開發者用戶、生產數據庫。佢哋認為教會AI點樣用好一個工具,比連接所有工具更重要。呢篇文章用實測數據提供咗一個好實際嘅反思,尤其適合需要快速迭代嘅開發團隊。

  • MCP嘅token消耗驚人:四個Server共77個工具,吃掉約21,077 tokens,佔Claude 10.5%上下文,GPT-4o 16.5%。
  • MCP效能懲罰明顯:首次調用比直接API慢9.4倍,每次調用慢3倍,增加除錯難度。
  • CLI方式極省token:同樣查一個Linear issue,MCP用12,957 tokens,CLI只需約200 tokens,差距65倍。
  • 替代方案CLI優先(直接用curl/psql等)同Skills模式(按需加載工具定義),釋放token並消除初始化失敗。
  • MCP仍有價值嘅場景:冇CLI替代嘅服務、非開發者用戶、生產數據庫;其他情況建議用CLI+Skills
值得記低
筆記

CLI優先+Skills模式混合方案

日常用Bash/CLI,多步驟工作流用Skills,只有冇CLI替代或需要統一認證嘅服務先保留MCP。

整理重點

MCP嘅token消耗——工具定義佔咗一成以上上下文

Quandri團隊測咗技術棧入面四個MCP Server嘅token消耗。Linear有42個工具,佔約12,807 tokens;Notion有14個工具,約4,039 tokens;Slack有12個工具,約3,792 tokens;Postgres有9個工具,約438 tokens。

四個Server加埋77個工具,總共食咗約21,077 tokens。Claude嘅200K上下文窗口,淨係工具定義就佔咗10.5%;GPT-4o嘅128K窗口更慘,佔到16.5%。

整理重點

效能問題:慢9.4倍嘅首次調用同調試難度

MCP Server引入咗額外架構開銷:獨立進程管理、認證失敗、會話中途崩潰、響應變慢。有人攞Jira MCP同直接調REST API做基準測試,發現MCP每次調用慢3倍,計埋初始化嘅首次調用慢9.4倍。

整理重點

直接對比:查一個Issue,Token差距65倍

Quandri做咗個直接對比:用MCP查一個Linear issue,消耗約12,957 tokens;用CLI做同樣嘅事,只需要約200 tokens。相差65倍。

原因好簡單。MCP需要先加載曬所有42個工具嘅定義,然後模型從中揀合適嘅工具,再發起調用。CLI方式直接寫一行curl命令,帶上GraphQL query,搞掂。

整理重點

替代方案:CLI優先同Skills按需加載

第一個策略係CLI優先。大部分服務都有現成嘅命令行工具,人和AI都用到。唔需要額外工具定義,唔佔上下文,除錯都直觀。例如Linear用curl + GraphQLPostgres用psql,Slack用webhook。

第二個係Skills模式。核心思路係按需加載,只喺需要嘅時候先將工具說明拉入上下文。用文章嘅比喻:MCP係將十份菜單攤滿成張枱,Skills係同圖書管理員講你要邊本書,淨係攞嗰本。上下文佔用從固定變成按需,唔用嘅工具唔消耗任何token。

整理重點

MCP並未完全死:仲有呢三個場景值得用

  1. 1 冇CLI替代品嘅服務:有些工具淨係提供Web界面同API,冇命令行客戶端,呢個時候MCP係合理嘅橋接層。
  2. 2 非開發者用戶:唔係個個都用終端,MCP俾唔掂命令行嘅人提供咗同AI工具交互嘅界面。
  3. 3 生產數據庫MCP嘅查詢安全護欄同憑證管理喺生產環境有實際價值,比直接俾AI一個psql連接可靠得多。但本地開發或個人數據庫就冇必要,Skills加CLI更輕快。

文章最後嘅結論係:教會AI點樣用好一個工具,比把所有工具都連上去更重要。呢個反思值得每個用緊MCP嘅團隊停低諗一諗。

Quandri 係一間保險科技公司,佢哋嘅後端工程師 Chloe Kim 用實測數據寫咗篇文章,標題好直接:MCP is Dead。MCP 俾人叫做「AI 生態嘅 USB-C」,但喺日常開發入面,呢個協議嘅實際表現同宣傳相差都幾遠


Quandri 測咗自己技術棧入面四個 MCP server 嘅 token 消耗。Linear 有 42 個工具,大約食咗 12,807 tokens;Notion 有 14 個工具,大約食咗 4,039 tokens;Slack 有 12 個工具,大約食咗 3,792 tokens;Postgres 有 9 個工具,大約食咗 438 tokens。四個 server 加埋總共 77 個工具,總共食咗大約 21,077 tokens

Claude 嘅 200K 上下文窗口,淨係工具定義就佔咗 10.5%。GPT-4o 嘅 128K 窗口仲慘,佔到 16.5%。呢啲 token 唔係用嚟推理,純粹係喺度描述「我可以做到啲乜嘢」

仲誇張嘅係 Linear 嘅 save_issue 呢一個工具就要大約 619 tokens,但大多數用戶根本用唔到 42 個工具入面嘅大部分

圖片

慢 9.4 倍嘅首次調用

MCP server 帶嚟咗額外嘅架構開銷:獨立進程管理、認證失敗、會話中途崩潰、回應變慢。有人攞 Jira MCP 同直接 call REST API 做咗基準測試,MCP 每次調用慢 3 倍,計埋初始化嘅首次調用慢 9.4 倍

對於需要快速迭代嘅開發場景,呢個延遲好難接受。CLI 工具直接 call API,冇中間層,出錯可以直接睇報錯信息就查到。MCP 多咗一層抽象,除錯複雜程度亦都跟住升

圖片

65 倍嘅 token 差距

Quandri 做咗一個直接對比:用 MCP check 一個 Linear issue,消耗大約 12,957 tokens。用 CLI 做同一樣嘅嘢,只需要大約 200 tokens。相差 65 倍

原因好簡單。MCP 需要先加載曬所有 42 個工具嘅定義,然後模型從中揀合適嘅工具,再發起調用。CLI 方式直接寫一行 curl 命令,帶埋 GraphQL query,搞掂

大多數 MCP server 對接嘅服務本身就有成熟嘅 CLI 同 API。MCP 將呢啲能力重新包裝一次,但係甩咗除錯嘅簡單性同可組合性

圖片

替代方案:CLI 優先 + Skills 按需加載

Quandri 提出兩個替代策略

第一個係 CLI 優先。大部分服務都有現成嘅命令行工具,人同 AI 都用得。唔需要額外嘅工具定義,唔佔上下文,除錯亦都直觀。Linear 用 curl + GraphQL,Postgres 用 psql,Slack 用 webhook

第二個係 Skills 模式。核心思路係按需加載,只係喺需要嘅時候先至將工具說明拉入上下文。用文章嘅比喻:MCP 係將十份菜單攤曬成張枱,Skills 係同圖書管理員講你要邊本書,淨係攞嗰本。上下文佔用由固定變成按需,唔用嘅工具唔會消耗任何 token

Quandri 實際落地嘅係混合方案。日常用嘅工具行 Bash/CLI,多步驟工作流用 Skills,只有冇 CLI 替代或者需要統一團隊認證嘅服務先保留 MCP

圖片

MCP 未完全死,但適用場景好窄

Chloe Kim 承認三種場景下 MCP 仍然有價值

冇 CLI 替代品嘅服務。有啲工具淨係提供 Web 界面同 API,冇命令行客戶端,呢個時候 MCP 係合理嘅橋接層

非開發者用戶。唔係個個都識用 terminal,MCP 俾唔掂命令行嘅人提供咗同 AI 工具互動嘅界面

生產數據庫。MCP 嘅查詢安全護欄同憑證管理喺生產環境有實際價值,比起直接俾 AI 一個 psql 連接可靠得多。但本地開發或者個人數據庫就冇必要,Skills 加 CLI 輕快好多

文章最後嘅結論係:教識 AI 點樣用好一個工具,比起將所有工具都連上去更加重要。Quandri 用 Skills 取代 MCP server 之後,釋放出大約 21,000 tokens,同時消除咗初始化失敗嘅問題

圖片

Quandri 是一家保險科技公司,他們的後端工程師 Chloe Kim 用實測數據寫了一篇文章,標題很直接:MCP is Dead。MCP 被稱為"AI 生態的 USB-C",但在日常開發中,這個協議的實際表現和宣傳差距不小


Quandri 測了自己技術棧裏四個 MCP server 的 token 消耗。Linear 42 個工具佔約 12,807 tokens,Notion 14 個工具佔約 4,039 tokens,Slack 12 個工具佔約 3,792 tokens,Postgres 9 個工具佔約 438 tokens。四個 server 加起來 77 個工具,總共吃掉約 21,077 tokens

Claude 的 200K 上下文窗口,光是工具定義就佔了 10.5%。GPT-4o 的 128K 窗口更慘,佔到 16.5%。這些 token 不是用來推理的,純粹是在描述"我能做什麼"

更誇張的是 Linear 的 save_issue 這一個工具就要約 619 tokens,但大多數用戶根本用不到 42 個工具裏的大部分

圖片

慢 9.4 倍的首次調用

MCP server 引入了額外的架構開銷:獨立進程管理、認證失敗、會話中途崩潰、響應變慢。有人拿 Jira MCP 和直接調 REST API 做了基準測試,MCP 每次調用慢 3 倍,算上初始化的首次調用慢 9.4 倍

對於需要快速迭代的開發場景,這個延遲很難接受。CLI 工具直接調 API,沒有中間層,出錯了直接看報錯信息就能排查。MCP 多了一層抽象,調試複雜度也跟着上去了

圖片

65 倍的 token 差距

Quandri 做了一個直接對比:用 MCP 查一個 Linear issue,消耗約 12,957 tokens。用 CLI 做同樣的事,只需要約 200 tokens。差了 65 倍

原因很簡單。MCP 需要先加載所有 42 個工具的定義,然後模型從中選擇合適的工具,再發起調用。CLI 方式直接寫一行 curl 命令,帶上 GraphQL query,完事

大多數 MCP server 對接的服務本來就有成熟的 CLI 和 API。MCP 把這些能力重新包裝了一遍,但丟掉了調試的簡單性和可組合性

圖片

替代方案:CLI 優先 + Skills 按需加載

Quandri 提出兩個替代策略

第一個是 CLI 優先。大部分服務都有現成的命令行工具,人和 AI 都能用。不需要額外的工具定義,不佔上下文,調試也直觀。Linear 用 curl + GraphQL,Postgres 用 psql,Slack 用 webhook

第二個是 Skills 模式。核心思路是按需加載,只在需要的時候才把工具說明拉進上下文。用文章裏的比喻:MCP 是把十份菜單攤滿整張桌子,Skills 是跟圖書管理員說你要哪本書,只拿那一本。上下文佔用從固定變成按需,不用的工具不消耗任何 token

Quandri 實際落地的是混合方案。日常用的工具走 Bash/CLI,多步驟工作流用 Skills,只有沒有 CLI 替代或者需要統一團隊認證的服務才保留 MCP

圖片

MCP 沒有完全死,但適用場景很窄

Chloe Kim 承認三種場景下 MCP 仍然有價值

沒有 CLI 替代品的服務。有些工具只提供 Web 界面和 API,沒有命令行客戶端,這時候 MCP 是合理的橋接層

非開發者用戶。不是每個人都會用終端,MCP 給不碰命令行的人提供了和 AI 工具交互的界面

生產數據庫。MCP 的查詢安全護欄和憑證管理在生產環境有實際價值,比直接給 AI 一個 psql 連接靠譜得多。但本地開發或個人數據庫就沒必要了,Skills 加 CLI 更輕快

文章最後的結論是:教會 AI 怎麼用好一個工具,比把所有工具都連上去更重要。Quandri 用 Skills 替換 MCP server 後,釋放了約 21,000 tokens,同時消除了初始化失敗的問題

圖片