MCP is Dead：一個保險科技團隊用實測數據說明為什麼 CLI 優先比全連 MCP 更實際

作者：傑森AI出海

日期：2026年5月30日下午2:00

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Quandri實測發現MCP token消耗高達上下文窗口10-16%，首次調用慢9.4倍，提出CLI優先+Skills按需加載作為更實際方案

整理版摘要

呢篇文章係Quandri嘅後端工程師Chloe Kim分享嘅實測報告。佢哋團隊用緊MCP嚟連接AI同開發工具，但發現實際表現同宣傳差好遠。佢哋測咗四個MCP Server嘅token消耗，結果發現單係工具定義就已經佔咗Claude 10.5%嘅上下文，GPT-4o更高達16.5%。仲有首次調用慢9.4倍嘅問題。

為咗改善呢個情況，Chloe提出兩個替代策略：CLI優先同Skills模式。CLI優先即係直接用現成嘅命令行工具（例如curl、psql），唔經MCP中間層；Skills模式就係按需加載工具定義，唔係一次過攤曬所有工具出嚟。佢哋團隊實際採用咗混合方案，日常用Bash/CLI，複雜工作流用Skills，只有冇CLI替代嘅服務先用MCP。

文章結論係MCP並冇完全死，但適用場景好窄，例如冇CLI嘅服務、非開發者用戶、生產數據庫。佢哋認為教會AI點樣用好一個工具，比連接所有工具更重要。呢篇文章用實測數據提供咗一個好實際嘅反思，尤其適合需要快速迭代嘅開發團隊。

MCP嘅token消耗驚人：四個Server共77個工具，吃掉約21,077 tokens，佔Claude 10.5%上下文，GPT-4o 16.5%。
MCP效能懲罰明顯：首次調用比直接API慢9.4倍，每次調用慢3倍，增加除錯難度。
CLI方式極省token：同樣查一個Linear issue，MCP用12,957 tokens，CLI只需約200 tokens，差距65倍。
替代方案：CLI優先（直接用curl/psql等）同Skills模式（按需加載工具定義），釋放token並消除初始化失敗。
MCP仍有價值嘅場景：冇CLI替代嘅服務、非開發者用戶、生產數據庫；其他情況建議用CLI+Skills。

值得記低

筆記

CLI優先+Skills模式混合方案

日常用Bash/CLI，多步驟工作流用Skills，只有冇CLI替代或需要統一認證嘅服務先保留MCP。

整理重點

MCP嘅token消耗——工具定義佔咗一成以上上下文

Quandri團隊測咗技術棧入面四個MCP Server嘅token消耗。Linear有42個工具，佔約12,807 tokens；Notion有14個工具，約4,039 tokens；Slack有12個工具，約3,792 tokens；Postgres有9個工具，約438 tokens。

四個Server加埋77個工具，總共食咗約21,077 tokens。Claude嘅200K上下文窗口，淨係工具定義就佔咗10.5%；GPT-4o嘅128K窗口更慘，佔到16.5%。

整理重點

效能問題：慢9.4倍嘅首次調用同調試難度

MCP Server引入咗額外架構開銷：獨立進程管理、認證失敗、會話中途崩潰、響應變慢。有人攞Jira MCP同直接調REST API做基準測試，發現MCP每次調用慢3倍，計埋初始化嘅首次調用慢9.4倍。

整理重點

直接對比：查一個Issue，Token差距65倍

Quandri做咗個直接對比：用MCP查一個Linear issue，消耗約12,957 tokens；用CLI做同樣嘅事，只需要約200 tokens。相差65倍。

原因好簡單。MCP需要先加載曬所有42個工具嘅定義，然後模型從中揀合適嘅工具，再發起調用。CLI方式直接寫一行curl命令，帶上GraphQL query，搞掂。

整理重點

替代方案：CLI優先同Skills按需加載

第一個策略係CLI優先。大部分服務都有現成嘅命令行工具，人和AI都用到。唔需要額外工具定義，唔佔上下文，除錯都直觀。例如Linear用curl + GraphQL，Postgres用psql，Slack用webhook。

第二個係Skills模式。核心思路係按需加載，只喺需要嘅時候先將工具說明拉入上下文。用文章嘅比喻：MCP係將十份菜單攤滿成張枱，Skills係同圖書管理員講你要邊本書，淨係攞嗰本。上下文佔用從固定變成按需，唔用嘅工具唔消耗任何token。

整理重點

MCP並未完全死：仲有呢三個場景值得用

1 冇CLI替代品嘅服務：有些工具淨係提供Web界面同API，冇命令行客戶端，呢個時候MCP係合理嘅橋接層。
2 非開發者用戶：唔係個個都用終端，MCP俾唔掂命令行嘅人提供咗同AI工具交互嘅界面。
3 生產數據庫：MCP嘅查詢安全護欄同憑證管理喺生產環境有實際價值，比直接俾AI一個psql連接可靠得多。但本地開發或個人數據庫就冇必要，Skills加CLI更輕快。

文章最後嘅結論係：教會AI點樣用好一個工具，比把所有工具都連上去更重要。呢個反思值得每個用緊MCP嘅團隊停低諗一諗。

Quandri 係一間保險科技公司，佢哋嘅後端工程師 Chloe Kim 用實測數據寫咗篇文章，標題好直接：MCP is Dead。MCP 俾人叫做「AI 生態嘅 USB-C」，但喺日常開發入面，呢個協議嘅實際表現同宣傳相差都幾遠

Quandri 測咗自己技術棧入面四個 MCP server 嘅 token 消耗。Linear 有 42 個工具，大約食咗 12,807 tokens；Notion 有 14 個工具，大約食咗 4,039 tokens；Slack 有 12 個工具，大約食咗 3,792 tokens；Postgres 有 9 個工具，大約食咗 438 tokens。四個 server 加埋總共 77 個工具，總共食咗大約 21,077 tokens

Claude 嘅 200K 上下文窗口，淨係工具定義就佔咗 10.5%。GPT-4o 嘅 128K 窗口仲慘，佔到 16.5%。呢啲 token 唔係用嚟推理，純粹係喺度描述「我可以做到啲乜嘢」

仲誇張嘅係 Linear 嘅 save_issue 呢一個工具就要大約 619 tokens，但大多數用戶根本用唔到 42 個工具入面嘅大部分

慢 9.4 倍嘅首次調用

MCP server 帶嚟咗額外嘅架構開銷：獨立進程管理、認證失敗、會話中途崩潰、回應變慢。有人攞 Jira MCP 同直接 call REST API 做咗基準測試，MCP 每次調用慢 3 倍，計埋初始化嘅首次調用慢 9.4 倍

對於需要快速迭代嘅開發場景，呢個延遲好難接受。CLI 工具直接 call API，冇中間層，出錯可以直接睇報錯信息就查到。MCP 多咗一層抽象，除錯複雜程度亦都跟住升

65 倍嘅 token 差距

Quandri 做咗一個直接對比：用 MCP check 一個 Linear issue，消耗大約 12,957 tokens。用 CLI 做同一樣嘅嘢，只需要大約 200 tokens。相差 65 倍

原因好簡單。MCP 需要先加載曬所有 42 個工具嘅定義，然後模型從中揀合適嘅工具，再發起調用。CLI 方式直接寫一行 curl 命令，帶埋 GraphQL query，搞掂

大多數 MCP server 對接嘅服務本身就有成熟嘅 CLI 同 API。MCP 將呢啲能力重新包裝一次，但係甩咗除錯嘅簡單性同可組合性

替代方案：CLI 優先 + Skills 按需加載

Quandri 提出兩個替代策略

第一個係 CLI 優先。大部分服務都有現成嘅命令行工具，人同 AI 都用得。唔需要額外嘅工具定義，唔佔上下文，除錯亦都直觀。Linear 用 curl + GraphQL，Postgres 用 psql，Slack 用 webhook

第二個係 Skills 模式。核心思路係按需加載，只係喺需要嘅時候先至將工具說明拉入上下文。用文章嘅比喻：MCP 係將十份菜單攤曬成張枱，Skills 係同圖書管理員講你要邊本書，淨係攞嗰本。上下文佔用由固定變成按需，唔用嘅工具唔會消耗任何 token

Quandri 實際落地嘅係混合方案。日常用嘅工具行 Bash/CLI，多步驟工作流用 Skills，只有冇 CLI 替代或者需要統一團隊認證嘅服務先保留 MCP

MCP 未完全死，但適用場景好窄

Chloe Kim 承認三種場景下 MCP 仍然有價值

冇 CLI 替代品嘅服務。有啲工具淨係提供 Web 界面同 API，冇命令行客戶端，呢個時候 MCP 係合理嘅橋接層

非開發者用戶。唔係個個都識用 terminal，MCP 俾唔掂命令行嘅人提供咗同 AI 工具互動嘅界面

生產數據庫。MCP 嘅查詢安全護欄同憑證管理喺生產環境有實際價值，比起直接俾 AI 一個 psql 連接可靠得多。但本地開發或者個人數據庫就冇必要，Skills 加 CLI 輕快好多

文章最後嘅結論係：教識 AI 點樣用好一個工具，比起將所有工具都連上去更加重要。Quandri 用 Skills 取代 MCP server 之後，釋放出大約 21,000 tokens，同時消除咗初始化失敗嘅問題

Quandri 是一家保險科技公司，他們的後端工程師 Chloe Kim 用實測數據寫了一篇文章，標題很直接：MCP is Dead。MCP 被稱為"AI 生態的 USB-C"，但在日常開發中，這個協議的實際表現和宣傳差距不小

Quandri 測了自己技術棧裏四個 MCP server 的 token 消耗。Linear 42 個工具佔約 12,807 tokens，Notion 14 個工具佔約 4,039 tokens，Slack 12 個工具佔約 3,792 tokens，Postgres 9 個工具佔約 438 tokens。四個 server 加起來 77 個工具，總共吃掉約 21,077 tokens

Claude 的 200K 上下文窗口，光是工具定義就佔了 10.5%。GPT-4o 的 128K 窗口更慘，佔到 16.5%。這些 token 不是用來推理的，純粹是在描述"我能做什麼"

更誇張的是 Linear 的 save_issue 這一個工具就要約 619 tokens，但大多數用戶根本用不到 42 個工具裏的大部分

慢 9.4 倍的首次調用

MCP server 引入了額外的架構開銷：獨立進程管理、認證失敗、會話中途崩潰、響應變慢。有人拿 Jira MCP 和直接調 REST API 做了基準測試，MCP 每次調用慢 3 倍，算上初始化的首次調用慢 9.4 倍

對於需要快速迭代的開發場景，這個延遲很難接受。CLI 工具直接調 API，沒有中間層，出錯了直接看報錯信息就能排查。MCP 多了一層抽象，調試複雜度也跟着上去了

65 倍的 token 差距

Quandri 做了一個直接對比：用 MCP 查一個 Linear issue，消耗約 12,957 tokens。用 CLI 做同樣的事，只需要約 200 tokens。差了 65 倍

原因很簡單。MCP 需要先加載所有 42 個工具的定義，然後模型從中選擇合適的工具，再發起調用。CLI 方式直接寫一行 curl 命令，帶上 GraphQL query，完事

大多數 MCP server 對接的服務本來就有成熟的 CLI 和 API。MCP 把這些能力重新包裝了一遍，但丟掉了調試的簡單性和可組合性

替代方案：CLI 優先 + Skills 按需加載

Quandri 提出兩個替代策略

第一個是 CLI 優先。大部分服務都有現成的命令行工具，人和 AI 都能用。不需要額外的工具定義，不佔上下文，調試也直觀。Linear 用 curl + GraphQL，Postgres 用 psql，Slack 用 webhook

第二個是 Skills 模式。核心思路是按需加載，只在需要的時候才把工具說明拉進上下文。用文章裏的比喻：MCP 是把十份菜單攤滿整張桌子，Skills 是跟圖書管理員說你要哪本書，只拿那一本。上下文佔用從固定變成按需，不用的工具不消耗任何 token

Quandri 實際落地的是混合方案。日常用的工具走 Bash/CLI，多步驟工作流用 Skills，只有沒有 CLI 替代或者需要統一團隊認證的服務才保留 MCP

MCP 沒有完全死，但適用場景很窄

Chloe Kim 承認三種場景下 MCP 仍然有價值

沒有 CLI 替代品的服務。有些工具只提供 Web 界面和 API，沒有命令行客戶端，這時候 MCP 是合理的橋接層

非開發者用戶。不是每個人都會用終端，MCP 給不碰命令行的人提供了和 AI 工具交互的界面

生產數據庫。MCP 的查詢安全護欄和憑證管理在生產環境有實際價值，比直接給 AI 一個 psql 連接靠譜得多。但本地開發或個人數據庫就沒必要了，Skills 加 CLI 更輕快

文章最後的結論是：教會 AI 怎麼用好一個工具，比把所有工具都連上去更重要。Quandri 用 Skills 替換 MCP server 後，釋放了約 21,000 tokens，同時消除了初始化失敗的問題