生產級 AI Agent 構建指南:MCP、CLI 與 Skills 的正確使用姿勢

作者:DeepNoMind
日期:2026年5月24日 上午10:59
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

生產級AI Agent要同時用Skills、MCPCLI,唔係二選一

整理版摘要

呢篇文章由Anthropic技術專家David Soria Parra嘅經驗出發,講緊點樣由Demo過渡到實際企業應用。佢指出MCP月下載量已達1.1億次,但唔係所有連接問題都可以靠單一方案解決。作者嘅核心觀點係:頂級Agent唔會只揀一種工具,而係同時用Skills、MCP同CLI,形成一個連接性協議棧。

文章詳細解釋咗三層嘅定位:Skills係以Markdown文件形式提供領域知識,跨客戶端可移植;CLI係類Unix嘅高效執行方式,Token消耗極低;MCP係集成協議層,提供豐富語義同企業級功能如OAuth同審計。作者強調,要根據情境選擇,唔好盲目追捧任何一個。

最後,作者提出咗幾個關鍵優化方向:漸進式發現(延遲加載工具)可以減少Token消耗高達46.9%;Code Mode畀模型寫腳本組合工具,大幅降低延遲;同埋為Agent設計工具,而唔係直接映射REST API。總括而言,未來Agent會融合三者優勢,先係生產級方案。

  • 結論:生產級Agent必須同時用Skills、MCPCLI,單一方案搞唔掂企業級需求。
  • 方法:漸進式發現同Code Mode係關鍵優化,分別減少Token消耗同推理延遲。
  • 差異MCP提供語義同治理,CLI Token效率高,Skills專注領域知識,三者互補。
  • 啟發:為Agent設計工具時,要從Agent角度出發,唔好直接照搬REST API
  • 可行動點Server作者應該用描述性命名、擁抱Code Mode,同埋考慮交付MCP App渲染UI。
值得記低
連結 github.com

superpowers

Skills相關工具集

連結 github.com

everything-claude-code

另一套Skills工具集

整理重點

背景:三層連接性協議棧

2024年我哋搭緊Demo,2025年寫Coding Agent,到2026年就開始將通用知識Agent投入生產。AnthropicDavid Soria Parra透露,MCP月下載量達1.1億次,快過當年React嘅增長。但佢點出一個關鍵:連接性唔係單一維度,如果有人話Computer Use、MCP或CLI其中一個可以解決所有問題,嗰個就係騙子。

頂級Agent不做選擇,它們同時使用整個連接性協議棧

  1. 1 Skills:領域知識,以Markdown文件形式教模型用工具,跨客戶端可移植。
  2. 2 CLI / Computer Use:類Unix連接,Token效率極高,約200 tokens每次,利用模型對git、gh等嘅預訓練知識。
  3. 3 MCP:集成協議層,語義豐富、平台無關,支援OAuth、治理策略、審計跟蹤。
整理重點

MCP定CLI?按情境揀

當你需要豐富語義、授權機制同平台無關性時,MCP係最佳選擇。但樸素實現會將所有工具schema一次過加載入上下文,Token開銷大。畀Server作者嘅建議:用描述性函數名、參數名,加註釋,等LLM更快更準確調用。

程式內容 python
from typing import Annotated
from datetime import date
from enum import Enum

class Category(str, Enum):
 TRAVEL = "travel"
 MEALS = "meals"
 OFFICE = "office"

def submit_expense(
 amount: Annotated[float, "The expense amount in USD"],
 date: Annotated[date, "Date of the expense in YYYY-MM-DD format"],
 category: Annotated[Category, "The expense category"]
) -> str:
 """Submits a new expense report for approval."""
 pass

CLI方面,當工具已經喺模型預訓練數據入面(例如GitHub CLI),執行效率極高。模型可以用管道同重定向組合命令,再用jq精確過濾數據,返回更緊湊嘅響應。

整理重點

進階優化:Code Mode同為Agent設計

想模型編排多個工具?唔好逼佢做順序工具調用,每次都要等推理延遲。改用Code Mode:畀模型一個REPL環境(如V8 isolate或Python沙箱),等佢寫一個腳本組合工具。

程式內容 javascript
// 程序化工具調用(Code Mode)
// 模型只需寫一次腳本,而非多次 LLM 輪次:
const issue = await mcp.call_tool('linear_get_issue', { id: 'ENG-5121' })
const prs = await mcp.call_tool('github_list_prs', { repo: 'frontend' })
// 使用結構化輸出強制類型
const expectedType = z
 .object({
 title: z.string(),
 status: z.string(),
 })
 .passthrough()
const typedIssue = await extract('claude-haiku-4-5', expectedType, issue)

為Agent設計工具,唔好直接映射REST API

  • 工具要有清晰意圖,似為人類設計界面。
  • 擁抱Code Mode,暴露執行環境畀模型。
  • 交付MCP App,用MCP豐富語義直接交付UI資源。
整理重點

MCP 2026路線圖同總結

MCP生態系統快速演進,三大方向:核心改進——Google提出無狀態傳輸協議,方便部署到K8sCloud Run;無處不在嘅集成——支援SSO同自動Server發現;邊界拓展——Skills over MCP,Server可以連埋領域知識一齊交付。

呢篇文章介紹咗生產級 AI Agent 嘅構建指南,用 Skills 提供領域知識、MCP 提供安全集成、CLI 提供高效執行。

圖片

從 Demo 到生產環境

2024 年,我哋喺度整 Demo。

2025 年,我哋喺度寫 Coding Agent。

2026 年,我哋開始將啲具備通用知識能力嘅智能體放入實際應用入面。

Anthropic 嘅 David Soria Parra 透露,Model Context Protocol(MCP)每月下載量已經達到 1.1 億次 —— 增長速度仲快過當年嘅 React。

但當我哋將 Agent 擴展到複雜嘅企業工作流時,有一個關鍵認知浮咗出嚟:連接性唔係單一維度嘅

如果有人話你知,Computer Use、MCP 或者 CLI 之中有一個可以解決所有連接問題,咁佢就係騙人。頂級 Agent 唔會做選擇,佢哋同時用曬成個連接性協議棧

呢篇文章會逐步帶你掌握 2026 年嘅連接性協議棧:Skills、MCP 同 CLI


理解三層連接性協議棧

喺寫 code 之前,先搞清楚三個唔同層級嘅 Agent 連接方式。

圖片

Skills(領域知識)

可重用嘅過程化指令,以 Markdown 檔案形式教識模型點用工具,跨客戶端可移植,通常喺 .claude/skills/ 目錄或遠程倉庫入面加載。推薦關注 superpowers[1] 和 everything-claude-code[2]

CLI / Computer Use(本地執行)

類似 Unix 風格嘅連接方式。高度可組合,Token 效率極高(每次回應大約 200 tokens),充分利用咗模型喺 gitghcurl 呢啲工具上嘅預訓練知識。安裝方式係通過套件管理程式安裝標準二進制檔案。

MCP(連接性技術)

集成協議層、語義豐富、平台無關同企業級特性:OAuth、治理策略、審計追蹤。MCP Server 通過程式碼定義 tools、resources 同 prompts(例如 server.py 或 server.ts),通過 JSON-RPC 2.0 over HTTP 或 SSE 通訊。


用 MCP 執行任務

當你需要豐富嘅語義、授權機制同平台無關性時,MCP 係最佳選擇。佢提供模式優先(schema-first)嘅確定性工具選擇

圖片

不過,呢個都有代價。簡單嘅實作會將所有工具 schema 一次過加載到上下文入面,返回嘅係完整、有類型嘅 JSON 對象。程式解析友好,但 Token 開銷唔細。

畀 Server 作者嘅建議

永遠用描述性函數名、參數名,同埋畀參數加描述註釋。LLM 喺清楚知道預期嘅時候,會更快、更準確咁調用工具。

from typing import Annotated
from datetime import date
from enum import Enum

class Category(str, Enum):
    TRAVEL = "travel"
    MEALS = "meals"
    OFFICE = "office"

def submit_expense(
    amount: Annotated[float, "The expense amount in USD"],
    date: Annotated[date, "Date of the expense in YYYY-MM-DD format"],
    category: Annotated[Category, "The expense category"]
)
 -> str:

    """Submits a new expense report for approval."""
    pass

用 CLI 執行任務

當工具已經喺模型嘅預訓練數據入面(例如 GitHub CLI 或者 Git),CLI 嘅執行效率極高。模型可以用管道同埋重新導向組合指令,並喺出錯嘅時候快速迭代。

圖片

同返回龐大嘅 JSON 唔同,模型可以用 jq 精確過濾所需數據,返回更為緊湊嘅回應。


核心優化:漸進式發現

呢個係 Agent 框架一定要做嘅最重要優化。

唔好將所有工具一次過加載到上下文視窗入面,而係延遲加載,等模型實際需要嗰陣先加載。

圖片

通過提供 tool_search 能力,模型可以動態揾工具,呢種模式可以將上下文使用量降低 5 倍

Spring AI 嘅實作顯示,喺 28 個工具嘅場景下,OpenAI、Anthropic 同 Gemini 模型都可以實現 34-64% 嘅 Token 削減。Cursor 嘅 A/B 測試表明,喺用 MCP 工具嘅會話入面,總 Token 消耗減少咗 **46.9%**。


進階優化:程序化工具調用(Code Mode)

如果想令模型編排多個工具,唔好強迫佢做順序工具調用 —— 每次調用都依賴推理延遲。

改用 Code Mode:畀模型提供 REPL 環境(例如 V8 isolate 或 Python 沙箱),等佢寫一個腳本將工具組合埋一齊。

圖片
// 程序化工具調用(Code Mode)
// 模型只需寫一次腳本,而非多次 LLM 輪次:
const issue = await mcp.call_tool('linear_get_issue', { id: 'ENG-5121' })
const prs = await mcp.call_tool('github_list_prs', { repo: 'frontend' })

// 使用結構化輸出強制類型
const expectedType = z
  .object({
    title: z.string(),
    status: z.string(),
  })
  .passthrough()
const typedIssue = await extract('claude-haiku-4-5', expectedType, issue)

為 Agent 設計(而唔係為人類設計)

作為 Server 作者,唔好再將 REST API 一對一映射到 MCP Server 上面。要從 Agent 嘅角度重新設計。

圖片

三個核心原則:

  1. 為 Agent 設計工具 —— 要有清晰嘅意圖,就好似為人類設計界面一樣。
  2. 擁抱 Code Mode —— 暴露執行環境(例如 Cloudflare MCP),等模型編排複雜工作流。
  3. 交付 MCP App —— 利用 MCP 嘅豐富語義,直接交付 UI 資源(HTML + JS + CSS),從而令伺服器喺客戶端自行渲染界面。

MCP 2026 路線圖

MCP 生態系統正喺度快速演進,以應對企業級需求。

圖片

三大方向:

核心改進:Google 提出嘅無狀態傳輸協議將會令 MCP Server 更容易部署到 Kubernetes 同 Cloud Run。TypeScript 同 Python SDK v2.0 就快發佈。

無處不在嘅集成:跨應用訪問將會支援通過公司身份提供者嘅單點登錄(SSO)。Server 發現將會通過 .well-known/mcp-server-card/server.json 自動完成。

邊界拓展:Skills over MCP 將會允許 Server 通過 skills/list 和 skills/get 端點,隨工具一齊交付領域知識。

需要根據具體情境同需求嚟決定用 MCP、CLI 定 Skills,以下係成個流程嘅概要。

圖片

總結

2026 年 Agent 連接性演進證明:冇銀彈。MCP 同 CLI 之爭係個偽命題,生產級 Agent 需要多層次嘅精細方法。

MCP 畀人鬧嘅幾點(Token 開銷、認證缺口、Server 質量) —— 係真實但可解決嘅工程挑戰,唔係生存威脅。生態系統已經喺度自我修正:漸進式發現同 Code Mode 大幅降低咗 Token 膨脹同延遲。

更重要嘅係,喺企業環境入面放棄 MCP 會引入更差嘅問題:認證碎片化、零審計追蹤、供應商鎖定。MCP 提供嘅「連接性技術」對於大規模治理同安全至關重要。

未來嘅 Agent 將會無縫融合三種能力:Skills 嘅領域知識、MCP 嘅安全連接、CLI 嘅 Token 高效執行,好嘅 Agent 會用盡全部能力。

參考資料
[1] 

superpowers: https://github.com/obra/superpowers

[2] 

everything-claude-code: https://github.com/affaan-m/everything-claude-code

請喺微信客戶端打開


本文介紹了生產級 AI Agent 構建指南,利用 Skills 提供領域知識、MCP 提供安全集成、CLI 提供高效執行。

圖片

從 Demo 到生產環境

2024 年,我們在搭 Demo。

2025 年,我們在寫 Coding Agent。

2026 年,我們開始把那些具備通用知識能力的智能體投入實際應用中。

Anthropic 的 David Soria Parra 透露,Model Context Protocol(MCP)月下載量已達 1.1 億次 —— 增長速度甚至超過當年的 React。

但當我們把 Agent 擴展到複雜企業工作流時,一個關鍵認知浮現了:連接性不是單一維度的

如果有人告訴你,Computer Use、MCP 或 CLI 中有一個能解決所有連接問題,那他就是個騙子。頂級 Agent 不做選擇,它們同時使用整個連接性協議棧

這篇文章手把手帶你掌握 2026 年的連接性協議棧:Skills、MCP 和 CLI


理解三層連接性協議棧

在寫代碼前,先搞清楚三個不同層級的 Agent 連接方式。

圖片

Skills(領域知識)

可複用的過程化指令,以 Markdown 文件形式教會模型如何使用工具,跨客戶端可移植,通常在 .claude/skills/ 目錄或遠程倉庫中加載。推薦關注 superpowers[1] 和 everything-claude-code[2]

CLI / Computer Use(本地執行)

類 Unix 風格的連接方式。高度可組合,Token 效率極高(每次響應約 200 tokens),充分利用模型在 gitghcurl 等工具上的預訓練知識。安裝方式是通過包管理器安裝標準二進制文件。

MCP(連接性技術)

集成協議層、語義豐富、平台無關以及企業級特性:OAuth、治理策略、審計跟蹤。MCP Server 通過代碼定義 tools、resources 和 prompts(如 server.py 或 server.ts),通過 JSON-RPC 2.0 over HTTP 或 SSE 通信。


用 MCP 執行任務

當你需要豐富的語義、授權機制和平台無關性時,MCP 是最佳選擇。它提供模式優先(schema-first)的確定性工具選擇

圖片

不過,這也有代價。樸素的實現會把所有工具 schema 一股腦加載到上下文中,返回的是完整的、帶類型的 JSON 對象。程序解析友好,但 Token 開銷不小。

給 Server 作者的建議

始終使用描述性函數名、參數名,並給參數加上描述註釋。LLM 在明確知道預期時,會更快、更準確的調用工具。

from typing import Annotated
from datetime import date
from enum import Enum

class Category(str, Enum):
    TRAVEL = "travel"
    MEALS = "meals"
    OFFICE = "office"

def submit_expense(
    amount: Annotated[float, "The expense amount in USD"],
    date: Annotated[date, "Date of the expense in YYYY-MM-DD format"],
    category: Annotated[Category, "The expense category"]
)
 -> str:

    """Submits a new expense report for approval."""
    pass

用 CLI 執行任務

當工具已經在模型的預訓練數據中(比如 GitHub CLI 或 Git),CLI 的執行效率極高。模型可以用管道和重定向組合命令,並在出錯的時候快速迭代。

圖片

與返回龐大的 JSON 不同,模型可以用 jq 精確過濾所需數據,返回更為緊湊的響應。


核心優化:漸進式發現

這是 Agent 框架必須做的最重要優化。

不要把所有工具一次性加載到上下文窗口中,而是延遲加載,等模型實際需要時才加載。

圖片

通過提供 tool_search 能力,模型可以動態查找工具,這種模式可以將上下文使用量降低 5 倍

Spring AI 的實現顯示,在 28 個工具的場景下,OpenAI、Anthropic 和 Gemini 模型都能實現 34-64% 的 Token 削減。Cursor 的 A/B 測試表明,在使用 MCP 工具的會話中,總 Token 消耗減少了 **46.9%**。


進階優化:程序化工具調用(Code Mode)

如果想讓模型編排多個工具,不要強迫它做順序工具調用 —— 每次調用都依賴推理延遲。

改用 Code Mode:給模型提供 REPL 環境(如 V8 isolate 或 Python 沙箱),讓它寫一個腳本把工具組合在一起。

圖片
// 程序化工具調用(Code Mode)
// 模型只需寫一次腳本,而非多次 LLM 輪次:
const issue = await mcp.call_tool('linear_get_issue', { id: 'ENG-5121' })
const prs = await mcp.call_tool('github_list_prs', { repo: 'frontend' })

// 使用結構化輸出強制類型
const expectedType = z
  .object({
    title: z.string(),
    status: z.string(),
  })
  .passthrough()
const typedIssue = await extract('claude-haiku-4-5', expectedType, issue)

為 Agent 設計(而非為人類設計)

作為 Server 作者,不要再把 REST API 一對一映射到 MCP Server 上。要從 Agent 的角度重新設計。

圖片

三個核心原則:

  1. 為 Agent 設計工具 —— 要有清晰的意圖,就像為人類設計界面一樣。
  2. 擁抱 Code Mode —— 暴露執行環境(如 Cloudflare MCP),讓模型編排複雜工作流。
  3. 交付 MCP App —— 利用 MCP 的豐富語義,直接交付 UI 資源(HTML + JS + CSS),從而讓服務器在客戶端自行渲染界面。

MCP 2026 路線圖

MCP 生態系統正在快速演進,以應對企業級需求。

圖片

三大方向:

核心改進:Google 提出的無狀態傳輸協議將使 MCP Server 更容易部署到 Kubernetes 和 Cloud Run。TypeScript 和 Python SDK v2.0 即將發佈。

無處不在的集成:跨應用訪問將支持通過公司身份提供商的單點登錄(SSO)。Server 發現將通過 .well-known/mcp-server-card/server.json 自動完成。

邊界拓展:Skills over MCP 將允許 Server 通過 skills/list 和 skills/get 端點,隨工具一起交付領域知識。

需要根據具體情境和需求來決定是使用 MCP、CLI 還是 Skills,以下是整個流程的概要。

圖片

總結

2026 年 Agent 連接性演進證明:沒有銀彈。MCP 和 CLI 之爭是個偽命題,生產級 Agent 需要多層次的精細方法。

MCP 飽受批評的幾點(Token 開銷、認證缺口、Server 質量) —— 是真實但可解決的工程挑戰,而非生存威脅。生態系統已經在自我修正:漸進式發現和 Code Mode 大幅降低了 Token 膨脹和延遲。

更重要的是,在企業環境中放棄 MCP 會引入更糟糕的問題:認證碎片化、零審計跟蹤、供應商鎖定。MCP 提供的"連接性技術"對於大規模治理和安全至關重要。

未來的 Agent 將無縫融合三種能力:Skills 的領域知識、MCP 的安全連接、CLI 的 Token 高效執行,好的 Agent 會利用全部能力。

參考資料
[1] 

superpowers: https://github.com/obra/superpowers

[2] 

everything-claude-code: https://github.com/affaan-m/everything-claude-code

請在微信客戶端打開