生產級 AI Agent 構建指南：MCP、CLI 與 Skills 的正確使用姿勢

作者：DeepNoMind

日期：2026年5月24日上午10:59

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

生產級AI Agent要同時用Skills、MCP同CLI，唔係二選一

整理版摘要

呢篇文章由Anthropic技術專家David Soria Parra嘅經驗出發，講緊點樣由Demo過渡到實際企業應用。佢指出MCP月下載量已達1.1億次，但唔係所有連接問題都可以靠單一方案解決。作者嘅核心觀點係：頂級Agent唔會只揀一種工具，而係同時用Skills、MCP同CLI，形成一個連接性協議棧。

文章詳細解釋咗三層嘅定位：Skills係以Markdown文件形式提供領域知識，跨客戶端可移植；CLI係類Unix嘅高效執行方式，Token消耗極低；MCP係集成協議層，提供豐富語義同企業級功能如OAuth同審計。作者強調，要根據情境選擇，唔好盲目追捧任何一個。

最後，作者提出咗幾個關鍵優化方向：漸進式發現（延遲加載工具）可以減少Token消耗高達46.9%；Code Mode畀模型寫腳本組合工具，大幅降低延遲；同埋為Agent設計工具，而唔係直接映射REST API。總括而言，未來Agent會融合三者優勢，先係生產級方案。

結論：生產級Agent必須同時用Skills、MCP同CLI，單一方案搞唔掂企業級需求。
方法：漸進式發現同Code Mode係關鍵優化，分別減少Token消耗同推理延遲。
差異：MCP提供語義同治理，CLI Token效率高，Skills專注領域知識，三者互補。
啟發：為Agent設計工具時，要從Agent角度出發，唔好直接照搬REST API。
可行動點：Server作者應該用描述性命名、擁抱Code Mode，同埋考慮交付MCP App渲染UI。

值得記低

連結 github.com

superpowers

Skills相關工具集

連結 github.com

everything-claude-code

另一套Skills工具集

整理重點

背景：三層連接性協議棧

2024年我哋搭緊Demo，2025年寫Coding Agent，到2026年就開始將通用知識Agent投入生產。Anthropic嘅David Soria Parra透露，MCP月下載量達1.1億次，快過當年React嘅增長。但佢點出一個關鍵：連接性唔係單一維度，如果有人話Computer Use、MCP或CLI其中一個可以解決所有問題，嗰個就係騙子。

頂級Agent不做選擇，它們同時使用整個連接性協議棧

1 Skills：領域知識，以Markdown文件形式教模型用工具，跨客戶端可移植。
2 CLI / Computer Use：類Unix連接，Token效率極高，約200 tokens每次，利用模型對git、gh等嘅預訓練知識。
3 MCP：集成協議層，語義豐富、平台無關，支援OAuth、治理策略、審計跟蹤。

整理重點

MCP定CLI？按情境揀

當你需要豐富語義、授權機制同平台無關性時，MCP係最佳選擇。但樸素實現會將所有工具schema一次過加載入上下文，Token開銷大。畀Server作者嘅建議：用描述性函數名、參數名，加註釋，等LLM更快更準確調用。

程式內容 python

from typing import Annotated
from datetime import date
from enum import Enum

class Category(str, Enum):
 TRAVEL = "travel"
 MEALS = "meals"
 OFFICE = "office"

def submit_expense(
 amount: Annotated[float, "The expense amount in USD"],
 date: Annotated[date, "Date of the expense in YYYY-MM-DD format"],
 category: Annotated[Category, "The expense category"]
) -> str:
 """Submits a new expense report for approval."""
 pass

CLI方面，當工具已經喺模型預訓練數據入面（例如GitHub CLI），執行效率極高。模型可以用管道同重定向組合命令，再用jq精確過濾數據，返回更緊湊嘅響應。

整理重點

進階優化：Code Mode同為Agent設計

想模型編排多個工具？唔好逼佢做順序工具調用，每次都要等推理延遲。改用Code Mode：畀模型一個REPL環境（如V8 isolate或Python沙箱），等佢寫一個腳本組合工具。

程式內容 javascript

// 程序化工具調用（Code Mode）
// 模型只需寫一次腳本，而非多次 LLM 輪次：
const issue = await mcp.call_tool('linear_get_issue', { id: 'ENG-5121' })
const prs = await mcp.call_tool('github_list_prs', { repo: 'frontend' })
// 使用結構化輸出強制類型
const expectedType = z
 .object({
 title: z.string(),
 status: z.string(),
 })
 .passthrough()
const typedIssue = await extract('claude-haiku-4-5', expectedType, issue)

為Agent設計工具，唔好直接映射REST API

工具要有清晰意圖，似為人類設計界面。
擁抱Code Mode，暴露執行環境畀模型。
交付MCP App，用MCP豐富語義直接交付UI資源。

整理重點

MCP 2026路線圖同總結

MCP生態系統快速演進，三大方向：核心改進——Google提出無狀態傳輸協議，方便部署到K8s同Cloud Run；無處不在嘅集成——支援SSO同自動Server發現；邊界拓展——Skills over MCP，Server可以連埋領域知識一齊交付。

呢篇文章介紹咗生產級 AI Agent 嘅構建指南，用 Skills 提供領域知識、MCP 提供安全集成、CLI 提供高效執行。

從 Demo 到生產環境

2024 年，我哋喺度整 Demo。

2025 年，我哋喺度寫 Coding Agent。

2026 年，我哋開始將啲具備通用知識能力嘅智能體放入實際應用入面。

Anthropic 嘅 David Soria Parra 透露，Model Context Protocol（MCP）每月下載量已經達到 1.1 億次 —— 增長速度仲快過當年嘅 React。

但當我哋將 Agent 擴展到複雜嘅企業工作流時，有一個關鍵認知浮咗出嚟：連接性唔係單一維度嘅。

如果有人話你知，Computer Use、MCP 或者 CLI 之中有一個可以解決所有連接問題，咁佢就係騙人。頂級 Agent 唔會做選擇，佢哋同時用曬成個連接性協議棧。

呢篇文章會逐步帶你掌握 2026 年嘅連接性協議棧：Skills、MCP 同 CLI。

理解三層連接性協議棧

喺寫 code 之前，先搞清楚三個唔同層級嘅 Agent 連接方式。

Skills（領域知識）

可重用嘅過程化指令，以 Markdown 檔案形式教識模型點用工具，跨客戶端可移植，通常喺 .claude/skills/ 目錄或遠程倉庫入面加載。推薦關注 superpowers^[1] 和 everything-claude-code^[2]。

CLI / Computer Use（本地執行）

類似 Unix 風格嘅連接方式。高度可組合，Token 效率極高（每次回應大約 200 tokens），充分利用咗模型喺 git、gh、curl 呢啲工具上嘅預訓練知識。安裝方式係通過套件管理程式安裝標準二進制檔案。

MCP（連接性技術）

集成協議層、語義豐富、平台無關同企業級特性：OAuth、治理策略、審計追蹤。MCP Server 通過程式碼定義 tools、resources 同 prompts（例如 server.py 或 server.ts），通過 JSON-RPC 2.0 over HTTP 或 SSE 通訊。

用 MCP 執行任務

當你需要豐富嘅語義、授權機制同平台無關性時，MCP 係最佳選擇。佢提供模式優先（schema-first）嘅確定性工具選擇。

不過，呢個都有代價。簡單嘅實作會將所有工具 schema 一次過加載到上下文入面，返回嘅係完整、有類型嘅 JSON 對象。程式解析友好，但 Token 開銷唔細。

畀 Server 作者嘅建議：

永遠用描述性函數名、參數名，同埋畀參數加描述註釋。LLM 喺清楚知道預期嘅時候，會更快、更準確咁調用工具。

from typing import Annotated
from datetime import date
from enum import Enum

class Category(str, Enum):
    TRAVEL = "travel"
    MEALS = "meals"
    OFFICE = "office"

def submit_expense(
    amount: Annotated[float, "The expense amount in USD"],
    date: Annotated[date, "Date of the expense in YYYY-MM-DD format"],
    category: Annotated[Category, "The expense category"]
) -> str:
    """Submits a new expense report for approval."""
    pass

用 CLI 執行任務

當工具已經喺模型嘅預訓練數據入面（例如 GitHub CLI 或者 Git），CLI 嘅執行效率極高。模型可以用管道同埋重新導向組合指令，並喺出錯嘅時候快速迭代。

同返回龐大嘅 JSON 唔同，模型可以用 jq 精確過濾所需數據，返回更為緊湊嘅回應。

核心優化：漸進式發現

呢個係 Agent 框架一定要做嘅最重要優化。

唔好將所有工具一次過加載到上下文視窗入面，而係延遲加載，等模型實際需要嗰陣先加載。

通過提供 tool_search 能力，模型可以動態揾工具，呢種模式可以將上下文使用量降低 5 倍。

Spring AI 嘅實作顯示，喺 28 個工具嘅場景下，OpenAI、Anthropic 同 Gemini 模型都可以實現 34-64% 嘅 Token 削減。Cursor 嘅 A/B 測試表明，喺用 MCP 工具嘅會話入面，總 Token 消耗減少咗 **46.9%**。

進階優化：程序化工具調用（Code Mode）

如果想令模型編排多個工具，唔好強迫佢做順序工具調用 —— 每次調用都依賴推理延遲。

改用 Code Mode：畀模型提供 REPL 環境（例如 V8 isolate 或 Python 沙箱），等佢寫一個腳本將工具組合埋一齊。

// 程序化工具調用（Code Mode）
// 模型只需寫一次腳本，而非多次 LLM 輪次：
const issue = await mcp.call_tool('linear_get_issue', { id: 'ENG-5121' })
const prs = await mcp.call_tool('github_list_prs', { repo: 'frontend' })

// 使用結構化輸出強制類型
const expectedType = z
  .object({
    title: z.string(),
    status: z.string(),
  })
  .passthrough()
const typedIssue = await extract('claude-haiku-4-5', expectedType, issue)

為 Agent 設計（而唔係為人類設計）

作為 Server 作者，唔好再將 REST API 一對一映射到 MCP Server 上面。要從 Agent 嘅角度重新設計。

三個核心原則：

為 Agent 設計工具 —— 要有清晰嘅意圖，就好似為人類設計界面一樣。
擁抱 Code Mode —— 暴露執行環境（例如 Cloudflare MCP），等模型編排複雜工作流。
交付 MCP App —— 利用 MCP 嘅豐富語義，直接交付 UI 資源（HTML + JS + CSS），從而令伺服器喺客戶端自行渲染界面。

MCP 2026 路線圖

MCP 生態系統正喺度快速演進，以應對企業級需求。

三大方向：

核心改進：Google 提出嘅無狀態傳輸協議將會令 MCP Server 更容易部署到 Kubernetes 同 Cloud Run。TypeScript 同 Python SDK v2.0 就快發佈。

無處不在嘅集成：跨應用訪問將會支援通過公司身份提供者嘅單點登錄（SSO）。Server 發現將會通過 .well-known/mcp-server-card/server.json 自動完成。

邊界拓展：Skills over MCP 將會允許 Server 通過 skills/list 和 skills/get 端點，隨工具一齊交付領域知識。

需要根據具體情境同需求嚟決定用 MCP、CLI 定 Skills，以下係成個流程嘅概要。

總結

2026 年 Agent 連接性演進證明：冇銀彈。MCP 同 CLI 之爭係個偽命題，生產級 Agent 需要多層次嘅精細方法。

MCP 畀人鬧嘅幾點（Token 開銷、認證缺口、Server 質量） —— 係真實但可解決嘅工程挑戰，唔係生存威脅。生態系統已經喺度自我修正：漸進式發現同 Code Mode 大幅降低咗 Token 膨脹同延遲。

更重要嘅係，喺企業環境入面放棄 MCP 會引入更差嘅問題：認證碎片化、零審計追蹤、供應商鎖定。MCP 提供嘅「連接性技術」對於大規模治理同安全至關重要。

未來嘅 Agent 將會無縫融合三種能力：Skills 嘅領域知識、MCP 嘅安全連接、CLI 嘅 Token 高效執行，好嘅 Agent 會用盡全部能力。

參考資料

[1]

superpowers: https://github.com/obra/superpowers

[2]

everything-claude-code: https://github.com/affaan-m/everything-claude-code

請喺微信客戶端打開

本文介紹了生產級 AI Agent 構建指南，利用 Skills 提供領域知識、MCP 提供安全集成、CLI 提供高效執行。

從 Demo 到生產環境

2024 年，我們在搭 Demo。

2025 年，我們在寫 Coding Agent。

2026 年，我們開始把那些具備通用知識能力的智能體投入實際應用中。

Anthropic 的 David Soria Parra 透露，Model Context Protocol（MCP）月下載量已達 1.1 億次 —— 增長速度甚至超過當年的 React。

但當我們把 Agent 擴展到複雜企業工作流時，一個關鍵認知浮現了：連接性不是單一維度的。

如果有人告訴你，Computer Use、MCP 或 CLI 中有一個能解決所有連接問題，那他就是個騙子。頂級 Agent 不做選擇，它們同時使用整個連接性協議棧。

這篇文章手把手帶你掌握 2026 年的連接性協議棧：Skills、MCP 和 CLI。

理解三層連接性協議棧

在寫代碼前，先搞清楚三個不同層級的 Agent 連接方式。

Skills（領域知識）

可複用的過程化指令，以 Markdown 文件形式教會模型如何使用工具，跨客戶端可移植，通常在 .claude/skills/ 目錄或遠程倉庫中加載。推薦關注 superpowers^[1] 和 everything-claude-code^[2]。

CLI / Computer Use（本地執行）

類 Unix 風格的連接方式。高度可組合，Token 效率極高（每次響應約 200 tokens），充分利用模型在 git、gh、curl 等工具上的預訓練知識。安裝方式是通過包管理器安裝標準二進制文件。

MCP（連接性技術）

集成協議層、語義豐富、平台無關以及企業級特性：OAuth、治理策略、審計跟蹤。MCP Server 通過代碼定義 tools、resources 和 prompts（如 server.py 或 server.ts），通過 JSON-RPC 2.0 over HTTP 或 SSE 通信。

用 MCP 執行任務

當你需要豐富的語義、授權機制和平台無關性時，MCP 是最佳選擇。它提供模式優先（schema-first）的確定性工具選擇。

不過，這也有代價。樸素的實現會把所有工具 schema 一股腦加載到上下文中，返回的是完整的、帶類型的 JSON 對象。程序解析友好，但 Token 開銷不小。

給 Server 作者的建議：

始終使用描述性函數名、參數名，並給參數加上描述註釋。LLM 在明確知道預期時，會更快、更準確的調用工具。

from typing import Annotated
from datetime import date
from enum import Enum

class Category(str, Enum):
    TRAVEL = "travel"
    MEALS = "meals"
    OFFICE = "office"

def submit_expense(
    amount: Annotated[float, "The expense amount in USD"],
    date: Annotated[date, "Date of the expense in YYYY-MM-DD format"],
    category: Annotated[Category, "The expense category"]
) -> str:
    """Submits a new expense report for approval."""
    pass

用 CLI 執行任務

當工具已經在模型的預訓練數據中（比如 GitHub CLI 或 Git），CLI 的執行效率極高。模型可以用管道和重定向組合命令，並在出錯的時候快速迭代。

與返回龐大的 JSON 不同，模型可以用 jq 精確過濾所需數據，返回更為緊湊的響應。

核心優化：漸進式發現

這是 Agent 框架必須做的最重要優化。

不要把所有工具一次性加載到上下文窗口中，而是延遲加載，等模型實際需要時才加載。

通過提供 tool_search 能力，模型可以動態查找工具，這種模式可以將上下文使用量降低 5 倍。

Spring AI 的實現顯示，在 28 個工具的場景下，OpenAI、Anthropic 和 Gemini 模型都能實現 34-64% 的 Token 削減。Cursor 的 A/B 測試表明，在使用 MCP 工具的會話中，總 Token 消耗減少了 **46.9%**。

進階優化：程序化工具調用（Code Mode）

如果想讓模型編排多個工具，不要強迫它做順序工具調用 —— 每次調用都依賴推理延遲。

改用 Code Mode：給模型提供 REPL 環境（如 V8 isolate 或 Python 沙箱），讓它寫一個腳本把工具組合在一起。

// 程序化工具調用（Code Mode）
// 模型只需寫一次腳本，而非多次 LLM 輪次：
const issue = await mcp.call_tool('linear_get_issue', { id: 'ENG-5121' })
const prs = await mcp.call_tool('github_list_prs', { repo: 'frontend' })

// 使用結構化輸出強制類型
const expectedType = z
  .object({
    title: z.string(),
    status: z.string(),
  })
  .passthrough()
const typedIssue = await extract('claude-haiku-4-5', expectedType, issue)

為 Agent 設計（而非為人類設計）

作為 Server 作者，不要再把 REST API 一對一映射到 MCP Server 上。要從 Agent 的角度重新設計。

三個核心原則：

為 Agent 設計工具 —— 要有清晰的意圖，就像為人類設計界面一樣。
擁抱 Code Mode —— 暴露執行環境（如 Cloudflare MCP），讓模型編排複雜工作流。
交付 MCP App —— 利用 MCP 的豐富語義，直接交付 UI 資源（HTML + JS + CSS），從而讓服務器在客戶端自行渲染界面。

MCP 2026 路線圖

MCP 生態系統正在快速演進，以應對企業級需求。

三大方向：

核心改進：Google 提出的無狀態傳輸協議將使 MCP Server 更容易部署到 Kubernetes 和 Cloud Run。TypeScript 和 Python SDK v2.0 即將發佈。

無處不在的集成：跨應用訪問將支持通過公司身份提供商的單點登錄（SSO）。Server 發現將通過 .well-known/mcp-server-card/server.json 自動完成。

邊界拓展：Skills over MCP 將允許 Server 通過 skills/list 和 skills/get 端點，隨工具一起交付領域知識。

需要根據具體情境和需求來決定是使用 MCP、CLI 還是 Skills，以下是整個流程的概要。

總結

2026 年 Agent 連接性演進證明：沒有銀彈。MCP 和 CLI 之爭是個偽命題，生產級 Agent 需要多層次的精細方法。

MCP 飽受批評的幾點（Token 開銷、認證缺口、Server 質量） —— 是真實但可解決的工程挑戰，而非生存威脅。生態系統已經在自我修正：漸進式發現和 Code Mode 大幅降低了 Token 膨脹和延遲。

更重要的是，在企業環境中放棄 MCP 會引入更糟糕的問題：認證碎片化、零審計跟蹤、供應商鎖定。MCP 提供的"連接性技術"對於大規模治理和安全至關重要。

未來的 Agent 將無縫融合三種能力：Skills 的領域知識、MCP 的安全連接、CLI 的 Token 高效執行，好的 Agent 會利用全部能力。

參考資料

[1]

superpowers: https://github.com/obra/superpowers

[2]

everything-claude-code: https://github.com/affaan-m/everything-claude-code

請在微信客戶端打開