你根本不會用 AI 寫代碼

作者：廢才俱樂部Club

日期：2026年1月20日上午7:18

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

真正嘅AI編程係編排，唔係對話；理解Sub-agent同Skill先識得揀工具

整理版摘要

呢篇文章係由一個熟悉AI編程嘅技術寫手寫嘅。佢發現好多人以為自己識用AI Coding工具，但其實只係同AI傾偈，真正嘅用法係要編排，即係令唔同「AI工人」各司其職。作者想解決嘅問題係：點樣先算真正用AI寫Code？結論係要掌握Sub-agent同Skill呢兩個核心概念。

Sub-agent係獨立上下文嘅專職工人，可以分開做唔同任務，唔怕互相干擾。Skill係可複用嘅工作流能力包，將常用指令打包，唔使次次重複寫。作者比較咗四大工具——Claude Code、OpenAI Codex、Google Antigravity、Cursor——喺呢兩個概念上嘅實現差異。

最後，作者俾出咗一個決策框架：視乎你最重視隔離、審計、可控性、自動化定整合體驗，去揀啱嘅工具。佢強調，要真正提效，就要開始設計系統，唔好淨係同AI傾偈。

真正嘅AI Coding係編排，唔係對話，要設計sub-agent同skill系統。
Sub-agent係獨立工人，有隔離嘅上下文同權限，可以安全並行執行任務。
Skill係可複用嘅技能卡，漸進式加載，唔會撐爆token。
四大工具各有側重：Claude Code最產品化、Codex最工程化、Antigravity最自動化、Cursor最有潛力但未穩定。
根據需求揀工具：要強隔離揀Claude Code，要審計揀Codex，要自動化揀Antigravity，要等成熟揀Cursor。

整理重點

先搞清楚Sub-agent同Skill係咩

你可以將Skill想像成一個「技能卡」，本質係一個文件夾入面有「SKILL.md」說明書同埋腳本資源。關鍵機制叫漸進式加載：AI啓動時只讀名稱同簡介，真係要用至加載完整內容，咁就唔會撐爆Token窗口。

Sub-agent就係「分身」，主Agent派出嘅工人，每個工人有自己的獨立上下文同埋權限隔離。佢哋可以並行工作，互相唔幹擾。

Skill解決可複用性：寫一次「生成單元測試」嘅skill，團隊人人都可以用。
Sub-agent解決複雜任務分解：派一個只讀分析，另一個實際修改，安全又高效。

整理重點

Claude Code vs Codex：產品化 vs 工程化

Claude Code將Sub-agent當作一等公民，內置Explore、Plan等專用代理，用硬隔離限制權限——Explore模式根本無寫文件嘅能力。Skill則係自動觸發，由AI按需求判斷，流暢但唔夠可控。

1 Claude Code嘅sub-agent可以自定義系統提示詞、工具權限甚至模型，適合要精細控制權限嘅場景。
2 Claude Code嘅skill靠「context: fork」隔離執行，但唔可以直接手動點名調用。

OpenAI Codex分兩層：產品層提供並行沙箱任務，SDK層則支援顯式多代理編排，有完整嘅trace記錄，每次prompt、工具調用、handoff都記低，方便審計。Skill支援顯式調用同隱式匹配，默認只注入名稱同描述，可預測性極強。

整理重點

Antigravity同Cursor：自動化 vs 潛力股

Google Antigravity走自動化路線，系統內置browser sub-agent同terminal sub-agent，主模型專注高層推理。但用戶自定義能力有限，公開資料未見支援自建sub-agent。Skill用菜單元數據+按需加載解決上下文飽和，偏隱式觸發。

Antigravity適合想要「開箱即用」自動分工嘅用戶，但要注意安全問題（終端自動執行、提示注入風險）。
如果係安全敏感場景，Antigravity嘅默認權限策略可能要考慮。

Cursor雖然有sub-agents同skills概念，但現階段僅Nightly渠道可用，功能未穩定。社區話「仲喺早期測試」。佢嘅優勢係IDE整合體驗，等成熟後可能最適合日常開發。

整理重點

到底點樣揀？一個決策框架

如果你最在意強隔離同精細權限控制，揀Claude Code。佢Explore模式係硬隔離，唔係靠prompt約束。

如果你最在意多代理協作可審計，揀OpenAI Codex SDK層。Trace機制最強，適合企業合規同團隊覆盤。

如果你最在意Skill可以顯式點名調用、可預測性強，同樣揀Codex。佢係唯一做到顯式/隱式雙模式且默認唔注入正文嘅工具。

1 如果你想開箱即用、系統自動分工，揀Antigravity，但要留意安全問題。
2 如果你係Cursor重度用戶，可以繼續用，關注Nightly更新，等佢成熟。

如果你同大多數人一樣，你以為自己識用 AI Coding 工具。

你開 Cursor，或者 Claude Code，或者 Codex，或者啱啱出嘅 Antigravity，然後你開始打字。你把需求掟俾佢，佢吐出代碼，你複製貼上，間中改下，然後你覺得自己係個「用 AI 提升效率嘅人」。

我唔係想打擊你。但如果你只係同 AI 傾偈，你根本冇用到佢。

你只係用緊一個好貴嘅補全工具。

真正嘅 AI Coding 唔係對話，係編排。唔係你問佢答，係你搭一套系統，令唔同嘅「AI 工人」各司其職，自動完成複雜任務。

呢套系統嘅核心，就係兩個你可能聽過但從未真正理解嘅概念：Sub-agent 和 Skill。

四大 AI Coding 工具——Claude Code、OpenAI Codex、Google Antigravity、Cursor——都喺度押注呢兩個嘢。但佢哋嘅實現方式完全唔同，適合嘅人也完全唔同。

呢篇文章會話俾你知：呢四個工具喺 sub-agent 同 skill 上到底有咩分別，以及你應該揀邊個。

呢個唔係產品評測。呢份係一份令你真正理解「AI 編排」嘅指南。

———

I — 先搞清楚呢兩個嘢到底係咩

喺對比之前，你一定要先理解呢兩個概念。唔係嗰種「哦我知」嘅理解，係嗰種可以令你自己設計方案嘅理解。

Skill：可重用嘅工作流能力包

你可以將 Skill 想像成一個「技能卡」。

佢嘅本質係一個文件夾，裏面裝住：一份說明書（通常叫 SKILL.md），可能仲有啲腳本、參考資料、資源文件。

當 AI 需要做某件特定嘅事情時——例如「用特定格式寫測試」或者「按公司規範生成 API 文檔」——佢會去翻呢個技能卡，按照裏面嘅指令執行。

關鍵機制叫漸進式加載（progressive disclosure）：AI 啟動時只讀技能嘅名同簡介，只有真係需要用嘅時候，先會將完整嘅說明塞入上下文。咁樣唔會撐爆 token 窗口。

Skill 解決嘅問題係：令 AI 嘅能力可重用、可共享、可標準化。

你寫咗一個「生成單元測試」嘅 skill，團隊裏所有人都用得。你唔使每次喺 prompt 裏面重複寫「請按照 Jest 格式，覆蓋邊界情況，mock 外部依賴……」.

Sub-agent：獨立上下文嘅專職工人

Sub-agent 係另一回事。

你可以將佢想像成「分身」。主 agent 係你嘅總管，sub-agent 係佢派出去嘅工人。每個工人自己有腦（獨立上下文），有自己嘅權限（例如呢個只能讀、嗰個可以寫），做完嘢之後將結果交返嚟。

關鍵特徵係隔離：

上下文隔離
：sub-agent 嘅對話唔會污染主對話
權限隔離
：你可以限制某個 sub-agent 只能讀代碼唔可以改
工具隔離
：唔同 sub-agent 可以用唔同嘅工具集

Sub-agent 解決嘅問題係：令複雜任務可以分解、並行、安全咁執行。

例如你令 AI 重構一個大項目，佢可以派一個 sub-agent 去「只讀分析」代碼結構，派另一個去「實際修改」文件，兩邊互不幹擾。分析嗰個唔會誤刪你嘅代碼，修改嗰個唔使等分析完。

兩者嘅關係

一句講曬：Skill 俾當前對話加能力，Sub-agent 將任務掟到另一個腦入面跑。

Skill 係「你會咩」，Sub-agent 係「邊個做」。

佢哋可以組合使用：一個 sub-agent 可以被配置成「只用某幾個 skill」。呢個先係真正嘅 AI 編排。

而家你理解咗概念，我哋嚟睇四個工具係點樣實現——以及佢哋嘅實現差異意味住咩。

———

II — Claude Code：將 Sub-agent 當一等公民

Claude Code（好多人誤寫成 CloudCode）係 Anthropic 嘅命令行編程工具。

喺 sub-agent 呢件事上，佢做得最「產品化」。

Sub-agent：真正嘅獨立代理

Claude Code 嘅 sub-agent 唔係概念，係產品功能。你可以用 /agents 管理佢哋，可以自定義創建，可以配置獨立嘅系統提示詞、工具權限、甚至模型。

佢內置咗幾個專用 sub-agent：

Explore
：只讀模式，專門用嚟快速搜索同理解代碼庫，禁止寫操作
Plan
：計劃模式下嘅研究員，同樣只讀
General-purpose
：做粗重嘢嘅，可以改代碼

呢種設計有一個好明確嘅好處：硬隔離。

Explore 模式下，AI 根本冇寫文件嘅能力。唔係「俾人話唔好寫」，係「冇嗰個工具」。呢個喺做代碼審查、安全分析時極其有用——你唔使擔心 AI 分析嘅時候順手改咗啲咩。

仲有一個限制值得注意：sub-agent 唔可以再生成 sub-agent（防套娃）。呢個係安全設計，但亦意味住嵌套複雜任務時你要自己規劃層級。

Skill：強自動觸發

Claude Code 嘅 skill 係「模型調用型」——AI 根據你嘅請求自動判斷要不要用某個 skill。

你唔需要（亦好難）手動點名調用一個 skill。你就正常講需求，AI 會自己翻技能卡。

呢個有好有壞。好處係流暢，壞處係唔夠可控。如果你強制要用某個 skill，你要透過 slash commands 迂迴，而唔係直接話「用 $xxx skill」。

另一個有意思嘅設計係 context: fork——skill 可以配置成喺「fork 出來嘅上下文」入面運行，相當於 skill 都享受到 sub-agent 嘅隔離特性。

安全提示

Anthropic 明確警告：skill 可能攜帶腳本同指令，你要審計來源。惡意 skill 可以引導 AI 泄露數據或執行危險操作。

呢個唔係嚇你。開源社區入面已經有人研究 skill 級別嘅 prompt 注入了。

———

III — OpenAI Codex：工程師嘅多代理編排

OpenAI 嘅 Codex 需要分兩層理解：產品層和 SDK 層。

產品層：並行任務沙箱

喺 Codex 產品入面，你唔會點見到「sub-agent」呢個詞。佢更強調係「並行處理好多任務」——每個任務跑喺獨立嘅雲端沙箱環境入面，完成後俾你可驗證嘅證據（日誌、測試輸出）。

呢種設計嘅核心價值係隔離同驗證：任務之間互不幹擾，結果可追溯。但佢唔係「sub-agent」嗰種「有自己嘅人格同權限配置」嘅概念。

SDK 層：顯式多代理編排

如果你用 Agents SDK，咁就完全係另一個世界了。

你可以定義多個角色代理，設置 handoff（交接）——當一個 agent 做完佢嘅部分，將任務交俾下一個。整個過程有 trace 記錄：每次 prompt、工具調用、交接都被記低，方便審計同覆盤。

呢個係 Codex 最強嘅地方：可審計性。

喺企業場景入面，你一定要能夠解釋「AI 點解做咗呢個決定」。Codex 嘅 trace 機制令你可以回放整個多代理協作過程，睇到每一步嘅輸入輸出。

Skill：顯式調用最完整

Codex 嘅 skill 體系係四個工具裏面「工程化」程度最高嘅。

兩種觸發方式：

顯式調用
：喺 prompt 入面用 /skills 或者 $skill_name 直接點名
隱式匹配
：任務描述匹配 skill 嘅 description 時自動啟用

最關鍵嘅區別係：默認只注入 skill 嘅名同描述，指令正文只有顯式調用時先會注入。

呢個意味住咩？可預測性極強。你知道 AI 用緊邊個 skill，你知道佢睇到咗啲咩指令。冇「AI 自己偷偷加載咗一堆嘢」嘅黑箱感。

技能目錄都分得好細：repo 級、用戶級、系統級，有明確嘅覆蓋優先級。團隊協作時，你可以喺 repo 入面放通用 skill，個人有自己嘅增強，系統級兜底。

———

IV — Google Antigravity：平台化嘅自動分工

Google 嘅 Antigravity 係今年啱啱出嘅「Agentic IDE」，走嘅係另一條路。

Sub-agent：系統內置分工

Antigravity 有 sub-agent，但唔係你可以自由配置嗰種。

佢嘅設計更加似「系統自動幫你分工」：

Web research 嘅任務自動交俾 Browser Subagent
命令行操作自動交俾 Terminal Subagent
主模型專注高層推理，具體執行由專用模塊負責

官方叫佢「Manager surface 可以 spawn/orchestrate 多 agents」。聽落好勁，但呢度有個關鍵限制：用戶自定義能力不如 Claude Code 同 Codex 明確。

喺 Google AI 開發者論壇入面，有人明確問「可唔可以自建 sub-agent，用唔同模型、唔同 skill」。目前嘅答案係：公開材料入面冇見到呢種支持。

如果你要嘅係「開箱即用嘅自動分工」，Antigravity 唔錯。如果你要嘅係「精細控制每個 sub-agent 嘅權限同行為」，可能仲要等。

Skill：解決上下文膨脹

Antigravity 嘅 skill 設計理念好清晰：解決 Context Saturation（上下文飽和）同 Tool Bloat（工具膨脹）。

佢用「菜單元數據 + 按需加載」嘅方式，將工作流做成可插拔模塊。你需要嘅時候加載，唔需要嘅時候唔佔空間。

但相比 Codex 嗰種「顯式/隱式雙模式」，Antigravity 更偏隱式同平台化。你冇咁多手動控制嘅選項。

安全性爭議

值得一提嘅係，Antigravity 嘅安全性已經被報道過一啲問題——例如終端自動執行、提示注入風險。呢個會直接影響 sub-agent 嘅默認權限策略。

如果你嘅場景對安全敏感，呢個係要考慮嘅。

———

V — Cursor：方向啱，但仲喺早測

Cursor 係四個裏面最特別嘅。

佢確實有 subagents 同 skills 嘅概念，文檔頁面都有寫。但打開一睇：僅 Nightly 渠道可用，功能可能唔完整同會變化。

社區論壇入面有人問「點樣喺 skills 入面用 subagent」，回覆係「仲喺早期測試」。

呢個唔係批評。Cursor 嘅產品方向明顯喺跟進 Claude Code 同 Codex 嘅能力——佢甚至俾人傳可以「從 Claude Code 同 Codex 導入 skills/sub-agents」。

但現階段，如果你要嘅係穩定可預期嘅 sub-agent/skill 體系，Cursor 唔係首選。佢更加適合嗰啲願意踩坑、願意跟住 Nightly 迭代嘅人。

Cursor 嘅優勢係：作為 IDE，佢嘅集成體驗可能最流暢。等 subagents 同 skills 穩定後，佢喺「開發者日常使用」呢個場景可能會好強。

但嗰個係以後嘅事。

———

VI — 點揀

講咗咁多，俾你一個決策框架。

如果你最在意「sub-agent 可唔可以強隔離、可唔可以精細控制權限」

揀 Claude Code。

佢嘅 sub-agent 係真正嘅一等公民。內置嘅 Explore 只讀模式係硬隔離，唔係靠 prompt 約束。你可以自定義 sub-agent 嘅權限、工具、甚至模型。

適合場景：代碼審查、安全分析、需要「AI 只能睇唔可以鬱」嘅任務。

如果你最在意「多代理協作過程可審計、可追溯」

揀 OpenAI Codex（SDK 層）。

佢嘅 trace 機制係四個裏面最強嘅。每次 prompt、工具調用、handoff 都有記錄，你可以回放整個協作過程。

適合場景：企業級使用、需要合規審計、團隊協作需要覆盤。

如果你最在意「skill 可以顯式點名調用、可預測性強」

都係 Codex。

佢係唯一一個將「顯式 $skill 調用」同「隱式自動匹配」都做得完整嘅。默認唔注入正文、只有顯式調用先加載指令嘅設計，令你完全知道 AI 用緊咩。

適合場景：需要精確控制 AI 行為、唔想有「黑箱感」嘅人。

如果你想「開箱即用，唔想配置太多，令系統自動分工」

睇下 Antigravity。

佢嘅 sub-agent 係系統內置嘅自動分工，你唔使自己編排。Skill 都係按需加載，唔使操心上下文膨脹。

適合場景：想要「託管式」體驗、唔想深度配置嘅人。但要注意安全問題。

如果你係 Cursor 重度用戶，願意等

繼續用 Cursor，關注 Nightly 更新。佢嘅方向係啱嘅，只係仲未穩定。等 subagents 同 skills 成熟後，作為 IDE 嘅集成體驗可能會最好。

———

VII — 最後講幾句

Sub-agent 同 skill 唔係啲咩高深概念。佢哋就係「令 AI 有分工」同「令 AI 有技能庫」。

但大多數人唔用呢啲嘢，因為佢哋仲用緊 AI 傾偈。

真正識用 AI Coding 嘅人，係喺設計系統。佢哋喺諗：呢個任務應該拆成幾個 sub-agent？每個 agent 應該有咩權限？邊啲能力應該抽成 skill 重用？

呢個先係 AI 編程嘅正確打開方式。

你可以繼續同 AI 傾偈。但如果你想真正提升效率 10 倍，你要開始編排。

四個工具各有側重。Claude Code 最產品化，Codex 最工程化，Antigravity 最自動化，Cursor 最有潛力但仲喺路上。

揀一個，開始搭你嘅第一個 sub-agent 同 skill 方案。

唔好淨係傾偈喇。

———

如果呢篇文章對你有幫助，可以分享俾同樣用緊 AI Coding 嘅朋友。

如果你有問題或者想傾具體嘅配置方案，歡迎留言。

如果你跟大多數人一樣，你以為自己會用 AI Coding 工具。

你打開 Cursor，或者 Claude Code，或者 Codex，或者剛出的 Antigravity，然後你開始打字。你把需求扔給它，它吐出代碼，你複製粘貼，偶爾改改，然後你覺得自己是個"用 AI 提效的人"。

我不是想打擊你。但如果你只是在和 AI 聊天，你根本沒在用它。

你只是在用一個很貴的補全工具。

真正的 AI Coding 不是對話，是編排。不是你問它答，是你搭建一套系統，讓不同的"AI 工人"各司其職，自動完成複雜任務。

這套系統的核心，就是兩個你可能聽過但從沒真正理解的概念：Sub-agent 和 Skill。

四大 AI Coding 工具——Claude Code、OpenAI Codex、Google Antigravity、Cursor——都在押注這兩個東西。但它們的實現方式完全不同，適合的人也完全不同。

這篇文章會告訴你：這四個工具在 sub-agent 和 skill 上到底有什麼區別，以及你應該選哪個。

這不是產品評測。這是一份讓你真正理解"AI 編排"的指南。

———

I — 先搞清楚這兩個東西到底是什麼

在對比之前，你必須先理解這兩個概念。不是那種"哦我知道"的理解，是那種能讓你自己設計方案的理解。

Skill：可複用的工作流能力包

你可以把 Skill 想象成一個"技能卡"。

它的本質是一個文件夾，裏面裝着：一份說明書（通常叫 SKILL.md），可能還有一些腳本、參考資料、資源文件。

當 AI 需要做某件特定的事情時——比如"用特定格式寫測試"或者"按公司規範生成 API 文檔"——它會去翻這個技能卡，按照裏面的指令執行。

關鍵機制叫漸進式加載（progressive disclosure）：AI 啓動時只讀技能的名字和簡介，只有真的需要用的時候，才會把完整的說明塞進上下文。這樣不會撐爆 token 窗口。

Skill 解決的問題是：讓 AI 的能力可複用、可共享、可標準化。

你寫了一個"生成單元測試"的 skill，團隊裏所有人都能用。你不用每次都在 prompt 裏重複寫"請按照 Jest 格式，覆蓋邊界情況，mock 外部依賴……"。

Sub-agent：獨立上下文的專職工人

Sub-agent 是另一回事。

你可以把它想象成"分身"。主 agent 是你的總管，sub-agent 是它派出去的工人。每個工人有自己的腦子（獨立上下文），有自己的權限（比如這個只能讀、那個可以寫），幹完活之後把結果交回來。

關鍵特徵是隔離：

上下文隔離
：sub-agent 的對話不會污染主對話
權限隔離
：你可以限制某個 sub-agent 只能讀代碼不能改
工具隔離
：不同 sub-agent 可以用不同的工具集

Sub-agent 解決的問題是：讓複雜任務可以分解、並行、安全地執行。

比如你讓 AI 重構一個大項目，它可以派一個 sub-agent 去"只讀分析"代碼結構，派另一個去"實際修改"文件，兩邊互不干擾。分析的那個不會誤刪你的代碼，修改的那個不用等分析完。

兩者的關係

一句話：Skill 給當前對話加能力，Sub-agent 把任務丟到另一個腦子裏跑。

Skill 是"你會什麼"，Sub-agent 是"誰來幹"。

它們可以組合使用：一個 sub-agent 可以被配置成"只用某幾個 skill"。這才是真正的 AI 編排。

現在你理解了概念，我們來看四個工具是怎麼實現的——以及它們的實現差異意味着什麼。

———

II — Claude Code：把 Sub-agent 當一等公民

Claude Code（很多人誤寫成 CloudCode）是 Anthropic 的命令行編程工具。

在 sub-agent 這件事上，它做得最"產品化"。

Sub-agent：真正的獨立代理

Claude Code 的 sub-agent 不是概念，是產品功能。你可以用 /agents 管理它們，可以自定義創建，可以配置獨立的系統提示詞、工具權限、甚至模型。

它內置了幾個專用 sub-agent：

Explore
：只讀模式，專門用來快速搜索和理解代碼庫，禁止寫操作
Plan
：計劃模式下的研究員，同樣只讀
General-purpose
：幹髒活的，可以改代碼

這種設計有一個很明確的好處：硬隔離。

Explore 模式下，AI 根本沒有寫文件的能力。不是"被告知不要寫"，是"沒有那個工具"。這在做代碼審查、安全分析時極其有用——你不用擔心 AI 分析的時候順手改了什麼。

還有一個限制值得注意：sub-agent 不能再生成 sub-agent（防套娃）。這是安全設計，但也意味着嵌套複雜任務時你得自己規劃層級。

Skill：強自動觸發

Claude Code 的 skill 是"模型調用型"的——AI 根據你的請求自動判斷要不要用某個 skill。

你不需要（也很難）手動點名調用一個 skill。你就正常說需求，AI 會自己翻技能卡。

這有好有壞。好處是流暢，壞處是不夠可控。如果你想強制用某個 skill，你得通過 slash commands 迂迴，而不是直接說"用 $xxx skill"。

另一個有意思的設計是 context: fork——skill 可以配置成在"fork 出來的上下文"裏運行，相當於 skill 也享受了 sub-agent 的隔離特性。

安全提示

Anthropic 明確警告：skill 可能攜帶腳本和指令，你要審計來源。惡意 skill 可以引導 AI 泄露數據或執行危險操作。

這不是嚇你。開源社區裏已經有人研究 skill 級別的 prompt 注入了。

———

III — OpenAI Codex：工程師的多代理編排

OpenAI 的 Codex 需要分兩層理解：產品層和 SDK 層。

產品層：並行任務沙箱

在 Codex 產品裏，你不太會看到"sub-agent"這個詞。它更強調的是"並行處理很多任務"——每個任務跑在獨立的雲端沙箱環境裏，完成後給你可驗證的證據（日誌、測試輸出）。

這種設計的核心價值是隔離和驗證：任務之間互不干擾，結果可追溯。但它不是"sub-agent"那種"有自己的人格和權限配置"的概念。

SDK 層：顯式多代理編排

如果你用 Agents SDK，那就完全是另一個世界了。

你可以定義多個角色代理，設置 handoff（交接）——當一個 agent 做完它的部分，把任務交給下一個。整個過程有 trace 記錄：每次 prompt、工具調用、交接都被記下來，方便審計和覆盤。

這是 Codex 最強的地方：可審計性。

在企業場景裏，你必須能解釋"AI 為什麼做了這個決定"。Codex 的 trace 機制讓你可以回放整個多代理協作過程，看到每一步的輸入輸出。

Skill：顯式調用最完整

Codex 的 skill 體系是四個工具裏"工程化"程度最高的。

兩種觸發方式：

顯式調用
：在 prompt 裏用 /skills 或者 $skill_name 直接點名
隱式匹配
：任務描述匹配 skill 的 description 時自動啓用

最關鍵的區別是：默認只注入 skill 的名字和描述，指令正文只有顯式調用時才會注入。

這意味着什麼？可預測性極強。你知道 AI 在用哪個 skill，你知道它看到了什麼指令。沒有"AI 自己偷偷加載了一堆東西"的黑箱感。

技能目錄也分得很細：repo 級、用戶級、系統級，有明確的覆蓋優先級。團隊協作時，你可以在 repo 裏放通用 skill，個人有自己的增強，系統級兜底。

———

IV — Google Antigravity：平台化的自動分工

Google 的 Antigravity 是今年剛出的"Agentic IDE"，走的是另一條路。

Sub-agent：系統內置分工

Antigravity 有 sub-agent，但不是你能自由配置的那種。

它的設計更像"系統自動幫你分工"：

Web research 的任務自動交給 Browser Subagent
命令行操作自動交給 Terminal Subagent
主模型專注高層推理，具體執行由專用模塊負責

官方叫它 "Manager surface 可以 spawn/orchestrate 多 agents"。聽起來很強，但這裏有個關鍵限制：用戶自定義能力不如 Claude Code 和 Codex 明確。

在 Google AI 開發者論壇裏，有人明確問"能不能自建 sub-agent，用不同模型、不同 skill"。目前的答案是：公開材料裏沒看到這種支持。

如果你要的是"開箱即用的自動分工"，Antigravity 不錯。如果你要的是"精細控制每個 sub-agent 的權限和行為"，可能還得等。

Skill：解決上下文膨脹

Antigravity 的 skill 設計理念很清晰：解決 Context Saturation（上下文飽和）和 Tool Bloat（工具膨脹）。

它用"菜單元數據 + 按需加載"的方式，把工作流做成可插拔模塊。你需要的時候加載，不需要的時候不佔空間。

但相比 Codex 那種"顯式/隱式雙模式"，Antigravity 更偏隱式和平台化。你沒有那麼多手動控制的選項。

安全性爭議

值得一提的是，Antigravity 的安全性已經被報道過一些問題——比如終端自動執行、提示注入風險。這會直接影響 sub-agent 的默認權限策略。

如果你的場景對安全敏感，這是要考慮的。

———

V — Cursor：方向對，但還在早測

Cursor 是四個裏面最特殊的。

它確實有 subagents 和 skills 的概念，文檔頁面也寫了。但打開一看：僅 Nightly 渠道可用，功能可能不完整且會變化。

社區論壇裏有人問"怎麼在 skills 裏用 subagent"，回覆是"還在早期測試"。

這不是批評。Cursor 的產品方向明顯在跟進 Claude Code 和 Codex 的能力——它甚至被傳可以"從 Claude Code 和 Codex 導入 skills/sub-agents"。

但現階段，如果你要的是穩定可預期的 sub-agent/skill 體系，Cursor 不是首選。它更適合那些願意踩坑、願意跟着 Nightly 迭代的人。

Cursor 的優勢是：作為 IDE，它的集成體驗可能最流暢。等 subagents 和 skills 穩定後，它在"開發者日常使用"這個場景可能會很強。

但那是以後的事。

———

VI — 怎麼選

說了這麼多，給你一個決策框架。

如果你最在意"sub-agent 能不能強隔離、能不能精細控制權限"

選 Claude Code。

它的 sub-agent 是真正的一等公民。內置的 Explore 只讀模式是硬隔離，不是靠 prompt 約束。你可以自定義 sub-agent 的權限、工具、甚至模型。

適合場景：代碼審查、安全分析、需要"AI 只能看不能動"的任務。

如果你最在意"多代理協作過程可審計、可追溯"

選 OpenAI Codex（SDK 層）。

它的 trace 機制是四個裏面最強的。每次 prompt、工具調用、handoff 都有記錄，你可以回放整個協作過程。

適合場景：企業級使用、需要合規審計、團隊協作需要覆盤。

如果你最在意"skill 可以顯式點名調用、可預測性強"

還是 Codex。

它是唯一一個把"顯式 $skill 調用"和"隱式自動匹配"都做得很完整的。默認不注入正文、只有顯式調用才加載指令的設計，讓你完全知道 AI 在用什麼。

適合場景：需要精確控制 AI 行為、不想有"黑箱感"的人。

如果你想"開箱即用，不想配置太多，讓系統自動分工"

看看 Antigravity。

它的 sub-agent 是系統內置的自動分工，你不用自己編排。Skill 也是按需加載，不用操心上下文膨脹。

適合場景：想要"託管式"體驗、不想深度配置的人。但要注意安全問題。

如果你是 Cursor 重度用戶，願意等

繼續用 Cursor，關注 Nightly 更新。它的方向是對的，只是還沒穩定。等 subagents 和 skills 成熟後，作為 IDE 的集成體驗可能會最好。

———

VII — 最後說幾句

Sub-agent 和 skill 不是什麼高深的概念。它們就是"讓 AI 有分工"和"讓 AI 有技能庫"。

但大多數人不用這些東西，因為他們還在用 AI 聊天。

真正會用 AI Coding 的人，是在設計系統。他們在想：這個任務應該拆成幾個 sub-agent？每個 agent 應該有什麼權限？哪些能力應該抽成 skill 複用？

這才是 AI 編程的正確打開方式。

你可以繼續和 AI 聊天。但如果你想真正提效 10 倍，你得開始編排。

四個工具各有側重。Claude Code 最產品化，Codex 最工程化，Antigravity 最自動化，Cursor 最有潛力但還在路上。

選一個，開始搭你的第一個 sub-agent 和 skill 方案。

別隻是聊天了。

———

如果這篇文章對你有幫助，可以分享給同樣在用 AI Coding 的朋友。

如果你有問題或者想聊具體的配置方案，歡迎留言。