你根本不會用 AI 寫代碼
整理版優先睇
真正嘅AI編程係編排,唔係對話;理解Sub-agent同Skill先識得揀工具
呢篇文章係由一個熟悉AI編程嘅技術寫手寫嘅。佢發現好多人以為自己識用AI Coding工具,但其實只係同AI傾偈,真正嘅用法係要編排,即係令唔同「AI工人」各司其職。作者想解決嘅問題係:點樣先算真正用AI寫Code?結論係要掌握Sub-agent同Skill呢兩個核心概念。
Sub-agent係獨立上下文嘅專職工人,可以分開做唔同任務,唔怕互相干擾。Skill係可複用嘅工作流能力包,將常用指令打包,唔使次次重複寫。作者比較咗四大工具——Claude Code、OpenAI Codex、Google Antigravity、Cursor——喺呢兩個概念上嘅實現差異。
最後,作者俾出咗一個決策框架:視乎你最重視隔離、審計、可控性、自動化定整合體驗,去揀啱嘅工具。佢強調,要真正提效,就要開始設計系統,唔好淨係同AI傾偈。
- 真正嘅AI Coding係編排,唔係對話,要設計sub-agent同skill系統。
- Sub-agent係獨立工人,有隔離嘅上下文同權限,可以安全並行執行任務。
- Skill係可複用嘅技能卡,漸進式加載,唔會撐爆token。
- 四大工具各有側重:Claude Code最產品化、Codex最工程化、Antigravity最自動化、Cursor最有潛力但未穩定。
- 根據需求揀工具:要強隔離揀Claude Code,要審計揀Codex,要自動化揀Antigravity,要等成熟揀Cursor。
先搞清楚Sub-agent同Skill係咩
你可以將Skill想像成一個「技能卡」,本質係一個文件夾入面有「SKILL.md」說明書同埋腳本資源。關鍵機制叫漸進式加載:AI啓動時只讀名稱同簡介,真係要用至加載完整內容,咁就唔會撐爆Token窗口。
Sub-agent就係「分身」,主Agent派出嘅工人,每個工人有自己的獨立上下文同埋權限隔離。佢哋可以並行工作,互相唔幹擾。
- Skill解決可複用性:寫一次「生成單元測試」嘅skill,團隊人人都可以用。
- Sub-agent解決複雜任務分解:派一個只讀分析,另一個實際修改,安全又高效。
Claude Code vs Codex:產品化 vs 工程化
Claude Code將Sub-agent當作一等公民,內置Explore、Plan等專用代理,用硬隔離限制權限——Explore模式根本無寫文件嘅能力。Skill則係自動觸發,由AI按需求判斷,流暢但唔夠可控。
- 1 Claude Code嘅sub-agent可以自定義系統提示詞、工具權限甚至模型,適合要精細控制權限嘅場景。
- 2 Claude Code嘅skill靠「context: fork」隔離執行,但唔可以直接手動點名調用。
OpenAI Codex分兩層:產品層提供並行沙箱任務,SDK層則支援顯式多代理編排,有完整嘅trace記錄,每次prompt、工具調用、handoff都記低,方便審計。Skill支援顯式調用同隱式匹配,默認只注入名稱同描述,可預測性極強。
Antigravity同Cursor:自動化 vs 潛力股
Google Antigravity走自動化路線,系統內置browser sub-agent同terminal sub-agent,主模型專注高層推理。但用戶自定義能力有限,公開資料未見支援自建sub-agent。Skill用菜單元數據+按需加載解決上下文飽和,偏隱式觸發。
- Antigravity適合想要「開箱即用」自動分工嘅用戶,但要注意安全問題(終端自動執行、提示注入風險)。
- 如果係安全敏感場景,Antigravity嘅默認權限策略可能要考慮。
Cursor雖然有sub-agents同skills概念,但現階段僅Nightly渠道可用,功能未穩定。社區話「仲喺早期測試」。佢嘅優勢係IDE整合體驗,等成熟後可能最適合日常開發。
到底點樣揀?一個決策框架
如果你最在意強隔離同精細權限控制,揀Claude Code。佢Explore模式係硬隔離,唔係靠prompt約束。
如果你最在意多代理協作可審計,揀OpenAI Codex SDK層。Trace機制最強,適合企業合規同團隊覆盤。
如果你最在意Skill可以顯式點名調用、可預測性強,同樣揀Codex。佢係唯一做到顯式/隱式雙模式且默認唔注入正文嘅工具。
- 1 如果你想開箱即用、系統自動分工,揀Antigravity,但要留意安全問題。
- 2 如果你係Cursor重度用戶,可以繼續用,關注Nightly更新,等佢成熟。
你開 Cursor,或者 Claude Code,或者 Codex,或者啱啱出嘅 Antigravity,然後你開始打字。你把需求掟俾佢,佢吐出代碼,你複製貼上,間中改下,然後你覺得自己係個「用 AI 提升效率嘅人」。
我唔係想打擊你。但如果你只係同 AI 傾偈,你根本冇用到佢。
你只係用緊一個好貴嘅補全工具。
真正嘅 AI Coding 唔係對話,係編排。唔係你問佢答,係你搭一套系統,令唔同嘅「AI 工人」各司其職,自動完成複雜任務。
呢套系統嘅核心,就係兩個你可能聽過但從未真正理解嘅概念:Sub-agent 和 Skill。
四大 AI Coding 工具——Claude Code、OpenAI Codex、Google Antigravity、Cursor——都喺度押注呢兩個嘢。但佢哋嘅實現方式完全唔同,適合嘅人也完全唔同。
呢篇文章會話俾你知:呢四個工具喺 sub-agent 同 skill 上到底有咩分別,以及你應該揀邊個。
呢個唔係產品評測。呢份係一份令你真正理解「AI 編排」嘅指南。
———
I — 先搞清楚呢兩個嘢到底係咩
喺對比之前,你一定要先理解呢兩個概念。唔係嗰種「哦我知」嘅理解,係嗰種可以令你自己設計方案嘅理解。
Skill:可重用嘅工作流能力包
你可以將 Skill 想像成一個「技能卡」。
佢嘅本質係一個文件夾,裏面裝住:一份說明書(通常叫 SKILL.md),可能仲有啲腳本、參考資料、資源文件。
當 AI 需要做某件特定嘅事情時——例如「用特定格式寫測試」或者「按公司規範生成 API 文檔」——佢會去翻呢個技能卡,按照裏面嘅指令執行。
關鍵機制叫漸進式加載(progressive disclosure):AI 啟動時只讀技能嘅名同簡介,只有真係需要用嘅時候,先會將完整嘅說明塞入上下文。咁樣唔會撐爆 token 窗口。
Skill 解決嘅問題係:令 AI 嘅能力可重用、可共享、可標準化。
你寫咗一個「生成單元測試」嘅 skill,團隊裏所有人都用得。你唔使每次喺 prompt 裏面重複寫「請按照 Jest 格式,覆蓋邊界情況,mock 外部依賴……」.
Sub-agent:獨立上下文嘅專職工人
Sub-agent 係另一回事。
你可以將佢想像成「分身」。主 agent 係你嘅總管,sub-agent 係佢派出去嘅工人。每個工人自己有腦(獨立上下文),有自己嘅權限(例如呢個只能讀、嗰個可以寫),做完嘢之後將結果交返嚟。
關鍵特徵係隔離:
- 上下文隔離
:sub-agent 嘅對話唔會污染主對話 - 權限隔離
:你可以限制某個 sub-agent 只能讀代碼唔可以改 - 工具隔離
:唔同 sub-agent 可以用唔同嘅工具集
Sub-agent 解決嘅問題係:令複雜任務可以分解、並行、安全咁執行。
例如你令 AI 重構一個大項目,佢可以派一個 sub-agent 去「只讀分析」代碼結構,派另一個去「實際修改」文件,兩邊互不幹擾。分析嗰個唔會誤刪你嘅代碼,修改嗰個唔使等分析完。
兩者嘅關係
一句講曬:Skill 俾當前對話加能力,Sub-agent 將任務掟到另一個腦入面跑。
Skill 係「你會咩」,Sub-agent 係「邊個做」。
佢哋可以組合使用:一個 sub-agent 可以被配置成「只用某幾個 skill」。呢個先係真正嘅 AI 編排。
而家你理解咗概念,我哋嚟睇四個工具係點樣實現——以及佢哋嘅實現差異意味住咩。
———
II — Claude Code:將 Sub-agent 當一等公民
Claude Code(好多人誤寫成 CloudCode)係 Anthropic 嘅命令行編程工具。
喺 sub-agent 呢件事上,佢做得最「產品化」。
Sub-agent:真正嘅獨立代理
Claude Code 嘅 sub-agent 唔係概念,係產品功能。你可以用 /agents 管理佢哋,可以自定義創建,可以配置獨立嘅系統提示詞、工具權限、甚至模型。
佢內置咗幾個專用 sub-agent:
- Explore
:只讀模式,專門用嚟快速搜索同理解代碼庫,禁止寫操作 - Plan
:計劃模式下嘅研究員,同樣只讀 - General-purpose
:做粗重嘢嘅,可以改代碼
呢種設計有一個好明確嘅好處:硬隔離。
Explore 模式下,AI 根本冇寫文件嘅能力。唔係「俾人話唔好寫」,係「冇嗰個工具」。呢個喺做代碼審查、安全分析時極其有用——你唔使擔心 AI 分析嘅時候順手改咗啲咩。
仲有一個限制值得注意:sub-agent 唔可以再生成 sub-agent(防套娃)。呢個係安全設計,但亦意味住嵌套複雜任務時你要自己規劃層級。
Skill:強自動觸發
Claude Code 嘅 skill 係「模型調用型」——AI 根據你嘅請求自動判斷要不要用某個 skill。
你唔需要(亦好難)手動點名調用一個 skill。你就正常講需求,AI 會自己翻技能卡。
呢個有好有壞。好處係流暢,壞處係唔夠可控。如果你強制要用某個 skill,你要透過 slash commands 迂迴,而唔係直接話「用 $xxx skill」。
另一個有意思嘅設計係 context: fork——skill 可以配置成喺「fork 出來嘅上下文」入面運行,相當於 skill 都享受到 sub-agent 嘅隔離特性。
安全提示
Anthropic 明確警告:skill 可能攜帶腳本同指令,你要審計來源。惡意 skill 可以引導 AI 泄露數據或執行危險操作。
呢個唔係嚇你。開源社區入面已經有人研究 skill 級別嘅 prompt 注入了。
———
III — OpenAI Codex:工程師嘅多代理編排
OpenAI 嘅 Codex 需要分兩層理解:產品層和 SDK 層。
產品層:並行任務沙箱
喺 Codex 產品入面,你唔會點見到「sub-agent」呢個詞。佢更強調係「並行處理好多任務」——每個任務跑喺獨立嘅雲端沙箱環境入面,完成後俾你可驗證嘅證據(日誌、測試輸出)。
呢種設計嘅核心價值係隔離同驗證:任務之間互不幹擾,結果可追溯。但佢唔係「sub-agent」嗰種「有自己嘅人格同權限配置」嘅概念。
SDK 層:顯式多代理編排
如果你用 Agents SDK,咁就完全係另一個世界了。
你可以定義多個角色代理,設置 handoff(交接)——當一個 agent 做完佢嘅部分,將任務交俾下一個。整個過程有 trace 記錄:每次 prompt、工具調用、交接都被記低,方便審計同覆盤。
呢個係 Codex 最強嘅地方:可審計性。
喺企業場景入面,你一定要能夠解釋「AI 點解做咗呢個決定」。Codex 嘅 trace 機制令你可以回放整個多代理協作過程,睇到每一步嘅輸入輸出。
Skill:顯式調用最完整
Codex 嘅 skill 體系係四個工具裏面「工程化」程度最高嘅。
兩種觸發方式:
- 顯式調用
:喺 prompt 入面用 /skills或者$skill_name直接點名 - 隱式匹配
:任務描述匹配 skill 嘅 description 時自動啟用
最關鍵嘅區別係:默認只注入 skill 嘅名同描述,指令正文只有顯式調用時先會注入。
呢個意味住咩?可預測性極強。你知道 AI 用緊邊個 skill,你知道佢睇到咗啲咩指令。冇「AI 自己偷偷加載咗一堆嘢」嘅黑箱感。
技能目錄都分得好細:repo 級、用戶級、系統級,有明確嘅覆蓋優先級。團隊協作時,你可以喺 repo 入面放通用 skill,個人有自己嘅增強,系統級兜底。
———
IV — Google Antigravity:平台化嘅自動分工
Google 嘅 Antigravity 係今年啱啱出嘅「Agentic IDE」,走嘅係另一條路。
Sub-agent:系統內置分工
Antigravity 有 sub-agent,但唔係你可以自由配置嗰種。
佢嘅設計更加似「系統自動幫你分工」:
Web research 嘅任務自動交俾 Browser Subagent 命令行操作自動交俾 Terminal Subagent 主模型專注高層推理,具體執行由專用模塊負責
官方叫佢「Manager surface 可以 spawn/orchestrate 多 agents」。聽落好勁,但呢度有個關鍵限制:用戶自定義能力不如 Claude Code 同 Codex 明確。
喺 Google AI 開發者論壇入面,有人明確問「可唔可以自建 sub-agent,用唔同模型、唔同 skill」。目前嘅答案係:公開材料入面冇見到呢種支持。
如果你要嘅係「開箱即用嘅自動分工」,Antigravity 唔錯。如果你要嘅係「精細控制每個 sub-agent 嘅權限同行為」,可能仲要等。
Skill:解決上下文膨脹
Antigravity 嘅 skill 設計理念好清晰:解決 Context Saturation(上下文飽和)同 Tool Bloat(工具膨脹)。
佢用「菜單元數據 + 按需加載」嘅方式,將工作流做成可插拔模塊。你需要嘅時候加載,唔需要嘅時候唔佔空間。
但相比 Codex 嗰種「顯式/隱式雙模式」,Antigravity 更偏隱式同平台化。你冇咁多手動控制嘅選項。
安全性爭議
值得一提嘅係,Antigravity 嘅安全性已經被報道過一啲問題——例如終端自動執行、提示注入風險。呢個會直接影響 sub-agent 嘅默認權限策略。
如果你嘅場景對安全敏感,呢個係要考慮嘅。
———
V — Cursor:方向啱,但仲喺早測
Cursor 係四個裏面最特別嘅。
佢確實有 subagents 同 skills 嘅概念,文檔頁面都有寫。但打開一睇:僅 Nightly 渠道可用,功能可能唔完整同會變化。
社區論壇入面有人問「點樣喺 skills 入面用 subagent」,回覆係「仲喺早期測試」。
呢個唔係批評。Cursor 嘅產品方向明顯喺跟進 Claude Code 同 Codex 嘅能力——佢甚至俾人傳可以「從 Claude Code 同 Codex 導入 skills/sub-agents」。
但現階段,如果你要嘅係穩定可預期嘅 sub-agent/skill 體系,Cursor 唔係首選。佢更加適合嗰啲願意踩坑、願意跟住 Nightly 迭代嘅人。
Cursor 嘅優勢係:作為 IDE,佢嘅集成體驗可能最流暢。等 subagents 同 skills 穩定後,佢喺「開發者日常使用」呢個場景可能會好強。
但嗰個係以後嘅事。
———
VI — 點揀
講咗咁多,俾你一個決策框架。
如果你最在意「sub-agent 可唔可以強隔離、可唔可以精細控制權限」
揀 Claude Code。
佢嘅 sub-agent 係真正嘅一等公民。內置嘅 Explore 只讀模式係硬隔離,唔係靠 prompt 約束。你可以自定義 sub-agent 嘅權限、工具、甚至模型。
適合場景:代碼審查、安全分析、需要「AI 只能睇唔可以鬱」嘅任務。
如果你最在意「多代理協作過程可審計、可追溯」
揀 OpenAI Codex(SDK 層)。
佢嘅 trace 機制係四個裏面最強嘅。每次 prompt、工具調用、handoff 都有記錄,你可以回放整個協作過程。
適合場景:企業級使用、需要合規審計、團隊協作需要覆盤。
如果你最在意「skill 可以顯式點名調用、可預測性強」
都係 Codex。
佢係唯一一個將「顯式 $skill 調用」同「隱式自動匹配」都做得完整嘅。默認唔注入正文、只有顯式調用先加載指令嘅設計,令你完全知道 AI 用緊咩。
適合場景:需要精確控制 AI 行為、唔想有「黑箱感」嘅人。
如果你想「開箱即用,唔想配置太多,令系統自動分工」
睇下 Antigravity。
佢嘅 sub-agent 係系統內置嘅自動分工,你唔使自己編排。Skill 都係按需加載,唔使操心上下文膨脹。
適合場景:想要「託管式」體驗、唔想深度配置嘅人。但要注意安全問題。
如果你係 Cursor 重度用戶,願意等
繼續用 Cursor,關注 Nightly 更新。佢嘅方向係啱嘅,只係仲未穩定。等 subagents 同 skills 成熟後,作為 IDE 嘅集成體驗可能會最好。
———
VII — 最後講幾句
Sub-agent 同 skill 唔係啲咩高深概念。佢哋就係「令 AI 有分工」同「令 AI 有技能庫」。
但大多數人唔用呢啲嘢,因為佢哋仲用緊 AI 傾偈。
真正識用 AI Coding 嘅人,係喺設計系統。佢哋喺諗:呢個任務應該拆成幾個 sub-agent?每個 agent 應該有咩權限?邊啲能力應該抽成 skill 重用?
呢個先係 AI 編程嘅正確打開方式。
你可以繼續同 AI 傾偈。但如果你想真正提升效率 10 倍,你要開始編排。
四個工具各有側重。Claude Code 最產品化,Codex 最工程化,Antigravity 最自動化,Cursor 最有潛力但仲喺路上。
揀一個,開始搭你嘅第一個 sub-agent 同 skill 方案。
唔好淨係傾偈喇。
———
如果呢篇文章對你有幫助,可以分享俾同樣用緊 AI Coding 嘅朋友。
如果你有問題或者想傾具體嘅配置方案,歡迎留言。

你打開 Cursor,或者 Claude Code,或者 Codex,或者剛出的 Antigravity,然後你開始打字。你把需求扔給它,它吐出代碼,你複製粘貼,偶爾改改,然後你覺得自己是個"用 AI 提效的人"。
我不是想打擊你。但如果你只是在和 AI 聊天,你根本沒在用它。
你只是在用一個很貴的補全工具。
真正的 AI Coding 不是對話,是編排。不是你問它答,是你搭建一套系統,讓不同的"AI 工人"各司其職,自動完成複雜任務。
這套系統的核心,就是兩個你可能聽過但從沒真正理解的概念:Sub-agent 和 Skill。
四大 AI Coding 工具——Claude Code、OpenAI Codex、Google Antigravity、Cursor——都在押注這兩個東西。但它們的實現方式完全不同,適合的人也完全不同。
這篇文章會告訴你:這四個工具在 sub-agent 和 skill 上到底有什麼區別,以及你應該選哪個。
這不是產品評測。這是一份讓你真正理解"AI 編排"的指南。
———
I — 先搞清楚這兩個東西到底是什麼
在對比之前,你必須先理解這兩個概念。不是那種"哦我知道"的理解,是那種能讓你自己設計方案的理解。
Skill:可複用的工作流能力包
你可以把 Skill 想象成一個"技能卡"。
它的本質是一個文件夾,裏面裝着:一份說明書(通常叫 SKILL.md),可能還有一些腳本、參考資料、資源文件。
當 AI 需要做某件特定的事情時——比如"用特定格式寫測試"或者"按公司規範生成 API 文檔"——它會去翻這個技能卡,按照裏面的指令執行。
關鍵機制叫漸進式加載(progressive disclosure):AI 啓動時只讀技能的名字和簡介,只有真的需要用的時候,才會把完整的說明塞進上下文。這樣不會撐爆 token 窗口。
Skill 解決的問題是:讓 AI 的能力可複用、可共享、可標準化。
你寫了一個"生成單元測試"的 skill,團隊裏所有人都能用。你不用每次都在 prompt 裏重複寫"請按照 Jest 格式,覆蓋邊界情況,mock 外部依賴……"。
Sub-agent:獨立上下文的專職工人
Sub-agent 是另一回事。
你可以把它想象成"分身"。主 agent 是你的總管,sub-agent 是它派出去的工人。每個工人有自己的腦子(獨立上下文),有自己的權限(比如這個只能讀、那個可以寫),幹完活之後把結果交回來。
關鍵特徵是隔離:
- 上下文隔離
:sub-agent 的對話不會污染主對話 - 權限隔離
:你可以限制某個 sub-agent 只能讀代碼不能改 - 工具隔離
:不同 sub-agent 可以用不同的工具集
Sub-agent 解決的問題是:讓複雜任務可以分解、並行、安全地執行。
比如你讓 AI 重構一個大項目,它可以派一個 sub-agent 去"只讀分析"代碼結構,派另一個去"實際修改"文件,兩邊互不干擾。分析的那個不會誤刪你的代碼,修改的那個不用等分析完。
兩者的關係
一句話:Skill 給當前對話加能力,Sub-agent 把任務丟到另一個腦子裏跑。
Skill 是"你會什麼",Sub-agent 是"誰來幹"。
它們可以組合使用:一個 sub-agent 可以被配置成"只用某幾個 skill"。這才是真正的 AI 編排。
現在你理解了概念,我們來看四個工具是怎麼實現的——以及它們的實現差異意味着什麼。
———
II — Claude Code:把 Sub-agent 當一等公民
Claude Code(很多人誤寫成 CloudCode)是 Anthropic 的命令行編程工具。
在 sub-agent 這件事上,它做得最"產品化"。
Sub-agent:真正的獨立代理
Claude Code 的 sub-agent 不是概念,是產品功能。你可以用 /agents 管理它們,可以自定義創建,可以配置獨立的系統提示詞、工具權限、甚至模型。
它內置了幾個專用 sub-agent:
- Explore
:只讀模式,專門用來快速搜索和理解代碼庫,禁止寫操作 - Plan
:計劃模式下的研究員,同樣只讀 - General-purpose
:幹髒活的,可以改代碼
這種設計有一個很明確的好處:硬隔離。
Explore 模式下,AI 根本沒有寫文件的能力。不是"被告知不要寫",是"沒有那個工具"。這在做代碼審查、安全分析時極其有用——你不用擔心 AI 分析的時候順手改了什麼。
還有一個限制值得注意:sub-agent 不能再生成 sub-agent(防套娃)。這是安全設計,但也意味着嵌套複雜任務時你得自己規劃層級。
Skill:強自動觸發
Claude Code 的 skill 是"模型調用型"的——AI 根據你的請求自動判斷要不要用某個 skill。
你不需要(也很難)手動點名調用一個 skill。你就正常說需求,AI 會自己翻技能卡。
這有好有壞。好處是流暢,壞處是不夠可控。如果你想強制用某個 skill,你得通過 slash commands 迂迴,而不是直接說"用 $xxx skill"。
另一個有意思的設計是 context: fork——skill 可以配置成在"fork 出來的上下文"裏運行,相當於 skill 也享受了 sub-agent 的隔離特性。
安全提示
Anthropic 明確警告:skill 可能攜帶腳本和指令,你要審計來源。惡意 skill 可以引導 AI 泄露數據或執行危險操作。
這不是嚇你。開源社區裏已經有人研究 skill 級別的 prompt 注入了。
———
III — OpenAI Codex:工程師的多代理編排
OpenAI 的 Codex 需要分兩層理解:產品層和 SDK 層。
產品層:並行任務沙箱
在 Codex 產品裏,你不太會看到"sub-agent"這個詞。它更強調的是"並行處理很多任務"——每個任務跑在獨立的雲端沙箱環境裏,完成後給你可驗證的證據(日誌、測試輸出)。
這種設計的核心價值是隔離和驗證:任務之間互不干擾,結果可追溯。但它不是"sub-agent"那種"有自己的人格和權限配置"的概念。
SDK 層:顯式多代理編排
如果你用 Agents SDK,那就完全是另一個世界了。
你可以定義多個角色代理,設置 handoff(交接)——當一個 agent 做完它的部分,把任務交給下一個。整個過程有 trace 記錄:每次 prompt、工具調用、交接都被記下來,方便審計和覆盤。
這是 Codex 最強的地方:可審計性。
在企業場景裏,你必須能解釋"AI 為什麼做了這個決定"。Codex 的 trace 機制讓你可以回放整個多代理協作過程,看到每一步的輸入輸出。
Skill:顯式調用最完整
Codex 的 skill 體系是四個工具裏"工程化"程度最高的。
兩種觸發方式:
- 顯式調用
:在 prompt 裏用 /skills或者$skill_name直接點名 - 隱式匹配
:任務描述匹配 skill 的 description 時自動啓用
最關鍵的區別是:默認只注入 skill 的名字和描述,指令正文只有顯式調用時才會注入。
這意味着什麼?可預測性極強。你知道 AI 在用哪個 skill,你知道它看到了什麼指令。沒有"AI 自己偷偷加載了一堆東西"的黑箱感。
技能目錄也分得很細:repo 級、用戶級、系統級,有明確的覆蓋優先級。團隊協作時,你可以在 repo 裏放通用 skill,個人有自己的增強,系統級兜底。
———
IV — Google Antigravity:平台化的自動分工
Google 的 Antigravity 是今年剛出的"Agentic IDE",走的是另一條路。
Sub-agent:系統內置分工
Antigravity 有 sub-agent,但不是你能自由配置的那種。
它的設計更像"系統自動幫你分工":
Web research 的任務自動交給 Browser Subagent 命令行操作自動交給 Terminal Subagent 主模型專注高層推理,具體執行由專用模塊負責
官方叫它 "Manager surface 可以 spawn/orchestrate 多 agents"。聽起來很強,但這裏有個關鍵限制:用戶自定義能力不如 Claude Code 和 Codex 明確。
在 Google AI 開發者論壇裏,有人明確問"能不能自建 sub-agent,用不同模型、不同 skill"。目前的答案是:公開材料裏沒看到這種支持。
如果你要的是"開箱即用的自動分工",Antigravity 不錯。如果你要的是"精細控制每個 sub-agent 的權限和行為",可能還得等。
Skill:解決上下文膨脹
Antigravity 的 skill 設計理念很清晰:解決 Context Saturation(上下文飽和)和 Tool Bloat(工具膨脹)。
它用"菜單元數據 + 按需加載"的方式,把工作流做成可插拔模塊。你需要的時候加載,不需要的時候不佔空間。
但相比 Codex 那種"顯式/隱式雙模式",Antigravity 更偏隱式和平台化。你沒有那麼多手動控制的選項。
安全性爭議
值得一提的是,Antigravity 的安全性已經被報道過一些問題——比如終端自動執行、提示注入風險。這會直接影響 sub-agent 的默認權限策略。
如果你的場景對安全敏感,這是要考慮的。
———
V — Cursor:方向對,但還在早測
Cursor 是四個裏面最特殊的。
它確實有 subagents 和 skills 的概念,文檔頁面也寫了。但打開一看:僅 Nightly 渠道可用,功能可能不完整且會變化。
社區論壇裏有人問"怎麼在 skills 裏用 subagent",回覆是"還在早期測試"。
這不是批評。Cursor 的產品方向明顯在跟進 Claude Code 和 Codex 的能力——它甚至被傳可以"從 Claude Code 和 Codex 導入 skills/sub-agents"。
但現階段,如果你要的是穩定可預期的 sub-agent/skill 體系,Cursor 不是首選。它更適合那些願意踩坑、願意跟着 Nightly 迭代的人。
Cursor 的優勢是:作為 IDE,它的集成體驗可能最流暢。等 subagents 和 skills 穩定後,它在"開發者日常使用"這個場景可能會很強。
但那是以後的事。
———
VI — 怎麼選
說了這麼多,給你一個決策框架。
如果你最在意"sub-agent 能不能強隔離、能不能精細控制權限"
選 Claude Code。
它的 sub-agent 是真正的一等公民。內置的 Explore 只讀模式是硬隔離,不是靠 prompt 約束。你可以自定義 sub-agent 的權限、工具、甚至模型。
適合場景:代碼審查、安全分析、需要"AI 只能看不能動"的任務。
如果你最在意"多代理協作過程可審計、可追溯"
選 OpenAI Codex(SDK 層)。
它的 trace 機制是四個裏面最強的。每次 prompt、工具調用、handoff 都有記錄,你可以回放整個協作過程。
適合場景:企業級使用、需要合規審計、團隊協作需要覆盤。
如果你最在意"skill 可以顯式點名調用、可預測性強"
還是 Codex。
它是唯一一個把"顯式 $skill 調用"和"隱式自動匹配"都做得很完整的。默認不注入正文、只有顯式調用才加載指令的設計,讓你完全知道 AI 在用什麼。
適合場景:需要精確控制 AI 行為、不想有"黑箱感"的人。
如果你想"開箱即用,不想配置太多,讓系統自動分工"
看看 Antigravity。
它的 sub-agent 是系統內置的自動分工,你不用自己編排。Skill 也是按需加載,不用操心上下文膨脹。
適合場景:想要"託管式"體驗、不想深度配置的人。但要注意安全問題。
如果你是 Cursor 重度用戶,願意等
繼續用 Cursor,關注 Nightly 更新。它的方向是對的,只是還沒穩定。等 subagents 和 skills 成熟後,作為 IDE 的集成體驗可能會最好。
———
VII — 最後說幾句
Sub-agent 和 skill 不是什麼高深的概念。它們就是"讓 AI 有分工"和"讓 AI 有技能庫"。
但大多數人不用這些東西,因為他們還在用 AI 聊天。
真正會用 AI Coding 的人,是在設計系統。他們在想:這個任務應該拆成幾個 sub-agent?每個 agent 應該有什麼權限?哪些能力應該抽成 skill 複用?
這才是 AI 編程的正確打開方式。
你可以繼續和 AI 聊天。但如果你想真正提效 10 倍,你得開始編排。
四個工具各有側重。Claude Code 最產品化,Codex 最工程化,Antigravity 最自動化,Cursor 最有潛力但還在路上。
選一個,開始搭你的第一個 sub-agent 和 skill 方案。
別隻是聊天了。
———
如果這篇文章對你有幫助,可以分享給同樣在用 AI Coding 的朋友。
如果你有問題或者想聊具體的配置方案,歡迎留言。
