裝了Superpowers還是不會用？這套完整工作流，讓你的AI從"工具"變成"搭檔"

作者：AI智聞說

日期：2026年5月12日上午7:41

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Superpowers 14個Skill唔係獨立工具，而係一條從需求到合併嘅開發流水線，防止AI偷懶走捷徑。

整理版摘要

呢篇文章係由一位熟悉Superpowers嘅開發者寫嘅，佢發現大部分人裝咗Superpowers之後，只用到入面10%嘅能力，問題在於唔知道點樣將14個Skill串連成一條完整嘅開發流水線。作者想幫讀者解決嘅問題係：點樣由「直接叫AI做嘢」變成「AI自動行完整個開發流程」。

整體結論係Superpowers嘅本質唔係14個獨立工具，而係一套防止AI偷懶嘅流水線：每個環節都係為咗確保方向正確、測試先行同埋驗證完成。你唔需要一次過記住所有Skill，只要記住三條鐵律就搞得掂：冇設計唔寫code、冇測試唔寫code、冇驗證唔講完成。

文章用一個真實嘅「加用戶註冊功能」案例，由brainstorming到合併PR，一步步示範點樣用流水線開發。作者特別強調，唔好直接同AI講「寫個功能」，而係要先出設計、拆任務、隔離工作空間、派獨立代理執行，最後再雙重審查先收尾。呢啲步驟加埋，先可以令AI真係變咗你嘅「拍檔」，而唔係一個亂寫code嘅工具。

Superpowers嘅14個Skill按階段分工，每個Skill嘅輸出就係下一個Skill嘅輸入，形成一條完整嘅開發流水線。
brainstorming防止你做錯方向：任何需求都要先出設計，你批准先可以寫code，就算得5分鐘嘅功能都要有設計。
writing-plans將設計拆成2-5分鐘嘅小任務，每個任務由獨立代理執行，避免上下文污染，計劃要寫到連陌生人都睇得明。
TDD鐵律：先寫失敗測試，再寫最小實現，唔可以跳過任何一步，連簡單code都要有測試。
verification要求新鮮證據：聲稱完成之前一定要跑驗證命令，唔可以講「應該冇問題」，上次跑過嘅結果唔算數。

值得記低

流程

Superpowers開發流水線

由brainstorming開始，經writing-plans、using-git-worktrees、subagent-driven-development（內含TDD）、requesting-code-review、receiving-code-review、verification-before-completion、finishing-a-development-branch，最後合併或開PR。

Prompt

驗證Superpowers是否生效嘅3個測試

1. 話「幫我規劃一個功能」，AI應該問問題唔係直接寫code。 2. 話「加個登錄功能」，AI應該先寫失敗測試。 3. 話「呢個bug幫我修一下」，AI應該先問根因。

整理重點

14個Skill一條流水線

Superpowers唔係14個獨立工具，而係一套有先後順序嘅開發流水線。每個階段都有對應嘅Skill，由入口檢查、設計、規劃、隔離、執行、測試、調試、審查、並行、驗證到收尾，一氣呵成。

關鍵洞察：每個Skill嘅輸出係下一個Skill嘅輸入

你唔需要記14個Skill，只要記住呢條流水線就可以。

1 入口：using-superpowers — 檢查應該用邊個Skill
2 設計：brainstorming — 唔好急住寫code，先問清楚需求
3 規劃：writing-plans — 將需求拆成2-5分鐘嘅小步驟
4 隔離：using-git-worktrees — 創建獨立工作空間
5 執行：subagent-driven-development — 每個任務派一個新代理
6 實現：executing-plans — 冇子代理時自己按計劃執行
7 測試：test-driven-development — 先寫失敗測試再寫最小實現
8 調試：systematic-debugging — 先揾根因再修bug

整理重點

實戰：由需求到上線7步走

用一個真實場景——加用戶註冊功能——行一次完整流程。

1 brainstorming：先探索項目上下文，逐個提問，提出2-3個方案，你揀完方案後出設計文檔。鐵律係無論需求幾簡單，都要先出設計你批准先寫得code。
2 writing-plans：將設計拆成2-5分鐘嘅小任務，每個任務有精確路徑同命令，寫畀一個對項目一無所知嘅人睇。
3 using-git-worktrees：自動創建隔離git工作空間，搞砸咗直接delete就得，主分支完全唔受影響。
4 subagent-driven-development：每個任務派一個全新代理實現，跟住派兩個審查代理（規格合規＋代碼質量），兩個都通過先算完成。
5 test-driven-development：每個實現代理內部行RED→GREEN→REFACTOR循環，唔可以跳過測試，唔可以「先寫code再補測試」。
6 requesting-code-review + receiving-code-review：第一輪派全新代理審查code變更，第二輪你驗證審查意見係咪正確，可以反駁唔合理嘅建議。
7 verification-before-completion + finishing-a-development-branch：跑驗證命令畀新鮮證據，然後揀合併、PR、保留或丟棄。

鐵律：冇驗證唔講完成，上次跑過嘅測試結果唔算數

整理重點

三條鐵律，記住就夠

14個Skill太多記唔住？記住呢三條鐵律，覆蓋80%嘅場景。

鐵律2：冇測試唔寫code — 先寫失敗測試，再寫最小實現。違反後果係寫咗一堆code，唔知啱唔啱，改一處壞三處。
鐵律3：冇驗證唔講完成 — 聲稱完成前，必須跑驗證命令並畀證據。違反後果係「應該冇問題」上線後出bug。

鐵律唔係限制你，係限制AI偷懶嘅傾向

整理重點

調試、並行同寫Skill

systematic-debugging係獨立於開發流水線嘅流程，任何階段遇到bug都可以觸發。

1 根因調查：讀錯誤信息、復現問題、查最近變更、追蹤數據流。
2 模式分析：揾正常code對比差異。
3 假設驗證：提出一個假設，最小改動驗證，一次只改一個變量。
4 實施修復：先寫失敗測試，修復根因，驗證通過。

最常見嘅反模式：「我試試改呢個睇嚇得唔得」——呢啲唔係調試，係靠估

並行方面，dispatching-parallel-agents可以同時處理唔相關嘅bug或者獨立任務，但絕對唔可以改同一個文件。寫自己嘅Skill都要行TDD：先諗壓力場景，唔帶Skill跑一次，記錄AI嘅「自然表現」同「藉口」，再針對藉口寫規則，循環直到防彈。

description只寫「幾時用」，唔好寫流程摘要，否則AI會自以為是

安裝Superpowers bash

# Claude Code安裝
/plugin marketplace add obra/superpowers-marketplace/plugin install superpowers@superpowers-marketplace

# 驗證安裝成功
# 重啟後講「幫我規劃一個功能」
# 如果AI開始問問題而不是直接寫code，說明brainstorming生效咗

自定義Skill可以放喺個人級~/.claude/skills/或者項目級.claude/skills/，驗證生效可以用三個測試。

整理重點

邊界同總結

Superpowers唔適合一次性腳本、探索性原型、緊急hotfix同一個人維護嘅小項目。最適合團隊協作、長期維護同複雜功能開發。

核心判斷標準：code要活幾耐？活一日嘅腳本唔需要，活一年嘅項目好需要

簡單需求可以直接做，不過verification都要有。正式需求就行完整流水線：brainstorming → writing-plans → using-git-worktrees → 每個任務循環（派代理 → 代理內部TDD → 審查請求 → 審查接收） → verification → finishing。

90%嘅人裝咗Superpowers但係只用咗10%嘅能力，問題在於唔知點樣串埋一齊

寫喺前面

你可能已經裝咗Superpowers。

但係老實講，你大概只係觸發咗其中一兩個Skill——寫代碼嗰陣偶然觸發TDD，調試嗰陣偶然觸發systematic-debugging，大部份時間仲係「直接叫AI做嘢」。

呢個唔係你嘅問題。Superpowers有14個Skill，每個都寫得好詳細，但係冇人話你知佢哋點樣串成一條完整嘅開發流水線。

今日呢篇文章，我由入門到實戰，完整講清楚一件事：由你提需求到代碼合入主分支，Superpowers嘅14個Skill點樣一步步接管你嘅開發流程。

睇完呢篇，你就會明點解有人話「Superpowers令AI自主工作幾粒鐘」——唔係吹水，係流程啱咗。

一、先睇全貌：14個Skill點樣分工

Superpowers唔係14個獨立嘅工具，係一套有先後次序嘅開發流水線：

階段	Skill	一句講曬職責	鐵律
入口	using-superpowers	檢查應該用邊個Skill	得1%可能會觸發
設計	brainstorming	唔好急住寫代碼，先問清楚需求	冇設計唔寫代碼
規劃	writing-plans	將需求拆成2-5分鐘嘅細步驟	計劃係寫俾零上下文嘅人睇
隔離	using-git-worktrees	建立隔離嘅工作空間	唔喺主分支上面開發
執行	subagent-driven-development	每個任務派一個新代理	代理唔會繼承歷史
實現	executing-plans	冇子代理嗰陣自己按計劃執行	唔跳過驗證步驟
測試	test-driven-development	先寫失敗測試，再寫最細實現	冇失敗測試唔寫代碼
調試	systematic-debugging	先揾根因，再修bug	冇揾到根因唔提方案
審查請求	requesting-code-review	派獨立代理審查代碼	完成任務一定要審查
審查接收	receiving-code-review	驗證審查意見先實施	唔好盲從審查意見
並行	dispatching-parallel-agents	獨立問題同時派多個代理	唔俾代理改同一檔案
驗證	verification-before-completion	聲稱完成之前一定要跑驗證	冇跑命令唔準話「搞掂咗」
收尾	finishing-a-development-branch	驗證、合併、清理	測試唔過唔合併
元技能	writing-skills	用TDD方法寫新Skill	冇壓力測試唔寫Skill

關鍵洞察：每個Skill嘅輸出係下一個Skill嘅輸入。 你唔需要記住14個Skill，只需要記住呢條流水線。

二、完整實戰：由需求到上線嘅7步走

我用一個真實場景行一次完整流程：幫一個項目加用戶註冊功能。

第1步：brainstorming — 唔好咁急

你話「幫我加個用戶註冊功能」，Superpowers唔會直接寫代碼。佢會先行brainstorming：

探索項目上下文 — 睇你現有代碼、文檔、最近嘅提交

逐個提問 — 「註冊需唔需要電郵驗證？」「需唔需要第三方登入？」「密碼策略係咩？」

提出2-3個方案 — 例如方案A：電郵+密碼註冊；方案B：手機驗證碼註冊；方案C：第三方OAuth

你揀咗方案之後，出設計文檔 — 保存到 docs/superpowers/specs/

大部份人嘅錯誤： 直接同AI講「寫個註冊功能」，AI寫完你發現冇考慮電郵驗證、冇考慮密碼強度、冇考慮重複註冊。brainstorming就係防止呢種「做錯方向」嘅問題。

鐵律： 無論需求幾簡單，都一定要先出設計、你批准先可以寫代碼。一個5分鐘就寫得完嘅功能，設計可能只要3句話——但係一定要有。

第2步：writing-plans — 拆到2分鐘一個任務

設計批准之後，自動進入writing-plans。呢一步將設計拆成2-5分鐘就搞得掂嘅小任務：

## 任務1：創建用戶模型
- [ ] 寫失敗測試：用戶創建需要郵箱和密碼
- [ ] 運行測試，確認失敗
- [ ] 實現User模型最小代碼
- [ ] 運行測試，確認通過
- [ ] 提交

## 任務2：添加郵箱唯一性驗證
- [ ] 寫失敗測試：重複郵箱註冊返回錯誤
- [ ] 運行測試，確認失敗
- [ ] 添加唯一性約束
- [ ] 運行測試，確認通過
- [ ] 提交

## 任務3：密碼加密
...

點解要拆到咁細？ 因為每個任務會派俾一個獨立嘅AI代理執行。任務越細，代理越唔容易出錯，審查亦越容易。

計劃係寫俾邊個睇？ 寫俾「一個技術好叻但係對項目一無所知嘅人」——所以要包含完整代碼、精確檔案路徑、具體命令。唔可以寫「加驗證」，要寫「喺 src/models/user.ts 第15行之後加 validates :email, uniqueness: true"。

第3步：using-git-worktrees — 隔離工作空間

執行計劃之前，先建立一個隔離嘅git工作空間：

# 自動創建隔離分支
git worktree add .worktrees/user-registration feature/user-registration
cd .worktrees/user-registration
npm install  # 自動檢測並安裝依賴
npm test     # 驗證基線測試通過

點解唔喺主分支上面開發？ 因為如果搞衰咗，直接刪咗worktree就得，主分支完全唔受影響。呢個就好似手術前嘅消毒——唔消毒多數都冇事，但係出事就大件事。

第4步：subagent-driven-development — 代理流水線

呢個係Superpowers最核心嘅執行引擎。每個任務行呢個循環：

派代理A實現（全新上下文，唔繼承歷史）

派代理B審查規格合規性（代碼做咗應該做嘅嘢未？）

派代理C審查代碼質素（代碼寫得好唔好？）

兩個審查都通過，任務完成

下一個任務，重複1-4

點解每個任務要派新代理？ 因為AI嘅上下文窗口係有限嘅。如果你喺一個對話入面做10個任務，到第5個任務嗰陣AI已經「唔記得」前面嘅細節。新代理 = 乾淨嘅上下文 = 更少嘅錯誤。

點解唔並行派實現代理？ 因為多個代理同時改同一個代碼庫會撞。實現係串行嘅，審查就可以並行。

模型揀選策略：

角色	推薦模型	原因
實現代理	Haiku/Sonnet	機械性工作，成本優先
規格審查	Sonnet	需要理解需求
代碼質素審查	Opus	需要深度判斷
調試代理	Opus	需要最強推理

第5步：test-driven-development — 每個代理內部嘅鐵律

每個實現代理內部，一定要跟TDD循環：

RED：寫一個失敗測試，執行，確認失敗

GREEN：寫最細代碼令測試通過，執行，確認通過

REFACTOR：重構，保持測試通過，執行，確認通過

重複

Superpowers嘅TDD比普通TDD更加嚴格：

•

「呢個功能太簡單唔需要測試」 → 唔得，簡單代碼都需要測試

•

「我寫完代碼先補測試」 → 唔得，先寫測試同後寫測試係兩回事

•

「我先寫個參考實現」 → 唔得，刪咗佢重新嚟過

•

「我只係想睇下API點用」 → 唔得，睇文檔，唔寫代碼

點解要咁嚴格？ 因為AI係最容易「先寫代碼再補測試」嘅。一旦開咗個口，AI就會100%走捷徑。鐵律唔係限制你，係限制AI嘅偷懶傾向。

第6步：requesting-code-review + receiving-code-review — 雙重審查

代碼寫完之後，行兩輪審查：

第一輪：請求審查（requesting-code-review）

•

派一個全新嘅審查代理，俾佢精確嘅上下文（唔係你嘅對話歷史）

•

審查代理淨係睇代碼變更，唔睇你嘅思考過程

•

按嚴重程度分級：Critical（一定要改）、Important（應該改）、Minor（記低先）

第二輪：接收審查（receiving-code-review）

•

呢一步最容易被忽略：唔係審查話改咩就改咩

•

Superpowers要求你先驗證審查意見係咪正確

•

如果審查建議會破壞現有功能，要反駁

•

如果審查建議違反YAGNI原則（You Aren't Gonna Need It），要反駁

•

修復次序：Critical → Important → Minor，每個修完單獨測試

審查嘅黃金法則： 技術正確性 > 社交舒適度。唔可以因為審查者「講得有道理」就盲從——要自己驗證。

第7步：verification-before-completion + finishing-a-development-branch — 收尾

驗證鐵律： 冇跑過命令，唔準話「搞掂咗」.

錯誤示範： 「代碼改完啦，應該冇問題㗎」
正確示範： "運行 npm test，32個測試全部通過，0個失敗」

Superpowers要求你提供新鮮嘅證據——上一次執行嘅測試結果唔算數，一定要係當前訊息中執行嘅。

驗證通過之後，finishing-a-development-branch俾你4個選擇：

本地合併到主分支

推送並建立PR

保留分支唔鬱

丟棄所有更改

每個選項都有對應嘅安全檢查——測試唔過唔可以合併，丟棄更改需要你輸入「discard」確認。

三、3條鐵律，記住就夠

14個Skill太多記唔曬？記住呢3條鐵律，覆蓋80%嘅場景：

鐵律1：冇設計唔寫代碼（brainstorming）

無論需求幾簡單，先出設計先動手。設計可以好短，但係一定要有。

違反後果： 做錯方向，返工3次。

觸發時機： 你話「幫我做XX」嗰陣，AI應該先問清楚，而唔係直接寫代碼。

鐵律2：冇測試唔寫代碼（TDD）

先寫失敗測試，再寫最細實現。

違反後果： 寫咗一大堆代碼，唔知啱唔啱，改一處壞三處。

觸發時機： 任何寫代碼嘅時候——新功能、修bug、重構。

鐵律3：冇驗證唔講完成（verification）

聲稱完成之前，一定要跑驗證命令並俾出證據。

違反後果： 「應該冇問題㗎」上線之後出bug。

觸發時機： 你話「搞掂啦」「應該得啦」「測試通過咗」嗰陣——AI一定要跑一次驗證。

四、調試：Superpowers點樣幫你修Bug

調試係獨立於開發流水線嘅流程，任何階段遇到bug都可以觸發：

根因調查：讀錯誤訊息、重現問題、查最近變更、追蹤數據流

模式分析：揾正常代碼、對比差異

假設驗證：提一個假設、最細改動驗證、一次只改一個變量

實施修復：先寫失敗測試、修復根因、驗證通過

最常見嘅反模式： 「我試下改呢個睇下得唔得」——呢個唔係調試，係靠估。

Superpowers嘅3次規則： 如果你連續3次修復都失敗，即係問題可能喺架構層面。停低，同人討論，而唔係繼續估。

幾時最應該用systematic-debugging？ 唔係得閒嗰陣，係最急嗰陣。因為越急就越容易靠估，越靠估就越浪費時間。系統調試15-30分鐘搞得掂嘅問題，靠估改可能要2-3個鐘。

五、並行：邊啲任務可以同時做

dispatching-parallel-agents令多個代理同時處理獨立問題：

適合並行嘅場景：

•

3個唔相關嘅bug要修

•

前端同後端嘅獨立任務

•

多個檔案嘅獨立重構

絕對唔可以並行嘅場景：

•

代理會改同一個檔案

•

一個問題嘅修復可能會影響另一個

•

你仲未確定問題喺邊（探索階段）

關鍵原則： 每個代理拎到嘅係精心構造嘅上下文，唔係你完整嘅對話歷史。你似項目經理咁分配任務、收集結果、處理衝突。

六、寫自己嘅Skill：用TDD方法

writing-skills話你知：寫Skill都要TDD。

RED： 先諗3個「壓力場景」——AI最容易犯錯嘅場景。唔帶Skill行一次，記錄AI嘅「自然表現」同「藉口」

GREEN： 針對嗰啲藉口寫Skill，再行一次，睇下AI係咪跟足

REFACTOR： 測試中AI又揾到新藉口？加反藉口規則，循環直到「防彈」

最重要嘅陷阱：description寫咗做摘要。

# 致命錯誤：描述變成了流程摘要
description: 在任務之間做代碼審查，確保質量

# 正確：只寫觸發條件
description: Use when completing a coding task, before marking it done

點解？因為AI讀到摘要就好可能「自以為明咗」，唔去讀Skill正文。description只寫「幾時用」，流程寫喺Skill入面。

七、大部份人唔知嘅5個細節

細節1：brainstorming會自動串聯writing-plans

設計一旦批准，brainstorming會自動叫writing-plans。你唔需要手動切換。呢個係14個Skill之間最核心嘅串聯關係。

細節2：subagent-driven-development嘅代理唔繼承歷史

每個代理拎到嘅上下文係你精心構造嘅，唔係你完整嘅對話。呢個意味住：

•

代理唔會「記住」你之前講嘅題外話

•

但係亦都意味住你一定要俾足夠嘅上下文俾代理

•

計劃寫得越詳細，代理執行得越好

細節3：receiving-code-review鼓勵你反駁

審查意見唔係聖旨。Superpowers清楚列出咗邊啲情況應該反駁：

•

建議會破壞現有功能

•

審查者唔瞭解完整上下文

•

建議違反YAGNI原則

•

建議喺技術上唔正確

細節4：verification-before-completion嘅「新鮮證據」要求

「我上次跑咗測試通過咗」唔算數。一定要係當前訊息入面執行嘅驗證結果。因為代碼可能喺你上次驗證之後又改過。

細節5：writing-plans嘅計劃係俾「陌生人」睇嘅

計劃一定要包含完整代碼、精確檔案路徑、具體命令。唔可以寫「加驗證」，要寫「喺 src/models/user.ts 第15行之後加 validates :email, uniqueness: true」。因為執行計劃嘅代理對你個項目一無所知。

八、由零開始：5分鐘配置Superpowers

# Claude Code安裝
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace

# 驗證安裝成功
# 重啓後說"幫我規劃一個功能"
# 如果AI開始問問題而不是直接寫代碼，說明brainstorming生效了

自訂Skill放邊度：

# 個人級（所有項目可用）
~/.claude/skills/my-skill/SKILL.md

# 項目級（團隊共享，提交到git）
.claude/skills/my-skill/SKILL.md

驗證Skill係咪生效嘅3個測試：

話「幫我規劃一個功能」，AI應該先問問題，而唔係直接寫代碼

話「加個登錄功能」，AI應該先寫失敗測試，而唔係直接寫實現

話「呢個bug幫我搞搞佢」，AI應該先問根因，而唔係直接改代碼

如果3個都冇按預期觸發，檢查嚇Skill嘅description係咪寫好咗觸發短語。

九、Superpowers唔適合咩場景

任何工具都有邊界，老實講：

唔適合嘅場景：

•

一次性腳本（寫完就掉嗰啲，TDD反而浪費時間）

•

探索性原型（你仲未確定要做咩，brainstorming會卡住）

•

緊急hotfix（先止血再補流程）

•

一個人維護嘅細 project（流程開銷可能大過收益）

最適合嘅場景：

•

團隊協作嘅 project（流程保證一致性）

•

長期維護嘅 project（測試同審查嘅投資回報高）

•

複雜功能開發（設計階段防止行錯方向）

•

AI輔助編程（流程彌補AI嘅偷懶傾向）

核心判斷標準： 代碼要生存幾耐？生存1日嘅腳本唔需要Superpowers，生存1年嘅 project就好需要。

十、一張圖總結

簡單需求： 直接做，但係verification（驗證）都要有

正式需求，行流水線：

brainstorming：問清楚需求，出設計，你批准

writing-plans：拆成2-5分鐘任務

using-git-worktrees：建立隔離空間

每個任務循環：subagent-driven-development（派代理實現，代理內部行TDD：RED→GREEN→REFACTOR）→ requesting-code-review（獨立審查）→ receiving-code-review（驗證後實施）

verification-before-completion：跑驗證，俾證據

finishing-a-development-branch：合併或者PR

Superpowers嘅本質唔係14個獨立工具，係一條防止AI偷懶嘅流水線。 每個環節都喺度防止AI走捷徑：brainstorming防止做錯方向，TDD防止跳過測試，code-review防止自說自話，verification防止假完成。

你唔需要一次過用曬所有Skill。由3條鐵律開始：冇設計唔寫代碼，冇測試唔寫代碼，冇驗證唔講完成。等呢3條變成習慣，再加其他Skill。

掃碼關注「AI智聞說」，每日3分鐘掌握AI新知識

90%的人裝完Superpowers只用到了10%的能力，問題出在不知道怎麼串起來

寫在前面

你可能已經裝了Superpowers。

但說實話，你大概率只觸發了其中一兩個Skill——寫代碼時偶爾觸發TDD，調試時偶爾觸發systematic-debugging，大部分時間還是"直接讓AI幹活"。

這不是你的問題。Superpowers有14個Skill，每個都寫得很詳細，但沒有人告訴你它們怎麼串成一條完整的開發流水線。

今天這篇文章，我從入門到實戰，完整講清楚一件事：從你提需求到代碼合入主分支，Superpowers的14個Skill怎麼一步步接管你的開發流程。

看完這篇，你會知道為什麼有人說"Superpowers讓AI自主工作幾小時"——不是吹牛，是流程對了。

一、先看全貌：14個Skill怎麼分工

Superpowers不是14個獨立的工具，是一套有先後順序的開發流水線：

階段	Skill	一句話職責	鐵律
入口	using-superpowers	檢查該用哪個Skill	1%可能就觸發
設計	brainstorming	不急着寫代碼，先問清楚需求	沒設計不寫代碼
規劃	writing-plans	把需求拆成2-5分鐘的小步驟	計劃寫給零上下文的人看
隔離	using-git-worktrees	創建隔離的工作空間	不在主分支上開發
執行	subagent-driven-development	每個任務派一個新代理	代理不繼承歷史
實現	executing-plans	無子代理時自己按計劃執行	不跳過驗證步驟
測試	test-driven-development	先寫失敗測試，再寫最小實現	沒有失敗測試不寫代碼
調試	systematic-debugging	先找根因，再修bug	沒找到根因不提方案
審查請求	requesting-code-review	派獨立代理審查代碼	完成任務必須審查
審查接收	receiving-code-review	驗證審查意見再實施	不盲從審查意見
並行	dispatching-parallel-agents	獨立問題同時派多個代理	不讓代理改同一文件
驗證	verification-before-completion	聲稱完成前必須跑驗證	沒跑命令不能說"搞定了"
收尾	finishing-a-development-branch	驗證、合併、清理	測試不過不合並
元技能	writing-skills	用TDD方法寫新Skill	沒壓測不寫Skill

關鍵洞察：每個Skill的輸出是下一個Skill的輸入。 你不需要記住14個Skill，只需要記住這條流水線。

二、完整實戰：從需求到上線的7步走

我用一個真實場景走一遍完整流程：給一個項目添加用戶註冊功能。

第1步：brainstorming — 別急着動手

你說"幫我加個用戶註冊功能"，Superpowers不會直接寫代碼。它先走brainstorming：

探索項目上下文 — 看你現有代碼、文檔、最近的提交

逐個提問 — "註冊需要郵箱驗證嗎？""需要第三方登錄嗎？""密碼策略是什麼？"

提出2-3個方案 — 比如方案A：郵箱+密碼註冊；方案B：手機驗證碼註冊；方案C：第三方OAuth

你選方案後，出設計文檔 — 保存到 docs/superpowers/specs/

大多數人的錯誤： 直接跟AI說"寫個註冊功能"，AI寫完你發現沒考慮郵箱驗證、沒考慮密碼強度、沒考慮重複註冊。brainstorming就是防止這種"做錯方向"的問題。

鐵律： 不管需求多簡單，都必須先出設計、你批准後才能寫代碼。一個5分鐘能寫完的功能，設計可能只要3句話——但必須有。

第2步：writing-plans — 拆到2分鐘一個任務

設計批准後，自動進入writing-plans。這一步把設計拆成2-5分鐘就能完成的小任務：

## 任務1：創建用戶模型
- [ ] 寫失敗測試：用戶創建需要郵箱和密碼
- [ ] 運行測試，確認失敗
- [ ] 實現User模型最小代碼
- [ ] 運行測試，確認通過
- [ ] 提交

## 任務2：添加郵箱唯一性驗證
- [ ] 寫失敗測試：重複郵箱註冊返回錯誤
- [ ] 運行測試，確認失敗
- [ ] 添加唯一性約束
- [ ] 運行測試，確認通過
- [ ] 提交

## 任務3：密碼加密
...

為什麼拆這麼細？ 因為每個任務會派給一個獨立的AI代理執行。任務越小，代理越不容易出錯，審查越容易。

計劃寫給誰看的？ 寫給"一個技術很強但對項目一無所知的人"——所以必須包含完整代碼、精確文件路徑、具體命令。不能寫"添加驗證"，要寫"在 src/models/user.ts 第15行後添加 validates :email, uniqueness: true"。

第3步：using-git-worktrees — 隔離工作空間

執行計劃前，先創建一個隔離的git工作空間：

# 自動創建隔離分支
git worktree add .worktrees/user-registration feature/user-registration
cd .worktrees/user-registration
npm install  # 自動檢測並安裝依賴
npm test     # 驗證基線測試通過

為什麼不在主分支上開發？ 因為如果搞砸了，直接刪掉worktree就行，主分支完全不受影響。這就像手術前的消毒——不消毒大概率也沒事，但出事就是大事故。

第4步：subagent-driven-development — 代理流水線

這是Superpowers最核心的執行引擎。每個任務走這個循環：

派代理A實現（全新上下文，不繼承歷史）

派代理B審查規格合規性（代碼做了該做的事嗎？）

派代理C審查代碼質量（代碼寫得好嗎？）

兩個審查都通過，任務完成

下一個任務，重複1-4

為什麼每個任務派新代理？ 因為AI的上下文窗口是有限的。如果你在一個對話裏幹10個任務，到第5個任務時AI已經"忘了"前面的細節。新代理 = 乾淨的上下文 = 更少的錯誤。

為什麼不併行派實現代理？ 因為多個代理同時改同一個代碼庫會衝突。實現是串行的，審查可以並行。

模型選擇策略：

角色	推薦模型	原因
實現代理	Haiku/Sonnet	機械性工作，成本優先
規格審查	Sonnet	需要理解需求
代碼質量審查	Opus	需要深度判斷
調試代理	Opus	需要最強推理

第5步：test-driven-development — 每個代理內部的鐵律

每個實現代理內部，必須遵循TDD循環：

RED：寫一個失敗測試，運行，確認失敗

GREEN：寫最小代碼讓測試通過，運行，確認通過

REFACTOR：重構，保持測試通過，運行，確認通過

重複

Superpowers的TDD比普通TDD更嚴格：

•

"這個功能太簡單不需要測試" → 不行，簡單代碼也需要測試

•

"我先寫完代碼再補測試" → 不行，先寫測試和後寫測試是兩回事

•

"我先寫個參考實現" → 不行，刪掉重來

•

"我只是想看看API怎麼用" → 不行，看文檔，不寫代碼

為什麼這麼嚴？ 因為AI是最容易"先寫代碼再補測試"的。一旦開了口子，AI會100%走捷徑。鐵律不是限制你，是限制AI的偷懶傾向。

第6步：requesting-code-review + receiving-code-review — 雙重審查

代碼寫完後，走兩輪審查：

第一輪：請求審查（requesting-code-review）

•

派一個全新的審查代理，給它精確的上下文（不是你的對話歷史）

•

審查代理只看代碼變更，不看你的思考過程

•

按嚴重度分級：Critical（必須修）、Important（應該修）、Minor（記下來）

第二輪：接收審查（receiving-code-review）

•

這一步最容易被忽視：不是審查說什麼就改什麼

•

Superpowers要求你先驗證審查意見是否正確

•

如果審查建議會破壞現有功能，要反駁

•

如果審查建議違反YAGNI原則（你不會需要它），要反駁

•

修復順序：Critical → Important → Minor，每個修完單獨測試

審查的黃金法則： 技術正確性 > 社交舒適度。不能因為審查者"說得有道理"就盲從——要自己驗證。

第7步：verification-before-completion + finishing-a-development-branch — 收尾

驗證鐵律： 沒跑過命令，不能說"搞定了"。

錯誤示範： "代碼改完了，應該沒問題"
正確示範： "運行 npm test，32個測試全部通過，0個失敗"

Superpowers要求你提供新鮮的證據——上一次運行的測試結果不算，必須是當前消息中運行的。

驗證通過後，finishing-a-development-branch給你4個選項：

本地合併到主分支

推送並創建PR

保留分支不動

丟棄所有更改

每個選項都有對應的安全檢查——測試不過不能合併，丟棄更改需要你輸入"discard"確認。

三、3條鐵律，記住就夠了

14個Skill太多記不住？記住這3條鐵律，覆蓋80%的場景：

鐵律1：沒設計不寫代碼（brainstorming）

不管需求多簡單，先出設計再動手。設計可以很短，但必須有。

違反後果： 做錯方向，返工3次。

觸發時機： 你說"幫我做XX"的時候，AI應該先問清楚，而不是直接寫代碼。

鐵律2：沒測試不寫代碼（TDD）

先寫失敗測試，再寫最小實現。

違反後果： 寫了一堆代碼，不知道對不對，改一處壞三處。

觸發時機： 任何寫代碼的時刻——新功能、修bug、重構。

鐵律3：沒驗證不說完成（verification）

聲稱完成之前，必須跑驗證命令並給出證據。

違反後果： "應該沒問題"上線後出bug。

觸發時機： 你說"搞定了""應該可以了""測試通過了"的時候——AI必須跑一遍驗證。

四、調試：Superpowers怎麼幫你修Bug

調試是獨立於開發流水線的流程，任何階段遇到bug都可以觸發：

根因調查：讀錯誤信息、復現問題、查最近變更、追蹤數據流

模式分析：找正常代碼、對比差異

假設驗證：提一個假設、最小改動驗證、一次只改一個變量

實施修復：先寫失敗測試、修復根因、驗證通過

最常見的反模式： "我試試改這個看行不行"——這不是調試，這是猜。

Superpowers的3次規則： 如果你連續3次修復都失敗，說明問題可能在架構層面。停下來，和人討論，而不是繼續猜。

什麼時候最該用systematic-debugging？ 不是閒的時候，是最急的時候。因為越急越容易猜，越猜越浪費時間。系統調試15-30分鐘搞定的問題，猜着改可能要2-3小時。

五、並行：哪些任務可以同時幹

dispatching-parallel-agents讓多個代理同時處理獨立問題：

適合並行的場景：

•

3個不相關的bug需要修

•

前端和後端的獨立任務

•

多個文件的獨立重構

絕對不能並行的場景：

•

代理會改同一個文件

•

一個問題的修復可能影響另一個

•

你還不確定問題出在哪（探索階段）

關鍵原則： 每個代理拿到的是精心構造的上下文，不是你的完整對話歷史。你像項目經理一樣分配任務、收集結果、處理衝突。

六、寫自己的Skill：用TDD方法

writing-skills告訴你：寫Skill也要TDD。

RED： 先想3個"壓力場景"——AI最容易犯錯的場景。不帶Skill跑一遍，記錄AI的"自然表現"和"藉口"

GREEN： 針對那些藉口寫Skill，再跑一遍，看AI是否遵守

REFACTOR： 測試中AI又找到新藉口？加反藉口規則，循環直到"防彈"

最重要的陷阱：description寫成了摘要。

# 致命錯誤：描述變成了流程摘要
description: 在任務之間做代碼審查，確保質量

# 正確：只寫觸發條件
description: Use when completing a coding task, before marking it done

為什麼？因為AI讀到摘要就可能"自以為懂了"，不去讀Skill正文。description只寫"什麼時候用"，流程寫在Skill裏面。

七、大多數人不知道的5個細節

細節1：brainstorming會自動串聯writing-plans

設計一旦批准，brainstorming會自動調用writing-plans。你不需要手動切換。這是14個Skill之間最核心的串聯關係。

細節2：subagent-driven-development的代理不繼承歷史

每個代理拿到的上下文是你精心構造的，不是你的完整對話。這意味着：

•

代理不會"記住"你之前說的偏題的話

•

但也意味着你必須給代理足夠的上下文

•

計劃寫得越詳細，代理執行得越好

細節3：receiving-code-review鼓勵你反駁

審查意見不是聖旨。Superpowers明確列出了哪些情況該反駁：

•

建議會破壞現有功能

•

審查者不瞭解完整上下文

•

建議違反YAGNI原則

•

建議在技術上不正確

細節4：verification-before-completion的"新鮮證據"要求

"我上次跑了測試通過了"不算。必須是當前消息中運行的驗證結果。因為代碼可能在你上次驗證後又改了。

細節5：writing-plans的計劃是給"陌生人"看的

計劃必須包含完整代碼、精確文件路徑、具體命令。不能寫"添加驗證"，要寫"在 src/models/user.ts 第15行後添加 validates :email, uniqueness: true"。因為執行計劃的代理對你的項目一無所知。

八、從零開始：5分鐘配置Superpowers

# Claude Code安裝
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace

# 驗證安裝成功
# 重啓後說"幫我規劃一個功能"
# 如果AI開始問問題而不是直接寫代碼，說明brainstorming生效了

自定義Skill放哪裏：

# 個人級（所有項目可用）
~/.claude/skills/my-skill/SKILL.md

# 項目級（團隊共享，提交到git）
.claude/skills/my-skill/SKILL.md

驗證Skill是否生效的3個測試：

說"幫我規劃一個功能"，AI應該先問問題，不是直接寫代碼

說"加個登錄功能"，AI應該先寫失敗測試，不是直接寫實現

說"這個bug幫我修一下"，AI應該先問根因，不是直接改代碼

如果3個都沒按預期觸發，檢查Skill的description是否寫好了觸發短語。

九、Superpowers不適合什麼場景

任何工具都有邊界，誠實地說：

不適合的場景：

•

一次性腳本（寫完就扔的那種，TDD反而浪費時間）

•

探索性原型（你還不確定要做什麼，brainstorming會卡住）

•

緊急hotfix（先止血再補流程）

•

一個人維護的小項目（流程開銷可能大於收益）

最適合的場景：

•

團隊協作的項目（流程保證一致性）

•

長期維護的項目（測試和審查的投資回報高）

•

複雜功能開發（設計階段防止走錯方向）

•

AI輔助編程（流程彌補AI的偷懶傾向）

核心判斷標準： 代碼要活多長時間？活1天的腳本不需要Superpowers，活1年的項目很需要。

十、一張圖總結

簡單需求： 直接做，但verification（驗證）還是要有

正式需求，走流水線：

brainstorming：問清楚需求，出設計，你批准

writing-plans：拆成2-5分鐘任務

using-git-worktrees：創建隔離空間

每個任務循環：subagent-driven-development（派代理實現，代理內部走TDD：RED→GREEN→REFACTOR）→ requesting-code-review（獨立審查）→ receiving-code-review（驗證後實施）

verification-before-completion：跑驗證，給證據

finishing-a-development-branch：合併或PR

Superpowers的本質不是14個獨立工具，是一條防止AI偷懶的流水線。 每個環節都在防止AI走捷徑：brainstorming防止做錯方向，TDD防止跳過測試，code-review防止自說自話，verification防止假完成。

你不需要一次用上所有Skill。從3條鐵律開始：沒設計不寫代碼，沒測試不寫代碼，沒驗證不說完成。等這3條變成習慣，再加其他Skill。

掃碼關注「AI智聞說」，每天3分鐘掌握AI新知識