第 014 篇 |Codex 三層工作法:Plan 模式、Superpowers 與 gstack 怎麼配合

作者:甲蟲傅里葉
日期:2026年5月13日 下午8:53
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Codex 三層工作法Plan 模式控制動手時機,Superpowers 控制思考質量,gstack 控制項目流程,三者按任務階段選最小夠用嗰層。

整理版摘要

呢篇筆記係作者日常用 Codex 做軟件項目嘅經驗總結,講述三層協作方法:Plan 模式、Superpowers 同 gstack。作者想解決嘅問題係:喺 AI 編程過程中,點樣按任務階段選擇合適嘅執行方式,避免方向錯誤、範圍失控或者流程混亂。整體結論係呢三層唔係互斥,而係層級關係——Plan 模式負責踩剎車,Superpowers 負責扶正方向盤,gstack 負責跑完整流水線。

作者指出,Plan 模式係執行狀態,解決「而家可唔可以動手」嘅問題;Superpowers 係工作方法論,解決「應該跟咩思路推進」嘅問題;gstack 係軟件項目流水線 skill 套件,解決「由想法到驗證交付應該跑邊啲角色同關卡」嘅問題。三者各司其職,唔應該每次都全部用曬。

作者強調,真正成熟嘅用法係根據任務階段選擇最小夠用嘅嗰層。例如,細任務直接做,唔確定就行 Plan,複雜過程用 Superpowers,項目交付用 gstack。最終所有方法都要回歸到證據,例如命令、測試、截圖或報告。

  • Plan 模式、Superpowers、gstack 係三層控制面,分別負責「做唔做」、「點樣做」同「完整流程
  • Plan 模式喺任務開始前或風險高時用,確保邊界、方案同回滾方式清晰
  • Superpowers 適合拆解、調試、TDD 等需要工程節奏嘅場景,防止 AI 亂改
  • gstack 係完整軟件項目 skill 套件,涵蓋 office-hours、review、QA、ship 等關卡
  • 日常使用默認策略:細任務直接做、唔確定就 Plan、複雜用 Superpowers、交付用 gstack
整理重點

三層方法嘅核心區別

Plan 模式、Superpowers 同 gstack 係三層唔同嘅控制面,唔係互斥關係。一句話記住:Plan 模式控制「做唔做」,Superpowers 控制「點樣做」,gstack 控制「完整流程」。

Plan 模式係執行狀態,唔係 skill

文章用一個表格清楚列出三者嘅本質、主要問題、適合階段同典型輸出。Plan 模式適合任務開始前、風險較高時,輸出方案、邊界、風險同執行步驟;Superpowers 適合需求澄清、調試、TDD,輸出分階段工作流、假設同驗證步驟;gstack 適合需求到交付嘅完整項目,輸出 office-hours、review、QA、ship 報告。

整理重點

Plan 模式:控制動手時機

Plan 模式嘅核心判斷係:呢個任務如果直接做,會唔會造成方向錯誤、範圍失控或者難以回滾?適合用 Plan 模式嘅情況包括需求模糊、影響全局配置、涉及刪除遷移、架構未定、需要先確認成本風險,或者用戶明確話「先俾方案」.

先走 Plan 模式,唔好改代碼

作者建議可以直接對 Codex 講:「先走 Plan 模式,唔好改代碼。請先俾我邊界、方案、風險同驗證方式。」Plan 模式嘅目標係防止一開始就跑錯方向,唔係拖慢工作。

  1. 1 需求模糊:只知道想做一個嘢
  2. 2 影響全局:配置、權限、共享 skill、自動化、部署
  3. 3 涉及刪除、清理、遷移、批量改文件
  4. 4 架構方案未確定
  5. 5 需要先確認成本、風險、邊界
  6. 6 用戶明確話「先俾方案」「唔好鬱代碼
整理重點

Superpowers:控制思考質量

Superpowers 適合控制 agent 嘅工作方法,令佢按更可靠嘅工程節奏推進。適用場景包括任務需要拆解成多步、bug 原因唔清楚、希望先寫測試或定義驗收、需要防止 agent 亂改、需要階段性 checkpoint,或者需要系統性思考需求、假設同風險。

將「AI 直接俾答案」改成「AI 按工程方法推進

例如可以講:「使用 Superpowers 方法處理呢個 bug:先調查,再提出假設,再驗證,最後先修。」或者「用 Superpowers 拆解任務,先寫清楚階段、驗收標準同驗證命令。」

整理重點

gstack:完整項目流水線

gstack 係一組 skill 套件,適合完整軟件項目,而唔係單個小問題。佢將項目拆成產品、工程、設計、QA、安全、發佈、覆盤等角色同關卡。常用嘅 gstack skill 包括:

  • gstack-office-hours:用喺想法模糊時,輸出產品判斷、範圍建議
  • gstack-autoplan:用喺計劃評審,輸出綜合方案
  • gstack-plan-eng-review:評審工程風險同實現建議
  • gstack-review:檢查代碼改動,輸出 bug 同風險
  • gstack-qa:用真實瀏覽器測試,輸出 QA 報告同截圖
  • gstack-ship:準備發佈,檢查測試、文檔、風險

gstack 適合「由模糊想法到交付」嘅完整流程

使用時直接講出對應 skill,例如「用 gstack-review 檢查當前 git diff,重點揾真實 bug、遺漏測試同迴歸風險。」

整理重點

組合方式同默認策略

作者提供咗四種常見組合,例如模糊需求到可執行方案:先 Plan 模式,再 gstack-office-hours,再用 Superpowers 拆階段,最後 gstack-plan-eng-review。複雜功能開發就係 Plan 確認後,用 Superpowers TDD 實現,再用 gstack-review 同 gstack-qa 驗證。

Bug 排查先用 Superpowers 調查,唔好直接修

作者推薦嘅日常默認策略係:細任務直接做;唔確定就行 Plan;複雜過程用 Superpowers;項目交付用 gstack。最後一定要返到證據,例如命令、測試、截圖或報告。

作者仲分享咗自己嘅調用模板:新項目先 Plan + gstack-office-hours + Superpowers;工程方案評審用 gstack-plan-eng-review;實現用 Superpowers 小步驗證;完成後用 gstack-review 同 gstack-qa;準備交付用 gstack-ship。


20

呢篇筆記係記錄緊 Codex 日常軟件項目工程嘅三層協作方法:Plan 模式決定「諗清楚先定直接鬱手」,Superpowers 負責「點樣思考同推進」,gstack 負責「將軟件項目行成完整流水線」。


一句話區分

Plan 模式唔係技能,而係執行狀態。佢解決嘅係「而家可唔可以鬱手」嘅問題。

Superpowers係工作方法論。佢解決嘅係「應該跟咩思路推進」嘅問題。

gstack係軟件項目流水線。佢解決嘅係「一個軟件項目由諗法到驗證交付應該行咩角色同關卡」嘅問題。

如果只係記一句:

先用 Plan 模式控制係咪鬱手,再用 Superpowers 控制思考質素,最後用 gstack 行完整軟件工程關卡。


三者各自負責啲咩

方法
本質
主要問題
適合階段
典型輸出
Plan 模式
執行狀態 / 安全邊界
而家應唔應該直接改?範圍同風險清唔清楚?
任務開始前、風險較高嘅時候
方案、邊界、風險、執行步驟
Superpowers
思考同協作方法論
點樣拆解、驗證、除錯、避免走歪?
需求釐清、除錯、TDD、複雜執行
分階段工作流程、假設、驗證步驟
gstack
軟件項目流水線技能套件
產品、工程、設計、QA、發佈點樣串連?
需求到交付嘅完整軟件項目
office-hours、review、qa、ship 報告

三者唔係互斥關係。佢哋似三層控制面:

  • • Plan 模式控制係咪進入執行
  • • Superpowers 控制執行方法係咪可靠
  • • gstack 控制軟件項目流程係咪完整
alt
alt

幾時用 Plan 模式

用 Plan 模式嘅核心判斷係:呢個任務如果直接做,係咪有可能造成方向錯誤、範圍失控或者難返轉頭。

適合用 Plan 模式嘅情況:

  • • 需求仲好模糊,淨係知「想做一個嘢」
  • • 會影響全局配置、賬號權限、共用技能、自動化、部署流程
  • • 涉及刪除、清理、遷移、批量改檔案
  • • 架構方案仲未確定
  • • 需要先同用戶確認成本、風險、邊界
  • • 用戶明確話「先畀方案」「唔好鬱代碼」

可以咁樣對 Codex 講:

先走 Plan 模式,不要改代碼。請先給我邊界、方案、風險和驗證方式。

或者:

這個任務影響比較大,先不要動手。先判斷有哪些方案、哪個最穩、怎麼回滾。

Plan 模式嘅目標唔係拖慢工作,而係防止一開始就行錯方向。


幾時用 Superpowers

Superpowers 適合用嚟控制 agent 嘅工作方法。佢唔係某個具體領域嘅工具,而係令 agent 跟更可靠嘅工程節奏工作。

適合用 Superpowers 嘅情況:

  • • 任務需要拆解成多步
  • • bug 原因唔清楚,需要先調查再修
  • • 想先寫測試或者先定義驗收
  • • 需要防止 agent 一邊修一邊亂改
  • • 需要階段性 checkpoint
  • • 需要對需求、假設、風險做系統性思考

可以咁樣講:

使用 Superpowers 方法處理這個 bug:先調查,再提出假設,再驗證,最後再修。

或者:

用 Superpowers 的方式拆解這個任務,先寫清楚階段、驗收標準和驗證命令。

Superpowers 嘅價值在於將「AI 直接畀答案」改成「AI 跟工程方法推進」。

alt

幾時用 gstack

gstack 更適合完整軟件項目,而唔係單個小問題。佢將一個項目拆成唔同角色同關卡:產品、工程、設計、QA、安全、發佈、覆盤。

適合用 gstack 嘅情況:

  • • 要由一個模糊諗法開始做軟件項目
  • • 想先由產品角度重新審視需求
  • • 想令工程方案俾系統 review
  • • 想對而家嘅改動做高強度代碼審查
  • • 想用真實瀏覽器做 QA
  • • 想將測試、文檔、發佈檢查串連

常用 gstack 技能嘅分工:

gstack skill
適合場景
輸出
gstack-office-hours
諗法仲好模糊,需要由用戶痛點同產品方向重新審視
產品判斷、範圍建議、下一步
gstack-autoplan
想令產品、設計、工程一齊過一次計劃
評審後嘅綜合方案
gstack-plan-eng-review
工程方案需要架構、邊界、測試檢查
工程風險同實現建議
gstack-review
已經有代碼改動,需要揾 bug 同遺漏
review findings、風險、修復建議
gstack-qa
有可運行網頁,需要真實瀏覽器測試
QA 報告、截圖或者重現路徑
gstack-ship
準備發佈或者提交 PR
測試、文檔、發佈檢查

可以咁樣講:

使用 gstack-office-hours,幫我重新審視這個產品需求,不要直接寫代碼。
使用 gstack-plan-eng-review,評審這個實現方案的架構風險和測試缺口。
使用 gstack-review,檢查當前 git diff,重點找真實 bug、遺漏測試和發佈風險。
使用 gstack-qa,打開 http://localhost:3000 做一輪真實瀏覽器 QA。
alt

組合方式

1. 模糊需求到可執行方案

適合:用戶淨係有個大概諗法,仲未形成項目邊界。

推薦流程:

  1. 1. Plan 模式:唔好鬱手住,確認目標同邊界。
  2. 2. gstack-office-hours:由產品問題同用戶痛點重新審視。
  3. 3. Superpowers:將結論拆成階段、驗收標準同風險。
  4. 4. gstack-plan-eng-review:評審工程實現路徑。
  5. 5. 再決定係咪進入實現。

可以直接講:

先走 Plan 模式,不要改代碼。使用 gstack-office-hours 重新審視這個需求,然後用 Superpowers 把它拆成可執行階段和驗收標準。

2. 複雜功能開發

適合:已經知道要做咩,但實現涉及多個模塊。

推薦流程:

  1. 1. Plan 模式:確認改動範圍、檔案邊界、驗收標準。
  2. 2. Superpowers:跟 TDD 或者分階段執行。
  3. 3. 實現代碼。
  4. 4. gstack-review:做代碼審查。
  5. 5. gstack-qa:如果有前端或者網頁服務,做真實瀏覽器驗證。

可以直接講:

先用 Plan 模式確認方案。確認後按 Superpowers 的 TDD 流程實現,完成後用 gstack-review 和 gstack-qa 驗證。

3. bug 排查

適合:有明確錯誤、現象或者失敗測試。

推薦流程:

  1. 1. Superpowers:先調查,唔直接修。
  2. 2. 揾到可證偽假設。
  3. 3. 最少改動修復。
  4. 4. gstack-review:睇下有無引入迴歸。
  5. 5. 必要時 gstack-qa:重現用戶路徑。

可以直接講:

使用 Superpowers 的系統調試流程處理這個 bug。先不要修,先找證據鏈和根因;修完後用 gstack-review 檢查迴歸風險。

4. 已完成代碼準備交付

適合:代碼已經寫完,準備提交、PR、上線或者交畀用戶。

推薦流程:

  1. 1. gstack-review:查真實 bug、邊界遺漏、測試缺口。
  2. 2. gstack-qa:對用戶路徑做瀏覽器驗證。
  3. 3. gstack-ship:跑發佈前檢查。
  4. 4. 普通 Codex 執行:根據 findings 做最少修復。

可以直接講:

使用 gstack-review 檢查當前改動。通過後再使用 gstack-qa 測試頁面,最後給我一份交付前風險報告。
alt

快速決策表

你想要嘅結果
優先使用
唔好鬱代碼,淨係睇方案
Plan 模式
需求混亂,需要拆清楚
Plan 模式 + Superpowers
想由產品角度重新審視需求
gstack-office-hours
想令工程方案更穩陣
gstack-plan-eng-review
想系統性除錯
Superpowers
想檢查代碼質素同風險
gstack-review
想打開網頁真實測試
gstack-qa
想準備發佈
gstack-ship
小修小改、查文件、跑測試
直接叫 Codex 做

唔應該點樣用

唔好將三者當成一串固定咒語。

錯誤用法:

使用 Plan 模式 + Superpowers + gstack 全部跑一遍。

咁樣會令任務變重,甚至令 agent 將簡單事情複雜化。

alt

更好嘅講法係:

這個任務現在還不清楚,先 Plan。

或者:

這是 bug,按 Superpowers 調試。

或者:

代碼已經寫完,用 gstack-review 和 gstack-qa 做交付前驗證。

推薦默認策略

日常使用可以採用下面嘅默認策略:

  1. 1. 細任務直接做:查文件、改一個 bug、跑一個測試,唔需要 skill。
  2. 2. 唔確定就行 Plan:範圍、風險、架構、權限、清理、遷移,先行 Plan。
  3. 3. 複雜過程用 Superpowers:除錯、TDD、多階段任務、容易走歪嘅工作。
  4. 4. 項目交付用 gstack:需求評審、工程評審、代碼 review、瀏覽器 QA、發佈檢查。
  5. 5. 最後一定要返去證據:無論用咗邊個方法,最終都要有命令、測試、截圖、報告或者可重現路徑。

呢套方式嘅目標唔係令 Codex 叫更多 skill,而係令每次軟件項目工作都有清楚嘅邊界、穩定嘅推進節奏同可驗證嘅交付結果。


我自己嘅調用模板

新項目/新功能

先走 Plan 模式,不要改代碼。使用 gstack-office-hours 重新審視需求,再用 Superpowers 拆成階段、驗收標準和風險。

工程方案評審

使用 gstack-plan-eng-review,檢查這個方案的架構邊界、數據流、失敗模式和測試缺口。

實現任務

按上面的方案實現。用 Superpowers 的執行節奏推進:小步改動、階段驗證、不要無關重構。

代碼完成後

使用 gstack-review 檢查當前 git diff,優先找真實 bug、遺漏測試、迴歸風險。不要只做風格點評。

前端或者網頁服務完成後

使用 gstack-qa 打開本地頁面做真實瀏覽器 QA,記錄復現路徑、失敗截圖和剩餘風險。

準備交付

用 gstack-ship 的思路做交付前檢查:測試、文檔、風險、回滾方式、下一步。

最終判斷

Plan 模式、Superpowers 同 gstack 嘅關係唔係替代關係,而係層級關係。

Plan 模式負責踩 brake。

Superpowers 負責將軚盤扶正。

gstack 負責將整條軟件工程流水線行完。

真正成熟嘅用法,係根據任務階段揀最少夠用嘅嗰一層,而唔係每次都全部開曬。


20

這篇筆記記錄的是 Codex 日常軟件項目工程中的三層協作方法:Plan 模式決定"先想清楚還是直接動手",Superpowers 負責"怎麼思考和推進",gstack 負責"把軟件項目跑成完整流水線"。


一句話區分

Plan 模式不是 skill,而是執行狀態。它解決的是"現在能不能動手"的問題。

Superpowers是工作方法論。它解決的是"應該按什麼思路推進"的問題。

gstack是軟件項目流水線。它解決的是"一個軟件項目從想法到驗證交付應該跑哪些角色和關卡"的問題。

如果只記一句:

先用 Plan 模式控制是否動手,再用 Superpowers 控制思考質量,最後用 gstack 跑完整軟件工程關卡。


三者各自負責什麼

方法
本質
主要問題
適合階段
典型輸出
Plan 模式
執行狀態 / 安全邊界
現在要不要直接改?範圍和風險清楚嗎?
任務開始前、風險較高時
方案、邊界、風險、執行步驟
Superpowers
思考和協作方法論
怎麼拆解、驗證、調試、避免跑偏?
需求澄清、調試、TDD、複雜執行
分階段工作流、假設、驗證步驟
gstack
軟件項目流水線 skill 套件
產品、工程、設計、QA、發佈怎麼串起來?
需求到交付的完整軟件項目
office-hours、review、qa、ship 報告

三者不是互斥關係。它們像三層控制面:

  • • Plan 模式控制是否進入執行
  • • Superpowers 控制執行方法是否可靠
  • • gstack 控制軟件項目流程是否完整
alt
alt

什麼時候用 Plan 模式

用 Plan 模式的核心判斷是:這個任務如果直接做,是否可能造成方向錯誤、範圍失控或難以回滾。

適合使用 Plan 模式的情況:

  • • 需求還模糊,只知道"想做一個東西"
  • • 會影響全局配置、賬號權限、共享 skill、自動化、部署流程
  • • 涉及刪除、清理、遷移、批量改文件
  • • 架構方案還沒確定
  • • 需要先和用戶確認成本、風險、邊界
  • • 用戶明確說"先給方案""不要動代碼"

可以這樣對 Codex 說:

先走 Plan 模式,不要改代碼。請先給我邊界、方案、風險和驗證方式。

或者:

這個任務影響比較大,先不要動手。先判斷有哪些方案、哪個最穩、怎麼回滾。

Plan 模式的目標不是拖慢工作,而是防止一開始就跑錯方向。


什麼時候用 Superpowers

Superpowers 適合用來控制 agent 的工作方法。它不是某個具體領域的工具,而是讓 agent 按更可靠的工程節奏工作。

適合使用 Superpowers 的情況:

  • • 任務需要拆解成多步
  • • bug 原因不清楚,需要先調查再修
  • • 希望先寫測試或先定義驗收
  • • 需要防止 agent 一邊修一邊亂改
  • • 需要階段性 checkpoint
  • • 需要對需求、假設、風險做系統性思考

可以這樣說:

使用 Superpowers 方法處理這個 bug:先調查,再提出假設,再驗證,最後再修。

或者:

用 Superpowers 的方式拆解這個任務,先寫清楚階段、驗收標準和驗證命令。

Superpowers 的價值在於把"AI 直接給答案"改成"AI 按工程方法推進"。

alt

什麼時候用 gstack

gstack 更適合完整軟件項目,而不是單個小問題。它把一個項目拆成不同角色和關卡:產品、工程、設計、QA、安全、發佈、覆盤。

適合使用 gstack 的情況:

  • • 要從一個模糊想法開始做軟件項目
  • • 想先從產品角度重新審視需求
  • • 想讓工程方案被系統 review
  • • 想對當前改動做高強度代碼審查
  • • 想用真實瀏覽器做 QA
  • • 想把測試、文檔、發佈檢查串起來

常用 gstack skill 的分工:

gstack skill
適合場景
輸出
gstack-office-hours
想法還模糊,需要從用戶痛點和產品方向重新審視
產品判斷、範圍建議、下一步
gstack-autoplan
想讓產品、設計、工程一起過一遍計劃
評審後的綜合方案
gstack-plan-eng-review
工程方案需要架構、邊界、測試檢查
工程風險和實現建議
gstack-review
已經有代碼改動,需要找 bug 和遺漏
review findings、風險、修復建議
gstack-qa
有可運行網頁,需要真實瀏覽器測試
QA 報告、截圖或復現路徑
gstack-ship
準備發佈或提交 PR
測試、文檔、發佈檢查

可以這樣說:

使用 gstack-office-hours,幫我重新審視這個產品需求,不要直接寫代碼。
使用 gstack-plan-eng-review,評審這個實現方案的架構風險和測試缺口。
使用 gstack-review,檢查當前 git diff,重點找真實 bug、遺漏測試和發佈風險。
使用 gstack-qa,打開 http://localhost:3000 做一輪真實瀏覽器 QA。
alt

組合方式

1. 模糊需求到可執行方案

適合:用戶只有一個大概想法,還沒形成項目邊界。

推薦流程:

  1. 1. Plan 模式:先不要動手,確認目標和邊界。
  2. 2. gstack-office-hours:從產品問題和用戶痛點重新審視。
  3. 3. Superpowers:把結論拆成階段、驗收標準和風險。
  4. 4. gstack-plan-eng-review:評審工程實現路徑。
  5. 5. 再決定是否進入實現。

可直接說:

先走 Plan 模式,不要改代碼。使用 gstack-office-hours 重新審視這個需求,然後用 Superpowers 把它拆成可執行階段和驗收標準。

2. 複雜功能開發

適合:已經知道要做什麼,但實現涉及多個模塊。

推薦流程:

  1. 1. Plan 模式:確認改動範圍、文件邊界、驗收標準。
  2. 2. Superpowers:按 TDD 或分階段執行。
  3. 3. 實現代碼。
  4. 4. gstack-review:做代碼審查。
  5. 5. gstack-qa:如果有前端或網頁服務,做真實瀏覽器驗證。

可直接說:

先用 Plan 模式確認方案。確認後按 Superpowers 的 TDD 流程實現,完成後用 gstack-review 和 gstack-qa 驗證。

3. bug 排查

適合:有明確錯誤、現象或失敗測試。

推薦流程:

  1. 1. Superpowers:先調查,不直接修。
  2. 2. 找到可證偽假設。
  3. 3. 最小改動修復。
  4. 4. gstack-review:看是否引入迴歸。
  5. 5. 必要時 gstack-qa:復現用戶路徑。

可直接說:

使用 Superpowers 的系統調試流程處理這個 bug。先不要修,先找證據鏈和根因;修完後用 gstack-review 檢查迴歸風險。

4. 已完成代碼準備交付

適合:代碼已經寫完,準備提交、PR、上線或交付給用戶。

推薦流程:

  1. 1. gstack-review:查真實 bug、邊界遺漏、測試缺口。
  2. 2. gstack-qa:對用戶路徑做瀏覽器驗證。
  3. 3. gstack-ship:跑發佈前檢查。
  4. 4. 普通 Codex 執行:根據 findings 做最小修復。

可直接說:

使用 gstack-review 檢查當前改動。通過後再使用 gstack-qa 測試頁面,最後給我一份交付前風險報告。
alt

快速決策表

你想要的結果
優先使用
先別動代碼,只看方案
Plan 模式
需求混亂,需要拆清楚
Plan 模式 + Superpowers
想從產品角度重審需求
gstack-office-hours
想讓工程方案更穩
gstack-plan-eng-review
想系統調試 bug
Superpowers
想檢查代碼質量和風險
gstack-review
想打開網頁真實測試
gstack-qa
想準備發佈
gstack-ship
小修小改、查文件、跑測試
直接讓 Codex 做

不應該怎麼用

不要把三者當成一串固定咒語。

錯誤用法:

使用 Plan 模式 + Superpowers + gstack 全部跑一遍。

這會讓任務變重,甚至讓 agent 把簡單事情複雜化。

alt

更好的說法是:

這個任務現在還不清楚,先 Plan。

或者:

這是 bug,按 Superpowers 調試。

或者:

代碼已經寫完,用 gstack-review 和 gstack-qa 做交付前驗證。

推薦默認策略

日常使用可以採用下面的默認策略:

  1. 1. 小任務直接做:查文件、改一處 bug、跑一個測試,不需要 skill。
  2. 2. 不確定就 Plan:範圍、風險、架構、權限、清理、遷移,先走 Plan。
  3. 3. 複雜過程用 Superpowers:調試、TDD、多階段任務、容易跑偏的工作。
  4. 4. 項目交付用 gstack:需求評審、工程評審、代碼 review、瀏覽器 QA、發佈檢查。
  5. 5. 最後必須回到證據:不管用了哪個方法,最終都要有命令、測試、截圖、報告或可復現路徑。

這套方式的目標不是讓 Codex 調用更多 skill,而是讓每次軟件項目工作都有清楚的邊界、穩定的推進節奏和可驗證的交付結果。


我自己的調用模板

新項目/新功能

先走 Plan 模式,不要改代碼。使用 gstack-office-hours 重新審視需求,再用 Superpowers 拆成階段、驗收標準和風險。

工程方案評審

使用 gstack-plan-eng-review,檢查這個方案的架構邊界、數據流、失敗模式和測試缺口。

實現任務

按上面的方案實現。用 Superpowers 的執行節奏推進:小步改動、階段驗證、不要無關重構。

代碼完成後

使用 gstack-review 檢查當前 git diff,優先找真實 bug、遺漏測試、迴歸風險。不要只做風格點評。

前端或網頁服務完成後

使用 gstack-qa 打開本地頁面做真實瀏覽器 QA,記錄復現路徑、失敗截圖和剩餘風險。

準備交付

用 gstack-ship 的思路做交付前檢查:測試、文檔、風險、回滾方式、下一步。

最終判斷

Plan 模式、Superpowers 和 gstack 的關係不是替代關係,而是層級關係。

Plan 模式負責踩剎車。

Superpowers 負責把方向盤扶正。

gstack 負責把整條軟件工程流水線跑完。

真正成熟的用法,是根據任務階段選擇最小夠用的那一層,而不是每次都全量打開。