OpenSpec + Superpowers + gstack:一套讓 AI 從「寫代碼」到「做項目」的組合拳
整理版優先睇
OpenSpec、Superpowers、gstack 三件套,令 AI 從寫代碼升級到做項目
作者用 AI 寫代碼差唔多一年,試過 ChatGPT 到 Claude Code 等工具,但一直遇到需求對唔齊、任務失控、質量冇保障嘅問題。佢最近發現三個開源項目嘅組合:OpenSpec、Superpowers 同 gstack,終於形成一套完整嘅 AI 做項目方法論。
呢篇文章詳細介紹每個工具嘅核心概念、安裝步驟同工作流程,仲話畀讀者點樣組合使用。整體結論係:AI 寫代碼只係開始,要做項目就需要先規格驅動、再拆細任務、最後用角色扮演完成整個開發週期。
作者分享自身經驗:佢成日畀 AI 模糊需求,結果代碼寫咗唔係佢想要嘅;冇文檔下次又要重新講;代碼冇測試唔放心;一個人 review 容易漏嘢。呢啲問題驅使佢揾到三個工具嘅組合。三個工具分工清晰:OpenSpec 管需求對齊,Superpowers 管任務拆解同測試,gstack 管角色扮演同自動化。三者組合由計劃到部署一條龍,令一個人可以做到團隊嘅效果。作者建議先從 gstack 開始體驗,因為佢最直接提升開發效率,然後再慢慢加入 OpenSpec 同 Superpowers。佢認為呢套組合拳係目前最完整嘅 AI 項目開發工作流。
- AI 寫代碼同做項目係兩回事,需要系統方法論。
- OpenSpec 強制「先對齊需求再寫代碼」,透過 propose、apply、archive 流程管理規格。
- Superpowers 將大任務拆成 2-5 分鐘小任務,每個有驗收標準,配合 TDD 紅綠重構。
- gstack 將 Claude Code 變成 23 人虛擬團隊,涵蓋設計、審查、測試、部署。
- 建議從 gstack 著手,逐步加入 OpenSpec 同 Superpowers,形成完整工作流。
OpenSpec
規格驅動開發工具,用於需求對齊同任務規劃。
Superpowers
AI 編程方法論,提供測試驅動同子代理開發流程。
gstack
Claude Code 配置工具,將 AI 變成 23 人虛擬工程團隊。
由寫代碼到做項目嘅痛點同解法
作者用 AI 寫代碼差唔多一年,試過 ChatGPT 到 Claude Code 等主流工具,但一直有個困擾:用 AI 寫代碼同用 AI 做項目完全係兩回事。佢遇到嘅問題包括:AI 改功能越改越離譜、冇需求文檔聊完就忘、寫咗代碼冇測試唔放心、一個人 review 容易漏嘢。
AI 寫代碼同做項目完全係兩回事
直到最近發現三個開源項目嘅組合——OpenSpec、Superpowers 同 gstack,佢先發現原來有完整方法論可以解決呢啲問題。
OpenSpec:需求先行,想清楚先鬱手
OpenSpec 係規格驅動開發嘅代表作,GitHub 上有 4.2 萬星,MIT 協議。佢嘅核心作用係喺 AI 寫代碼之前先對齊「要做啲乜」。
規格驅動開發
作者之前嘅工作流係畀 AI 一個模糊需求,例如「幫我做個用戶管理系統」,結果 AI 寫咗普通用戶界面,唔係管理員功能。痛點就係需求冇講清楚,代碼寫得幾好都係浪費時間。
- 1 /opsx:propose add-dark-mode → 創建 proposal.md (點解要做)
- 2 → 創建 specs/ (需求場景)
- 3 → 創建 design.md (技術方案)
- 4 → 創建 tasks.md (實施清單)
- 5 /opsx:apply → 按 tasks.md 逐項執行
- 6 /opsx:archive → 歸檔到歷史,更新規格庫
npm install -g opsx-cli
# 或者直接用 GitHub 上的腳本
git clone https://github.com/Fission-AI/OpenSpec.git
cd OpenSpec
./opsx.sh init
Superpowers:測試驅動、子代理驅動開發
Superpowers 係一套完整嘅 AI 編程方法論,GitHub 16.6 萬星,MIT 協議。佢嘅核心係令 AI 可以自主工作幾小時唔會走偏。
自主工作幾小時唔會走偏
作者之前畀 AI 做功能,走開一個鐘返嚟發現代碼完全唔係想要嘅。問題根源係冇將大任務拆成小任務,同埋冇明確嘅驗收標準。
- 設計:brainstorming,蘇格拉底式提問,將模糊想法變清晰規格
- 分支:using-git-worktrees,創建工作樹,隔離開發
- 規劃:writing-plans,拆成 2-5 分鐘小任務,每個有驗收標準
- 開發:subagent-driven-development,子代理驅動,每個任務獨立執行、審查
- 測試:test-driven-development,紅綠重構循環,先寫測試再寫代碼
- 審查:requesting-code-review,代碼審查清單
- 完成:finishing-a-development-branch,合併/PR 決策
git clone https://github.com/obra/superpowers.git
cd superpowers
cat README.md
./init.sh
gstack:虛擬工程團隊全流程
gstack 係 Y Combinator CEO Garry Tan 嘅 Claude Code 完整配置,GitHub 8.2 萬星,MIT 協議。佢嘅核心係將 Claude Code 變成一個 23 人嘅虛擬工程團隊。
23 人嘅虛擬工程團隊
呢 23 個角色涵蓋產品、設計、工程、測試、發佈同覆盤等崗位,每個角色都有特定嘅 prompt 同工作流程。
- /office-hours - YC 導師,6 個靈魂拷問,重新定義產品方向
- /plan-ceo-review - CEO,重新思考問題,揾到 10 分產品
- /plan-eng-review - 工程經理,鎖死架構、數據流、邊界情況
- /plan-design-review - 高級設計師,設計維度打分 0-10
- /review - 代碼審查員,自動修復問題
- /qa - QA 工程師,真實瀏覽器測試
- /ship - 發佈工程師,跑測試、開 PR、自動部署
- /retro - 覆盤教練,每週工程覆盤
git clone https://github.com/garrytan/gstack.git
cd gstack
cat INSTALL.md
./install-mac.sh # Mac 用戶
./install-linux.sh # Linux 用戶
三件套組合使用
呢三個工具可以組合使用,形成由需求到部署嘅完整工作流。
- 1 第一步:用 OpenSpec 對齊需求,寫清楚要做啲乜
- 2 第二步:用 Superpowers 拆解任務,每個任務獨立執行
- 3 第三步:用 gstack 扮演唔同角色,代碼審查、測試、部署一條龍
作者用後感覺需求唔再跑偏,開發更有節奏,一個人做到團隊嘅事,代碼質量有保障。佢建議從 gstack 開始體驗,然後再慢慢加上 OpenSpec 同 Superpowers。
從 gstack 開始體驗
用 AI 寫 code 呢件事,我已經搞咗差唔多成年。
由最早期嘅 ChatGPT 到而家嘅 Claude Code,可以話市面上主流嘅 AI 編程工具我都試過曬。但係有個問題一直困擾住我:用 AI 寫 code 同用 AI 做 project,完全係兩回事。
你係咪有呢種感覺?
- 叫 AI 改個功能,點知佢越改越離譜,寫咗半日都唔係你想要嘅嘢。
- 冇需求文檔,傾完就唔記得,下次又要重新對齊。
- AI 寫嘅 code 望落似用得,但係冇 test,心裏總係唔係好放心。
- 一個人 review code,好容易走漏邊界情況。
- 寫完 code 都唔知要唔要 test、要唔要 deploy。
呢啲問題搞到我頭都大。直到最近發現三個 open source project 嘅組合,我先發現:原來「AI 做 project」呢件事可以有完整嘅方法論。
呢三個 project 分別係:OpenSpec + Superpowers + gstack。
一、OpenSpec:需求先行,諗清楚先鬱手
GitHub:https://github.com/Fission-AI/OpenSpec
Star:4.2 萬+(MIT 協議)
呢個係規格驅動開發(Spec-driven development)嘅代表作。佢嘅核心作用係:喺 AI 寫 code 之前,先對齊「要做乜嘢」。
點解要用 OpenSpec?
我之前嘅工作流程係咁:俾 AI 一個模糊嘅需求,例如「幫我做一個用戶管理系統」,然後睇住佢開始寫。寫寫下就發現唔妥——我要嘅係管理員功能,佢俾我寫咗個普通用戶介面。
痛點就係:需求冇講清楚,code 寫得幾好都係浪費時間。
工作流
/opsx:propose add-dark-mode → 創建 proposal.md(為什麼要做)
→ 創建 specs/(需求場景)
→ 創建 design.md(技術方案)
→ 創建 tasks.md(實施清單)
/opsx:apply → 按 tasks.md 逐項執行
/opsx:archive → 歸檔到歷史,更新規格庫
安裝使用
# 通過 npm 安裝
npm install -g opsx-cli
# 或者直接用 GitHub 上的腳本
git clone https://github.com/Fission-AI/OpenSpec.git
cd OpenSpec
./opsx.sh init
二、Superpowers:測試驅動、子代理驅動開發
GitHub:https://github.com/obra/superpowers
Star:16.6 萬+(MIT 協議)
呢個係一套完整嘅 AI 編程方法論,核心係令 AI 可以自主工作幾個鐘唔走樣。
點解需要 Superpowers?
我之前叫 AI 做一個功能,俾咗需求就去搞其他嘢。一個鐘後返嚟一睇,嘩,code 寫咗幾百行,但完全唔係我想要嘅嘢。
問題嘅根源係:冇將大 task 拆成細 task,冇明確嘅驗收標準。
工作流
| 階段 | 技能 | 做什麼 |
|---|---|---|
| 設計 | brainstorming | 蘇格拉底式提問,將模糊諗法變成清晰規格 |
| 分支 | using-git-worktrees | 建立工作樹,隔離開發 |
| 規劃 | writing-plans | 拆成2-5分鐘嘅細 task,每個都有驗收標準 |
| 開發 | subagent-driven-development | 子 agent 驅動,每個 task 獨立執行、審查 |
| 測試 | test-driven-development | 紅綠重構循環,先寫 test 再寫 code |
| 審查 | requesting-code-review | code review 清單 |
| 完成 | finishing-a-development-branch | 合併/PR 決策 |
安裝使用
git clone https://github.com/obra/superpowers.git
cd superpowers
cat README.md
./init.sh
三、gstack:虛擬工程團隊全流程
GitHub:https://github.com/garrytan/gstack
Star:8.2 萬+(MIT 協議)
呢個係 Y Combinator CEO Garry Tan 嘅 Claude Code 完整配置。佢嘅核心係將 Claude Code 變成一個 23 人嘅虛擬工程團隊。
23個角色
/office-hours- YC 導師,6個靈魂拷問,重新定義產品方向/plan-ceo-review- CEO,重新思考問題,揾到10分產品/plan-eng-review- 工程經理,鎖死架構、數據流、邊界情況/plan-design-review- 高級設計師,設計維度打分0-10/review- 代碼審查員,自動修復問題/qa- QA工程師,真實瀏覽器測試/ship- 發佈工程師,跑 test、開 PR、自動 deploy/retro- 覆盤教練,每週工程覆盤
安裝使用
git clone https://github.com/garrytan/gstack.git
cd gstack
cat INSTALL.md
./install-mac.sh # Mac用戶
./install-linux.sh # Linux用戶
效果有幾誇張?
Garry Tan 自己話:2026年 code 產出係2013年嘅240倍(按邏輯變更計算)。
四、三件套點樣組合?
- 第一步:用 OpenSpec 對齊需求,寫清楚要做乜嘢
- 第二步:用 Superpowers 拆解 task,每個 task 獨立執行
- 第三步:用 gstack 扮演唔同角色,code review、test、deploy 一條龍
三者組合,就係由「寫 code」到「做 project」嘅完整工作流程。
五、我嘅使用感受
- 需求唔會走偏:OpenSpec 強制先諗清楚先做
- 開發更有節奏:Superpowers 將大 task 拆成細 task
- 一個人可以做團隊嘅嘢:gstack 嘅23個角色令 AI 可以扮演唔同角色
- code 質量有保障:Superpowers 嘅 TDD 流程令每個功能都有 test
建議由 gstack 開始體驗,然後再慢慢加返 OpenSpec 同 Superpowers。
你哋有用過類似嘅 AI 開發工作流程嗎?效果點樣?留言區傾下,你哋覺得呢三個工具邊個最有用?
用 AI 寫代碼這件事,我已經摺騰了快一年了。
從最開始的 ChatGPT 到現在的 Claude Code,可以說市面上主流的 AI 編程工具我都試了個遍。但有個問題一直困擾着我:用 AI 寫代碼和用 AI 做項目,完全是兩回事。
你有沒有這種感覺?
- 讓 AI 改個功能,結果它越改越離譜,寫了半天不是你想要的
- 沒有需求文檔,聊完就忘,下次還得重新對齊
- AI 寫的代碼看着能用,但沒有測試,心裏總是不踏實
- 一個人 review 代碼,容易漏掉邊界情況
- 寫完代碼也不知道要不要測試、要不要部署
這些問題把我折磨得夠嗆。直到最近發現三個開源項目的組合,我才發現:原來「AI 做項目」這件事可以有完整的方法論。
這三個項目分別是:OpenSpec + Superpowers + gstack。
一、OpenSpec:需求先行,想清楚再動手
GitHub:https://github.com/Fission-AI/OpenSpec
Star:4.2 萬+(MIT 協議)
這是規格驅動開發(Spec-driven development)的代表作。它的核心作用是:在 AI 寫代碼之前,先對齊「要做什麼」。
為什麼要用 OpenSpec?
我之前的工作流是這樣的:給 AI 一個模糊的需求,比如"幫我做一個用戶管理系統",然後看着它開始寫。寫着寫着就發現不對——我要的是管理員功能,它給我寫了個普通用戶界面。
痛點就是:需求沒說清楚,代碼寫得再好也是浪費時間。
工作流
/opsx:propose add-dark-mode → 創建 proposal.md(為什麼要做)
→ 創建 specs/(需求場景)
→ 創建 design.md(技術方案)
→ 創建 tasks.md(實施清單)
/opsx:apply → 按 tasks.md 逐項執行
/opsx:archive → 歸檔到歷史,更新規格庫
安裝使用
# 通過 npm 安裝
npm install -g opsx-cli
# 或者直接用 GitHub 上的腳本
git clone https://github.com/Fission-AI/OpenSpec.git
cd OpenSpec
./opsx.sh init
二、Superpowers:測試驅動、子代理驅動開發
GitHub:https://github.com/obra/superpowers
Star:16.6 萬+(MIT 協議)
這是一套完整的 AI 編程方法論,核心是讓 AI 能自主工作幾小時不跑偏。
為什麼需要 Superpowers?
我之前讓 AI 做一個功能,給了需求就去幹別的事了。一小時後回來一看,好傢伙,代碼寫了幾百行,但完全不是我想要的。
問題的根源是:沒有把大任務拆成小任務,沒有明確的驗收標準。
工作流
| 階段 | 技能 | 做什麼 |
|---|---|---|
| 設計 | brainstorming | 蘇格拉底式提問,把模糊想法變成清晰規格 |
| 分支 | using-git-worktrees | 創建工作樹,隔離開發 |
| 規劃 | writing-plans | 拆成2-5分鐘的小任務,每個都有驗收標準 |
| 開發 | subagent-driven-development | 子代理驅動,每個任務獨立執行、審查 |
| 測試 | test-driven-development | 紅綠重構循環,先寫測試再寫代碼 |
| 審查 | requesting-code-review | 代碼審查清單 |
| 完成 | finishing-a-development-branch | 合併/PR決策 |
安裝使用
git clone https://github.com/obra/superpowers.git
cd superpowers
cat README.md
./init.sh
三、gstack:虛擬工程團隊全流程
GitHub:https://github.com/garrytan/gstack
Star:8.2 萬+(MIT 協議)
這是 Y Combinator CEO Garry Tan 的 Claude Code 完整配置。它的核心是把 Claude Code 變成一個 23 人的虛擬工程團隊。
23個角色
/office-hours- YC 導師,6個靈魂拷問,重新定義產品方向/plan-ceo-review- CEO,重新思考問題,找到10分產品/plan-eng-review- 工程經理,鎖死架構、數據流、邊界情況/plan-design-review- 高級設計師,設計維度打分0-10/review- 代碼審查員,自動修復問題/qa- QA工程師,真實瀏覽器測試/ship- 發佈工程師,跑測試、開PR、自動部署/retro- 覆盤教練,每週工程覆盤
安裝使用
git clone https://github.com/garrytan/gstack.git
cd gstack
cat INSTALL.md
./install-mac.sh # Mac用戶
./install-linux.sh # Linux用戶
效果有多誇張?
Garry Tan 自己說:2026年代碼產出是2013年的240倍(按邏輯變更計算)。
四、三件套怎麼組合?
- 第一步:用 OpenSpec 對齊需求,寫清楚要做什麼
- 第二步:用 Superpowers 拆解任務,每個任務獨立執行
- 第三步:用 gstack 扮演不同角色,代碼審查、測試、部署一條龍
三者組合,就是從「寫代碼」到「做項目」的完整工作流。
五、我的使用感受
- 需求不再跑偏:OpenSpec 強制先想清楚再做
- 開發更有節奏:Superpowers 把大任務拆成小任務
- 一個人也能幹團隊的事:gstack 的23個角色讓AI能扮演不同角色
- 代碼質量有保障:Superpowers 的 TDD 流程讓每個功能都有測試
建議從 gstack 開始體驗,然後再慢慢加上 OpenSpec 和 Superpowers。
你們有用過類似的 AI 開發工作流嗎?效果怎麼樣?評論區聊聊,你們覺得這三個工具哪個最有用?