從流程門禁到決策盤問：brainstorming 與 grill-me 該怎麼選

作者：BINFALRE

日期：2026年6月4日上午8:00

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

比較 brainstorming 同 grill-me：按不確定性類型揀 Agent 前置 Skill

整理版摘要

呢篇文章係關於兩個 Coding Agent Skill：brainstorming 同 grill-me。佢哋都唔係用嚟寫代碼，而係喺實現之前幫你對齊需求、審查方案同埋決策澄清。作者點出一個關鍵問題：Agent 越能幹，錯誤方向嘅執行速度就越快，所以真正昂貴嘅失敗係目標、邊界、取捨未對齊就進入實現。

呢兩個 Skill 嘅核心差異在於治理對象唔同。brainstorming 係階段治理，處理「需求尚未成型」嘅不確定性；grill-me 係決策治理，處理「方案看似成型」嘅偽確定性。前者係流程門禁，防止過早進入實現；後者係方案壓力測試，防止帶住隱含假設進入實現。

整體結論係：最有價值嘅唔係揀邊個 Skill，而係先識別自己面對邊種不確定性。需求模糊就用 brainstorming，方案未經壓測就用 grill-me。高風險任務可以先用 brainstorming 收斂設計，再用 grill-me 壓測關鍵決策。成熟嘅 Agent 使用唔係追求更快，而係知道幾時要停低問問題。

核心差異：brainstorming 係階段治理（流程門禁），grill-me 係決策治理（方案壓力測試）。
選擇框架：根據任務不確定性類型——需求模糊用 brainstorming，已有方案但怕遺漏用 grill-me。
關鍵機制：brainstorming 有9步強門禁流程，包括上下文探索、逐步澄清、方案比較、設計文檔同用戶複核；grill-me 沿決策樹逐個追問，每次一個問題並畀推薦答案。
三個差異維度：治理對象、交互節奏、產物形態（brainstorming 產出設計合約，grill-me 產出被檢驗嘅取捨）。
實用建議：高風險任務可先 brainstorming 後 grill-me；低風險小改動只用 grill-me 或者唔用；成熟 Agent 使用係知道幾時減速。

整理重點

點解要比較呢兩個 Skill？

Coding Agent 寫代碼越來越容易，難嘅係喺佢動手之前確認目標冇錯。brainstorming 同 grill-me 都係高熱度嘅 Agent Skill，佢哋唔負責生成代碼，而係將需求對齊、方案審查同決策澄清前移到實現之前。

實現前約束類 Skill

截至2026-06-03，grill-me 同 brainstorming 各自有 254K 同 198K 安裝量，但呢啲數字只係熱度信號，唔可以直接當成質量排名。更重要嘅係，兩個唔直接寫代碼嘅 Skill 都獲得咁高使用熱度，說明工程師唔單止需要 Agent 寫更多代碼，亦需要約束 Agent 幾時唔好寫代碼、幾時必須先問問題。

Agent 越能幹，錯誤方向執行越快

呢兩個 Skill 之所以值得比較，正因為佢哋都位於實現之前。brainstorming 偏 planning 之前，用嚟將模糊需求收斂成設計；grill-me 可以發生喺 planning 之前或者 plan 草案之後，用嚟壓測已有方案。計劃寫得好唔好，取決於計劃生成之前需求、約束同決策有冇被充分暴露。

整理重點

階段治理 vs. 決策治理

brainstorming 嘅核心係階段治理，佢將「由想法進入實現」呢一步設置為受控階段切換：Agent 必須先理解上下文、澄清需求、比較方案、展示設計，並獲得用戶批准，先至可以繼續。grill-me 嘅核心係決策治理，佢假設你已經有計劃或設計，但裏面仲有未命名嘅分支、依賴同取捨，要求 Agent 圍繞計劃持續盤問。

1 治理對象：brainstorming 治理階段狀態（可唔可以進入實現），grill-me 治理決策節點（方案經唔經得起追問）。
2 交互節奏：brainstorming 漸進收斂，從上下文、問題、方案到設計文檔；grill-me 連續下鑽，沿決策樹一次一個問題。
3 產物形態：brainstorming 產出設計合約，可進入後續 planning；grill-me 產出被檢驗過嘅取捨同顯性化假設。

整理重點

各自嘅運作機制

brainstorming 係一個強門禁型 Skill，包含九個順序步驟：探索項目上下文、必要時提供視覺輔助、一次一個問題澄清需求、提出2到3個方案、展示設計、寫設計文檔、自檢、用戶複核，最後轉入 writing-plans。呢個流程嘅終點唔係實現，而係進入實現計劃。

強制先讀上下文

逐步澄清一次一個問題

1 Agent 要圍繞計劃每個方面追問，沿設計樹逐個解決依賴
2 每次只問一個問題
3 每個問題都要畀推薦答案。如果問題可以通過代碼庫探索回答，Agent 應該自己查，而唔係將事實檢索交畀用戶。

每次只問一個問題

每個問題畀推薦答案

整理重點

誤用邊界同選擇指南

brainstorming 嘅主要誤用係冇判斷任務成本就採用完整流程。對於低風險、可逆、範圍明確嘅小改動，完整設計文檔同多輪審批可能會拖慢節奏。grill-me 嘅主要誤用係喺冇方案時強行盤問，因為需要一個可被挑戰嘅對象。

冇方案時唔好急住盤問

只有想法、目標成功標準唔清楚：用 brainstorming，先結構化意圖同約束。
已有明確方案但擔心遺漏邊界：用 grill-me，沿決策樹追問隱藏假設。
新功能、跨模塊改動、架構調整： brainstorming 優先，需要階段門禁同設計合約。
小改動、已有實現思路、只想快速校準： grill-me 優先，低成本壓測關鍵取捨。
高風險任務且方案初步形成：先 brainstorming 再 grill-me，收斂設計後壓測決策。

決定使用 brainstorming 就要遵守 hard gate

兩者仲有共同邊界：佢哋唔可以替代代碼閲讀、事實檢索、測試驗證同用戶最終價值判斷。grill-me 明確要求能由代碼庫回答嘅問題就由 Agent 自己探索，呢點尤其重要：唔好將所有不確定性都扮成需要用戶回答嘅問題。

整理重點

成熟嘅 Agent 使用係知道幾時減速

brainstorming 同 grill-me 嘅共同價值，係將問題前置到實現前。區別在於佢哋前置嘅問題唔同：brainstorming 處理需求未成型，grill-me 處理方案未經壓測。

先識別不確定性類型

所以，最有價值嘅結論唔係「應該揀 brainstorming 定 grill-me」，而係：你要先識別自己面對嘅係邊一種不確定性。如果係需求未成型，揀 brainstorming；如果係方案未經壓測，揀 grill-me。如果任務風險高、影響面大、後續需要可複核計劃，先用 brainstorming 收斂設計，再用 grill-me 壓測關鍵決策。

令 Coding Agent 寫代碼越嚟越容易，難嘅係喺佢鬱手之前確認目標冇錯。brainstorming 和 grill-me 呢兩個都係好熱嘅 Agent Skill：佢哋唔負責生成代碼，而係將需求對齊、方案審查同決策澄清擺喺實現之前做。

問題在於：Agent 越能幹，喺錯誤方向上嘅執行速度亦越快。真正貴嘅失敗往往唔係某一行代碼寫錯，而係 Agent 喺目標、邊界、取捨未對齊就開始實現。brainstorming 與 grill-me 兩個都係處理呢個問題，但佢哋處理嘅唔係同一種不確定性。

結論先講：brainstorming 處理「需求未成形」嘅不確定性，grill-me 處理「方案看似成形」嘅偽確定性。前者係階段治理，回答「而家可唔可以進入實現」；後者係決策治理，回答「呢個方案頂唔頂得住追問」。用戶真正要揀嘅唔係更強嘅 Skill，而係更匹配當前任務成熟度嘅認知煞車。

背景：點解呢兩個 Skill 值得比較

截至 2026-06-03 訪問 skills.sh 嗰陣，grill-me 和 brainstorming 都已經係高安裝量嘅 Skill：

Skill	來源倉庫	skills.sh 頁面顯示 installs	skills.sh 頁面顯示 GitHub stars	首次收錄
`grill-me`	`mattpocock/skills`	254.1K	115.5K	2026-03-13
`brainstorming`	`obra/superpowers`	198.7K	215.9K	2026-01-19

呢啲數字只可以當作熱度信號，唔可以直接當成質量排名。安裝量會受曝光、倉庫聲譽、分發渠道同時間窗口影響，好難證明「邊個 Skill 更好」。但佢哋足以說明一個更有趣嘅事實：兩個唔直接寫代碼嘅 Skill，都得到相當高嘅使用熱度。

呢啲數據提示，實現前約束類 Skill 至少獲得咗可見嘅關注同安裝，但唔可以證明具體用戶規模或安裝動機。喺真實使用中，工程師唔只需要 Agent 寫更多代碼，亦需要約束 Agent 幾時唔好寫代碼、幾時一定要先問問題、幾時應該將設計變成可複核嘅產物。Agent Skill 嘅價值喺呢度體現得好清楚：佢唔係將一句「先諗清楚」寫得更客氣，而係將實現前嘅協作規則固化為可重複觸發嘅工作流程。

brainstorming 和 grill-me 之所以值得擺埋一齊比較，正正因為佢哋都位於實現之前。brainstorming 偏重規劃之前，用嚟將模糊需求收斂成設計；grill-me 可以發生喺規劃之前，亦可以發生喺計劃或設計草案之後，用嚟壓力測試已有方案。計劃寫得好唔好，好大程度取決於計劃生成之前或進入實現之前，需求、約束同決策有冇被充分暴露。

核心判斷：階段治理 vs. 決策治理

brainstorming 嘅核心係階段治理。佢將「由想法進入實現」呢一步設定為受控嘅階段切換：Agent 必須先理解上下文、澄清需求、比較方案、展示設計，並得到用戶批准之後，先可以繼續進入後續計劃或實現流程。來自 Superpowers 嘅 brainstorming 明確將呢個過程寫成 hard gate：冇設計確認，就唔可以寫代碼、唔可以 scaffold、唔可以調用實現類 Skill。

grill-me 嘅核心係決策治理。佢假設你已經有一個計劃或設計，但呢個計劃裏面仍然埋咗未命名嘅分支、依賴同取捨。來自 Matt Pocock Skills 嘅 grill-me 要求 Agent 圍繞計劃持續盤問，一次只問一個問題，沿設計樹逐個解決依賴，並為每個問題畀出推薦答案。

呢兩個治理對象唔同，導致佢哋嘅使用時機都唔同。

brainstorming 問嘅係：呢個需求係咪已經夠清楚，可以進入下一階段？

grill-me 問嘅係：呢個方案裏面有啲乜嘢看似已經決定、但實際上仍然未俾人審查嘅判斷？

前者似流程門禁，重點係防止過早進入實現；後者似方案壓力測試，重點係防止帶住隱含假設進入實現。

一個使用者選擇框架：你面對嘅係邊種不確定性？

揀呢兩個 Skill 之前，先唔好問「邊個更勁」。更好嘅問題係：當前任務嘅不確定性喺邊度？

第一類不確定性係需求未成形。你知道大約想做啲乜，但目標、約束、成功標準、邊界條件同比較方案仲未有系統化表達。例如「幫我做一個儀錶板」、「將登入體驗優化一下」、「畀呢個項目加一個導入功能」。呢啲請求睇起身可以直接開工，但裏面其實有大量等住確認嘅內容：用戶係邊個、成功標準係乜、有冇兼容性要求、有冇現有模式要重用、邊啲行為唔可以改。

呢個時候應該優先使用 brainstorming。佢嘅目標係將模糊意圖壓縮成設計合約，等後續規劃有穩定嘅輸入。例如同樣係「做一個導入功能」，brainstorming 嘅第一問可能會係：「呢個導入功能係服務邊個，成功標準係乜，有邊啲現有數據或接口唔改得？」

第二類不確定性係方案看似成形。你已經有方向，甚至已經寫咗一段計劃，但你擔心自己漏咗關鍵分支。例如「我打算新增一個緩存層」、「我準備將狀態搬去 URL query」、「我想將呢個模塊拆成兩個包」。呢類問題最危險嘅地方係令人生出一種「已經諗清楚」嘅錯覺。實際上，緩存失效、遷移策略、邊界 API、錯誤處理、回滾路徑、兼容策略可能都仲未俾人問出來。

呢個時候應該優先使用 grill-me。佢嘅目標唔係由零生成方案，而係令已有方案經受系統性嘅追問。如果用戶已經話「我準備用批處理隊列做導入」，grill-me 嘅第一問可能會係：「隊列失敗嗰陣你希望重試、跳過、回滾，定係等用戶手動處理？我嘅建議係先支援可重試失敗記錄，而唔係全量回滾。」

如果仲係揸唔定主意，可以先問自己三個問題：

我係咪已經可以清楚描述目標、成功標準同唔可以掂嘅邊界？
我係咪已經有一個可以俾人挑戰嘅具體方案？
我係咪需要留低正式嘅設計產物，等之後嘅計劃、實現或覆盤用？

如果第一個問題答唔到，先用 brainstorming。如果第二個問題答得到，但你唔肯定方案係咪可靠，用 grill-me。如果第三個問題答案係「需要」，brainstorming 更適合作為主流程，grill-me 可以作為關鍵決策嘅補充壓力測試。

`brainstorming`：處理「需求未成形」嘅不確定性

brainstorming 係一個強門禁型 Skill。佢嘅價值唔係「問多幾個問題」，而係將需求澄清、方案比較、設計確認同規格文檔沉澱組織成一個完整嘅前置流程。

從 brainstorming 嘅原文機制睇，佢包含九個順序步驟：探索項目上下文、必要時提供可選視覺輔助、一次一個問題澄清需求、提出 2 至 3 個方案、展示設計、寫設計文檔、自檢、用戶審核，最後轉入 writing-plans。呢個流程嘅終點唔係實現，而係進入實現計劃。

關鍵在於，好多 Agent 失敗唔係因為唔曉寫計劃，而係計劃輸入本身已經錯咗。Agent Planning 需要目標、約束、依賴、驗證方案同回滾路徑；但如果需求階段冇將呢啲資訊收斂出來，計劃就只係喺度包裝一個未經驗證嘅猜測。

brainstorming 喺呢個環節做咗三件事。

第一，佢強制 Agent 先讀上下文。現有代碼庫裏面嘅真實約束通常唔喺用戶一句說話嘅需求裏面，而係喺目錄結構、已有實現、近期提交、測試習慣同命名風格裏面。brainstorming 要求 Agent 提出方案之前先理解項目狀態，咁樣可以減少憑空設計。

第二，佢要求逐步澄清，而唔係一次過拋出一大堆問題。一次一個問題睇起身好似冇效率，實際上係降低對齊成本。多個開放問題撈埋一齊嘅時候，用戶容易漏答，Agent 都容易將未回答嘅部分自己補齊。逐步澄清令每個決策點都有明確回應。

第三，佢要求比較方案並得到批准。呢度嘅設計唔係 Agent 嘅內部思考，而係用戶可以審閲嘅中間產物。對於新功能、跨模塊改動、架構調整或用戶體驗設計，設計文檔本身就係後續實現嘅合約。

所以，brainstorming 適合呢啲場景：需求描述仲好粗糙，任務影響範圍唔清，用戶冇辦法直接畀出成功標準，改動跨越多個模塊，或者團隊需要留低正式設計記錄。佢嘅代價亦好明顯：流程重、互動多、節奏慢。對於一個低風險嘅單行配置修改，佢可能太大陣仗；但對於任何「做錯方向會好貴」嘅任務，呢個成本通常係值得嘅。

`grill-me`：處理「方案看似成形」嘅偽確定性

grill-me 係一個極小互動型 Skill。佢嘅正文好短，但捉住咗一個高槓桿動作：持續盤問一個計劃或設計，直到雙方形成共享理解。

grill-me 嘅關鍵約束有三條。第一，Agent 要圍繞計劃嘅每個方面追問，沿設計樹逐個解決依賴。第二，每次只問一個問題。第三，每個問題都要畀出推薦答案。如果問題可以通過代碼庫探索回答，Agent 應該自己查，而唔係將事實檢索轉交俾用戶。

這讓 grill-me 同普通嘅「你覺得仲有冇問題呀」完全唔同。佢唔係請用戶補充需求，而係主動將隱藏決策顯現化。

舉個例，用戶話：「我打算幫呢個 API 加緩存。」一個普通 Agent 可能會直接問緩存時間幾長，然後開始實現。grill-me 更應該追問嘅係：緩存鍵點定義？係咪區分用戶權限？數據更新之後點失效？失敗嗰陣係回源、報錯定係用舊數據？使唔使監察命中率？呢個係臨時優化定係要做長期基礎設施？每個問題背後都係設計樹上嘅一個分支。

更重要嘅係，grill-me 要求 Agent 畀推薦答案。呢樣令到佢唔係審問式資訊收集，而係協作式設計評審。Agent 必須基於上下文畀出自己嘅工程判斷，用戶只需要接受、修改或者拒絕默認建議。呢個都符合好嘅 Agent 指令實踐：唔好只係叫 Agent 問多啲問題，仲要叫 Agent 分清楚邊啲問題應該問用戶，邊啲事實應該自己查。

grill-me 適合呢啲場景：你已經有方案，但想暴露盲點；你要做架構調整，但唔肯定權衡係咪足夠；你準備進入實現之前，希望有人沿依賴樹逐個追問；你唔一定需要正式設計文檔，只需要將關鍵假設檢驗一下。

佢嘅代價都要睇清楚。grill-me 沒有像 brainstorming 咁樣嘅文檔同審核閘門，結束就靠雙方判斷係咪已經形成共享理解，亦唔會自動產出規格文檔。如果用戶只得一個非常模糊嘅念頭，grill-me 好容易變成冇抓手嘅追問。佢更加似壓力測試工具，而唔係需求成形工具。

三個關鍵差異：對象、節奏、產物

將兩個 Skill 擺埋一齊睇，最重要嘅差異可以壓縮成三組：治理對象、互動節奏同產物形態。

維度	`brainstorming`	`grill-me`
治理對象	階段狀態：可唔可以進入實現	決策節點：方案頂唔頂得住追問
適用輸入	模糊需求、初始想法、未成形任務	已有計劃、已有設計、等壓力測試方案
互動節奏	漸進收斂：上下文、問題、方案、設計、文檔	連續下鑽：沿決策樹一次一個問題
主要產物	設計合約，可以進入後續規劃	被檢驗過嘅取捨同顯現化假設
主要風險	對細任務嚟講太重手	對冇方案嘅任務缺少抓手

brainstorming 嘅節奏係由發散到收斂。佢容許一開始有模糊性，但會逐步將模糊性壓縮成設計。呢個過程自然適合「仲未知點做」嘅任務。

grill-me 嘅節奏係由表面方案向深層假設下鑽。佢唔負責幫你由零形成方案，而係要求你將已有方案擺上枱，接受逐個決策節點嘅追問。呢個過程自然適合「以為已經識做」嘅任務。

產物差異亦決定咗後續協作方式。brainstorming 嘅產物可以交俾後續實現計劃，成為規劃輸入；grill-me 嘅產物更加似經過檢驗嘅決策記錄，未必自動沉澱為文檔。實際使用時，如果你希望將 grill-me 嘅結果帶入執行，最好喺盤問結束之後主動整理成 spec、ADR（Architecture Decision Record）或 implementation plan。

長 Skill 與短 Skill：長度唔代表強弱，行為槓桿先係

從文件型態睇，brainstorming 很長，grill-me 好短。一個自然嘅誤解係：長 Skill 更完整，短 Skill 更輕量，所以長嘅更適合嚴肅任務，短嘅更適合隨手用。呢個判斷只啱咗一半。

Skill 嘅價值唔係由篇幅決定，而係由佢係咪改變 Agent 喺關鍵時刻嘅默認行為決定。呢個就係 Agent Skill 作為能力封裝嘅關鍵：佢將一類可重複觸發嘅行為寫成工作流，令 Agent 喺特定場景入面唔再依賴臨場發揮。

brainstorming 長，係因為佢治理嘅係完整階段轉換。佢必須規定觸發條件、禁止事項、澄清方式、方案比較、設計展示、文檔位置、自檢同用戶審核。呢度嘅長度唔係囉嗦，而係因為流程中每一步都喺度防止 Agent 過早進入實現。

grill-me 短，係因為佢只固化一個行為槓桿：盤問方案。佢唔嘗試接管完整生命週期，亦唔規定文檔模板、測試策略或後續實現。佢嘅強度來自互動姿態，而唔係流程覆蓋面。

因此，使用者唔應該用「長短」來判斷揀邊個，而應該睇自己需要嘅係完整流程治理，定係局部行為增強。

如果你面對嘅係需求未成形、目標唔穩定、上下文未讀、後續需要正式計劃嘅任務，長流程就有價值。

如果你面對嘅係方案已經形成、只差俾人挑戰、需要快速暴露盲點嘅任務，短 Skill 反而更精準。

呢個都係兩個 Skill 流行背後嘅共同啟發：Agent 寫代碼嘅速度越快，就越需要喺少數高風險認知節點施加約束。真正稀缺嘅唔係令 Agent 繼續前進嘅能力，而係令 Agent 喺錯誤階段停落嚟嘅機制。

誤用邊界：幾時佢哋會失效

brainstorming 嘅主要誤用，係採用呢個 workflow 之前冇判斷任務成本。佢自己嘅原文強調就算簡單任務都要設計，呢個喺 Superpowers 嘅強流程哲學入面係自洽嘅；但喺具體項目入面，仍然需要先判斷係咪值得用完整流程。對於低風險、可逆、範圍清楚嘅細改動，如果已經有清楚目標同驗證方式，完整嘅設計文檔同多輪審批可能會拖慢節奏。呢個判斷只能喺觸發之前做；一旦決定用 brainstorming，就應該遵守佢嘅 hard gate。

grill-me 嘅主要誤用，係冇方案嗰陣強行盤問。佢需要一個可以被挑戰嘅對象。如果用戶只得一句「我想優化系統」，Agent 好難沿決策樹下鑽，因為仲未有明確嘅決策樹。呢個時候更應該先用 brainstorming 收斂問題空間，而唔係畀 grill-me 喺空泛概念上追問。

兩者仲有共同邊界。佢哋唔可以取代代碼閲讀，唔可以取代事實檢索，唔可以取代測試驗證，亦唔可以取代用戶嘅最終價值判斷。grill-me 明確要求可以由代碼庫回答嘅問題就由 Agent 自己探索，呢一點尤其重要：唔好將所有不確定性都偽裝成需要用戶回答嘅問題。用戶應該決定目標同取捨，Agent 應該自行查證代碼庫嘅事實。

更準確啲講，呢兩個 Skill 唔係提升模型能力嘅捷徑，而係令 Agent 喺關鍵階段唔好自作聰明嘅約束。

使用者選擇指南：決策表與執行順序

實際揀嘅時候，可以用「任務成熟度、風險等級、需唔需要產物」三個維度判斷。

場景	推薦選擇	原因
得個諗法，目標同成功標準仲未清楚	`brainstorming`	先將意圖、約束、方案結構化
已有明確方案，但擔心漏咗邊界	`grill-me`	叫 Agent 沿決策樹追問隱藏假設
新功能、跨模塊改動、架構調整	`brainstorming` 優先	需要階段門禁同設計合約
細改動、已有實現思路、只想快速校準	`grill-me` 優先	用較低成本壓力測試關鍵取捨
成日遇到 Agent 做得快但方向錯	先固定用 `brainstorming`	問題多數發生喺需求輸入階段
成日遇到上線之後先發現邊界條件	喺規劃前加 `grill-me`	問題多數發生喺方案審查階段
高風險任務而且方案已經初步形成	先 `brainstorming`，再 `grill-me`	先收斂目標同設計，再壓力測試關鍵決策

更完整嘅執行順序可以係：

需求模糊嘅時候，用 brainstorming 形成設計合約。
設計初步成立之後，用 grill-me 壓力測試關鍵取捨。
盤問完之後，將結論整理入 spec、ADR 或者 implementation plan。
入實現之前，再用測試同驗證計劃鎖定成功標準。

一個簡單規則係：冇方案嗰陣，唔好急住盤問；冇目標嗰陣，唔好急住計劃。呢個順序唔適合所有任務。佢適合嗰啲「實現成本低，但方向錯成本高」嘅任務。對於一次性、低風險、可以快啲回滾嘅改動，使用者完全可以只用較輕嘅 grill-me，甚至唔用呢兩個 Skill。

結論：成熟嘅 Agent 使用，係知道幾時要減速

brainstorming 和 grill-me 嘅共同價值，係將問題前置到實現之前。分別在於佢哋前置嘅係唔同問題。

brainstorming 叫 Agent 喺需求未成形嗰陣停落嚟，將意圖、約束、方案同設計產物結構化。佢適合治理階段切換，防止 Agent 喺唔知目標嗰陣就開始實現。

grill-me 叫 Agent 喺方案看似成形嗰陣停落嚟，將隱藏假設、依賴分支同工程取捨問出來。佢適合治理關鍵決策，防止 Agent 帶住未經審查嘅默認假設進入實現。

所以，最有價值嘅結論唔係「應該揀 brainstorming 還是 grill-me」，而係：你要先認清自己面對嘅係邊一種不確定性。

如果不確定性來自需求未成形，揀 brainstorming。

如果不確定性來自方案未經壓力測試，揀 grill-me。

如果任務風險高、影響面大、後續需要可複核計劃，先用 brainstorming 收斂設計，再用 grill-me 壓力測試關鍵決策。

成熟嘅 Agent 使用，唔係追求更高嘅自動性，而係喺高風險認知節點主動降低自動性。真正專業嘅使用者，唔係令 Agent 永遠更快，而係知道幾時應該叫佢停落嚟問啱嘅問題。

參考資料

skills.sh: https://www.skills.sh
mattpocock/skills: https://github.com/mattpocock/skills
obra/superpowers: https://github.com/obra/superpowers

讓 Coding Agent 寫代碼越來越容易，難的是在它動手前確認目標沒有錯。brainstorming 和 grill-me 都是高熱度的 Agent Skill：它們不負責生成代碼，而是把需求對齊、方案審查和決策澄清前移到實現之前。

問題在於：Agent 越能幹，錯誤方向上的執行速度也越快。真正昂貴的失敗往往不是某一行代碼寫錯，而是 Agent 在目標、邊界、取捨尚未對齊時就進入實現。brainstorming 與 grill-me 都在處理這個問題，但它們處理的不是同一種不確定性。

結論先行：brainstorming 處理“需求尚未成型”的不確定性，grill-me 處理“方案看似成型”的偽確定性。前者是階段治理，回答“現在是否可以進入實現”；後者是決策治理，回答“這個方案是否經得起追問”。使用者真正要選的不是更強的 Skill，而是更匹配當前任務成熟度的認知剎車。

背景：為什麼這兩個 Skill 值得比較

截至 2026-06-03 訪問 skills.sh 時，grill-me 和 brainstorming 都已經是高安裝量 Skill：

Skill	來源倉庫	skills.sh 頁面展示 installs	skills.sh 頁面展示 GitHub stars	首次收錄
`grill-me`	`mattpocock/skills`	254.1K	115.5K	2026-03-13
`brainstorming`	`obra/superpowers`	198.7K	215.9K	2026-01-19

這些數字只能作為熱度信號，不能直接當作質量排名。安裝量受曝光、倉庫聲譽、分發渠道和時間窗口影響，很難證明“哪個 Skill 更好”。但它們足以說明一個更有意思的事實：兩個並不直接寫代碼的 Skill，都獲得了相當高的使用熱度。

這些數據提示，實現前約束類 Skill 至少獲得了可見關注和安裝，但不能證明具體用戶規模或安裝動機。在真實使用中，工程師不只需要 Agent 寫更多代碼，也需要約束 Agent 何時不要寫代碼、何時必須先問問題、何時應該把設計變成可複核產物。Agent Skill 的價值在這裏體現得很清楚：它不是把一句“先想清楚”寫得更禮貌，而是把實現前的協作規則固化為可重複觸發的工作流。

brainstorming 和 grill-me 之所以值得放在一起比較，正因為它們都位於實現之前。brainstorming 更偏 planning 之前，用來把模糊需求收斂成設計；grill-me 可以發生在 planning 之前，也可以發生在 plan 或 design 草案之後，用來壓測已有方案。計劃寫得好不好，很大程度取決於計劃生成之前或進入實現之前，需求、約束和決策有沒有被充分暴露。

核心判斷：階段治理 vs. 決策治理

brainstorming 的核心是階段治理。它把“從想法進入實現”這一步設置為受控階段切換：Agent 必須先理解上下文、澄清需求、比較方案、展示設計，並在獲得用戶批准後，才能繼續進入後續計劃或實現流程。來自 Superpowers 的 brainstorming 明確把這個過程寫成 hard gate：沒有設計確認，就不能寫代碼、不能 scaffold、不能調用實現類 Skill。

grill-me 的核心是決策治理。它假設你已經有了一個計劃或設計，但這個計劃裏仍然埋着未命名的分支、依賴和取捨。來自 Matt Pocock Skills 的 grill-me 要求 Agent 圍繞計劃持續盤問，一次只問一個問題，沿設計樹逐個解決依賴，併為每個問題給出推薦答案。

這兩個治理對象不同，導致它們的使用時機也不同。

brainstorming 問的是：這個需求是否已經足夠清楚，足以進入下一階段？

grill-me 問的是：這個方案裏有哪些看似已經決定、實際仍未被審查的判斷？

前者像流程門禁，重點是防止過早進入實現；後者像方案壓力測試，重點是防止帶着隱含假設進入實現。

一個使用者選擇框架：你面對的是哪種不確定性？

選擇這兩個 Skill 之前，先不要問“哪個更強”。更好的問題是：當前任務的不確定性在哪裏？

第一類不確定性是需求尚未成型。你知道大概想做什麼，但目標、約束、成功標準、邊界條件和可選方案還沒有被系統化表達。比如“幫我做一個儀表盤”“把登錄體驗優化一下”“給這個項目加一個導入功能”。這些請求看起來能直接開工，但裏面其實有大量待確認內容：用戶是誰、成功標準是什麼、是否有兼容性要求、有沒有現有模式要複用、哪些行為不能改變。

這時應該優先用 brainstorming。它的目標是把模糊意圖壓縮成設計合約，讓後續 planning 有穩定輸入。比如同樣是“做一個導入功能”，brainstorming 的第一問更可能是：“這個導入功能要服務誰，成功標準是什麼，哪些現有數據或接口不能被改變？”

第二類不確定性是方案看似成型。你已經有了方向，甚至已經寫出一段計劃，但你擔心自己漏掉關鍵分支。比如“我打算新增一個緩存層”“我準備把狀態遷到 URL query”“我想把這個模塊拆成兩個包”。這類問題最危險的地方在於它給人一種“已經想清楚”的錯覺。實際上，緩存失效、遷移策略、邊界 API、錯誤處理、回滾路徑、兼容策略可能都還沒有被問出來。

這時應該優先用 grill-me。它的目標不是從零生成方案，而是讓已有方案經受系統性追問。如果用戶已經說“我準備用批處理隊列做導入”，grill-me 的第一問更可能是：“隊列失敗時你希望重試、跳過、回滾，還是讓用戶手動處理？我的建議是先支持可重試失敗記錄，而不是全量回滾。”

如果仍然拿不準，可以先問三個問題：

我是否已經能清楚描述目標、成功標準和不可觸碰邊界？
我是否已經有一個可以被挑戰的具體方案？
我是否需要留下正式設計產物，供後續計劃、實現或覆盤使用？

如果第一個問題答不上來，先用 brainstorming。如果第二個問題答得上來，但你不確定方案是否可靠，用 grill-me。如果第三個問題答案是“需要”，brainstorming 更適合作為主流程，grill-me 可以作為關鍵決策的補充壓力測試。

`brainstorming`：處理“需求尚未成型”的不確定性

brainstorming 是一個強門禁型 Skill。它的價值不是“多問幾個問題”，而是把需求澄清、方案比較、設計確認和規格文檔沉澱組織成完整的前置流程。

從 brainstorming 的原文機制看，它包含九個順序步驟：探索項目上下文、必要時提供可選視覺輔助、一次一個問題澄清需求、提出 2 到 3 個方案、展示設計、寫設計文檔、自檢、用戶複核，最後轉入 writing-plans。這個流程的終點不是實現，而是進入實現計劃。

關鍵在於，很多 Agent 失敗不是因為不會寫計劃，而是計劃輸入本身已經錯了。Agent Planning 需要目標、約束、依賴、驗證方案和回滾路徑；但如果需求階段沒有把這些信息收斂出來，計劃就只是在包裝一個未經驗證的猜測。

brainstorming 在這個環節做了三件事。

第一，它強制 Agent 先讀上下文。既有代碼庫裏的真實約束通常不在用戶的一句話需求裏，而在目錄結構、已有實現、近期提交、測試習慣和命名風格里。brainstorming 要求 Agent 在提方案之前先理解項目狀態，這能減少憑空設計。

第二，它要求逐步澄清，而不是一次拋出一組問題。一次一個問題看似低效，實際是在降低對齊成本。多個開放問題混在一起時，用戶容易漏答，Agent 也容易把未回答部分自行補全。逐步澄清讓每個決策點都有明確回應。

第三，它要求比較方案並獲得批准。這裏的設計不是 Agent 的內部思考，而是用戶可審閲的中間產物。對於新功能、跨模塊改動、架構調整或用戶體驗設計，設計文檔本身就是後續實現的合約。

所以，brainstorming 適合這些場景：需求描述還粗糙，任務影響範圍不清，用戶無法直接給出成功標準，改動跨越多個模塊，或者團隊需要留下正式設計記錄。它的代價也很明顯：流程重、交互多、節奏慢。對於一個低風險的單行配置修改，它可能過度；但對於任何“做錯方向會很貴”的任務，這個成本通常是值得的。

`grill-me`：處理“方案看似成型”的偽確定性

grill-me 是一個極小交互型 Skill。它的正文很短，但抓住了一個高槓杆動作：持續盤問一個計劃或設計，直到雙方形成共享理解。

grill-me 的關鍵約束有三條。第一，Agent 要圍繞計劃的每個方面追問，沿設計樹逐個解決依賴。第二，每次只問一個問題。第三，每個問題都要給出推薦答案。如果問題可以通過代碼庫探索回答，Agent 應該自己查，而不是把事實檢索轉交給用戶。

這讓 grill-me 和普通“你覺得還有什麼問題嗎”的澄清完全不同。它不是請用戶補充需求，而是主動把隱藏決策顯性化。

舉個例子，用戶說：“我打算給這個 API 加緩存。”一個普通 Agent 可能會直接問緩存時間多長，然後開始實現。grill-me 更應該追問的是：緩存鍵如何定義？是否區分用戶權限？數據更新後如何失效？失敗時是回源、報錯還是使用陳舊數據？是否需要觀測命中率？這是不是臨時優化，還是要作為長期基礎設施？每個問題背後都是設計樹上的一個分支。

更重要的是，grill-me 要求 Agent 給推薦答案。這讓它不是審問式信息收集，而是協作式設計評審。Agent 必須基於上下文給出自己的工程判斷，用戶只需要接受、修正或拒絕默認建議。這也符合好的 Agent 指令實踐：不要只讓 Agent 多問問題，還要讓 Agent 區分哪些問題該問用戶，哪些事實該自己查。

grill-me 適合這些場景：你已經有方案，但想暴露盲點；你要做架構調整，但不確定權衡是否充分；你準備進入實現前，希望有人沿依賴樹逐個追問；你不一定需要正式設計文檔，只需要讓關鍵假設被檢驗。

它的代價也要看清楚。grill-me 沒有像 brainstorming 那樣的文檔和複核 gate，結束依賴雙方判斷是否已經形成共享理解，也不自動產出規格文檔。如果用戶只有一個非常模糊的念頭，grill-me 容易變成沒有抓手的追問。它更像壓力測試工具，而不是需求成型工具。

三個關鍵差異：對象、節奏、產物

把兩個 Skill 放在一起看，最重要的差異可以壓縮為三組：治理對象、交互節奏和產物形態。

維度	`brainstorming`	`grill-me`
治理對象	階段狀態：是否可以進入實現	決策節點：方案是否經得起追問
適用輸入	模糊需求、初始想法、未成型任務	已有計劃、已有設計、待壓測方案
交互節奏	漸進收斂：上下文、問題、方案、設計、文檔	連續下鑽：沿決策樹一次一個問題
主要產物	設計合約，可進入後續 planning	被檢驗過的取捨和顯性化假設
主要風險	對小任務過重	對無方案任務缺少抓手

brainstorming 的節奏是從發散到收斂。它允許一開始存在模糊性，但會逐步把模糊性壓縮為設計。這個過程天然適合“還不知道要怎麼做”的任務。

grill-me 的節奏是從表層方案向深層假設下鑽。它不負責幫你從零形成方案，而是要求你把已有方案放到桌面上，接受逐個決策節點的追問。這個過程天然適合“以為已經知道怎麼做”的任務。

產物差異也決定了後續協作方式。brainstorming 的產物可以交給後續實現計劃，成為 planning 輸入；grill-me 的產物更像經過檢驗的決策記錄，未必自動沉澱為文檔。實際使用時，如果你希望把 grill-me 的結果帶入執行，最好在盤問結束後主動整理為 spec、ADR（Architecture Decision Record）或 implementation plan。

長 Skill 與短 Skill：長度不是強弱，行為槓桿才是

從文件形態看，brainstorming 很長，grill-me 很短。一個自然誤解是：長 Skill 更完整，短 Skill 更輕量，所以長的更適合嚴肅任務，短的更適合隨手使用。這個判斷只說對了一半。

Skill 的價值不由篇幅決定，而由它是否改變 Agent 在關鍵時刻的默認行為決定。這也是 Agent Skill 作為能力封裝的關鍵：它把一類可重複觸發的行為寫成工作流，讓 Agent 在特定場景中不再依賴臨場發揮。

brainstorming 長，是因為它治理的是完整階段轉換。它必須規定觸發條件、禁止事項、澄清方式、方案比較、設計展示、文檔位置、自檢和用戶複核。這裏的長度不是囉嗦，而是因為流程中每一步都在防止 Agent 過早進入實現。

grill-me 短，是因為它只固化一個行為槓桿：盤問方案。它不試圖接管完整生命週期，也不規定文檔模板、測試策略或後續實現。它的強度來自交互姿態，而不是流程覆蓋面。

因此，使用者不應該用“長短”來判斷選擇，而應該看自己需要的是完整流程治理，還是局部行為增強。

如果你面對的是需求不成型、目標不穩定、上下文未讀、後續需要正式計劃的任務，長流程是價值。

如果你面對的是方案已形成、只差被挑戰、需要快速暴露盲點的任務，短 Skill 反而更精準。

這也是兩個 Skill 流行背後的共同啓發：Agent 寫代碼的速度越快，越需要在少數高風險認知節點施加約束。真正稀缺的不是讓 Agent 繼續前進的能力，而是讓 Agent 在錯誤階段停下來的機制。

誤用邊界：什麼時候它們會失效

brainstorming 的主要誤用，是在採用這套 workflow 之前沒有判斷任務成本。它自己的原文強調即使簡單任務也要設計，這在 Superpowers 的強流程哲學裏是自洽的；但在具體項目裏，仍然需要先判斷是否值得采用完整流程。對於低風險、可逆、範圍明確的小改動，如果已經有清楚目標和驗證方式，完整的設計文檔和多輪審批可能會拖慢節奏。這個判斷只能發生在觸發之前；一旦決定使用 brainstorming，就應該遵守它的 hard gate。

grill-me 的主要誤用，是在沒有方案時強行盤問。它需要一個可被挑戰的對象。如果用戶只有一句“我想優化系統”，Agent 很難沿決策樹下鑽，因為還沒有明確的決策樹。這時更應該先用 brainstorming 收斂問題空間，而不是讓 grill-me 在空泛概念上追問。

兩者還有共同邊界。它們不能替代代碼閲讀，不能替代事實檢索，不能替代測試驗證，也不能替代用戶的最終價值判斷。grill-me 明確要求能由代碼庫回答的問題就由 Agent 自己探索，這一點尤其重要：不要把所有不確定性都偽裝成需要用戶回答的問題。用戶應該決定目標和取捨，Agent 應該自行查證代碼庫事實。

更準確地說，這兩個 Skill 不是提升模型能力的捷徑，而是讓 Agent 在關鍵階段不要自作聰明的約束。

使用者選擇指南：決策表與執行順序

實際選擇時，可以用“任務成熟度、風險等級、是否需要產物”三個維度判斷。

場景	推薦選擇	原因
只有想法，目標和成功標準還不清楚	`brainstorming`	先把意圖、約束、方案結構化
已有明確方案，但擔心遺漏邊界	`grill-me`	讓 Agent 沿決策樹追問隱藏假設
新功能、跨模塊改動、架構調整	`brainstorming` 優先	需要階段門禁和設計合約
小改動、已有實現思路、只想快速校準	`grill-me` 優先	用較低成本壓測關鍵取捨
經常遇到 Agent 做得很快但方向錯	先固定使用 `brainstorming`	問題多半發生在需求輸入階段
經常遇到上線後才發現邊界條件	在 planning 前加 `grill-me`	問題多半發生在方案審查階段
高風險任務且方案也已初步形成	先 `brainstorming`，再 `grill-me`	先收斂目標和設計，再壓測關鍵決策

更完整的執行順序可以是：

需求模糊時，用 brainstorming 形成設計合約。
設計初步成立後，用 grill-me 壓測關鍵取捨。
盤問結束後，把結論整理進 spec、ADR 或 implementation plan。
進入實現前，再用測試和驗證計劃鎖定成功標準。

一個簡單規則是：沒有方案時，不要急着盤問；沒有目標時，不要急着計劃。這個順序並不適合所有任務。它適合那些“實現成本低，但方向錯誤成本高”的任務。對於一次性、低風險、可快速回滾的改動，使用者完全可以只用較輕的 grill-me，甚至不使用這兩個 Skill。

結論：成熟的 Agent 使用，是知道何時減速

brainstorming 和 grill-me 的共同價值，是把問題前置到實現前。區別在於它們前置的是不同問題。

brainstorming 讓 Agent 在需求未成型時停下來，把意圖、約束、方案和設計產物結構化。它適合治理階段切換，防止 Agent 在不知道目標時就開始實現。

grill-me 讓 Agent 在方案看似成型時停下來，把隱藏假設、依賴分支和工程取捨問出來。它適合治理關鍵決策，防止 Agent 帶着未經審查的默認假設進入實現。

所以，最有價值的結論不是“應該選 brainstorming 還是 grill-me”，而是：你要先識別自己面對的是哪一種不確定性。

如果不確定性來自需求尚未成型，選 brainstorming。

如果不確定性來自方案未經壓測，選 grill-me。

如果任務風險高、影響面大、後續需要可複核計劃，先用 brainstorming 收斂設計，再用 grill-me 壓測關鍵決策。

成熟的 Agent 使用，不是追求更高自動性，而是在高風險認知節點主動降低自動性。真正專業的使用者，不是讓 Agent 永遠更快，而是知道什麼時候該讓它停下來問對問題。

參考資料

skills.sh: https://www.skills.sh
mattpocock/skills: https://github.com/mattpocock/skills
obra/superpowers: https://github.com/obra/superpowers

點解要比較呢兩個 Skill？

階段治理 vs. 決策治理

各自嘅運作機制

誤用邊界同選擇指南

成熟嘅 Agent 使用係知道幾時減速

背景：點解呢兩個 Skill 值得比較

核心判斷：階段治理 vs. 決策治理

一個使用者選擇框架：你面對嘅係邊種不確定性？

brainstorming：處理「需求未成形」嘅不確定性

grill-me：處理「方案看似成形」嘅偽確定性

三個關鍵差異：對象、節奏、產物

長 Skill 與短 Skill：長度唔代表強弱，行為槓桿先係

誤用邊界：幾時佢哋會失效

使用者選擇指南：決策表與執行順序

結論：成熟嘅 Agent 使用，係知道幾時要減速

參考資料

背景：為什麼這兩個 Skill 值得比較

核心判斷：階段治理 vs. 決策治理

一個使用者選擇框架：你面對的是哪種不確定性？

brainstorming：處理“需求尚未成型”的不確定性

grill-me：處理“方案看似成型”的偽確定性

三個關鍵差異：對象、節奏、產物

長 Skill 與短 Skill：長度不是強弱，行為槓桿才是

誤用邊界：什麼時候它們會失效

使用者選擇指南：決策表與執行順序

結論：成熟的 Agent 使用，是知道何時減速

參考資料

`brainstorming`：處理「需求未成形」嘅不確定性

`grill-me`：處理「方案看似成形」嘅偽確定性

`brainstorming`：處理“需求尚未成型”的不確定性

`grill-me`：處理“方案看似成型”的偽確定性