拷問+任務拆解+測試驅動:我每天都在用的 5 個 skill
整理版優先睇
透過5個Skill標準化開發流程,提升AI Agent產出質量
呢篇文章係由開發者 Matt Pocock(mattpocock)寫嘅,佢分享咗自己每日都用嘅 5 個 skill,目的係為咗令 AI agent 嘅開發流程標準化,解決 agent 產出唔穩定嘅問題。作者認為,要想令 agent 產出有用成果,必須制定極其嚴格同清晰嘅流程,而呢啲 skill 正正係將流程固定落嚟。
首先,grill-me 透過持續追問設計樹來達成共識,避免 agent 過早拋出方案。跟住 to-prd 將對話轉為產品需求文檔,to-issues 將目標拆解為可獨立執行嘅 issue。測試方面,tdd 強制紅-綠-重構循環,大幅提升程式碼質量。最後 improve-codebase-architecture 自動分析程式碼庫,提出重構建議,令程式碼對 agent 更友好。
整體結論係:AI 雖然冇記憶,但只要似對待人類咁對待佢哋,透過標準化技能引導,就可以持續提升產出質量。呢套技能可以透過一句 npx 命令安裝,值得開發者一試。
- 結論:標準化技能係提升 AI agent 產出最穩定嘅方式。
- 方法:grill-me 透過設計樹追問;to-prd 生成文檔;to-issues 拆解任務;tdd 測試驅動;improve-codebase-architecture 重構架構。
- 差異:呢啲 skill 係固定流程,唔似普通 prompt 咁自由,強制 AI 跟住路徑行。
- 啟發:AI 冇記憶,但可以透過標準化技能模擬人類協作。
- 可行動點:即刻用 npx skills@latest add mattpocock/skills 安裝,然後喺開發中應用。
安裝所有5個skill
執行以下命令安裝所有skill: npx skills@latest add mattpocock/skills
標準化流程嘅核心:grill-me
呢個 skill 得三句話,但效果驚人:佢會對你嘅計劃進行毫不留情嘅「拷問」,直到達成共識。作者強調,設計樹(design tree)嘅概念來自《The Design of Design》,要求逐個分支排查,確保所有決策都被考慮。
設計樹(design tree)
作者試過呢個 skill 持續近半小時,包含30-50個問題,幫助確定產品細節。調用grill-me嘅目的係為咗喺寫code之前同模型達成真正共識,避免agent過早拋出方案。
達成共識
避免過早拋出方案
從文檔到任務拆解:to-prd 與 to-issues
一旦達成共識,就用 to-prd 將對話轉為產品需求文檔(PRD),佢會分析描述、瀏覽codebase、規劃模塊,再用模板寫PRD。呢個過程借鑑咗敏捷開發嘅方法。
產品需求文檔(PRD)
敏捷開發
跟住 to-issues 將 PRD 拆解成獨立嘅 issue,建立任務之間嘅阻塞關係。具體流程包括定位PRD、探索codebase、起草垂直切片。
垂直切片
阻塞關係
- 定位PRD
- 探索codebase
- 起草垂直切片:將PRD拆解為各個子任務
呢個機制令多個agent可以並行工作,互相唔會阻塞。
測試驅動開發:tdd 提升程式碼質量
tdd 強制 agent 遵循「紅-綠-重構」循環:先確認測試行為,設計接口,每次寫一個測試,再編寫code通過測試,最後重構。呢個模式對agent非常有效,創造良性循環。
紅-綠-重構
呢個skill仲融入咗關於重構、Mock同深度模塊嘅設計哲學,確保測試邊界清晰。
Mock
深度模塊
改善架構:improve-codebase-architecture 與結語
呢個skill自動探索codebase,查找令人困惑嘅地方,例如:需要喺多個小文件之間切換、為測試方便抽取嘅純函數、緊密耦合嘅模塊帶來集成風險。
模塊邊界
純函數
集成風險
- 理解概念需要喺多個小文件之間頻繁切換
- 抽取純函數只為測試方便,真正bug隱藏喺調用方式
- 緊密耦合模塊帶嚟集成風險
建議每週執行一次,隨着重構,agent嘅輸出質量會明顯提升。作者結語話:AI冇記憶,但好似對待人類咁對待佢哋,先係提升質量嘅關鍵。
冇記憶
似對待人類咁對待佢哋
作為開發者,你要不斷咁引導你嘅 agent,確保佢哋行啱條路。
要想 agent 產出有用嘅工作成果,你一定要制定極嚴格同埋定義清晰嘅流程。
對此,我嘅解決方法係建立同用大量嘅 skills。
呢啲 skills 都係為咗將我嘅開發流程無限標準化,令 AI 每次有固定路徑可以跟住。
跟住介紹嘅 5 個 skill,全部可以用下面嘅指令安裝:
npx skills@latest add mattpocock/skills01/grill-me:完善你嘅諗法
呢個係我最鍾意同最常用嘅 skill。佢得三句話,但效果驚人:
Interview me relentlessly about every aspect of this plan until we reach a shared understanding.
Walk down each branch of the design tree, resolving dependencies between decisions one-by-one. For each question, provide your recommended answer.
Ask the questions one at a time.
If a question can be answered by exploring the codebase, explore the codebase instead.
翻譯過嚟就係:
針對呢個計劃嘅每一個細節,對我進行毫不留情嘅「拷問」(interview),直到我哋達成共識。
順住設計樹(design tree)嘅每個分支逐一排查,依次解決各項決策之間嘅依賴關係。
最後,如果某個問題可以透過閲讀代碼庫嚟解答,請直接去閲讀代碼庫,而唔係向我提問。
設計樹(design tree)嘅概念源自 Frederick P. Brooks 嘅著作《The Design of Design》。佢嘅核心觀點係:喺設計某樣嘢嗰陣,你需要遍歷設計樹嘅所有分支。
例如呢個 skill 嘅作者提過,喺設計搜索頁面嗰陣,你需要喺「高級搜索界面」同「簡易文本框」之間做選擇。如果選擇高級搜索,你就必須理清所有篩選同排序規則。你需要不斷沿住呢棵樹向下走,直到徹底搞清楚成個設計,再開始寫 code。

調用呢個 skill 嘅目的,就係希望同模型達成共識。
無論咩 Agent,喺計劃模式下往往都會過早咁拋出一個方案,喺我哋未真正互相理解之前就整好咗文檔。而 grill me 強制啟動咗呢種對話交流。
喺處理真正複雜嘅功能嗰陣,我曾經歷過持續近半個鐘、包含 30、40 甚至 50 個問題嘅拷問環節,佢可以幫我確定產品嘅細節同走向。
02/to-prd:由對話到文件
一旦同模型達成咗共識,我就會調用下一個 skill:/to-prd。
呢個 skill 根據當前嘅對話、上下文、代碼庫內容生成一份產品需求文件(PRD),佢嘅工作流包括:
- 分析用戶提供嘅詳細描述
- 瀏覽代碼庫以驗證假設
- 規劃所需嘅核心模塊
- 使用模板編寫 PRD
佢參考咗敏捷開發嘅方法,用自然嘅語言嚟描述系統嘅預期行為。
03/to-issues:將目標拆解為過程
PRD 描述咗你嘅目標同預期,但真正實現所需要嘅,係達到目標嘅過程。
呢個就係 PRD to Issues skill 嘅作用。佢可以將一份 PRD 轉化為任務看板,上面全部係可以獨立領取嘅 issue。
具體流程如下:
- 定位 PRD
- 探索代碼庫
- 起草垂直切片:將 PRD 拆解為各個子任務
呢個 skill 仲會建立任務之間嘅阻斷關係。
例如,某個 issue 可能唔會被任何嘢阻塞,咁佢就可以被獨立領取。呢個喺多個 agent 並行工作嘅開發環境下非常有用。
04/tdd:提升代碼質素
/tdd 可以確保實現方案穩健,同埋大幅提升代碼質素。
TDD 代表測試驅動開發(Test-Driven Development),佢會強制(更準確啲講係引導)agent 遵循「紅-綠-重構」嘅循環。
佢融入咗關於重構、Mock 以及點樣構建深度模塊嘅設計哲學。實踐證明,做好 TDD 係提升 agent 輸出質素最穩定有效嘅方式。
呢個 skill 會:
- 確認需要測試邊啲行為
- 為可測試功能設計接口
- 每次只寫一個測試
- 編寫 code 令測試通過
- 揾可以重構嘅 code
喺 agent 上應用「紅-綠-重構」模式非常有效,佢會創造一個良性循環,不斷迭代直到任務完成。
05/improve-codebase-architecture:等你嘅 code 對 Agent 更友好
TDD 對代碼庫嘅設計要求好高。
喺一個結構混亂嘅代碼庫中,測試邊界會非常模糊,AI 可能會唔知道應該喺邊度或者邊個層級進行測試。
當你嘅代碼庫有清晰嘅模塊邊界嗰陣,編寫測試就會容易好多。
/improve-codebase-architecture skill 會自動探索你嘅代碼庫,揾令人困惑嘅地方:
- 喺邊啲地方,理解一個概念需要喺好多細文件之間頻繁切換?
- 喺邊啲地方,抽取純函數只係為咗測試方便,真正嘅 bug 卻隱藏喺調用方式中?
- 喺邊啲地方,緊密耦合嘅模塊帶嚟咗集成風險?
然後,佢會提出值得優化嘅候選模塊。
每星期執行一次呢個操作,或者喺開發嘅高峯階段結束之後執行一次。
隨住你不斷重構同提煉代碼庫,你會明顯發現 agent 嘅輸出質素逐步提升。
如果你嘅代碼庫係一堆垃圾,咁 AI 都只能喺呢個代碼庫入面繼續產生垃圾。
06最後
雖然 AI 有奇怪嘅特性:例如冇記憶、克隆出嚟就直接做到嘢,但追根究底,佢哋就係類似人類思維模式嘅智能個體。
所以,想令 agent 產出嘅結果質素再上一個台階,最關鍵嘅方法,就係好似對待人咁對待佢哋。
07推薦閲讀
作為開發者,你需要不斷引導你的 agent,確保它們在正確的軌道上前進。
要想讓 agent 產出有用的工作成果,你必須制定極其嚴格且定義清晰的流程。
對此,我的解決辦法是創建和使用大量的 skills。
這些 skills 都是為了將我的開發流程無限標準化,讓 AI 每次都有固定的路徑可以遵循。
接下來介紹的 5 個 skill,均可使用下面的命令安裝:
npx skills@latest add mattpocock/skills01/grill-me:完善你的想法
這是我最喜歡也最常用的 skill。它只有三句話,但效果驚人:
Interview me relentlessly about every aspect of this plan until we reach a shared understanding.
Walk down each branch of the design tree, resolving dependencies between decisions one-by-one. For each question, provide your recommended answer.
Ask the questions one at a time.
If a question can be answered by exploring the codebase, explore the codebase instead.
翻譯過來就是:
針對這個計劃的每一個細節,對我進行毫不留情的“拷問”(interview),直到我們達成共識。
順着設計樹(design tree)的每個分支逐一排查,依次解決各項決策之間的依賴關係。
最後,如果某個問題可以通過閲讀代碼庫來解答,請直接去閲讀代碼庫,而不是向我提問。
設計樹(design tree)的概念源自 Frederick P. Brooks 的著作《The Design of Design 》。它的核心觀點是:在設計某樣東西時,你需要遍歷設計樹的所有分支。
例如這個 skill 的作者提到過,在設計搜索頁面時,你需要在“高級搜索界面”和“簡易文本框”之間做選擇。如果選擇高級搜索,你就必須理清所有的篩選和排序規則。你需要不斷沿着這棵樹往下走,直到徹底弄清楚整個設計,再動手寫代碼。

調用這個 skill 的目的,就是希望與模型達成共識。
無論什麼 Agent,在計劃模式下往往都會過早地拋出一個方案,在我們還沒真正互相理解之前就建好了文檔。而 grill me 強制啓動了這種對話交流。
在處理真正複雜的功能時,我曾經歷過持續近半小時、包含 30、40 甚至 50 個問題的拷問環節,它能幫助我確定產品的細節和走向。
02/to-prd:從對話到文檔
一旦與模型達成了共識,我就會調用下一個 skill:/to-prd。
這個 skill 根據當前的對話、上下文、代碼庫內容生成一份產品需求文檔(PRD),它的工作流包括:
- 分析用戶提供詳細描述
- 瀏覽代碼庫以驗證假設
- 規劃所需的核心模塊
- 使用模板編寫 PRD
它借鑑了敏捷開發的方法,用自然的語言來描述系統的預期行為。
03/to-issues:將目標拆解為過程
PRD 描述了你的目標和預期,但真正實現所需要的,是達到目標的過程。
這就是 PRD to Issues skill 的作用。它能將一份 PRD 轉化為任務看板,上面全是可以獨立領取的 issue。
具體流程如下:
- 定位 PRD
- 探索代碼庫
- 起草垂直切片:將 PRD 拆解為各個子任務
這個 skill 還會建立任務之間的阻斷關係。
例如,某個 issue 可能不會被任何東西阻塞,那它就可以被獨立領取。這在多個 agent 並行工作的開發環境下非常有用。
04/tdd:提升代碼質量
/tdd 可以確保實現方案穩健,並大幅提升代碼質量。
TDD 代表測試驅動開發(Test-Driven Development),它會強制(更確切地說是引導)agent 遵循“紅-綠-重構”的循環。
它融入了關於重構、Mock 以及如何構建深度模塊的設計哲學。實踐證明,做好 TDD 是提升 agent 輸出質量最穩定有效的方式。
這個 skill 會:
- 確認需要測試哪些行為
- 為可測試功能設計接口
- 每次只寫一個測試
- 編寫代碼使測試通過
- 尋找可以重構的代碼
在 agent 上應用“紅-綠-重構”模式非常有效,它會創造一個良性循環,不斷迭代直到任務完成。
05/improve-codebase-architecture:讓你的代碼對 Agent 更友好
TDD 對代碼庫的設計要求很高。
在一個結構混亂的代碼庫中,測試邊界會非常模糊,AI 可能會不知道該在哪裏或者那個層級進行測試。
當你的代碼庫擁有清晰的模塊邊界時,編寫測試就會容易得多。
/improve-codebase-architecture skill 會自動探索你的代碼庫,查找讓人困惑的地方:
- 在哪些地方,理解一個概念需要在許多小文件之間頻繁切換?
- 在哪些地方,抽取純函數只是為了測試方便,真正的 bug 卻隱藏在調用方式中?
- 在哪些地方,緊密耦合的模塊帶來了集成風險?
然後,它會提出值得優化的候選模塊。
每週執行一次該操作,或者在開發的高峯階段結束後執行一次。
隨着你不斷重構和提煉代碼庫,你會明顯發現 agent 的輸出質量在逐步提升。
如果你的代碼庫是一堆垃圾,那麼 AI 也只能在這個代碼庫中繼續產生垃圾。
06最後
雖然 AI 有着奇怪的特性:比如沒有記憶、克隆出來就能直接幹活,但追根究底,它們就是類似人類思維模式的智能個體。
所以,想要讓 agent 產出的結果質量再上一個台階,最關鍵的辦法,就是像對待人類一樣對待它們。