拷問+任務拆解+測試驅動:我每天都在用的 5 個 skill

作者:數字邊界 EdgeX
日期:2026年5月29日 下午12:09
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

透過5個Skill標準化開發流程,提升AI Agent產出質量

整理版摘要

呢篇文章係由開發者 Matt Pocock(mattpocock)寫嘅,佢分享咗自己每日都用嘅 5 個 skill,目的係為咗令 AI agent 嘅開發流程標準化,解決 agent 產出唔穩定嘅問題。作者認為,要想令 agent 產出有用成果,必須制定極其嚴格同清晰嘅流程,而呢啲 skill 正正係將流程固定落嚟。

首先,grill-me 透過持續追問設計樹來達成共識,避免 agent 過早拋出方案。跟住 to-prd 將對話轉為產品需求文檔,to-issues 將目標拆解為可獨立執行嘅 issue。測試方面,tdd 強制紅-綠-重構循環,大幅提升程式碼質量。最後 improve-codebase-architecture 自動分析程式碼庫,提出重構建議,令程式碼對 agent 更友好。

整體結論係:AI 雖然冇記憶,但只要似對待人類咁對待佢哋,透過標準化技能引導,就可以持續提升產出質量。呢套技能可以透過一句 npx 命令安裝,值得開發者一試。

  • 結論:標準化技能係提升 AI agent 產出最穩定嘅方式。
  • 方法:grill-me 透過設計樹追問;to-prd 生成文檔;to-issues 拆解任務;tdd 測試驅動;improve-codebase-architecture 重構架構。
  • 差異:呢啲 skill 係固定流程,唔似普通 prompt 咁自由,強制 AI 跟住路徑行。
  • 啟發:AI 冇記憶,但可以透過標準化技能模擬人類協作。
  • 可行動點:即刻用 npx skills@latest add mattpocock/skills 安裝,然後喺開發中應用。
值得記低
Skill

安裝所有5個skill

執行以下命令安裝所有skill: npx skills@latest add mattpocock/skills

整理重點

標準化流程嘅核心:grill-me

呢個 skill 得三句話,但效果驚人:佢會對你嘅計劃進行毫不留情嘅「拷問」,直到達成共識。作者強調,設計樹(design tree)嘅概念來自《The Design of Design》,要求逐個分支排查,確保所有決策都被考慮。

設計樹(design tree)

作者試過呢個 skill 持續近半小時,包含30-50個問題,幫助確定產品細節。調用grill-me嘅目的係為咗喺寫code之前同模型達成真正共識,避免agent過早拋出方案。

達成共識

避免過早拋出方案

整理重點

從文檔到任務拆解:to-prd 與 to-issues

一旦達成共識,就用 to-prd 將對話轉為產品需求文檔(PRD),佢會分析描述、瀏覽codebase、規劃模塊,再用模板寫PRD。呢個過程借鑑咗敏捷開發嘅方法。

產品需求文檔(PRD

敏捷開發

跟住 to-issues 將 PRD 拆解成獨立嘅 issue,建立任務之間嘅阻塞關係。具體流程包括定位PRD、探索codebase、起草垂直切片。

垂直切片

阻塞關係

  • 定位PRD
  • 探索codebase
  • 起草垂直切片:將PRD拆解為各個子任務

呢個機制令多個agent可以並行工作,互相唔會阻塞。

整理重點

測試驅動開發:tdd 提升程式碼質量

tdd 強制 agent 遵循「紅-綠-重構」循環:先確認測試行為,設計接口,每次寫一個測試,再編寫code通過測試,最後重構。呢個模式對agent非常有效,創造良性循環。

紅-綠-重構

呢個skill仲融入咗關於重構、Mock同深度模塊嘅設計哲學,確保測試邊界清晰。

Mock

深度模塊

整理重點

改善架構:improve-codebase-architecture 與結語

呢個skill自動探索codebase,查找令人困惑嘅地方,例如:需要喺多個小文件之間切換、為測試方便抽取嘅純函數、緊密耦合嘅模塊帶來集成風險。

模塊邊界

純函數

集成風險

  • 理解概念需要喺多個小文件之間頻繁切換
  • 抽取純函數只為測試方便,真正bug隱藏喺調用方式
  • 緊密耦合模塊帶嚟集成風險

建議每週執行一次,隨着重構,agent嘅輸出質量會明顯提升。作者結語話:AI冇記憶,但好似對待人類咁對待佢哋,先係提升質量嘅關鍵。

冇記憶

似對待人類咁對待佢哋

作為開發者,你要不斷咁引導你嘅 agent,確保佢哋行啱條路

要想 agent 產出有用嘅工作成果,你一定要制定極嚴格同埋定義清晰嘅流程。

對此,我嘅解決方法係建立同用大量嘅 skills

呢啲 skills 都係為咗將我嘅開發流程無限標準化,令 AI 每次有固定路徑可以跟住


跟住介紹嘅 5 個 skill,全部可以用下面嘅指令安裝:

npx skills@latest add mattpocock/skills

01/grill-me:完善你嘅諗法

呢個係我最鍾意同最常用嘅 skill。佢得三句話,但效果驚人:

Interview me relentlessly about every aspect of this plan until we reach a shared understanding. 

Walk down each branch of the design tree, resolving dependencies between decisions one-by-one. For each question, provide your recommended answer.

Ask the questions one at a time.

If a question can be answered by exploring the codebase, explore the codebase instead.

翻譯過嚟就係:

針對呢個計劃嘅每一個細節,對我進行毫不留情嘅「拷問」(interview),直到我哋達成共識。

順住設計樹(design tree)嘅每個分支逐一排查,依次解決各項決策之間嘅依賴關係。

最後,如果某個問題可以透過閲讀代碼庫嚟解答,請直接去閲讀代碼庫,而唔係向我提問。

設計樹(design tree)嘅概念源自 Frederick P. Brooks 嘅著作《The Design of Design》。佢嘅核心觀點係:喺設計某樣嘢嗰陣,你需要遍歷設計樹嘅所有分支

例如呢個 skill 嘅作者提過,喺設計搜索頁面嗰陣,你需要喺「高級搜索界面」同「簡易文本框」之間做選擇。如果選擇高級搜索,你就必須理清所有篩選同排序規則。你需要不斷沿住呢棵樹向下走,直到徹底搞清楚成個設計,再開始寫 code。

Claude asking clarifying questions about a feature

調用呢個 skill 嘅目的,就係希望同模型達成共識。

無論咩 Agent,喺計劃模式下往往都會過早咁拋出一個方案,喺我哋未真正互相理解之前就整好咗文檔。而 grill me 強制啟動咗呢種對話交流。

喺處理真正複雜嘅功能嗰陣,我曾經歷過持續近半個鐘、包含 30、40 甚至 50 個問題嘅拷問環節,佢可以幫我確定產品嘅細節同走向


02/to-prd:由對話到文件

一旦同模型達成咗共識,我就會調用下一個 skill:/to-prd

呢個 skill 根據當前嘅對話、上下文、代碼庫內容生成一份產品需求文件(PRD),佢嘅工作流包括:

  • 分析用戶提供嘅詳細描述
  • 瀏覽代碼庫以驗證假設
  • 規劃所需嘅核心模塊
  • 使用模板編寫 PRD

佢參考咗敏捷開發嘅方法,用自然嘅語言嚟描述系統嘅預期行為


03/to-issues:將目標拆解為過程

PRD 描述咗你嘅目標同預期,但真正實現所需要嘅,係達到目標嘅過程

呢個就係 PRD to Issues skill 嘅作用。佢可以將一份 PRD 轉化為任務看板,上面全部係可以獨立領取嘅 issue。

具體流程如下:

  1. 定位 PRD
  2. 探索代碼庫
  3. 起草垂直切片將 PRD 拆解為各個子任務

呢個 skill 仲會建立任務之間嘅阻斷關係

例如,某個 issue 可能唔會被任何嘢阻塞,咁佢就可以被獨立領取。呢個喺多個 agent 並行工作嘅開發環境下非常有用。


04/tdd:提升代碼質素

/tdd 可以確保實現方案穩健,同埋大幅提升代碼質素。

TDD 代表測試驅動開發(Test-Driven Development),佢會強制(更準確啲講係引導)agent 遵循「紅-綠-重構」嘅循環。

佢融入咗關於重構、Mock 以及點樣構建深度模塊嘅設計哲學。實踐證明,做好 TDD 係提升 agent 輸出質素最穩定有效嘅方式。

呢個 skill 會:

  • 確認需要測試邊啲行為
  • 為可測試功能設計接口
  • 每次只寫一個測試
  • 編寫 code 令測試通過
  • 揾可以重構嘅 code

喺 agent 上應用「紅-綠-重構」模式非常有效,佢會創造一個良性循環,不斷迭代直到任務完成。


05/improve-codebase-architecture:等你嘅 code 對 Agent 更友好

TDD 對代碼庫嘅設計要求好高。

喺一個結構混亂嘅代碼庫中,測試邊界會非常模糊,AI 可能會唔知道應該喺邊度或者邊個層級進行測試。

當你嘅代碼庫有清晰嘅模塊邊界嗰陣,編寫測試就會容易好多。

/improve-codebase-architecture skill 會自動探索你嘅代碼庫,揾令人困惑嘅地方:

  • 喺邊啲地方,理解一個概念需要喺好多細文件之間頻繁切換?
  • 喺邊啲地方,抽取純函數只係為咗測試方便,真正嘅 bug 卻隱藏喺調用方式中?
  • 喺邊啲地方,緊密耦合嘅模塊帶嚟咗集成風險?

然後,佢會提出值得優化嘅候選模塊。

每星期執行一次呢個操作,或者喺開發嘅高峯階段結束之後執行一次

隨住你不斷重構同提煉代碼庫,你會明顯發現 agent 嘅輸出質素逐步提升。

如果你嘅代碼庫係一堆垃圾,咁 AI 都只能喺呢個代碼庫入面繼續產生垃圾。


06最後

雖然 AI 有奇怪嘅特性:例如冇記憶、克隆出嚟就直接做到嘢,但追根究底,佢哋就係類似人類思維模式嘅智能個體。

所以,想令 agent 產出嘅結果質素再上一個台階,最關鍵嘅方法,就係好似對待人咁對待佢哋


07推薦閲讀

Github 106k Star 嘅 Skill,作者 mattpocock 親授你用唔好 grill-me 嘅 9 個原因
Github 上一夜爆火到 12 萬個 star,karpathy 到底係咩神仙技能?
程序員必備嘅 Design Skills,唔好令 UI 變成產品短板

作為開發者,你需要不斷引導你的 agent,確保它們在正確的軌道上前進

要想讓 agent 產出有用的工作成果,你必須制定極其嚴格且定義清晰的流程。

對此,我的解決辦法是創建和使用大量的 skills

這些 skills 都是為了將我的開發流程無限標準化,讓 AI 每次都有固定的路徑可以遵循


接下來介紹的 5 個 skill,均可使用下面的命令安裝:

npx skills@latest add mattpocock/skills

01/grill-me:完善你的想法

這是我最喜歡也最常用的 skill。它只有三句話,但效果驚人:

Interview me relentlessly about every aspect of this plan until we reach a shared understanding. 

Walk down each branch of the design tree, resolving dependencies between decisions one-by-one. For each question, provide your recommended answer.

Ask the questions one at a time.

If a question can be answered by exploring the codebase, explore the codebase instead.

翻譯過來就是:

針對這個計劃的每一個細節,對我進行毫不留情的“拷問”(interview),直到我們達成共識。

順着設計樹(design tree)的每個分支逐一排查,依次解決各項決策之間的依賴關係。

最後,如果某個問題可以通過閲讀代碼庫來解答,請直接去閲讀代碼庫,而不是向我提問。

設計樹(design tree)的概念源自 Frederick P. Brooks 的著作《The Design of Design 》。它的核心觀點是:在設計某樣東西時,你需要遍歷設計樹的所有分支

例如這個 skill 的作者提到過,在設計搜索頁面時,你需要在“高級搜索界面”和“簡易文本框”之間做選擇。如果選擇高級搜索,你就必須理清所有的篩選和排序規則。你需要不斷沿着這棵樹往下走,直到徹底弄清楚整個設計,再動手寫代碼。

Claude asking clarifying questions about a feature

調用這個 skill 的目的,就是希望與模型達成共識。

無論什麼 Agent,在計劃模式下往往都會過早地拋出一個方案,在我們還沒真正互相理解之前就建好了文檔。而 grill me 強制啓動了這種對話交流。

在處理真正複雜的功能時,我曾經歷過持續近半小時、包含 30、40 甚至 50 個問題的拷問環節,它能幫助我確定產品的細節和走向


02/to-prd:從對話到文檔

一旦與模型達成了共識,我就會調用下一個 skill:/to-prd

這個 skill 根據當前的對話、上下文、代碼庫內容生成一份產品需求文檔(PRD),它的工作流包括:

  • 分析用戶提供詳細描述
  • 瀏覽代碼庫以驗證假設
  • 規劃所需的核心模塊
  • 使用模板編寫 PRD

它借鑑了敏捷開發的方法,用自然的語言來描述系統的預期行為


03/to-issues:將目標拆解為過程

PRD 描述了你的目標和預期,但真正實現所需要的,是達到目標的過程

這就是 PRD to Issues skill 的作用。它能將一份 PRD 轉化為任務看板,上面全是可以獨立領取的 issue。

具體流程如下:

  1. 定位 PRD
  2. 探索代碼庫
  3. 起草垂直切片將 PRD 拆解為各個子任務

這個 skill 還會建立任務之間的阻斷關係

例如,某個 issue 可能不會被任何東西阻塞,那它就可以被獨立領取。這在多個 agent 並行工作的開發環境下非常有用。


04/tdd:提升代碼質量

/tdd 可以確保實現方案穩健,並大幅提升代碼質量。

TDD 代表測試驅動開發(Test-Driven Development),它會強制(更確切地說是引導)agent 遵循“紅-綠-重構”的循環。

它融入了關於重構、Mock 以及如何構建深度模塊的設計哲學。實踐證明,做好 TDD 是提升 agent 輸出質量最穩定有效的方式。

這個 skill 會:

  • 確認需要測試哪些行為
  • 為可測試功能設計接口
  • 每次只寫一個測試
  • 編寫代碼使測試通過
  • 尋找可以重構的代碼

在 agent 上應用“紅-綠-重構”模式非常有效,它會創造一個良性循環,不斷迭代直到任務完成。


05/improve-codebase-architecture:讓你的代碼對 Agent 更友好

TDD 對代碼庫的設計要求很高。

在一個結構混亂的代碼庫中,測試邊界會非常模糊,AI 可能會不知道該在哪裏或者那個層級進行測試。

當你的代碼庫擁有清晰的模塊邊界時,編寫測試就會容易得多。

/improve-codebase-architecture skill 會自動探索你的代碼庫,查找讓人困惑的地方:

  • 在哪些地方,理解一個概念需要在許多小文件之間頻繁切換?
  • 在哪些地方,抽取純函數只是為了測試方便,真正的 bug 卻隱藏在調用方式中?
  • 在哪些地方,緊密耦合的模塊帶來了集成風險?

然後,它會提出值得優化的候選模塊。

每週執行一次該操作,或者在開發的高峯階段結束後執行一次

隨着你不斷重構和提煉代碼庫,你會明顯發現 agent 的輸出質量在逐步提升。

如果你的代碼庫是一堆垃圾,那麼 AI 也只能在這個代碼庫中繼續產生垃圾。


06最後

雖然 AI 有着奇怪的特性:比如沒有記憶、克隆出來就能直接幹活,但追根究底,它們就是類似人類思維模式的智能個體。

所以,想要讓 agent 產出的結果質量再上一個台階,最關鍵的辦法,就是像對待人類一樣對待它們


07推薦閲讀

Github 106k Star 的 Skill,作者 mattpocock 親授你用不好 grill-me 的 9 個原因
Github 上一夜爆火到 12 萬個 star,karpathy 到底是什麼神仙技能?
程序員必備的 Design Skills,不要讓 UI 成為產品短板