如何把經驗裝到Skills？

作者：產品方法論集散地

日期：2026年4月28日上午12:50

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

寫 Skill 唔係只係畀任務說明，而係要將自己嘅經驗同判斷邏輯寫入去，先至可以得到真正可用嘅結果。

整理版摘要

呢篇文章係一位 SaaS 產品經理分享佢點樣將自己嘅經驗裝入 AI Skills 嘅過程。佢經常要評估客戶嘅定製需求工作量，每星期少則一兩個，多則五到十個，每次評估耗時唔少，但最後真正願意俾錢嘅客戶連 5% 都唔到。佢想整一個 AI Skill 幫手自動評估工作量，但發現直接將需求掟畀 AI 係唔得嘅。

佢經歷咗三輪調試：第一輪一個 Skill 想做曬所有嘢（方案設計同工作量評估），結果評估結果完全唔靠譜；第二輪拆開職責，但只係畀硬性比例（例如測試係後端嘅三分之一到二分之一），結果 AI 死跟比例但唔理解點解，結果都係錯。第三輪佢重新寫過，將自己嘅評估方法論——「需求 → 場景 → 模塊 → 功能 → 原子任務」拆解路徑同五步法——明確寫入 Skill，結果終於可用。最後佢總結咗幾條關鍵原則：一個 Skill 只做一件事、將 Skills 當成新入職實習生、將經驗同判斷邏輯作為上下文提供、同埋工具同模型嘅選擇會影響效果。

一個 Skill 只做一件事：設計方案同評估工作量要分開，避免職責混合。
只畀硬約束唔畀方法：AI 會盲從比例而忽略實際，必須畀清楚判斷邏輯。
畀一套拆解路徑：例如「需求→場景→模塊→功能→原子任務」，幫 AI 有結構地分析。
經驗要作為參考系而非鐵律：容許浮動（例如測試工作量係後端一半），但唔好鎖死。
將 Skills 視為新入職實習生：需要背景、標準同方法論先可以產出合預期結果。

值得記低

流程

工作量評估五步法

將需求按「需求→場景→模塊→功能→原子任務」逐層拆解，然後按角色（後端、前端、產品、測試）評估，最終以場景為單位組織輸出。

整理重點

點解要將經驗裝入 Skill？

作為 SaaS 產品經理，作者每週要評估大量客戶定製需求工作量，但真正付費嘅客戶好少。佢想用 AI 幫手，但發現直接畀任務說明係唔夠嘅。

你係喺話畀佢知，咩先叫符合你嘅業務現實

整理重點

第一、二輪調試：撞板經驗

第一輪作者犯咗一個常見錯誤：希望一個 Skill 同時做方案設計同工作量評估。結果輸出嘅評估結果偏差好大，仲包含好多技術細節，唔適合同客戶溝通。

一個 Skill 幹太多事

評估結果偏差大：經驗判斷 15 人天，AI 畀出 30 甚至 59 人天。
拆得太細太技術化：列出日誌管理、數據映射呢啲研發內部細節，客戶睇唔明。

第二輪作者拆開職責，專注工作量評估，並畀咗硬性比例約束。

只畀要求、唔畀方法

AI 死跟比例：測試係後端三分之一到二分之一，結果後端 18 天、前端 9 天、測試 9 天，總共 44 人天（經驗判斷 15 人天）。
問題在於 AI 唔理解比例背後嘅判斷邏輯，只係機械式執行。

整理重點

第三輪調試：方法論嘅力量

第三輪作者推倒重來，寫咗一個全新 Skill，目標單一：只做工作量評估。呢次佢唔再加硬約束，而係將真正嘅方法論話畀 AI 知。

1 遵循「需求是 1，方案是 1」原則：先問清需求，再確認方案，最後先評估。
2 畀一套明確嘅拆解路徑：需求 → 場景 → 模塊 → 功能 → 原子任務。
3 將工作量評估定義成「五步法」：按需求、場景、業務、最小功能點、任務逐層展開。
4 經驗作為參考系：測試工作量通常係後端一半，產品工作量按複雜度浮動（0.5 到 5 天），唔好鎖死。

微調兩次後：第一次將輸出表格按場景組織，容許 0.2、0.4 天嘅小功能；第二次將產品同測試工作量改為場景級彙總評估。最終結果符合預期。

將你嘅經驗同方法論當成上下文告訴佢

整理重點

可再用法則

一個 Skill 只做一件事：寫需求文檔、探索方案、輸出方案、評估工作量、畫原型、寫上線公告，全部要分開。
將每個 Skill 當成一個好聰明但剛入職嘅實習生：唔畀背景佢就只能估；唔講標準佢就只能按通用理解去做。
將你嘅經驗同方法論當成上下文話畀佢知：唔好期望 AI 自己估中你嗰行嘅判斷標準。
工具同模型嘅選擇會影響效果：免費工具夠試玩，但想做生產力，就要投資好啲嘅工具（例如 Trae、Cursor 付費版配 Gemini 或 Claude）。

Skills 唔係幫你「發明」工作經驗，而係幫你將已有經驗穩定複用

最後問自己一個問題：你寫入去嘅，究竟只係任務說明，定係已經開始將自己嘅經驗裝入去？呢個分別決定咗佢係玩具定係生產力。

唔知你有冇留意，最近一直係咁分享Skills。

由最早講佢點樣完成50個客戶案例，到後來講佢點樣嵌入產品經理嘅工作流程，再到最近分享點樣由0到1寫一個「畫原型」嘅Skills，呢條線其實一直好清晰：唔係炫耀技術，而係回答一個更實際嘅問題，AI到底點樣真正進入工作，而唔係淨係停留喺示範入面。

但呢度一直有一個繞唔開嘅話題，之前冇單獨詳細講。

就係：點樣將你嘅經驗、方法論，真正裝入Skills裏面，令佢輸出嘅內容唔單止「睇落啱」，而係「對你有用」。

好多人都會有一個好自然嘅疑問：AI已經咁強啦，點解仲要強調「將自己嘅經驗餵畀佢」？呢個聽落好似有啲自以為是，彷彿默認自己比AI更叻。

其實唔係。

更準確咁講，你唔係教AI變聰明，而係畀佢一個邊界、一個約束、一個參考。你係話畀佢知，咩先至符合你嘅業務現實，咩先至符合你嘅判斷標準，咩先至係你真正想要嘅輸出結果。

否則，佢當然都可以畀答案你，而且往往仲會畀得好完整、好靚、好有咁嘅一回事。但問題係，嗰啲內容未必屬於你，未必適合你嘅場景，甚至可能只係「高檔大氣上檔次」，但同實際工作冇咩關係。

呢篇文章，就係想講呢件事。

點解我會開始搞呢個問題

用一個好真實嘅場景嚟講。

作為一個SaaS產品經理，每個星期最少要評估1到2個客戶嘅定製需求工作量，多嘅時候可能有5到10個。每次評估，最少1個鐘，多就成日。佢又重複，又高頻，仲特別嘥時間。

你如果唔認真評估，淨係畀客戶一個籠統嘅人天，例如10人天，對方好可能會繼續追問：「你哋有冇評估根據？有冇需求理解同時間拆解？？”

但如果你認真去做，又會好快陷入另一個現實：花咗唔少時間，最終真正願意畀錢定製嘅客戶，可能連5%都冇。

呢個就係一個好典型、亦都好適合用Skills去解決嘅問題。

但真正開始寫嘅時候，好快就會發現，件事冇咁簡單。一個睇落「好明確」嘅需求，要做成一個穩定可用嘅Skills，背後其實好講究。唔係將需求描述畀AI，就可以自然得到一個符合預期嘅結果。

我前後調咗幾個鐘，寫廢過一個Skills，又用5個完全唔同嘅真實需求反覆驗證，先慢慢調出一個可以真正投入工作嘅版本。

翻轉頭睇，真正決定結果嘅，唔係提示詞寫得有幾長，而係你有冇將自己嘅經驗同方法論講清楚。

呢個都係呢篇文章嘅由來。想將呢個過程完整分享畀你，或者可以幫你少行啲冤枉路。

第一輪調試：一個Skill做太多嘢

最開始調試嗰陣，我其實犯咗一個好常見嘅錯：希望一個Skill一次過解決曬所有問題。

我當時嘅想法好直接。輸入一個需求，叫佢同時輸出解決方案、用戶故事、流程圖，再順便畀埋工作量評估。聽落好合理，甚至仲有啲「一步到位」嘅味道。

結果都的確可以出到嘢。佢會畀我2到3個解決方案，每個方案後面仲附帶一份對應嘅工作量評估。

但真正睇一睇，就發現問題好明顯。

第一個問題，係評估結果偏差好大。原本經驗判斷大概15人天嘅需求，佢畀出嚟嘅方案一可能係30人天，方案二甚至可以去到59人天。表面睇好似係「多方案分析」，實際上係評估基準已經偏離咗。

第二個問題，係拆得太細，而且太技術化。佢會將好多研發內部嘅實現層內容直接攤出嚟，例如日誌管理、數據映射配置之類。咁樣嘅結果拎畀客戶，未必幫到對方理解，反而更容易令溝通走歪。

後來再翻轉頭睇，呢一輪失敗幾乎係必然嘅。因為我實際上係叫一個Skill同時做「方案設計」同「工作量評估」兩種唔同職責。一個偏發散，一個偏收斂，本來就唔應該撈埋一齊。

第二輪調試：拆開職責，但淨係畀要求，唔畀方法

第一輪結果唔符合預期之後，我開始拆開職責。

講到底，問題有兩個。一個係唔符合Skills嘅設計常識，即係一個Skill最好淨係做一件事。另一個更關鍵，係我雖然畀咗好多要求，但冇將背後嘅經驗同方法講畀佢知。

於是第二輪，我將佢拆成至少兩個Skill。一個負責設計解決方案，一個專門負責評估工作量。

今次，我將約束加得好強，亦明確話畀佢知一啲經驗判斷。例如測試工作量通常係後端嘅三分一到二分一，前端一般係後端嘅一半，產品同設計工作量最細，簡單需求1日，最複雜都唔超過5日。

然後，我用一個真實需求去測試佢：

評估工作量：需求係新增審批流程，支持審批通過後，將對應嘅Excel表附件數據自動同步到系統入面。背景係目前系統已有兩種導入方式，一種係直接導入，一種係經第三方API接口同步，但仲未支持經審批流程導入。

本來以為今次會比第一輪好，結果反而有啲弄巧成拙。

同樣一個經驗判斷大約15人天嘅需求，佢直接畀我評到44人天。而且佢仲特別「聽話」，幾乎完全照我畀嘅比例去套。後端18日，前端9日，測試又9日，數字睇落好整齊，邏輯都似乎講得通，但結果明顯唔啱。

嗰一刻我先真正意識到，淨係畀比例、唔畀方法，問題會更大。因為佢會好認真咁執行約束，但唔一定真係明你點解要咁約束。

你有冇類似經驗？你畀一個新人好多規則，結果對方每條都記住咗，但做出嚟嘅嘢都係唔啱。問題唔係喺執行力，而係佢冇建立判斷框架。

AI都係一樣嘅。

第三輪調試：畀佢經驗，更加要畀佢判斷邏輯

前兩輪調試之後，我慢慢發現咗一個核心問題：

唔係AI唔夠聰明，而係我對佢有不切實際嘅期望。

我一開始太希望佢好似「肚裏面嘅蛔蟲」，又可以自動讀懂需求，又可以自己掌握拆解需求、評估工作量嘅方法論。但現實係，呢個幾乎等於你期望一個啱啱入職嘅同事，喺唔瞭解業務、唔熟悉系統嘅情況下，直接產出一份完全符合你預期嘅結果。

就算呢個同事再聰明，都唔現實。

所以第三輪，我索性推倒重來，由0到1重新寫咗一個全新嘅Skill，目標好單一：淨係做工作量評估。

今次，我唔再一味加強硬約束，而係開始將真正嘅方法論話畀佢知。

最核心嘅，係下面呢幾件事。

第一，要跟從「需求係1，方案係1」嘅原則。即係話，喺需求未搞清楚之前，唔可以直接評估工作量；喺方案未定落嚟之前，都唔可以直接畀時數。一定要先問清楚需求，再確認方案，最後先評估。

第二，要有一套明確嘅拆解路徑。我畀佢嘅係「需求 → 場景 → 模塊 → 功能 → 原子任務」呢條鏈路，並補充咗拆解原則。例如一個功能點淨係做一件事、鏈路要閉環、唔好為拆而拆。

第三，要話畀佢知點樣一步步拆。我將工作量評估定義成一個「五步法」，按照需求、場景、業務、最小功能點、任務嘅順序逐層展開，而唔係一開波就按角色亂咁報數。

第四，可以畀經驗，但唔好畀死。例如測試工作量通常係後端嘅一半，產品工作量可以按需求複雜度浮動，細需求0.5日，常規需求1日，中等需求2日，複雜需求3日，超級複雜需求最多5日。佢哋應該係參考系，而唔係鐵律。

今次，我索性單獨新開咗一個項目，由零開始重建，工具都由釦子換咗去Trae，將呢啲拆解原則同方法論都明確寫咗入去。

結果比前兩輪明顯好咗好多，但都係冇一步到位。

同一個需求輸入咗之後，佢雖然開始更加似樣，但輸出方式仲係唔符合我想要嘅工作習慣。佢會按角色逐項評估，每個角色都畀一整份時數，睇落好完整，但唔夠適合直接拎去同客戶溝通。

於是，我又繼續調整。

第一次微調，重點係約束最終輸出形式。將「UI」替換成「產品」角色，同時將表格邏輯改成按場景嚟組織。每一行對應一個用戶場景，功能點聚合喺同一格，後端、前端、產品、測試分別展示工作量，最後一行再彙總總人天。而且我特意補咗一條：如果某個功能點好細，允許評估成0.2、0.4日，唔使強行由0.5起跳。

第二次微調，係將產品經理同測試嘅工作量由「功能級逐項評估」改成「場景級彙總評估」。因為真實工作入面，呢兩個角色通常冇需要喺每個細功能點上拆得咁細。產品更加係按需求複雜度判斷，測試更加係按整體鏈路同風險範圍評估。

經過呢兩輪微調之後，最終結果終於大致符合預期，亦正式投入到實際工作入面。

我點樣判斷呢個Skill算係「用得」喇

真正決定一個Skill可唔可以入工作流程，標準其實冇咁複雜。

對我嚟講，只有兩個。

第一，評估顆粒度要合適。又唔可以粗到淨係得一個總人天，又唔可以細到全部係客戶睇唔明嘅技術項。最理想嘅狀態係：一個需求拆成若干場景，一個場景下面再拆若干功能點。場景負責令客戶睇得明，功能點負責支撐細節。

第二，工作量結果要符合經驗同常識。如果同一個需求，我嘅經驗判斷係10人天，咁佢畀出嘅結果喺上下20%波動都可以接受；但如果直接翻倍，或者壓得離譜，再靚嘅表格都冇意義。

講到底，Skills唔係幫你「發明」工作經驗，而係幫你將已有經驗穩定咁重複使用出嚟。

最後，分享幾個我覺得好重要嘅經驗

寫到呢度，其實最想傳達嘅唔係「呢個Skill我係點樣調出嚟嘅」，而係如果你都想寫出一個真正用得嘅Skill，應該點樣諗呢件事。

首先，一個Skill淨係做一件事。

唔好貪心。寫需求文檔係一個Skill，探索方案思路係一個Skill，輸出正式方案係一個Skill，評估工作量係一個Skill，畫原型係一個Skill，寫上線公告都係一個Skill。分得越清楚，越容易穩定。

其次，將每個Skill都當成一個好聰明、但啱啱入職嘅實習生。

佢能力好強，執行亦好快，但佢唔係你肚入面嘅蟲。你唔畀背景，佢就只能估；你唔講標準，佢就只能按「通用理解」去做。

再進一步，將你嘅經驗同方法論當成上下文話畀佢知。

AI學過好多知識，但唔代表佢天生知道你喺咩行業、你喺咩團隊、你呢份工作嘅判斷標準。你完全可以直接將方法論講畀佢知，而唔係期望佢自己估中。就好似今次工作量評估入面用到嘅拆解思路，本質上都唔係「我原創」嘅，而係從經驗中提煉出嚟，再明確寫入Skill入面。

最後，工具同模型嘅選擇，的確會影響結果。

免費工具當然可以開始用，都夠你試下新嘢，但如果你真係想將Skills當成生產力，而唔係玩具，仲係要接受一件事：好工具、好模型，的確會令你少行好多冤枉路。至少喺現階段，Trae或者Cursor嘅付費版，再搭配Gemini或者Claude呢啲模型，整體體驗會更穩定。

寫喺最後

翻轉頭睇，呢一路最大嘅變化，唔係我幾識寫提示詞，而係我終於開始接受一件事：

AI嘅價值，唔單止係幫你做事，更加係幫你重複使用判斷。

而判斷呢樣嘢，唔會憑空出現。佢嚟自你嘅經驗，嚟自你踩過嘅坑，嚟自你總結出嚟嘅方法論。你將呢啲嘢講清楚，Skills先可能真正變成「你嘅Skills」，而唔係一個睇落好犀利、實際上任何人都可以替代嘅通用能力。

所以，如果你最近都喺度寫Skills，不妨問自己一個問題：

你而家寫入去嘅，究竟只係任務說明，定係已經開始將自己嘅經驗裝入去？

呢兩者嘅分別，往往決定了佢最終係玩具，定係生產力。

不知道你有沒有留意，最近一直在分享Skills。

從最早聊它如何完成 50 個客戶案例，到後來聊它怎樣嵌進產品經理的工作流，再到最近分享如何從 0 到 1 寫一個“畫原型”的 Skills，這條線其實一直很清晰：不是在炫技，而是在回答一個更實際的問題，AI 到底怎麼真正進入工作，而不是隻停留在演示裏。

但這裏面一直有一個繞不開的話題，之前沒有單獨展開說。

那就是：怎麼把你的經驗、方法論，真正裝進 Skills 裏，讓它輸出的內容不只是“看起來對”，而是“對你有用”。

很多人會有一個很自然的疑問：AI 已經這麼強了，為什麼還要強調“把自己的經驗餵給它”？這聽起來好像有點自以為是，彷彿默認自己比 AI 更懂。

其實不是。

更準確地說，你不是在教 AI 變聰明，而是在給它一個邊界、一個約束、一個參考。你是在告訴它，什麼才叫符合你的業務現實，什麼才叫符合你的判斷標準，什麼才是你真正想要的輸出結果。

否則，它當然也能給你答案，而且往往還會給得很完整、很漂亮、很像那麼回事。但問題是，那些內容未必屬於你，未必適合你的場景，甚至可能只是“高大上”，卻和實際工作沒什麼關係。

這篇文章，就是想聊這件事。

為什麼我會開始折騰這個問題

拿一個很真實的場景來說。

作為一名 SaaS 產品經理，每週少則要評估 1 到 2 家客戶的定製需求工作量，多的時候可能有 5 到 10 家。每次評估，少則 1 小時，多則一整天。它既重複，又高頻，還特別費時間。

你如果不認真評估，只是給客戶一個籠統的人天，比如 10 人天，對方很可能會繼續追問：“你們有評估依據嗎？有沒有需求理解和時數拆解？”

可你如果認真去做，又會很快陷入另一個現實：費了不少時間，最終真正願意付費定製的客戶，可能連 5% 都不到。

這就是一個特別典型、也特別適合用 Skills 去解決的問題。

但真正開始寫的時候，很快就會發現，事情沒那麼簡單。一個看起來“很明確”的需求，要做成一個穩定可用的 Skills，背後其實很講究。不是把需求描述給 AI，就能自然得到一個符合預期的結果。

我前後調了好幾個小時，寫廢過一個 Skills，又拿 5 個完全不同的真實需求反覆驗證，才慢慢調出一個能真正投入工作的版本。

回過頭來看，真正決定結果的，不是提示詞寫得多長，而是你有沒有把自己的經驗和方法論講清楚。

這也是這篇文章的由來。想把這個過程完整分享給你，或許能幫你少走一點彎路。

第一輪調試：一個 Skill 幹太多事

最開始調試的時候，我其實犯了一個很常見的錯：希望一個 Skill 一次性把所有問題都解決。

我當時的想法很直接。輸入一個需求，讓它同時輸出解決方案、用戶故事、流程圖，再順便給出工作量評估。聽起來很合理，甚至還有點“一步到位”的味道。

結果也確實能出東西。它會給我 2 到 3 個解決方案，每個方案後面還附帶一份對應的工作量評估。

但真正一看，就發現問題很明顯。

第一個問題，是評估結果偏差非常大。原本經驗判斷大概 15 人天的需求，它給出來的方案一可能是 30 人天，方案二甚至能到 59 人天。表面上看是在“多方案分析”，實際上是評估基準已經飄了。

第二個問題，是拆得太細，而且太技術化。它會把很多研發內部的實現層內容直接攤出來，比如日誌管理、數據映射配置之類。這樣的結果拿給客戶，未必能幫助對方理解，反而更容易把溝通帶偏。

後來再回頭看，這一輪失敗幾乎是必然的。因為我實際上是在讓一個 Skill 同時承擔“方案設計”和“工作量評估”兩種不同職責。一個偏發散，一個偏收斂，本來就不該混在一起。

第二輪調試：拆開職責，但只給要求，不給方法

第一輪結果不符合預期之後，我開始拆分職責。

說到底，問題有兩個。一個是不符合 Skills 的設計常識，也就是一個 Skill 最好只做一件事。另一個更關鍵，是我雖然給了很多要求，卻沒有把背後的經驗和方法講給它。

於是第二輪，我把它拆成了至少兩個 Skill。一個負責設計解決方案，一個專門負責評估工作量。

這次，我把約束加得很強，也明確告訴它一些經驗判斷。比如測試工作量通常是後端的三分之一到二分之一，前端一般是後端的一半，產品和設計工作量最小，簡單需求 1 天，最複雜也不超過 5 天。

然後，我拿一個真實需求去測它：

評估工作量：需求是新增審批流支持審批通過後，把對應 Excel 表附件數據自動同步到系統中。背景是目前系統已有兩種導入方式，一種是直接導入，一種是通過第三方 API 接口同步，但還不支持通過審批流程導入。

本來以為這次會比第一輪好，結果反而有點弄巧成拙。

同樣一個經驗判斷大約 15 人天的需求，它直接給我評到了 44 人天。而且它還特別“聽話”，幾乎完全照着我給的比例去套。後端 18 天，前端 9 天，測試又 9 天，數字看起來很規整，邏輯也似乎說得通，但結果明顯不對。

那一刻我才真正意識到，只給比例、不給方法，問題會更大。因為它會非常認真地執行約束，卻不一定真的理解你為什麼這麼約束。

你有沒有過類似體驗？你給一個新人很多規則，結果對方每條都記住了，但做出來的東西還是不對。問題不在執行力，而在於他沒有建立判斷框架。

AI 也是一樣的。

第三輪調試：給它經驗，更要給它判斷邏輯

前兩輪調試之後，我慢慢發現了一個核心問題：

不是 AI 不夠聰明，而是我對它有不切實際的期待。

我一開始太希望它像“肚子裏的蛔蟲”，既能自動讀懂需求，又能自己掌握拆解需求、評估工作量的方法論。可現實是，這幾乎等於你期待一個剛入職的同事，在不瞭解業務、不熟悉系統的情況下，直接產出一份完全符合你預期的結果。

哪怕這個同事再聰明，也不現實。

所以第三輪，我索性推倒重來，從 0 到 1 重新寫了一個全新的 Skill，目標非常單一：只做工作量評估。

這一次，我不再一味加強硬約束，而是開始把真正的方法論告訴它。

最核心的，是下面這幾件事。

第一，要遵循“需求是 1，方案是 1”的原則。也就是說，在需求沒搞清楚之前，不能直接評估工作量；在方案沒定下來之前，也不能直接給時數。必須先問清需求，再確認方案，最後才評估。

第二，要有一套明確的拆解路徑。我給它的是“需求 → 場景 → 模塊 → 功能 → 原子任務”這條鏈路，並補充了拆解原則。比如一個功能點只做一件事、鏈路要閉環、不要為了拆而拆。

第三，要告訴它如何一步步拆。我把工作量評估定義成一個“五步法”，按照需求、場景、業務、最小功能點、任務的順序逐層展開，而不是一上來就按角色拍腦袋報數。

第四，可以給經驗，但不要給死。比如測試工作量通常是後端的一半，產品工作量可以按需求複雜度浮動，小需求 0.5 天，常規需求 1 天，中等需求 2 天，複雜需求 3 天，超級複雜需求最多 5 天。它們應該是參考系，而不是鐵律。

這一次，我乾脆單獨新開了一個項目，從零開始重建，工具也從釦子換到了 Trae，把這些拆解原則和方法論都明確寫進去了。

結果比前兩輪明顯好很多，但還是沒有一步到位。

同一個需求輸進去之後，它雖然開始更像回事了，可輸出方式還是不符合我想要的工作習慣。它會按角色逐項評估，每個角色都給一整份時數，看上去很完整，但不夠適合直接拿去跟客戶溝通。

於是，我又繼續調。

第一次微調，重點是約束最終輸出形式。把“UI”替換成“產品”角色，同時把表格邏輯改成按場景來組織。每一行對應一個用戶場景，功能點聚合在同一格里，後端、前端、產品、測試分別展示工作量，最後一行再彙總總人天。並且我特意補了一條：如果某個功能點很小，允許評估成 0.2、0.4 天，不必強行從 0.5 起跳。

第二次微調，是把產品經理和測試的工作量從“功能級逐項評估”改成“場景級彙總評估”。因為真實工作裏，這兩個角色通常沒必要在每個小功能點上拆得那麼細。產品更多是按需求複雜度判斷，測試更多是按整體鏈路和風險範圍評估。

經過這兩輪微調後，最終結果終於基本符合預期，也正式投入到實際工作裏了。

我怎麼判斷這個 Skill 算“可用”了

真正決定一個 Skill 能不能進工作流，標準其實沒那麼複雜。

對我來說，只有兩個。

第一，評估顆粒度要合適。既不能粗到只剩一個總人天，也不能細到全是客戶看不懂的技術項。最理想的狀態是：一個需求拆成若干場景，一個場景下再拆若干功能點。場景負責讓客戶看懂，功能點負責支撐細節。

第二，工作量結果要符合經驗和常識。如果同一個需求，我的經驗判斷是 10 人天，那它給出的結果在上下 20% 波動都可以接受；但如果直接翻倍，或者壓得離譜，再漂亮的表格也沒有意義。

說到底，Skills 不是替你“發明”工作經驗，而是幫你把已有經驗穩定地複用出來。

最後，分享幾個我覺得很重要的經驗

寫到這裏，其實最想傳達的不是“這個 Skill 我是怎麼調出來的”，而是你如果也想寫出一個真正能用的 Skill，應該怎麼想這件事。

首先，一個 Skill 只做一件事。

別貪心。寫需求文檔是一個 Skill，探索方案思路是一個 Skill，輸出正式方案是一個 Skill，評估工作量是一個 Skill，畫原型是一個 Skill，寫上線公告也是一個 Skill。分得越清楚，越容易穩定。

其次，把每個 Skill 都當成一個很聰明、但剛入職的實習生。

它能力很強，執行也很快，但它不是你肚子裏的蛔蟲。你不給背景，它就只能猜；你不講標準，它就只能按“通用理解”去做。

再進一步，把你的經驗和方法論當成上下文告訴它。

AI 學過很多知識，但不代表它天然知道你所在行業、你所在團隊、你這份工作的判斷標準。你完全可以直接把方法論講給它，而不是期待它自己猜中。就像這次工作量評估裏用到的拆解思路，本質上也不是“我原創”的，而是從經驗中提煉出來，再明確寫進 Skill 裏。

最後，工具和模型的選擇，確實會影響結果。

免費工具當然可以上手，也足夠你嚐鮮，但如果你真的想把 Skills 當成生產力，而不是玩具，還是要接受一件事：好工具、好模型，確實會讓你少走很多彎路。至少在當前階段，Trae 或 Cursor 的付費版，再搭配 Gemini 或 Claude 這樣的模型，整體體驗會更穩定。

寫在最後

回頭看，這一路最大的變化，不是我多會寫提示詞了，而是我終於開始接受一件事：

AI 的價值，不只是替你幹活，更是替你複用判斷。

而判斷這件事，不會憑空出現。它來自你的經驗，來自你踩過的坑，來自你總結出來的方法論。你把這些東西講清楚，Skills 才可能真正長成“你的 Skills”，而不是一個看起來很厲害、實際上誰都能替代的通用能力。

所以，如果你最近也在寫 Skills，不妨問自己一個問題：

你現在寫進去的，究竟只是任務說明，還是已經開始把自己的經驗裝進去了？

這兩者的差別，往往決定了它最終是玩具，還是生產力。