寫了 15 篇 AI Skill拆解，我發現優秀設計只有 3 個共同點

作者：努力撞蘑菇AI

日期：2026年6月8日上午7:55

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

優秀AI技能設計的三大共同點：用原因取代規則、記錄真實踩坑經驗、精簡至5-7步核心流程

整理版摘要

呢篇文章係由努力撞蘑菇AI寫嘅，佢過去幾個月拆解咗15篇AI技能設計文章，原本以為係研究「AI點執行任務」，但最後發現其實係研究「人類點樣將模糊意圖翻譯成AI能夠執行嘅結構」。佢總結出三個所有優秀AI技能設計嘅共同點。

第一，最好嘅技能係規則少但原因清楚，因為原因賦予AI推導能力，令佢可以自行處理未見過嘅情況。第二，最有價值嘅內容係設計者真實踩過嘅坑，呢啲具體細節先係無法被替代嘅知識。第三，複雜度係技能最隱蔽嘅殺手，最佳核心流程係5到7步，多過8步會導致指令互相稀釋，AI執行到後面會漂移。

總括嚟講，技能設計唔係技術問題而係表達問題：將自己真正理解嘅嘢，壓縮成對方剛好需要嘅形式。呢三個共同點唔單止適用於AI技能，亦適用於任何操作手冊或流程文件。

好技能用原因解釋規則，AI所以有判斷力，規則數量自然減少。
真實踩過嘅坑係技能最寶貴嘅部分，比想像嘅邊界情況有用得多。
核心流程5-7步效果最穩定，過少會飄忽，過多會漂移。
技能越複雜，反映設計者越唔肯定，最終只會令AI越迷茫。
技能設計本質係表達問題：清楚傳達意圖，比堆砌規則更重要。

整理重點

由研究AI變成研究人

作者寫咗15篇AI技能拆解，橫跨數據分析同上下文工程系列，本來以為總結會好易寫，點知寫到一半先發現：自己研究嘅從來唔係AI，而係人類點樣將模糊意圖變成AI理解嘅結構。技能係人同AI之間嘅翻譯層。

技能唔係AI嘅使用說明書，而係人同AI之間嘅翻譯層

整理重點

共同點一：最好嘅規則係唔需要規則

作者將15個技能嘅規則全部抽出來對比，發現一個反直覺現象：設計得越好嘅技能，規則反而越少。

好技能唔寫規則，而係寫原因

爛技能剩係話「對超過2000詞元嘅內容壓縮」，但好技能會補充「因為模型喺呢個長度之後注意力開始分散，壓縮係為咗保護關鍵信息召回質量」。呢句原因改變咗AI嘅執行邏輯。

爛技能：規則多但冇原因，遇到邊界情況AI會僵住。
好技能：規則+原因，AI按意圖自行推斷，覆蓋更多場景。
維護成本：好技能因意圖清晰，規則反而越精煉越穩定。

整理重點

共同點二：最有價值嘅內容係設計者唔敢寫嘅部分

數據分析系列入面，有一篇技能令作者印象最深，唔係因為步驟設計精妙，而係因為佢寫咗一段好具體嘅踩坑記錄：「每年12月31日嘅數據有統計口徑問題，會計入下一年第一日。」呢種內容先係真正令技能有效嘅關鍵。

真正好用的技能都有真實踩過的坑，而唔係腦補嘅邊界情況

作者發現一個認知陷阱：寫技能時傾向寫「應該發生咩」，而唔係「實際會發生咩」。但AI執行嘅係真實世界，所以嗰啲「感覺有啲多餘」嘅細節先係最有價值嘅部分。

整理重點

共同點三：複雜度係技能最隱蔽嘅殺手

作者統計咗15個技能嘅步驟數量同實際使用效果，發現一個好整齊嘅規律：效果最好嘅技能核心流程集中喺5到7步。少過5步會跳過關鍵判斷節點，AI自己腦補；多過8步，AI執行到中段開始漂移，後半段形同虛設。

步驟越多，指令之間互相稀釋，AI唔知聽邊條

更深層嘅問題係：長技能入面大部分內容係解決寫技能嘅人想像出嚟嘅問題，而唔係真實存在嘅問題。呢啲「以防萬一」嘅填充稀釋咗重要指令嘅權重。

1 少於5步：結果飄忽，AI自行腦補。
2 5到7步：穩定可復現，效果最佳。
3 多於8步：後半段漂移，指令互相稀釋。
4 超過12步：整體崩潰，技能變成堆砌。

整理重點

呢啲唔止係AI問題

作者話寫完15篇之後，對技能設計嘅理解完全唔同咗。最初以為係技術問題，而家認為係表達問題：將自己真正知道嘅嘢，用對方聽得明嘅方式講清楚。

好的表達係將你真正理解嘅嘢壓縮成對方剛好需要嘅形式——唔多，唔少，唔模糊

呢三個共同點唔單止適用於AI技能，仲適用於SOP、需求說明、流程手冊等任何寫俾人執行嘅文檔。好多流程文檔失效嘅原因，同爛技能失效嘅原因完全一樣。

開篇：我以為我喺度研究AI，結果我喺度研究人

我諗住總結篇會特別易寫。

畢竟素材都有曬——過去幾個月寫咗15篇AI技能(Skill)拆解，橫跨兩個系列：數據分析系列（5篇，全部完結）同上下文工程系列（多篇），加埋幾篇散篇。每篇都認真讀過源碼、踩過坑、揾過設計邏輯。到寫總結嘅時候，應該係信手拈來。

結果寫到一半，我醒起一件事：

我一直以為自己喺度研究「AI點樣執行任務」。但拆完15篇，我先發現自己研究嘅從來都唔係AI——而係人類點樣將模糊嘅意圖，變成AI能夠理解同執行嘅結構。

技能唔係AI嘅使用說明書，佢係人同AI之間嘅翻譯層。

所有優秀嘅技能設計，本質上都在解決同一個問題：人類嘅語言係模糊嘅，AI嘅執行係精確嘅，點樣喺兩者之間起一座橋？

從呢個角度重新睇15篇，3個共同點浮出水面——而且每一個都令我有啲意外。

共同點一：最好嘅規則，係令AI唔需要規則

先講一個令我有啲震驚嘅發現。

當我將15個技能裏面嘅規則全部揀出嚟擺埋一齊對比嘅時候，我發現咗一個極之反直覺嘅現象：設計得越好嘅技能，規則越少。

唔係因為佢哋覆蓋嘅場景少，恰恰相反——佢哋覆蓋嘅場景更多、更複雜。但規則數量反而更少。

點解？

因為好技能唔寫規則，而寫原因。

爛技能嘅典型樣係咁嘅：

“
對超過2000個詞元嘅內容進行壓縮處理。優先保留最近3輪對話。遇到模糊指令時返回澄清問題。

每一條都係命令，讀完知道「要做啲乜」，但完全唔知道「點解要咁做」。

好技能嘅樣係咁嘅：

“
對超過2000個詞元嘅內容進行壓縮處理——因為模型喺呢個長度之後注意力開始分散，壓縮嘅目的係保護關鍵信息嘅召回質量，而唔係節省token。

睇起嚟只係多咗一句話，但呢句話徹底改變咗AI嘅執行邏輯。

冇原因嘅規則，AI只能死守。 遇到邊界情況，佢唔知道呢條規則嘅優先級，只能機械執行或者乾脆放棄。你每次遇到一個新場景，就要再寫一條新規則——規則越寫越多，技能越來越臃腫，AI越來越迷茫。

有咗原因，AI就有咗推導能力。 佢知道呢條規則背後保護嘅係乜，遇到任何冇覆蓋嘅情況，都可以按同樣嘅邏輯自己推斷——而唔係等你嚟補規則。

呢個就係點解好技能規則反而更少：佢唔係喺度堆砌指令，而係喺度向AI解釋意圖。將意圖交俾AI，AI就可以自己生成無數條規則。

真正嘅頓悟係：「點解」唔係註釋，係俾AI嘅判斷力。寫清楚咗意圖，你就唔需要窮舉規則。

對比維度	爛技能：只寫規則	好技能：寫規則 + 原因
規則形態	「對超過2000詞元嘅內容進行壓縮」	「壓縮超過2000詞元——因為模型此後注意力開始分散」
遇到邊界情況	AI僵住，或者隨機揀一種執行方式	AI按背後嘅意圖自行推導，畀出合理判斷
維護成本	每新增一個場景，就要手動補一條規則	意圖冇變，規則自動覆蓋未預見嘅新場景
規模趨勢	越寫越多，最終臃腫到AI無從選擇	越精煉越穩定，覆蓋範圍反而更廣
本質	喺控制AI嘅行為	喺向AI解釋你嘅意圖

共同點二：最有價值嘅內容，係設計者唔敢寫嘅部分

數據分析系列裏面，有一篇技能令我印象最深——唔係因為佢嘅步驟設計得幾精妙，而係因為佢有一段話，係我喺其他技能裏面幾乎從未見過嘅：

“
注意：每年12月31日嘅數據喺系統中存在一個已知嘅統計口徑問題，該日期嘅數據會被計入下一年的第一天。如果你發現年末數據異常偏低，優先檢查呢個問題，而唔係揾數據源嘅bug。

呢條內容唔係乜嘢通用原則，唔係乜嘢設計哲學，就係一個非常具體嘅、踩過嘅坑。

但正正係呢條內容，令呢個技能喺真實使用中有效。因為佢覆蓋咗一個只有真正用過呢套系統嘅人先會知道嘅情況。

我後來發現，幾乎所有真正好用嘅技能，都有呢啲內容——唔係腦補出嚟嘅邊界情況，而係真實踩過嘅坑。

而幾乎所有睇起嚟「結構完整」但實際用起嚟一堆問題嘅技能，都缺少呢部分。佢哋嘅邊界處理寫嘅係「如果出現異常情況……」——但乜嘢叫異常情況？邊個嚟判斷？AI唔知，用戶都唔知。

呢度有一個好深嘅認知陷阱：

我哋寫技能嘅時候，天然傾向於寫「應該發生啲乜」，而唔係「實際上會發生啲乜」。 因為「應該發生啲乜」係有邏輯、有秩序、好表達嘅；「實際上會發生啲乜」係混亂嘅、具體嘅、需要真實經歷先至寫得出嚟嘅。

但AI執行嘅係真實世界，唔係理想世界。

所以嗰啲真正有價值嘅內容，往往係設計者覺得「呢個太細節喇，使唔使寫」、猶豫咗一下、最後都寫上去嗰一條。

真正嘅頓悟係：好技能嘅價值密度，藏喺嗰啲「感覺有啲多餘」嘅細節裏面。越係具體嘅坑，越係冇辦法被替代嘅價值。

共同點三：複雜度係技能最隱蔽嘅殺手

呢個係15篇裏面我自己認知變化最大嘅一個點。

最開始我以為：技能越詳細越好。畢竟場景越複雜，需要覆蓋嘅情況就越多，規則當然要多。

後來我發現，呢個直覺完全錯咗。

我做咗一個簡單嘅統計：將15個技能按照「實際使用效果」排咗個大概嘅次序，然後睇佢哋嘅步驟數量分佈。結果出乎意料咁整齊：

效果最好嘅技能，核心流程集中喺5到7步。 少過5步嘅，往往跳過咗關鍵判斷節點，AI會自己腦補填空，結果飄忽不定；多過8步嘅，AI執行到中段開始漂移，後半段嘅步驟形同虛設。

但更加有意思嘅發現唔係呢個數字，而係點解會漂移。

我以前以為AI漂移係因為「唔夠聰明」——步驟太多記唔住。後來發現唔係咁。真正嘅原因係：步驟多嘅技能，往往包含咗大量互相稀釋嘅指令。

乜嘢叫互相稀釋？例如技能嘅第3步話「優先保證準確性」，第7步話「如果時間緊張可以適當犧牲精度」——呢兩條指令本身都冇錯，但佢哋同時出現，AI唔知應該聽邊條，會喺每次執行時隨機揀一條，結果就變得唔穩定。

更深一層嘅問題係：長技能裏面嘅大部分內容，唔係喺度解決真實存在嘅問題，而係喺度解決寫技能嘅人想像出嚟嘅問題。 因為寫嗰陣成日覺得「如果遇到呢種情況點算」「如果用戶咁講點算」——然後不斷塞入去。

呢啲內容唔係冇用，但佢哋稀釋咗真正重要嘅指令嘅權重。AI無法區分邊條指令係核心，邊條係邊角——佢會將所有內容一視同仁咁處理。

精簡嘅本質，唔係刪內容，而係只保留真實發生嘅問題對應嘅解決方案，刪走所有「以防萬一」嘅填充。

真正嘅頓悟係：技能嘅複雜度唔係功能嘅體現，係設計者唔確定性嘅體現。越唔確定，就越想寫多啲；越寫得多，AI就越唔確定。呢個係一個惡性循環。

步驟數量	執行表現	根本原因	典型症狀
少於5步	結果飄忽，不可預測	跳過關鍵判斷節點，AI自行腦補	每次跑出嚟結果都唔一樣
5到7步	穩定，效果最佳	指令密度啱啱好，AI能完整消化	可復現，可迭代
多於8步	後半段形同虛設	互相稀釋嘅指令令AI無從選擇	前幾步執行正常，後面開始漂移
超過12步	整體崩潰	技能本質上係設計者喺度堆砌「以防萬一」	AI由第3步開始就唔知聽邊條

結尾：呢個唔只係AI嘅問題

寫完呢15篇，我對「skill設計」呢件事嘅理解，已經同開始時完全唔一樣喇。

最開始我以為呢個係技術問題——點樣寫prompt、點樣設計流程、點樣覆蓋場景。

而家我認為呢個係表達問題：你能唔能夠將自己真正知道嘅嘢，用對方能夠理解嘅方式講清楚。

呢三個共同點——將意圖而唔係規則交俾AI、將真實嘅坑而唔係想像嘅坑寫入去、只保留真實發生嘅問題嘅解決方案——唔只係AI技能嘅設計標準。

佢哋同樣適用於任何你寫俾人執行嘅文檔：SOP、需求說明、流程手冊、操作指南。

好多流程文檔失效嘅原因，同爛技能失效嘅原因完全一樣：規則太多原因太少，想像嘅情況太多真實嘅坑太少，寫嘅人越唔確定就越想寫多啲，執行嘅人越寫得多就越迷茫。

好嘅表達，係將你真正理解嘅嘢，壓縮成對方啱啱好需要嘅形式。 唔多，唔少，唔模糊。

我係專注AI Agent深度實踐嘅努力撞蘑菇AI，致力於分享真實可用嘅AI使用經驗與工作流探索，歡迎你同我一齊將AI玩明白，如果內容對你有幫助，歡迎關注、讚好、轉發。

開篇：我以為我在研究 AI，結果我在研究人

我以為總結篇會特別好寫。

畢竟素材都有了——過去幾個月寫了 15 篇 AI 技能(Skill)拆解，橫跨兩個系列：數據分析系列（5 篇，全部完結）和上下文工程系列（多篇），外加幾篇散篇。每篇都認真讀過源碼、踩過坑、找過設計邏輯。到了寫總結的時候，應該是信手拈來。

結果寫到一半，我意識到一件事：

我一直以為自己在研究"AI 怎麼執行任務"。但拆完 15 篇，我才發現自己研究的從來都不是 AI——而是人類如何把模糊的意圖，變成 AI 能夠理解和執行的結構。

技能不是 AI 的使用說明書，它是人和 AI 之間的翻譯層。

所有優秀的技能設計，本質上都在解決同一個問題：人類的語言是模糊的，AI 的執行是精確的，怎麼在兩者之間建一座橋？

從這個角度重新看 15 篇，3 個共同點浮出水面——而且每一個都讓我有點意外。

共同點一：最好的規則，是讓 AI 不需要規則

先說一個讓我有點震驚的發現。

當我把 15 個技能裏的規則全部摘出來放在一起對比的時候，我發現了一個極其反直覺的現象：設計得越好的技能，規則越少。

不是因為它們覆蓋的場景少，恰恰相反——它們覆蓋的場景更多、更復雜。但規則數量反而更少。

為什麼？

因為好技能不寫規則，而寫原因。

爛技能的典型長相是這樣的：

“
對超過 2000 個詞元的內容進行壓縮處理。優先保留最近 3 輪對話。遇到模糊指令時返回澄清問題。

每一條都是命令，讀完知道"要做什麼"，但完全不知道"為什麼這麼做"。

好技能的長相是這樣的：

“
對超過 2000 個詞元的內容進行壓縮處理——因為模型在這個長度之後注意力開始分散，壓縮的目的是保護關鍵信息的召回質量，而不是節省 token。

看起來只是多了一句話，但這句話徹底改變了 AI 的執行邏輯。

沒有原因的規則，AI 只能死守。 遇到邊界情況，它不知道這條規則的優先級，只能機械執行或乾脆放棄。你每遇到一個新場景，就要再寫一條新規則——規則越寫越多，技能越來越臃腫，AI 越來越迷茫。

有了原因，AI 有了推導能力。 它知道這條規則背後保護的是什麼，遇到任何沒有覆蓋的情況，都能按同樣的邏輯自己推斷——而不是等你來補規則。

這就是為什麼好技能規則反而更少：它不是在堆砌指令，而是在向 AI 解釋意圖。把意圖交給 AI，AI 就能自己生成無數條規則。

真正的頓悟是：「為什麼」不是註釋，是給 AI 的判斷力。寫清楚了意圖，你就不需要窮舉規則。

對比維度	爛技能：只寫規則	好技能：寫規則 + 原因
規則形態	"對超過 2000 詞元的內容進行壓縮"	"壓縮超過 2000 詞元——因為模型此後注意力開始分散"
遇到邊界情況	AI 僵住，或隨機選一種執行方式	AI 按背後的意圖自行推導，給出合理判斷
維護成本	每新增一個場景，就要手動補一條規則	意圖沒變，規則自動覆蓋未預見的新場景
規模趨勢	越寫越多，最終臃腫到 AI 無從選擇	越精煉越穩定，覆蓋範圍反而更廣
本質	在控制 AI 的行為	在向 AI 解釋你的意圖

共同點二：最有價值的內容，是設計者不敢寫的部分

數據分析系列裏，有一篇技能讓我印象最深——不是因為它的步驟設計得多精妙，而是因為它有一段話，是我在其他技能裏幾乎從沒見過的：

“
注意：每年 12 月 31 日的數據在系統中存在一個已知的統計口徑問題，該日期的數據會被計入下一年的第一天。如果你發現年末數據異常偏低，優先檢查這個問題，而不是尋找數據源的 bug。

這條內容不是什麼通用原則，不是什麼設計哲學，就是一個非常具體的、踩過的坑。

但正是這條內容，讓這個技能在真實使用中有效。因為它覆蓋了一個只有真正用過這套系統的人才會知道的情況。

我後來發現，幾乎所有真正好用的技能，都有這樣的內容——不是腦補出來的邊界情況，而是真實踩過的坑。

而幾乎所有看起來"結構完整"但實際用起來一堆問題的技能，都缺少這部分。它們的邊界處理寫的是"如果出現異常情況……"——但什麼叫異常情況？誰來判斷？AI 不知道，用戶也不知道。

這裏有一個很深的認知陷阱：

我們在寫技能的時候，天然傾向於寫"應該發生什麼"，而不是"實際會發生什麼"。 因為"應該發生什麼"是有邏輯、有秩序、好表達的；"實際會發生什麼"是混亂的、具體的、需要真實經歷才能寫出來的。

但 AI 執行的是真實世界，不是理想世界。

所以那些真正有價值的內容，往往是設計者覺得"這個太細節了，要不要寫"、猶豫了一下、還是寫上去的那一條。

真正的頓悟是：好技能的價值密度，藏在那些"感覺有點多餘"的細節裏。越是具體的坑，越是無法被替代的價值。

共同點三：複雜度是技能最隱蔽的殺手

這是 15 篇裏我自己認知變化最大的一個點。

最開始我以為：技能越詳細越好。畢竟場景越複雜，需要覆蓋的情況就越多，規則當然要多。

後來我發現，這個直覺完全錯了。

我做了一個簡單的統計：把 15 個技能按照"實際使用效果"排了個大概的序，然後看它們的步驟數量分佈。結果出乎意料地整齊：

效果最好的技能，核心流程集中在 5 到 7 步。 少於 5 步的，往往跳過了關鍵判斷節點，AI 會自己腦補填空，結果飄忽不定；多於 8 步的，AI 執行到中段開始漂移，後半段的步驟形同虛設。

但更有意思的發現不是這個數字，而是為什麼會漂移。

我以前以為 AI 漂移是因為"不夠聰明"——步驟太多記不住。後來發現不是這樣。真正的原因是：步驟多的技能，往往包含了大量互相稀釋的指令。

什麼叫互相稀釋？比如技能的第 3 步說"優先保證準確性"，第 7 步說"如果時間緊張可以適當犧牲精度"——這兩條指令本身都沒錯，但它們同時出現，AI 不知道該聽哪條，會在每次執行時隨機選一條，結果就變得不穩定。

更深一層的問題是：長技能裏的大部分內容，不是在解決真實存在的問題，而是在解決寫技能的人想象出來的問題。 因為寫的時候總覺得"如果遇到這種情況怎麼辦""如果用戶這麼說怎麼辦"——然後不斷往裏塞。

這些內容不是無用的，但它們稀釋了真正重要的指令的權重。AI 無法區分哪條指令是核心，哪條是邊角——它會把所有內容一視同仁地處理。

精簡的本質，不是刪內容，而是只保留真實發生的問題對應的解決方案，刪掉所有"以防萬一"的填充。

真正的頓悟是：技能的複雜度不是功能的體現，是設計者不確定性的體現。越不確定，就越想多寫；越多寫，AI 就越不確定。這是一個惡性循環。

步驟數量	執行表現	根本原因	典型症狀
少於 5 步	結果飄忽，不可預測	跳過關鍵判斷節點，AI 自行腦補	每次跑出來結果都不一樣
5 到 7 步	穩定，效果最佳	指令密度剛好，AI 能完整消化	可復現，可迭代
多於 8 步	後半段形同虛設	互相稀釋的指令讓 AI 無從選擇	前幾步執行正常，後面開始漂移
超過 12 步	整體崩潰	技能本質上是設計者在堆砌"以防萬一"	AI 從第 3 步開始就不知道聽哪條

結尾：這不只是 AI 的問題

寫完這 15 篇，我對"skill設計"這件事的理解，已經和剛開始完全不一樣了。

最開始我以為這是個技術問題——怎麼寫 prompt、怎麼設計流程、怎麼覆蓋場景。

現在我認為這是個表達問題：你能不能把自己真正知道的東西，用對方能理解的方式說清楚。

這三個共同點——把意圖而不是規則交給 AI、把真實的坑而不是想象的坑寫進去、只保留真實發生的問題的解決方案——不只是 AI 技能的設計標準。

它們同樣適用於任何你寫給別人執行的文檔：SOP、需求說明、流程手冊、操作指南。

很多流程文檔失效的原因，和爛技能失效的原因完全一樣：規則太多原因太少，想象的情況太多真實的坑太少，寫的人越不確定就越想多寫，執行的人越多寫就越迷茫。

好的表達，是把你真正理解的東西，壓縮成對方剛好需要的形式。 不多，不少，不模糊。

我是專注 AI Agent深度實踐的努力撞蘑菇AI，致力於分享真實可用的 AI 使用經驗與工作流探索，歡迎你和我一起把 AI 玩明白，如果內容對你有幫助，歡迎關注、點贊、轉發。