寫了 15 篇 AI Skill拆解,我發現優秀設計只有 3 個共同點
整理版優先睇
優秀AI技能設計的三大共同點:用原因取代規則、記錄真實踩坑經驗、精簡至5-7步核心流程
呢篇文章係由努力撞蘑菇AI寫嘅,佢過去幾個月拆解咗15篇AI技能設計文章,原本以為係研究「AI點執行任務」,但最後發現其實係研究「人類點樣將模糊意圖翻譯成AI能夠執行嘅結構」。佢總結出三個所有優秀AI技能設計嘅共同點。
第一,最好嘅技能係規則少但原因清楚,因為原因賦予AI推導能力,令佢可以自行處理未見過嘅情況。第二,最有價值嘅內容係設計者真實踩過嘅坑,呢啲具體細節先係無法被替代嘅知識。第三,複雜度係技能最隱蔽嘅殺手,最佳核心流程係5到7步,多過8步會導致指令互相稀釋,AI執行到後面會漂移。
總括嚟講,技能設計唔係技術問題而係表達問題:將自己真正理解嘅嘢,壓縮成對方剛好需要嘅形式。呢三個共同點唔單止適用於AI技能,亦適用於任何操作手冊或流程文件。
- 好技能用原因解釋規則,AI所以有判斷力,規則數量自然減少。
- 真實踩過嘅坑係技能最寶貴嘅部分,比想像嘅邊界情況有用得多。
- 核心流程5-7步效果最穩定,過少會飄忽,過多會漂移。
- 技能越複雜,反映設計者越唔肯定,最終只會令AI越迷茫。
- 技能設計本質係表達問題:清楚傳達意圖,比堆砌規則更重要。
由研究AI變成研究人
作者寫咗15篇AI技能拆解,橫跨數據分析同上下文工程系列,本來以為總結會好易寫,點知寫到一半先發現:自己研究嘅從來唔係AI,而係人類點樣將模糊意圖變成AI理解嘅結構。技能係人同AI之間嘅翻譯層。
技能唔係AI嘅使用說明書,而係人同AI之間嘅翻譯層
共同點一:最好嘅規則係唔需要規則
作者將15個技能嘅規則全部抽出來對比,發現一個反直覺現象:設計得越好嘅技能,規則反而越少。
好技能唔寫規則,而係寫原因
爛技能剩係話「對超過2000詞元嘅內容壓縮」,但好技能會補充「因為模型喺呢個長度之後注意力開始分散,壓縮係為咗保護關鍵信息召回質量」。呢句原因改變咗AI嘅執行邏輯。
- 爛技能:規則多但冇原因,遇到邊界情況AI會僵住。
- 好技能:規則+原因,AI按意圖自行推斷,覆蓋更多場景。
- 維護成本:好技能因意圖清晰,規則反而越精煉越穩定。
共同點二:最有價值嘅內容係設計者唔敢寫嘅部分
數據分析系列入面,有一篇技能令作者印象最深,唔係因為步驟設計精妙,而係因為佢寫咗一段好具體嘅踩坑記錄:「每年12月31日嘅數據有統計口徑問題,會計入下一年第一日。」呢種內容先係真正令技能有效嘅關鍵。
真正好用的技能都有真實踩過的坑,而唔係腦補嘅邊界情況
作者發現一個認知陷阱:寫技能時傾向寫「應該發生咩」,而唔係「實際會發生咩」。但AI執行嘅係真實世界,所以嗰啲「感覺有啲多餘」嘅細節先係最有價值嘅部分。
共同點三:複雜度係技能最隱蔽嘅殺手
作者統計咗15個技能嘅步驟數量同實際使用效果,發現一個好整齊嘅規律:效果最好嘅技能核心流程集中喺5到7步。少過5步會跳過關鍵判斷節點,AI自己腦補;多過8步,AI執行到中段開始漂移,後半段形同虛設。
步驟越多,指令之間互相稀釋,AI唔知聽邊條
更深層嘅問題係:長技能入面大部分內容係解決寫技能嘅人想像出嚟嘅問題,而唔係真實存在嘅問題。呢啲「以防萬一」嘅填充稀釋咗重要指令嘅權重。
- 1 少於5步:結果飄忽,AI自行腦補。
- 2 5到7步:穩定可復現,效果最佳。
- 3 多於8步:後半段漂移,指令互相稀釋。
- 4 超過12步:整體崩潰,技能變成堆砌。
呢啲唔止係AI問題
作者話寫完15篇之後,對技能設計嘅理解完全唔同咗。最初以為係技術問題,而家認為係表達問題:將自己真正知道嘅嘢,用對方聽得明嘅方式講清楚。
好的表達係將你真正理解嘅嘢壓縮成對方剛好需要嘅形式——唔多,唔少,唔模糊
呢三個共同點唔單止適用於AI技能,仲適用於SOP、需求說明、流程手冊等任何寫俾人執行嘅文檔。好多流程文檔失效嘅原因,同爛技能失效嘅原因完全一樣。
開篇:我以為我喺度研究AI,結果我喺度研究人
我諗住總結篇會特別易寫。
畢竟素材都有曬——過去幾個月寫咗15篇AI技能(Skill)拆解,橫跨兩個系列:數據分析系列(5篇,全部完結)同上下文工程系列(多篇),加埋幾篇散篇。每篇都認真讀過源碼、踩過坑、揾過設計邏輯。到寫總結嘅時候,應該係信手拈來。
結果寫到一半,我醒起一件事:
我一直以為自己喺度研究「AI點樣執行任務」。但拆完15篇,我先發現自己研究嘅從來都唔係AI——而係人類點樣將模糊嘅意圖,變成AI能夠理解同執行嘅結構。
技能唔係AI嘅使用說明書,佢係人同AI之間嘅翻譯層。
所有優秀嘅技能設計,本質上都在解決同一個問題:人類嘅語言係模糊嘅,AI嘅執行係精確嘅,點樣喺兩者之間起一座橋?
從呢個角度重新睇15篇,3個共同點浮出水面——而且每一個都令我有啲意外。

共同點一:最好嘅規則,係令AI唔需要規則
先講一個令我有啲震驚嘅發現。
當我將15個技能裏面嘅規則全部揀出嚟擺埋一齊對比嘅時候,我發現咗一個極之反直覺嘅現象:設計得越好嘅技能,規則越少。
唔係因為佢哋覆蓋嘅場景少,恰恰相反——佢哋覆蓋嘅場景更多、更複雜。但規則數量反而更少。
點解?
因為好技能唔寫規則,而寫原因。
爛技能嘅典型樣係咁嘅:
“對超過2000個詞元嘅內容進行壓縮處理。優先保留最近3輪對話。遇到模糊指令時返回澄清問題。
每一條都係命令,讀完知道「要做啲乜」,但完全唔知道「點解要咁做」。
好技能嘅樣係咁嘅:
“對超過2000個詞元嘅內容進行壓縮處理——因為模型喺呢個長度之後注意力開始分散,壓縮嘅目的係保護關鍵信息嘅召回質量,而唔係節省token。
睇起嚟只係多咗一句話,但呢句話徹底改變咗AI嘅執行邏輯。
冇原因嘅規則,AI只能死守。 遇到邊界情況,佢唔知道呢條規則嘅優先級,只能機械執行或者乾脆放棄。你每次遇到一個新場景,就要再寫一條新規則——規則越寫越多,技能越來越臃腫,AI越來越迷茫。
有咗原因,AI就有咗推導能力。 佢知道呢條規則背後保護嘅係乜,遇到任何冇覆蓋嘅情況,都可以按同樣嘅邏輯自己推斷——而唔係等你嚟補規則。
呢個就係點解好技能規則反而更少:佢唔係喺度堆砌指令,而係喺度向AI解釋意圖。將意圖交俾AI,AI就可以自己生成無數條規則。
真正嘅頓悟係:「點解」唔係註釋,係俾AI嘅判斷力。寫清楚咗意圖,你就唔需要窮舉規則。
| 規則形態 | ||
| 遇到邊界情況 | ||
| 維護成本 | ||
| 規模趨勢 | ||
| 本質 |
共同點二:最有價值嘅內容,係設計者唔敢寫嘅部分
數據分析系列裏面,有一篇技能令我印象最深——唔係因為佢嘅步驟設計得幾精妙,而係因為佢有一段話,係我喺其他技能裏面幾乎從未見過嘅:
“注意:每年12月31日嘅數據喺系統中存在一個已知嘅統計口徑問題,該日期嘅數據會被計入下一年的第一天。如果你發現年末數據異常偏低,優先檢查呢個問題,而唔係揾數據源嘅bug。
呢條內容唔係乜嘢通用原則,唔係乜嘢設計哲學,就係一個非常具體嘅、踩過嘅坑。
但正正係呢條內容,令呢個技能喺真實使用中有效。因為佢覆蓋咗一個只有真正用過呢套系統嘅人先會知道嘅情況。
我後來發現,幾乎所有真正好用嘅技能,都有呢啲內容——唔係腦補出嚟嘅邊界情況,而係真實踩過嘅坑。
而幾乎所有睇起嚟「結構完整」但實際用起嚟一堆問題嘅技能,都缺少呢部分。佢哋嘅邊界處理寫嘅係「如果出現異常情況……」——但乜嘢叫異常情況?邊個嚟判斷?AI唔知,用戶都唔知。
呢度有一個好深嘅認知陷阱:
我哋寫技能嘅時候,天然傾向於寫「應該發生啲乜」,而唔係「實際上會發生啲乜」。 因為「應該發生啲乜」係有邏輯、有秩序、好表達嘅;「實際上會發生啲乜」係混亂嘅、具體嘅、需要真實經歷先至寫得出嚟嘅。
但AI執行嘅係真實世界,唔係理想世界。
所以嗰啲真正有價值嘅內容,往往係設計者覺得「呢個太細節喇,使唔使寫」、猶豫咗一下、最後都寫上去嗰一條。
真正嘅頓悟係:好技能嘅價值密度,藏喺嗰啲「感覺有啲多餘」嘅細節裏面。越係具體嘅坑,越係冇辦法被替代嘅價值。
共同點三:複雜度係技能最隱蔽嘅殺手
呢個係15篇裏面我自己認知變化最大嘅一個點。
最開始我以為:技能越詳細越好。畢竟場景越複雜,需要覆蓋嘅情況就越多,規則當然要多。
後來我發現,呢個直覺完全錯咗。
我做咗一個簡單嘅統計:將15個技能按照「實際使用效果」排咗個大概嘅次序,然後睇佢哋嘅步驟數量分佈。結果出乎意料咁整齊:
效果最好嘅技能,核心流程集中喺5到7步。 少過5步嘅,往往跳過咗關鍵判斷節點,AI會自己腦補填空,結果飄忽不定;多過8步嘅,AI執行到中段開始漂移,後半段嘅步驟形同虛設。

但更加有意思嘅發現唔係呢個數字,而係點解會漂移。
我以前以為AI漂移係因為「唔夠聰明」——步驟太多記唔住。後來發現唔係咁。真正嘅原因係:步驟多嘅技能,往往包含咗大量互相稀釋嘅指令。
乜嘢叫互相稀釋?例如技能嘅第3步話「優先保證準確性」,第7步話「如果時間緊張可以適當犧牲精度」——呢兩條指令本身都冇錯,但佢哋同時出現,AI唔知應該聽邊條,會喺每次執行時隨機揀一條,結果就變得唔穩定。
更深一層嘅問題係:長技能裏面嘅大部分內容,唔係喺度解決真實存在嘅問題,而係喺度解決寫技能嘅人想像出嚟嘅問題。 因為寫嗰陣成日覺得「如果遇到呢種情況點算」「如果用戶咁講點算」——然後不斷塞入去。
呢啲內容唔係冇用,但佢哋稀釋咗真正重要嘅指令嘅權重。AI無法區分邊條指令係核心,邊條係邊角——佢會將所有內容一視同仁咁處理。
精簡嘅本質,唔係刪內容,而係只保留真實發生嘅問題對應嘅解決方案,刪走所有「以防萬一」嘅填充。
真正嘅頓悟係:技能嘅複雜度唔係功能嘅體現,係設計者唔確定性嘅體現。越唔確定,就越想寫多啲;越寫得多,AI就越唔確定。呢個係一個惡性循環。
| 5到7步 | 穩定,效果最佳 | 指令密度啱啱好,AI能完整消化 | 可復現,可迭代 |
結尾:呢個唔只係AI嘅問題
寫完呢15篇,我對「skill設計」呢件事嘅理解,已經同開始時完全唔一樣喇。
最開始我以為呢個係技術問題——點樣寫prompt、點樣設計流程、點樣覆蓋場景。
而家我認為呢個係表達問題:你能唔能夠將自己真正知道嘅嘢,用對方能夠理解嘅方式講清楚。
呢三個共同點——將意圖而唔係規則交俾AI、將真實嘅坑而唔係想像嘅坑寫入去、只保留真實發生嘅問題嘅解決方案——唔只係AI技能嘅設計標準。
佢哋同樣適用於任何你寫俾人執行嘅文檔:SOP、需求說明、流程手冊、操作指南。
好多流程文檔失效嘅原因,同爛技能失效嘅原因完全一樣:規則太多原因太少,想像嘅情況太多真實嘅坑太少,寫嘅人越唔確定就越想寫多啲,執行嘅人越寫得多就越迷茫。
好嘅表達,係將你真正理解嘅嘢,壓縮成對方啱啱好需要嘅形式。 唔多,唔少,唔模糊。
我係專注AI Agent深度實踐嘅努力撞蘑菇AI,致力於分享真實可用嘅AI使用經驗與工作流探索,歡迎你同我一齊將AI玩明白,如果內容對你有幫助,歡迎關注、讚好、轉發。
開篇:我以為我在研究 AI,結果我在研究人
我以為總結篇會特別好寫。
畢竟素材都有了——過去幾個月寫了 15 篇 AI 技能(Skill)拆解,橫跨兩個系列:數據分析系列(5 篇,全部完結)和上下文工程系列(多篇),外加幾篇散篇。每篇都認真讀過源碼、踩過坑、找過設計邏輯。到了寫總結的時候,應該是信手拈來。
結果寫到一半,我意識到一件事:
我一直以為自己在研究"AI 怎麼執行任務"。但拆完 15 篇,我才發現自己研究的從來都不是 AI——而是人類如何把模糊的意圖,變成 AI 能夠理解和執行的結構。
技能不是 AI 的使用說明書,它是人和 AI 之間的翻譯層。
所有優秀的技能設計,本質上都在解決同一個問題:人類的語言是模糊的,AI 的執行是精確的,怎麼在兩者之間建一座橋?
從這個角度重新看 15 篇,3 個共同點浮出水面——而且每一個都讓我有點意外。

共同點一:最好的規則,是讓 AI 不需要規則
先說一個讓我有點震驚的發現。
當我把 15 個技能裏的規則全部摘出來放在一起對比的時候,我發現了一個極其反直覺的現象:設計得越好的技能,規則越少。
不是因為它們覆蓋的場景少,恰恰相反——它們覆蓋的場景更多、更復雜。但規則數量反而更少。
為什麼?
因為好技能不寫規則,而寫原因。
爛技能的典型長相是這樣的:
“對超過 2000 個詞元的內容進行壓縮處理。 優先保留最近 3 輪對話。 遇到模糊指令時返回澄清問題。
每一條都是命令,讀完知道"要做什麼",但完全不知道"為什麼這麼做"。
好技能的長相是這樣的:
“對超過 2000 個詞元的內容進行壓縮處理——因為模型在這個長度之後注意力開始分散,壓縮的目的是保護關鍵信息的召回質量,而不是節省 token。
看起來只是多了一句話,但這句話徹底改變了 AI 的執行邏輯。
沒有原因的規則,AI 只能死守。 遇到邊界情況,它不知道這條規則的優先級,只能機械執行或乾脆放棄。你每遇到一個新場景,就要再寫一條新規則——規則越寫越多,技能越來越臃腫,AI 越來越迷茫。
有了原因,AI 有了推導能力。 它知道這條規則背後保護的是什麼,遇到任何沒有覆蓋的情況,都能按同樣的邏輯自己推斷——而不是等你來補規則。
這就是為什麼好技能規則反而更少:它不是在堆砌指令,而是在向 AI 解釋意圖。把意圖交給 AI,AI 就能自己生成無數條規則。
真正的頓悟是:「為什麼」不是註釋,是給 AI 的判斷力。寫清楚了意圖,你就不需要窮舉規則。
| 規則形態 | ||
| 遇到邊界情況 | ||
| 維護成本 | ||
| 規模趨勢 | ||
| 本質 |
共同點二:最有價值的內容,是設計者不敢寫的部分
數據分析系列裏,有一篇技能讓我印象最深——不是因為它的步驟設計得多精妙,而是因為它有一段話,是我在其他技能裏幾乎從沒見過的:
“注意:每年 12 月 31 日的數據在系統中存在一個已知的統計口徑問題,該日期的數據會被計入下一年的第一天。如果你發現年末數據異常偏低,優先檢查這個問題,而不是尋找數據源的 bug。
這條內容不是什麼通用原則,不是什麼設計哲學,就是一個非常具體的、踩過的坑。
但正是這條內容,讓這個技能在真實使用中有效。因為它覆蓋了一個只有真正用過這套系統的人才會知道的情況。
我後來發現,幾乎所有真正好用的技能,都有這樣的內容——不是腦補出來的邊界情況,而是真實踩過的坑。
而幾乎所有看起來"結構完整"但實際用起來一堆問題的技能,都缺少這部分。它們的邊界處理寫的是"如果出現異常情況……"——但什麼叫異常情況?誰來判斷?AI 不知道,用戶也不知道。
這裏有一個很深的認知陷阱:
我們在寫技能的時候,天然傾向於寫"應該發生什麼",而不是"實際會發生什麼"。 因為"應該發生什麼"是有邏輯、有秩序、好表達的;"實際會發生什麼"是混亂的、具體的、需要真實經歷才能寫出來的。
但 AI 執行的是真實世界,不是理想世界。
所以那些真正有價值的內容,往往是設計者覺得"這個太細節了,要不要寫"、猶豫了一下、還是寫上去的那一條。
真正的頓悟是:好技能的價值密度,藏在那些"感覺有點多餘"的細節裏。越是具體的坑,越是無法被替代的價值。
共同點三:複雜度是技能最隱蔽的殺手
這是 15 篇裏我自己認知變化最大的一個點。
最開始我以為:技能越詳細越好。畢竟場景越複雜,需要覆蓋的情況就越多,規則當然要多。
後來我發現,這個直覺完全錯了。
我做了一個簡單的統計:把 15 個技能按照"實際使用效果"排了個大概的序,然後看它們的步驟數量分佈。結果出乎意料地整齊:
效果最好的技能,核心流程集中在 5 到 7 步。 少於 5 步的,往往跳過了關鍵判斷節點,AI 會自己腦補填空,結果飄忽不定;多於 8 步的,AI 執行到中段開始漂移,後半段的步驟形同虛設。

但更有意思的發現不是這個數字,而是為什麼會漂移。
我以前以為 AI 漂移是因為"不夠聰明"——步驟太多記不住。後來發現不是這樣。真正的原因是:步驟多的技能,往往包含了大量互相稀釋的指令。
什麼叫互相稀釋?比如技能的第 3 步說"優先保證準確性",第 7 步說"如果時間緊張可以適當犧牲精度"——這兩條指令本身都沒錯,但它們同時出現,AI 不知道該聽哪條,會在每次執行時隨機選一條,結果就變得不穩定。
更深一層的問題是:長技能裏的大部分內容,不是在解決真實存在的問題,而是在解決寫技能的人想象出來的問題。 因為寫的時候總覺得"如果遇到這種情況怎麼辦""如果用戶這麼說怎麼辦"——然後不斷往裏塞。
這些內容不是無用的,但它們稀釋了真正重要的指令的權重。AI 無法區分哪條指令是核心,哪條是邊角——它會把所有內容一視同仁地處理。
精簡的本質,不是刪內容,而是只保留真實發生的問題對應的解決方案,刪掉所有"以防萬一"的填充。
真正的頓悟是:技能的複雜度不是功能的體現,是設計者不確定性的體現。越不確定,就越想多寫;越多寫,AI 就越不確定。這是一個惡性循環。
| 5 到 7 步 | 穩定,效果最佳 | 指令密度剛好,AI 能完整消化 | 可復現,可迭代 |
結尾:這不只是 AI 的問題
寫完這 15 篇,我對"skill設計"這件事的理解,已經和剛開始完全不一樣了。
最開始我以為這是個技術問題——怎麼寫 prompt、怎麼設計流程、怎麼覆蓋場景。
現在我認為這是個表達問題:你能不能把自己真正知道的東西,用對方能理解的方式說清楚。
這三個共同點——把意圖而不是規則交給 AI、把真實的坑而不是想象的坑寫進去、只保留真實發生的問題的解決方案——不只是 AI 技能的設計標準。
它們同樣適用於任何你寫給別人執行的文檔:SOP、需求說明、流程手冊、操作指南。
很多流程文檔失效的原因,和爛技能失效的原因完全一樣:規則太多原因太少,想象的情況太多真實的坑太少,寫的人越不確定就越想多寫,執行的人越多寫就越迷茫。
好的表達,是把你真正理解的東西,壓縮成對方剛好需要的形式。 不多,不少,不模糊。
我是專注 AI Agent深度實踐的努力撞蘑菇AI,致力於分享真實可用的 AI 使用經驗與工作流探索,歡迎你和我一起把 AI 玩明白,如果內容對你有幫助,歡迎關注、點贊、轉發。