別把它當提示詞!Anthropic 用幾百個 Skills 把 Claude 榨乾了

作者:AI信息Gap
日期:2026年3月22日 上午12:00
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

不要將 Skills 當提示詞,Anthropic 用幾百個 Skills 將 Claude 榨乾

整理版摘要

呢篇文章係 Claude Code 核心工程師 Thariq Shihipar 嘅系列第三篇,佢公開咗 Anthropic 內部點樣打造幾百個 Skills。作者想解決嘅問題係點樣令 Claude 喺開發流程入面發揮最大效用,而唔係靠單一提示詞。整體結論係:Skills 唔係 Markdown 文件,而係一個文件夾,入面可以有腳本、配置、數據集,Claude 可以自己探索。將 Skills 當成工具箱,效果遠超單純嘅提示詞。

Thariq 將 Skills 分為 9 大類,覆蓋寫碼、審碼、部署、數據分析等成條工程流水線。最反直覺嘅係「產品驗證」類,Anthropic 會用成個星期去打磨一個驗證 Skill。例如 signup-flow-driver 可以自動跑註冊流程,checkout-verifier 用 Stripe 測試卡驗證支付。咁樣 Claude 寫完碼就可以自測,唔使等人審。仲有 babysit-pr 會自動處理 PR,adversarial-review 用另一個子代理對抗式審查,確保碼質素。最終人由執行者變成最終審批者。

Thariq 建議唔好寫 Claude 本來就識嘅嘢,要專注踩坑記錄同設計品味呢類獨家知識。Skills 嘅描述要當觸發條件寫,唔好當產品介紹。Skills 仲可以有記憶同鈎子,例如 /careful 攔截高危命令。Anthropic 內部行去中心化路線,好嘅 Skills 先喺沙盒…

  • Skills 唔係提示詞而係一個文件夾,Claude 可以自行探索入面嘅腳本、配置等資源,效果遠超單一 prompt。
  • 驗證類 Skills 最值得投入,例如 signup-flow-driver、checkout-verifier 等,可以令 Claude 自測,減少人手審查。
  • Anthropic 將開發流程轉變為 AI 寫碼、AI 審碼、AI 盯部署,人由執行者變成最終審批者。
  • 唔好寫 Claude 本來就識嘅嘢,要專注踩坑記錄同設計品味等獨家知識,Skills 嘅描述要當觸發條件寫。
  • 可以直接安裝 Anthropic 官方開源 Skills,或者將自寫 Skills 放喺 ~/.claude/skills/ 目錄,Claude 會自動發現。
值得記低
連結 github.com

Anthropic Skills 開源倉庫

Anthropic 官方開源嘅 Skills 集合,Apache 2.0 協議,可以喺 Claude Code 用 /plugin marketplace add anthropics/skills 安裝。

整理重點

Skills 本質:文件夾,唔係提示詞

Thariq 話 Skills 唔係就咁一個 Markdown 文件,而係一個文件夾。Markdown 只係入口,入面可以放腳本、配置文件、數據集、模板資源。Claude 可以自己探索成個文件夾,按需要讀取內容。

將 Skills 當成文字,Claude 就當係文字;將佢當成工具箱,效果完全唔同。

整理重點

最值得投資:產品驗證類 Skills

9 類 Skills 入面最反直覺嘅係「產品驗證」。Thariq 話 It can be worth having an engineer spend a week just making your verification skills excellent。即係值得用成個星期去打磨一個驗證 Skill。

  1. 1 signup-flow-driverClaude 改完註冊流程嘅碼,呢個 Skill 會自動跑註冊→郵件驗證→新手引導全流程,每一步用腳本斷言檢查狀態。
  2. 2 checkout-verifier:用 Stripe 測試卡跑完整個支付流程,確保支付環節無問題。
  3. 3 tmux-cli-driver:專檢測需要終端交互嘅命令行工具。

仲有 babysit-pr 會幫你睇住 PR,自動化測試掛咗會判斷係咪偶發失敗,合併衝突會即場解決,全綠先合併。deploy-<service> 一條龍:構建→冒煙測試→逐步放量→對比錯誤率→異常回滾。

adversarial-review 係對抗式審查,Claude 寫完碼後另起一個子代理用全新視角挑毛病,改完再審,循環到只剩雞蛋裏挑骨頭。

整理重點

點樣寫高質 Skills:專注踩坑記錄

Thariq 建議唔好寫 Claude 本來就識嘅嘢,因為 Claude 自己好懂碼。要話畀佢嗰啲佢憑自己諗唔到嘅資訊。例如前端設計 Skill 會跳過樣式碼教程,專攻設計品味,避開 Inter 字體、紫色漸變、圓角卡片呢啲「一眼 AI」嘅設計套路。

一個 Skills 入面含金量最高嘅部分,係踩坑記錄。

每次 Claude 用呢個 Skill 碰到問題,就記低。時間越長,踩坑記錄越厚,Skill 越好用。呢個做法同之前講嘅「漸進式披露」一個邏輯。

整理重點

記憶、鈎子與管理方式

Skills 可以有記憶,最簡單做法係創建一個只追加嘅日誌文件。例如 standup-post,每次生成日報都寫入日誌,下次跑嘅時候 Claude 拉取上次記錄就知道邊啲變咗。

  • /careful:攔截 rm -rf、DROP TABLE、force-push、kubectl delete 等高危命令。
  • /freeze:鎖定指定目錄之外嘅文件,禁止編輯。平時唔生效,需要時一句命令激活,成個會話有效。

Anthropic 內部行去中心化路線,小團隊直接提交到代碼倉庫嘅 Skills 目錄,大團隊經內部插件市場上架。唔設中心化審核,先用 GitHub 沙盒試,多人用先正式上架。佢哋用鈎子機制追蹤每個 Skill 嘅調用頻次,邊啲火邊啲冇人用一目瞭然。

整理重點

立即行動:安裝官方 Skills 或自建

AnthropicGitHub 開源咗一批官方 Skills,Apache 2.0 協議,社區市場都有現成 Skills。用起嚟好簡單:

安裝官方 Skills shell
/plugin marketplace add anthropics/skills

如果想自己寫,將 Skills 放到 ~/.claude/skills/ 目錄,Claude 會自動發現。呢個系列第三篇就係咁多,之前仲有提示緩存同工具設計嘅文章。

別糾結選邊個模型,Anthropic 已經用幾百個 Skills 將模型榨乾喇。

Claude Code 核心工程師系列第三彈。

Claude Code,大概有20個工具。

圍住呢20個工具,Anthropic內部整咗幾百個 Skills。

你冇睇錯,幾百個。

呢個數字嚟自 Claude Code 核心工程師 Thariq Shihipar。幾日前佢又分享咗一篇長文,將團隊內部 Skills 做咗一次全面盤點。9大分類,一套方法論。

我哋之前講過佢另一篇「學會從 AI 嘅視角睇問題」,覆盤 Claude Code 嘅20個工具點樣迭代出嚟。今次講嘅係 Skills。

《Lessons from Building Claude Code》系列,第三篇。

圖片


「Skills 唔係 Markdown 文件。係一個文件夾。」

Markdown 只係入口。裏面可以有腳本、設定檔、數據集、模板資源。

Claude 可以自己探索成個文件夾,按需要讀取。

你將 Skills 當提示詞,Claude 就會當佢係文字。你將佢當工具箱,效果完全唔同。



9類 Skills,覆蓋咗寫代碼、審代碼、部署維運、數據分析、團隊自動化在內嘅成條工程流水線。

圖片

Thariq話,好嘅 Skill 可以明確咁歸類到某一類入面。而令人困惑嘅 Skill,往往橫跨幾類。

9類裏面最反直覺嘅係「產品驗證」。

值得花一個工程師成個星期去將你嘅驗證 Skills 整到最好。

驗證類 Skills,值得俾一個工程師用成個星期嚟打磨。

一個星期。淨係做一個 Skill。聽落好奢侈。

Claude 寫完代碼,傳統做法係等真人嚟審。Anthropic 換咗個思路,讓 Claude 自己驗證自己。

signup-flow-driverClaude 改完註冊流程嘅代碼,呢個 Skill 會行一次註冊→郵件驗證→新手引導嘅全流程。每一步用腳本斷言檢查狀態。

checkout-verifier用 Stripe 測試卡行曬成個支付流程。tmux-cli-driver專門檢測需要終端互動嘅命令行工具。

代碼寫完唔使等人工審。直接自測。



babysit-pr幫你嘅代碼做保母。

你將代碼提交上去,佢會睇住。自動化測試 fail 咗,判斷係咪偶發失敗,係嘅就重新行。合併衝突,當場解決。全部通過之後先合併。

deploy-<service>構建→冒煙測試→逐步放量→對比錯誤率→發現異常直接回滾。一條龍。

adversarial-review,「對抗式審查」。Claude 寫完代碼,另外開一個子代理用全新視角揾問題,改完再審,循環到剩係雞蛋裏面挑骨頭為止。

AI 寫代碼,AI 審代碼,AI 睇住部署。

人喺呢套開發流程裏面嘅角色,由「執行者」變成「最終審批者」。



Thariq 嘅建議,「唔好寫 Claude 本來就知嘅嘢。」

圖片

Claude 自己好識代碼。你要話俾佢知啲靠自己諗唔到嘅資訊。

以前端設計 Skill 為例。 frontend-design 跳過樣式代碼教學,專攻設計品味。點樣避開 Inter 字體、紫色漸變、圓角卡片呢啲「一眼 AI」嘅設計套路。

呢個 Skill 係同客戶反覆迭代出嚟。



一個 Skill 裏面最有價值嘅部分,係踩坑記錄。

每次 Claude 用呢個 Skill 遇到問題,記低。時間越長,踩坑記錄越厚,Skill 越好用。

圖片

呢個同上篇文章講嘅「漸進式披露」同一個邏輯。

Claude Code 由向量數據庫 RAG 檢索進化到俾 Claude 自己搜代碼庫,核心就係漸進式披露。

今次 Thariq 將同樣嘅方法搬咗去 Skills 度。

入口 Markdown 話俾 Claude 知文件夾裏面有啲乜。詳細嘅接口文檔拆解到子目錄。模板放資源文件夾。腳本放根目錄。Claude 逐層展開,按需要載入。

將成個檔案系統視為一種上下文工程同漸進式披露。

上下文工程 + 漸進式披露

圖片


Skills 嘅「描述」字段,決定了 Claude 幾時觸發呢個 Skill。

如果你寫「呢個 Skill 用嚟做代碼審查」,模型好難判斷幾時應該調用。寫成「當用戶要求審查代碼質素,或者提交代碼之前」,觸發條件就清楚好多。

圖片

將「描述」當觸發條件嚟寫,唔好當產品介紹嚟寫。



Skills 可以有記憶。

最簡單嘅做法,建立一個只係追加嘅日誌檔案。例如 standup-post每次生成日報都寫入日誌。下次行嘅時候 Claude 拉返上次嘅記錄,就知道邊啲變咗。

圖片

Skills 仲可以掛鈎(Hook)。

Anthropic 內部有一個 safety hook, /careful調用後會攔截 rm -rf、drop database rm -rfDROP TABLEforce-pushkubectl delete 呢啲高危命令。/freeze 鎖定指定目錄以外嘅檔案,禁止編輯。

平時唔生效,需要嘅時候一句命令激活,成個會話有效。



Anthropic 內部嘅幾百個 Skills,行去中心化路線。

小團隊直接提交到代碼倉庫嘅 Skills 目錄。大團隊行內部插件市場,上載、安裝、自由組合。

內部唔設中心化審核。

好用嘅 Skills 先掉去 GitHub 沙盒文件夾,喺 Slack 推介。用嘅人多了再加到正式市場。

但 Thariq 都話咗,Skill 門檻低,隨手就可以整一個。上架前要有有人把關。

佢哋用鈎子機制追蹤每個 Skill 嘅調用次數,邊啲爆紅,邊啲冇人用,一目瞭然。



Anthropic 喺 GitHub 上開源咗一批官方 Skills,Apache 2.0 協議。社區市場都有現成嘅 Skills 可以直接裝。

https://github.com/anthropics/skills

用起上嚟唔複雜。喺 Claude Code 入面執行 /plugin marketplace add anthropics/skills就可以安裝官方 Skills。

自己寫嘅 Skill 放到 ~/.claude/skills/ 目錄,Claude 會自動揾到。



呢個係 Thariq《Lessons from Building Claude Code》系列嘅第三篇。

第一篇講提示緩存,緩存命中率決定 Agent 嘅速度同成本。第二篇講工具設計,20個工具點樣踩坑踩出嚟。呢一篇講 Skills,幾百個 Skills 點樣寫、點樣管、點樣衡量。

唔好糾結揀邊個模型。

Anthropic 已經用幾百個 Skills 將模型榨乾曬。




我係木易,Top2 + 美國 Top10 CS 碩,而家係 AI 產品經理。

關注「AI信息Gap」,讓 AI 成為你嘅外掛。




圖片

Claude Code 核心工程師系列第三彈。

Claude Code,大約 20 個工具。

圍繞這 20 個工具,Anthropic 內部打造了幾百個 Skills。

你沒有看錯,幾百個。

這個數字來自 Claude Code 核心工程師 Thariq Shihipar。幾天前他又分享了一篇長文,把團隊內部 Skills 做了一次全量盤點。9 大分類,一套方法論。

我們之前聊過他另一篇「學會從 AI 的視角看問題」,覆盤 Claude Code 的 20 個工具怎麼迭代出來的。這次聊的是 Skills。

「Lessons from Building Claude Code」系列,第三篇。

圖片


「Skills 不是 Markdown 文件。是一個文件夾。」

Markdown 只是入口。裏面可以有腳本、配置文件、數據集、模板資源。

Claude 能自己探索整個文件夾,按需讀取。

你把 Skills 當提示詞,Claude 就把它當成文字。你把它當工具箱,效果完全不一樣。



9 類 Skills,覆蓋了寫代碼、審代碼、部署運維、數據分析、團隊自動化在內的整條工程流水線。

圖片

Thariq 說,好的 Skill 能明確地歸屬到某一類裏。而讓人困惑的 Skill,往往橫跨好幾類。

9 類裏面最反直覺的是「產品驗證」。

It can be worth having an engineer spend a week just making your verification skills excellent.

驗證類 Skills,值得讓一個工程師花整整一週來打磨。

一週。只做一個 Skill。聽起來很奢侈。

Claude 寫完代碼,傳統做法是等真人來審。Anthropic 換了個思路,讓 Claude 自己驗證自己。

signup-flow-driver。Claude 改完註冊流程的代碼,這個 Skill 跑一遍註冊→郵件驗證→新手引導的全流程。每一步用腳本斷言檢查狀態。

checkout-verifier,用 Stripe 測試卡跑完整個支付流程。tmux-cli-driver,專門檢測需要終端交互的命令行工具。

代碼寫完不用等人審。直接自測。



babysit-pr。給你的代碼當保姆。

你把代碼提交上去,它盯着。自動化測試掛了,判斷是不是偶發失敗,是的話重新跑。合併衝突,當場解決。全綠之後再合併。

deploy-<service>,構建→冒煙測試→逐步放量→對比錯誤率→發現異常直接回滾。一條龍。

adversarial-review,「對抗式審查」。Claude 寫完代碼,另起一個子代理用全新視角挑毛病,改完再審,循環到只剩雞蛋裏挑骨頭為止。

AI 寫代碼,AI 審代碼,AI 盯部署。

人在這套開發流程裏的角色,從「執行者」變成了「最終審批者」。



Thariq 的建議,「不要寫 Claude 本來就知道的東西。」

圖片

Claude 自己很懂代碼。你得告訴它那些憑自己想不到的信息。

以前端設計 frontend-design Skill 為例。跳過樣式代碼教程,專攻設計品位。怎麼避開 Inter 字體、紫色漸變、圓角卡片這些「一眼 AI」的設計套路。

這個 Skill 是跟客戶反覆迭代出來的。



一個 Skill 裏含金量最高的部分,是踩坑記錄。

每次 Claude 用這個 Skill 碰到問題,記下來。時間越長,踩坑記錄越厚,Skill 越好用。

圖片

這跟上篇文章講的「漸進式披露」一個邏輯。

Claude Code 從向量數據庫 RAG 檢索進化到讓 Claude 自己搜代碼庫,核心就是漸進式披露。

這次 Thariq 把同樣的方法搬到了 Skills 上。

入口 Markdown 告訴 Claude 文件夾裏有什麼。詳細的接口文檔拆解到子目錄。模板放資源文件夾。腳本放根目錄。Claude 逐層展開,按需加載。

Think of the entire file system as a form of context engineering and progressive disclosure.

上下文工程 + 漸進式披露

圖片


Skills 的「描述」字段,決定了 Claude 什麼時候觸發這個 Skill。

如果你寫「這個 Skill 用於代碼審查」,模型很難判斷什麼時候該調用。寫成「當用戶要求審查代碼質量,或提交代碼之前」,觸發條件就清晰多了。

圖片

把「描述」當觸發條件寫,別當產品介紹寫。



Skills 可以有記憶。

最簡單的做法,創建一個只追加的日誌文件。比如 standup-post,每次生成日報都寫入日誌。下次跑的時候 Claude 拉取上次的記錄,就知道哪些變了。

圖片

Skills 還可以帶鈎子(Hook)。

Anthropic 內部有一個 /careful,調用後攔截 rm -rfDROP TABLEforce-pushkubectl delete 這些高危命令。/freeze 鎖定指定目錄之外的文件,禁止編輯。

平時不生效,需要時一句命令激活,整個會話有效。



Anthropic 內部的幾百個 Skills,走去中心化路線。

小團隊直接提交到代碼倉庫的 Skills 目錄。大團隊走內部插件市場,上傳、安裝、自由組合。

內部不設置中心化審核。

好用的 Skills 先扔到 GitHub 沙盒文件夾,在 Slack 推薦。用的人多了再加到正式市場。

但 Thariq 也說了,Skill 門檻低,隨手就能糊一個。上架前得有人把關。

他們用鈎子機制追蹤每個 Skill 的調用頻次,哪些火了,哪些沒人用,一目瞭然。



Anthropic 在 GitHub 上開源了一批官方 Skills,Apache 2.0 協議。社區市場也有現成的 Skills 可以直接裝。

https://github.com/anthropics/skills

用起來不復雜。在 Claude Code 裏運行 /plugin marketplace add anthropics/skills,就能安裝官方 Skills。

自己寫的 Skill 放到 ~/.claude/skills/ 目錄,Claude 會自動發現。



這是 Thariq「Lessons from Building Claude Code」系列的第三篇。

第一篇講提示緩存,緩存命中率決定 Agent 的速度和成本。第二篇講工具設計,20 個工具怎麼踩坑踩出來的。這一篇講 Skills,幾百個 Skills 怎麼寫、怎麼管、怎麼衡量。

別糾結選哪個模型。

Anthropic 已經用幾百個 Skills 把模型榨乾了。




我是木易,Top2 + 美國 Top10 CS 碩,現在是 AI 產品經理。

關注「AI信息Gap」,讓 AI 成為你的外掛。




圖片