字節大佬開源Garden Skills 從網頁設計到生圖檢索全搞定

作者:大飛的AI賦能筆記
日期:2026年5月7日 下午12:45
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Garden Skills:三個超實用Skills,一次過幫AI裝上設計品味、本地生圖同漸進式檢索能力。

整理版摘要

話說你成日覺得AI生成嘅網頁永遠係嗰個樣——藍色按鈕、紫紅漸變、圓角大卡片?呢個唔係你問題,而係大模型天生有審美趨同嘅缺點。最近字節大佬ConardLi開源咗Garden Skills,一個GitHub項目,專為AI加載生產級Skills而設。作者本身係知名前端技術博主,佢嘅目標係畀AI嘅能力跳出一式一樣嘅框架,真正變得更實用。

呢個Skills合集目前包含三個核心技能:web-design-engineer(設計品味)、gpt-image-2(本地生圖兼prompt顧問)同kb-retriever(漸進式知識庫檢索)。每個技能都經過精心打磨,唔係求數量,而係求質素。仲有一個即將發佈嘅web-video-presentation,可以將腳本變成電影級演示。整體結論係:AI嘅能力上限取決於你畀佢裝咗乜嘢技能包,呢套Skills絕對值得一試。

安裝方式超簡單,兼容Claude CodeCursor等主流平台,MIT開源,想玩就玩。

  • web-design-engineer 提供反俗套清單同六步工作法,令AI生成網頁從「能用」升級到「驚豔」。
  • gpt-image-2 一個技能三種模式:本地API生圖、宿主委託、顧問寫prompt,冇API Key都用到。
  • kb-retriever 用分層索引、grep優先、最多五輪檢索,取代成個檔案塞畀AI嘅暴力做法,慳token又快。
  • Skills結構由SKILL.md定義,AI會自動判斷幾時觸發,唔會亂用。
  • 安裝支援Claude Code插件市場、手動複製同Git子模塊,跨平台兼容,仲可以自己貢獻Skill。
值得記低
連結 github.com

Garden Skills GitHub

字節大佬ConardLi開源嘅Skills合集,包含網頁設計、圖像生成、知識庫檢索技能。

結構示例

內容結構

內容結構 text
/plugin marketplace add ConardLi/garden-skills/plugin install web-design-skills@garden-skills/plugin install knowledge-base-skills@garden-skills/plugin install image-generation-skills@garden-skills
整理重點

點解要有Garden Skills?AI生成網頁千篇一律嘅痛點

你有冇發覺叫AI幫你整網頁,出嚟永遠係嗰套設計?藍色主按鈕(色號#3b82f6)、紫紅漸變背景、圓角大卡片、emoji當圖標,仲要夾硬編啲虛假用戶評價。呢個唔係你問題,而係大模型傾向於生成最安全、最常見嘅嘢,結果就係千篇一律。

AI喺網頁設計上有天然嘅審美趨同

最近GitHub上有個寶藏項目Garden Skills,由知名前端技術博主ConardLi開源,短時間內收穫2k+ Star。佢唔係求多,而係求精——目前有三個核心技能,外加一個即將發佈嘅視頻演示技能,專為AI配備「設計品味」「本地生圖」「漸進式檢索」三大超能力。

整理重點

web-design-engineer:將「能用」變成「驚豔」的設計流程

呢個技能係全個項目最亮眼嘅部分,直接幫AI戒甩「撞臉」設計。佢嘅做法好聰明:畀咗一份反俗套清單(anti-cliché blocklist),明確禁止呢啲通用毛病:

  • 禁止紫色-粉色-藍色漸變背景
  • 禁止Inter / Roboto / Arial / 系統默認字體
  • 禁止emoji替代正經圖標
  • 禁止編造的統計數據、假logo牆、假用戶評價

標準係驚豔,唔係能用

除咗禁令,技能仲內置一套六步工作法,比好多設計師仲規範:理解需求、收集設計上下文、聲明設計系統、展示v0草稿、完整構建、驗證自查。呢個流程令AI唔再「一把梭」,而係似一個真正嘅設計工程師分步思考。

  1. 1 理解需求:根據你提供嘅信息量智能判斷問幾多問題
  2. 2 收集設計上下文:優先讀你畀嘅設計稿/截圖/代碼庫
  3. 3 聲明設計系統:寫代碼前先用文字定好色彩、字體、間距、動效
  4. 4 展示v0草稿:先出低保真版本確認方向
  5. 5 完整構建:全面開發組件、狀態、動效
  6. 6 驗證:上線前檢查控制枱錯誤同禁用配色

六步工作法比大部分設計師仲規範

呢個技能覆蓋嘅場景好廣,包括營銷落地頁、交互原型、HTML幻燈片、數據儀表盤、CSS/JS動畫演示、UI組件庫探索,基本前端視覺產出都支援。

整理重點

gpt-image-2:一個技能三種模式,冇API Key都照用

呢個係第二大重頭技能,專門為圖像生成與編輯而設。佢最大嘅設計亮點係:同一個Skill自動適配三種完全唔同嘅運行環境,使用體驗完全一致。

同一套Skills,三種模式任意切換

Mode A(Garden本地模式):如果你有OpenAI API Key,Skill會完整走通揀模板→寫prompt→調用腳本→出圖存盤,圖片同prompt自動歸檔。Mode B(宿主委託模式):喺Cursor或ChatGPT呢啲自帶圖像工具嘅平台,Skill會退化做提示詞工程專家,寫好prompt交畀宿主出圖。Mode C(顧問模式):乜都冇嘅時候,Skill會幫你寫專業級prompt,你再複製去Midjourney或DALL·E用。

內置18個視覺類目、80多個結構化提示詞模板

呢個技能覆蓋海報、UI原型、產品展示圖、信息圖、學術配圖、技術架構圖、漫畫、頭像、故事板、品牌板、電影分鏡甚至IP周邊設計。每次啟動第一件事就係運行模式檢測腳本,確保唔會行錯路徑。

整理重點

kb-retriever:漸進式檢索,告別全檔案暴力讀取

呢個技能解決一個好實際嘅問題:點樣喺本地知識庫入面高效揾資訊,又唔想成個檔案塞畀AI食token?好多人都係直接將整個文件夾讀入去,但一旦文件多咗、大咗(例如幾十MB PDF),AI嘅上下文窗口根本頂唔順。

漸進式檢索:先索引,再定位,最後精細讀取

kb-retriever採用一套漸進式策略:首先讀取每層目錄下嘅data_structure.md索引文件,瞭解文件結構;然後用grep精確關鍵詞搜索,只讀局部內容;最多迭代5輪,逐步縮小範圍。

  • 分層索引導航:先讀index,唔直接翻檔案
  • 先學習再處理PDF/Excel必須先讀參考文檔,禁止盲目讀取
  • grep優先 + 局部讀取:精確定位,只讀相關片段
  • 最多迭代5輪:每輪收窄關鍵詞,第5輪揾唔到就明確話你知

慳token、慳時間,答案仲要更準

呢個設計對維護個人知識庫嘅朋友嚟講真係神器,支援MarkdownPDFExcel三種格式。你可以將上百份筆記、大PDF電子書、Excel報表放喺知識庫,問AI一個問題,佢唔會再暴力讀取,而係聰明地揀路行。

整理重點

點安裝?三種方法,豐儉由人

Garden Skills提供三種安裝方式,由最簡單到最靈活都有。第一種係用Claude Code插件市場,敲三行命令就搞掂;第二種係手動複製Skill文件夾到對應目錄;第三種係用Git子模塊,適合想同步更新嘅用戶。

Claude Code插件市場最快,三行命令即開即用

實測支援Claude CodeClaude.ai網頁版、CursorCodex CLI、Gemini CLI、OpenCode等多個平台,Windows/Mac/Linux都得。每個Skill嘅結構好簡單:一個SKILL.md(核心操作手冊)、README、scripts、assets等。SKILL.md開頭嘅YAML資訊會話畀AI呢個技能做乜嘢、幾時觸發。

Skills格式跨平台兼容,裝好即用

總結嚟講,Garden Skills唔追求數量,但每個都係精心設計。佢哋畀AI嘅能力帶嚟肉眼可見嘅提升——無論係網頁設計嘅美感、圖像生成嘅專業度,定係知識庫檢索嘅效率。MIT開源,想玩就上GitHubConardLi/garden-skills,Star同Fork都歡迎。話唔定你都可以貢獻一個自己嘅Skill添!

你嘅AI每次整網頁系咪都同一個樣?藍色按鈕、紫色漸變、Inter字體……唔單止咁,想叫佢幫你畫張海報、揾個本地文件,操作仲好麻煩。今日介紹一個GitHub開源Skills合集,一次過幫AI裝上"設計品味""本地生圖""漸進式檢索"三大超能力。

你係咪都有咁嘅經驗:叫AI幫你寫個網頁,出嚟永遠都系嗰套——藍色主按鈕、紫紅漸變背景、圓角大卡片、emoji當圖標,再加上一段唔知邊度作出來嘅"用戶好評"?功能上冇錯,但生得太似"AI寫"㗎啦,拎出去真系唔好意思畀人睇。

呢個唔系你嘅問題,而系大模型喺網頁設計上有天然嘅"審美趨同"——佢哋傾向生成最安全、最常見、最唔會出錯嘅設計,結果就係千篇一律。

最近喺GitHub上發現咗一個寶藏項目——Garden Skills,由知名前端技術博主ConardLi開源維護,短短時間就收穫咗2k+ Star。佢唔系嗰種動不動就上百個技能嘅大雜燴,而系一個精心策劃嘅生產級Skills合集,每個技能都經過咗充分嘅打磨同實戰驗證。目前個合集涵蓋咗網頁設計工程化、圖像生成、本地知識庫檢索三大核心場景,仲有一個即將發佈嘅視頻演示技能,可以說系幫AI配咗把啱手嘅瑞士軍刀。

web-design-engineer:幫你嘅AI裝上設計品味

呢個成個項目入面最亮眼嘅技能,亦系Star數貢獻最多嘅部分。佢嘅定位好明確:將AI生成嘅網頁由"能用"升級到"驚豔"

頭先講過,大模型喺做網頁設計嘅時候特別容易"撞臉"——Inter字體、藍色主按鈕(色號永遠系#3b82f6)、紫紅漸變背景、左邊框高亮卡片、emoji當圖標充數、作虛假嘅用戶評價同數據……

web-design-engineer呢個Skill嘅做法好聰明:佢直接幫AI列咗一份反俗套清單(anti-cliché blocklist),將呢啲通用毛病一一禁止曬:

  • • ❌ 禁止紫色-粉色-藍色漸變背景
  • • ❌ 禁止Inter / Roboto / Arial / 系統默認字體
  • • ❌ 禁止emoji代替正經圖標
  • • ❌ 禁止作嘅統計數據、假logo牆、假用戶評價

淨繫有"禁令"仲唔夠,更加重要嘅系佢幫AI提供咗一套專業設計方法論。呢個技能嘅核心哲學系:"標準系驚豔,唔系能用"——每一個像素都繫有心做嘅,每一次交互都系精心設計嘅。

六步工作法,比大部分設計師仲規範

呢個技能最勁嘅地方,系內置咗一套完整嘅設計流程:

  1. 1. 理解需求:唔系機械式咁問一堆問題,而系根據你提供嘅信息量智能判斷應該問咩、問幾多
  2. 2. 收集設計上下文:優先讀你俾嘅設計稿/截圖/代碼庫,唔系你俾嘅再問你要
  3. 3. 聲明設計系統:喺寫代碼之前,先用文字將色彩、字體、間距、動效方案定落嚟
  4. 4. 展示v0草稿:先出個低保真版本畀你睇下方向啱唔啱,及時糾正
  5. 5. 完整構建:確認方向之後全面開發,包括組件、狀態、動效
  6. 6. 驗證:上線前自查清單,確保冇控制枱報錯,亦冇用到禁用嘅配色

呢套流程令AI唔再"一把梭",而繫好似一個真正嘅設計工程師咁,逐步思考、逐步交付。

呢個技能覆蓋嘅場景都好廣:營銷落地頁、交互原型(帶設備框架嗰種)、HTML幻燈片(16:9比例,支持鍵盤翻頁)、數據儀表盤(Chart.js / D3)、CSS/JS動畫演示、UI組件庫探索……基本你諗到嘅前端視覺產出都支持。

gpt-image-2:一個技能,三種模式,邊度都用得

呢個系項目中第二個重頭技能,專門為GPT Image 2(以及兼容OpenAI接口嘅圖像API) 打造嘅圖像生成同編輯工具。但佢唔止於此——就算你冇任何API Key,佢照樣幫到手。

佢最大嘅設計亮點系:同一個Skill,自動適配三種完全唔同嘅運行環境,你嘅使用體驗卻完全一致

Mode A:Garden本地模式(最強形態)

如果你自己有OpenAI API Key,Set好環境變量,Skill就會進入"完全體"模式。佢會完整行通"揀模板→寫prompt→調用腳本→出圖存檔"嘅全流程,生成嘅圖片同prompt都會自動歸檔到garden-gpt-image-2/目錄底下,方便複用同版本管理。

Mode B:宿主委託模式

如果你用緊Cursor、ChatGPT呢類自帶圖像工具嘅平台,Skill會自動檢測到宿主環境嘅圖像能力,將自己退化為一個"提示詞工程專家"——佢仍然會用專業嘅模板幫你寫好prompt,然後將渲染好嘅提示詞交畀宿主自帶嘅圖像工具去出圖。

Mode C:顧問模式(乜都冇都用得)

最極端嘅情況——你嘅環境既冇API Key,宿主都冇圖像工具——Skill仲可以退化為一個"高質量prompt撰寫顧問"。佢會幫你將prompt寫到專業級別,然後你可以複製粘貼到ChatGPT、Midjourney、DALL·E呢啲外部工具度用。

唔理邊種模式,呢個技能內置咗18個視覺類目、80幾個結構化提示詞模板,覆蓋海報、UI原型、產品展示圖、信息圖、學術配圖、技術架構圖、漫畫、頭像、故事板、品牌板、電影分鏡甚至IP周邊設計。基本上你講需求,佢就可以喺模板庫度揾到最合適嘅起點,幫你組織出專業級嘅提示詞。

值得一提嘅系,呢個技能每次啓動陣做嘅第一件事就係運行模式檢測腳本,確保自己唔會行錯執行路徑——呢個細節做得非常嚴謹。

kb-retriever:唔再成個文件塞畀AI啦

呢個技能解決嘅系一個非常實際嘅問題:喺本地知識庫度高效查找信息,但又唔想成個文件一鋪過丟畀AI食token

好多人用AI搜索本地文檔嘅做法系:成個文件夾嘅內容全部讀曬入去,然後叫AI喺入面揾答案。呢種方法對細文件夾仲得,但一旦文件多咗、大咗(比如幾十MB嘅PDF、幾萬行嘅Excel),AI嘅上下文窗口根本頂唔住,響應亦越來越慢。

kb-retriever嘅設計思路完全唔同,佢採用咗一套漸進式檢索策略:

  1. 1. 分層索引導航:唔系直接去翻文件,而系先讀取每層目錄底下嘅data_structure.md索引文件(呢個文件需要你自己建),瞭解呢個目錄入面有啲咩、每份文件大概系咩內容、覆蓋咗邊啲時間段,然後精準定位到最可能包含答案嘅文件
  2. 2. 先學習再處理:遇到PDF或Excel文件陣,強制一定要先讀取references/目錄底下嘅學習方法文檔,搞清楚推薦嘅處理工具同命令,先去提取內容——禁止盲目讀成個文件
  3. 3. grep優先 + 局部讀取:用精確關鍵詞搜索定位,然後淨系讀相關片段嘅局部內容,唔系讀成個文件
  4. 4. 最多迭代5輪:設定嚴格嘅檢索上限,每輪縮小關鍵詞範圍,去到第5輪都未揾到就明確通知用戶

呢種設計對於維護個人知識庫(PKM)嘅同學嚟講簡直系神器。比如你嘅knowledge/目錄入面有上百份Markdown筆記、幾個大PDF電子書、一堆Excel數據報表,問AI一個問題,佢唔再系"全讀一遍"嘅暴力模式,而系先睇索引、定位細範圍、精細讀取——慳token、慳時間、答案仲更準。

目前呢個技能支持Markdown/文本、PDF、Excel三種文件格式,PDF同Excel都有對應嘅處理腳本同參考文檔。

web-video-presentation:將腳本變成電影級演示(即將發佈)

呢個技能目前喺項目中標註為"Coming soon",但從預覽描述嚟看好值得期待。

佢要做嘅嘢系:將一個腳本、文章、課程大綱或者產品演示稿,變成可以錄屏嘅電影級網頁演示。技術棧系Vite + React + TypeScript,每個"點擊"對應一個敍事節拍,每步佔據完整嘅1920×1080舞台,錄屏陣UI保持乾淨。

簡單講,你寫一個腳本,AI幫你生成一個網頁版嘅"Keynote/PPT",而且帶咗電影級嘅動效同轉場,錄屏就可以直接當視頻用。從預覽嚟睇,佢有固定嘅16:9舞台、全局播放控制器、章節/步驟雙遊標系統、多種主題配色方案,體驗思路好新穎。

點樣裝?三種方式,豐儉由人

項目提供咗三種安裝方式,由最簡單到最靈活都有:

方式一:Claude Code插件市場(最快)

如果你用緊Claude Code,直接喺終端打三行命令:

/plugin marketplace add ConardLi/garden-skills
/plugin install web-design-skills@garden-skills
/plugin install knowledge-base-skills@garden-skills
/plugin install image-generation-skills@garden-skills

插件會自動將技能安裝到對應位置,即開即用。

方式二:手動複製(最通用)

每個Skill文件夾都系自包含嘅,直接複製到項目度就得:

# Claude Code 或 Claude.ai
cp
 -r skills/web-design-engineer your-project/.claude/skills/

# Cursor 或其他Agent

cp
 -r skills/web-design-engineer your-project/.agents/skills/

AI喺掃描工作區陣就會發覺並加載呢個Skill。

方式三:Git子模塊(適合想同步更新嘅)

如果你想將Skill作為項目嘅一部分,仲可以隨時拉取上游更新:

git submodule add https://github.com/ConardLi/web-design-skill.git vendor/garden-skills
ln
 -s ../../vendor/garden-skills/skills/web-design-engineer .claude/skills/web-design-engineer

兼容性一覽

呢啲Skill嘅格式系跨平台可移植嘅,實測支持以下環境:

平台
Skill目錄位置
測試狀態
Claude Code
.claude/skills/
 或插件市場
✅ 已測試
Claude.ai(網頁版)
設置 → 能力 → Skills
✅ 已測試
Cursor
.agents/skills/
✅ 已測試
Codex CLI
.codex/skills/
✅ 已測試
Gemini CLI
擴展清單
✅ 已測試
OpenCode
.opencode/skills/
✅ 已測試

一個Skill嘅"解剖圖"

如果你好奇一個Skill系咩樣嘅,佢嘅結構其實好簡單:

skills/某個技能/
├── SKILL.md ← 核心:給AI看的操作手冊(必須)
├── README.md ← 給人看的英文文檔
├── README.zh-CN.md ← 給人看的中文文檔
├── references/ ← 參考資料(AI按需加載)
├── scripts/ ← 可執行腳本(如JS/Python)
└── assets/ ← 模板、字體、圖標等物料

SKILL.md文件開頭有一段YAML信息,話畀AI知呢個技能叫咩、幾時用:

---
name:
 my-skill
description:
 用一句話說清楚這個技能幹什麼、什麼時候該觸發
---

AI會根據呢個描述自動判斷:用戶嘅請求同我呢個技能匹配嗎?匹配就加載,唔匹配就按普通對話處理。

小結:點解值得你試下

Garden Skills同市面上好多"大而全"嘅Skills合集唔同。佢唔追求數量(目前正式發佈嘅系3個+1個即將發佈),但每個都經過咗精心設計同實戰打磨:

  • • web-design-engineer 解決咗AI生成網頁"千篇一律"嘅痛點,將設計品味注入AI決策過程
  • • gpt-image-2 用一套代碼適配三種運行環境,有API可以生圖、冇API可以寫prompt,邊度都用得
  • • kb-retriever 用漸進式檢索替代"全文件丟畀AI"嘅粗暴做法,慳token、快響應、答案仲準
  • • web-video-presentation 即將發佈,腳本變電影級演示,思路新穎

成個項目MIT協議開源,Skill格式跨平台兼容,安裝只要複製文件夾或者打幾行命令。

我自己試落嚟最大嘅感受系:AI嘅能力上限,很大程度上取決於你幫佢裝咗咩"技能包"。 同樣嘅Claude Code,同一個模型,裝唔裝呢個Skill,產出嘅網頁設計質量差距肉眼可見;搞唔搞知識庫檢索,查本地文件嘅效率都系天壤之別。

GitHub上搜 ConardLi/garden-skills 就揾到,Star同Fork都歡迎。

講唔定你都可以貢獻一個自己嘅Skill呢?

作者注:該項目Skills格式兼容Claude Code、Claude.ai、Cursor、Codex CLI、Gemini CLI、OpenCode等多個AI編程平台,Windows/Mac/Linux全平台可用。安裝前請確保你嘅AI工具支持Skills機制。

你的AI每次生成網頁是不是長一個樣?藍色按鈕、紫色漸變、Inter字體……不僅如此,想讓它幫你畫張海報、搜個本地文件,操作還很繁瑣。今天介紹一個GitHub開源Skills合集,一次性給AI裝上"設計品味""本地生圖""漸進式檢索"三大超能力。

你是不是也有這樣的體驗:讓AI幫你寫個網頁,出來的永遠是那一套——藍色主按鈕、紫紅漸變背景、圓角大卡片、emoji當圖標,再加上一段不知道從哪編出來的"用戶好評"?功能上沒錯,但長得太像"AI寫的"了,拿出去實在不好意思給人看。

這不是你的問題,而是大模型在網頁設計上有天然的"審美趨同"——它們傾向於生成最安全、最常見、最不會出錯的設計,結果就是千篇一律。

最近在GitHub上發現了一個寶藏項目——Garden Skills,由知名前端技術博主ConardLi開源維護,短短時間就收穫了2k+ Star。它不是那種動輒上百個技能的大雜燴,而是一個精心策劃的生產級Skills合集,每個技能都經過了充分的打磨和實戰驗證。目前合集涵蓋了網頁設計工程化、圖像生成、本地知識庫檢索三大核心場景,還有一個即將發佈的視頻演示技能,可以說是給AI配上了一把趁手的瑞士軍刀。

web-design-engineer:給你的AI裝上設計品味

這是整個項目裏最亮眼的技能,也是Star數貢獻最多的部分。它的定位很明確:把AI生成的網頁從"能用"升級到"驚豔"

前面說了,大模型在做網頁設計時特別容易"撞臉"——Inter字體、藍色主按鈕(色號永遠是#3b82f6)、紫紅漸變背景、左邊框高亮卡片、emoji當圖標充數、編造虛假的用戶評價和數據……

web-design-engineer這個Skill的做法非常聰明:它直接給AI列了一份反俗套清單(anti-cliché blocklist),把這些通用毛病一一禁止掉:

  • • ❌ 禁止紫色-粉色-藍色漸變背景
  • • ❌ 禁止Inter / Roboto / Arial / 系統默認字體
  • • ❌ 禁止emoji替代正經圖標
  • • ❌ 禁止編造的統計數據、假logo牆、假用戶評價

光有"禁令"還不夠,更重要的是它給AI提供了一套專業設計方法論。這個技能的核心哲學是:"標準是驚豔,不是能用"——每一個像素都是有意為之,每一次交互都是精心設計的。

六步工作法,比大多數設計師還規範

這個技能最厲害的地方,是內置了一套完整的設計流程:

  1. 1. 理解需求:不機械地發一堆問題,而是根據你提供的信息量智能判斷該問什麼、問多少
  2. 2. 收集設計上下文:優先讀你給的設計稿/截圖/代碼庫,不是你給的再去問你要
  3. 3. 聲明設計系統:在寫代碼之前,先用文字把色彩、字體、間距、動效方案定下來
  4. 4. 展示v0草稿:先出個低保真版本讓你看看方向對不對,及時糾正
  5. 5. 完整構建:確認方向後全面開發,包括組件、狀態、動效
  6. 6. 驗證:上線前自查清單,確保沒有控制枱報錯、也沒有跑到禁用的配色上去

這套流程讓AI不再"一把梭",而是像一個真正的設計工程師一樣,分步思考、逐步交付。

這個技能覆蓋的場景也很廣:營銷落地頁、交互原型(帶設備框架的那種)、HTML幻燈片(16:9比例,支持鍵盤翻頁)、數據儀表盤(Chart.js / D3)、CSS/JS動畫演示、UI組件庫探索……基本你能想到的前端視覺產出都支持。

gpt-image-2:一個技能,三種模式,哪裏都能用

這是項目中第二個重頭技能,專門為GPT Image 2(以及兼容OpenAI接口的圖像API) 打造的圖像生成與編輯工具。但它不止於此——就算你沒有任何API Key,它照樣能幫上大忙。

它最大的設計亮點是:同一個Skill,自動適配三種完全不同的運行環境,你的使用體驗卻完全一致

Mode A:Garden本地模式(最強形態)

如果你有自己的OpenAI API Key,配好環境變量,Skill就會進入"完全體"模式。它會完整走通"選模板→寫prompt→調用腳本→出圖存盤"的全流程,生成的圖片和prompt都會自動歸檔到garden-gpt-image-2/目錄下,方便複用和版本管理。

Mode B:宿主委託模式

如果你用的是Cursor、ChatGPT這類自帶圖像工具的平台,Skill會自動檢測到宿主環境的圖像能力,把自己退化為一個"提示詞工程專家"——它仍然會用專業的模板幫你寫好prompt,然後把渲染好的提示詞交給宿主自帶的圖像工具去出圖。

Mode C:顧問模式(什麼都沒有也能用)

最極端的情況——你的環境既沒有API Key,宿主也沒有圖像工具——Skill還能退化為一個"高質量prompt撰寫顧問"。它會幫你把prompt寫到專業級別,然後你可以複製粘貼到ChatGPT、Midjourney、DALL·E這些外部工具裏用。

不管哪種模式,這個技能內置了18個視覺類目、80多個結構化提示詞模板,覆蓋海報、UI原型、產品展示圖、信息圖、學術配圖、技術架構圖、漫畫、頭像、故事板、品牌板、電影分鏡甚至IP周邊設計。基本上你說需求,它就能從模板庫裏找到最合適的起點,幫你組織出專業級的提示詞。

值得一提的是,這個技能每次啓動時做的第一件事就是運行模式檢測腳本,確保自己不會走錯執行路徑——這個細節做得非常嚴謹。

kb-retriever:再也不把整個文件塞給AI了

這個技能解決的是一個非常實際的問題:在本地知識庫裏高效查找信息,但又不想把整個文件一股腦丟給AI吃token

很多人用AI搜索本地文檔的做法是:把整個文件夾的內容全讀進去,然後讓AI在裏面找答案。這種方法對小文件夾還行,但一旦文件多了、大了(比如幾十MB的PDF、幾萬行的Excel),AI的上下文窗口根本扛不住,響應也越來越慢。

kb-retriever的設計思路完全不同,它採用了一套漸進式檢索策略:

  1. 1. 分層索引導航:不是直接去翻文件,而是先讀取每層目錄下的data_structure.md索引文件(這個文件需要你自己建),瞭解這個目錄裏有什麼、每份文件大致是什麼內容、覆蓋了哪些時間段,然後精準定位到最可能包含答案的文件
  2. 2. 先學習再處理:遇到PDF或Excel文件時,強制必須先讀取references/目錄下的學習方法文檔,搞清楚推薦的處理工具和命令,再去提取內容——禁止盲目讀整個文件
  3. 3. grep優先 + 局部讀取:用精確關鍵詞搜索定位,然後只讀相關片段的局部內容,而不是讀整個文件
  4. 4. 最多迭代5輪:設定嚴格的檢索上限,每輪縮小關鍵詞範圍,到了第5輪還沒找到就明確告知用戶

這種設計對於維護個人知識庫(PKM)的同學來說簡直是神器。比如你的knowledge/目錄裏有上百份Markdown筆記、幾個大PDF電子書、一堆Excel數據報表,問AI一個問題,它不再是"全讀一遍"的暴力模式,而是先看索引、定位小範圍、精細讀取——省token、省時間、答案還更準。

目前這個技能支持Markdown/文本、PDF、Excel三種文件格式,PDF和Excel都有對應的處理腳本和參考文檔。

web-video-presentation:把腳本變成電影級演示(即將發佈)

這個技能目前在項目中標註為"Coming soon",但從預覽描述來看非常值得期待。

它要做的事情是:把一個腳本、文章、課程大綱或者產品演示稿,變成一個可錄屏的電影級網頁演示。技術棧是Vite + React + TypeScript,每個"點擊"對應一個敍事節拍,每步佔據完整的1920×1080舞台,錄屏時UI保持乾淨。

簡單說,你寫一個腳本,AI幫你生成一個網頁版的"Keynote/PPT",而且帶了電影級的動效和轉場,錄屏就能直接當視頻用。從預覽來看,它有固定的16:9舞台、全局播放控制器、章節/步驟雙遊標系統、多種主題配色方案,體驗思路非常新穎。

怎麼裝?三種方式,豐儉由人

項目提供了三種安裝方式,從最簡單到最靈活都有:

方式一:Claude Code插件市場(最快)

如果你在用Claude Code,直接在終端敲三行命令:

/plugin marketplace add ConardLi/garden-skills
/plugin install web-design-skills@garden-skills
/plugin install knowledge-base-skills@garden-skills
/plugin install image-generation-skills@garden-skills

插件會自動把技能安裝到對應位置,即開即用。

方式二:手動複製(最通用)

每個Skill文件夾都是自包含的,直接複製到項目裏就行:

# Claude Code 或 Claude.ai
cp
 -r skills/web-design-engineer your-project/.claude/skills/

# Cursor 或其他Agent

cp
 -r skills/web-design-engineer your-project/.agents/skills/

AI在掃描工作區時就會發現並加載這個Skill。

方式三:Git子模塊(適合想同步更新的)

如果你想把Skill作為項目的一部分,還能隨時拉取上游更新:

git submodule add https://github.com/ConardLi/web-design-skill.git vendor/garden-skills
ln
 -s ../../vendor/garden-skills/skills/web-design-engineer .claude/skills/web-design-engineer

兼容性一覽

這些Skill的格式是跨平台可移植的,實測支持以下環境:

平台
Skill目錄位置
測試狀態
Claude Code
.claude/skills/
 或插件市場
✅ 已測試
Claude.ai(網頁版)
設置 → 能力 → Skills
✅ 已測試
Cursor
.agents/skills/
✅ 已測試
Codex CLI
.codex/skills/
✅ 已測試
Gemini CLI
擴展清單
✅ 已測試
OpenCode
.opencode/skills/
✅ 已測試

一個Skill的"解剖圖"

如果你好奇一個Skill長什麼樣,它的結構其實非常簡單:

skills/某個技能/
├── SKILL.md ← 核心:給AI看的操作手冊(必須)
├── README.md ← 給人看的英文文檔
├── README.zh-CN.md ← 給人看的中文文檔
├── references/ ← 參考資料(AI按需加載)
├── scripts/ ← 可執行腳本(如JS/Python)
└── assets/ ← 模板、字體、圖標等物料

SKILL.md文件的開頭是一段YAML信息,告訴AI這個技能叫什麼、什麼時候用:

---
name:
 my-skill
description:
 用一句話說清楚這個技能幹什麼、什麼時候該觸發
---

AI會根據這個描述自動判斷:用戶的請求跟我這個技能匹配嗎?匹配就加載,不匹配就按普通對話處理。

小結:為什麼值得你試試

Garden Skills跟市面上很多"大而全"的Skills合集不一樣。它不追求數量(目前正式發佈的是3個+1個即將發佈),但每個都經過了精心設計和實戰打磨:

  • • web-design-engineer 解決了AI生成網頁"千篇一律"的痛點,把設計品味注入AI決策過程
  • • gpt-image-2 用一套代碼適配三種運行環境,有API能生圖、沒API能寫prompt,哪兒都能用
  • • kb-retriever 用漸進式檢索替代"全文件丟給AI"的粗暴做法,省token、快響應、答案還準
  • • web-video-presentation 即將發佈,腳本變電影級演示,思路新穎

整個項目MIT協議開源,Skill格式跨平台兼容,安裝只要複製文件夾或敲幾行命令。

我自己試下來最大的感受是:AI的能力上限,很大程度上取決於你給它裝了什麼樣的"技能包"。 同樣的Claude Code,同一個模型,裝不裝這個Skill,產出的網頁設計質量差距肉眼可見;搞不搞知識庫檢索,查本地文件的效率也是天壤之別。

GitHub上搜 ConardLi/garden-skills 就能找到,Star和Fork都歡迎。

說不定你也能貢獻一個自己的Skill呢?

作者注:該項目Skills格式兼容Claude Code、Claude.ai、Cursor、Codex CLI、Gemini CLI、OpenCode等多個AI編程平台,Windows/Mac/Linux全平台可用。安裝前請確保你的AI工具支持Skills機制。