GPT-image2 萬能設計 Skill，你的設計師天團已準備就緒

作者：空格的鍵盤

日期：2026年4月27日上午9:02

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

用 GPT-image2 自製設計 Skill，等於擁有一個設計師團隊

整理版摘要

作者空格唔係專業設計師，但成日要出封面圖、文章配圖、PPT、流程圖等。佢圍繞 GPT-image2 設計咗一個統一嘅 image-studio Skill，將多種作圖需求整合，仲開源咗出嚟。文章拆解咗佢由單一 Skill 到合成一體嘅過程，仲分享點樣用 Codex 或 API 慳成本。

整體結論係：與其俾月費買設計工具，不如自己用 Skill 同模型 DIY，仲可以按自己審美改風格。

GPT-image2 出圖質素超高，文字無瑕疵，風格多變，係目前最強嘅圖片生成模型。
作者整合咗文章配圖、PPT、封面、圖表等場景，製作咗統一嘅 image-studio Skill，開源喺 GitHub。
製作方法係用 Claude Code 參考舊 Skill 自動改寫，再反覆測試調整，解決咗提示詞過長、大圖超時等問題。
內置 12 種設計風格，每種有完整規範（底色、字體、色板、視覺元素），但建議用戶按自己品味修改。
日常用 Codex（Plus 會員 $20/月）出圖，批量就用 API（約 $0.1/張），慳返設計訂閲費。

值得記低

連結 github.com

space-GPT-image2-design GitHub 開源項目

包含完整嘅 image-studio Skill 檔案，可直接用或改做。

整理重點

點解要整呢個 Skill？

作者唔係設計師，但日常工作成日要出封面圖、文章配圖、PPT、流程圖等。之前靠生成 HTML 截圖，而家 GPT-image2 出圖完全勝過 HTML，所以決定搞個統一嘅 Skill 搞掂曬。

1 封面圖：小紅書、公眾號、視頻號，一日可能要幾張。
2 文章配圖：寫完文要插圖，唔可以成日冇圖。
3 PPT 圖：演講、分享、彙報，每頁都要設計。
4 流程圖、架構圖、數據可視化：產品方案、技術分享。
5 原型圖：產品設計、驗證、需求溝通。

整理重點

點樣用 AI 自動改造 Skill

作者直接將需求掟俾 Claude Code，叫佢參考之前做過嘅 PPT Skill，複製一個用 GPT-image2 出圖嘅新 Skill。流程係用戶輸入內容 -> 問類型 -> 確認齊料 -> 問風格 -> 揀自動定審核提示詞 -> 出圖。

Claude Code 自動讀取舊 Skill 結構，理解風格定義方式，然後重新設計流程。

測試過程遇到提示詞太長被 API 拒、4:3 大圖超時、PPT 風格字太少太單調等問題，逐個迭代解決。

整理重點

先做單一 Skill，再合成一個

文章配圖 Skill：自動分析每段核心內容，批量生成配圖並插入 markdown，一篇文章 6 張圖 10 分鐘搞掂。
PPT 製作 Skill：俾主題同大綱，逐頁生成幻燈片設計圖，最後導出 PPTX 同 PDF。
小紅書封面 Skill：輸入封面描述，揀風格即刻出圖。
圖表流程圖 Skill：一句話整流程圖、架構圖、熱力圖、四象限圖、數據可視化。

但分開用要成日切 Skill，風格定義唔統一，維護麻煩。

最後合成 space-image-studio Skill，內置 12 種設計風格，每種包含底色 hex、標題字體字重、5-8 個顏色色板、視覺元素清單、該做同絕對唔做嘅規則。用戶只需一句話（當然越詳細越好）就可以出圖。

整理重點

點樣調用 GPT-image-2

作者用兩種方法：

1 用 Codex：開 ChatGPT Plus 會員（$20/月）就用到，Codex 包算力，仲可以配合 Skill 用 API 出圖。
2 買 API：官方或中轉站都得，成本大約 $0.1 一張圖。日常寫文配圖用 Codex，批量生成用 API 更快。

整理重點

最後嘅建議

雖然內置咗 12 種風格，但作者強烈建議拎返去自己改。將色板換成品牌色，字體換成順手嘅，「該做乜」改成自己設計偏好。

呢幾日一直冇出 GPT-image-2 嘅內容。

見到好多測評文章，毫無疑問佢係圖片生成嘅最高水平，文字零瑕疵，風格多變，冇 AI 味。

咁我應該點樣用佢呢？

過去幾日，我一直圍繞住 GPT-image2 嚟設計 Skill，終於有個穩定嘅 Skill。

佢可以幫我整出 PPT、文章配圖、封面圖、邏輯圖、架構圖、流程圖等等。

就好似呢篇文章嘅封面圖，我一次叫佢整咗 5 張，每張效果都勁靚啊🤩！

所以呢篇文章唔只介紹我呢個 Skill 可以做啲乜，仲要拆解我整佢嘅思路。

01 我嘅作圖場景有啲乜？

對個人用戶嚟講，我唔係設計師，但我日常工作都成日要用到配圖嘅場景。

最常用嘅作圖場景就呢幾個：

1封面圖。小紅書、公眾號、視頻號，一日可能要幾張。

2文章配圖。寫完文章要插圖，總不能全部用。3 PPT 圖。演講、分享、匯報，每頁都要設計。4 流程圖、架構圖、數據可視化。產品方案、技術分享、工作匯報。

5原型圖。產品設計、驗證、需求溝通。

啱好呢幾個場景之前都做過對應嘅 Skill。

只係之前用嘅係叫 AI 生成 HTML 嘅方式，畫出嚟係網頁，截圖當圖用。

我只需要將 HTML 換成 GPT-image-2 模型出圖就得。

擺喺以前，我要講 html 出嘅 PPT、配圖同圖片模型出嘅各有優勢

而家可以話 GPT-image-2 出圖完勝 html。

諗清楚咗，就開搞。

02 叫 AI 自己改自己嘅 Skill

我嘅做法好直接：將需求掉畀 Claude Code，叫佢參考之前做過嘅 Skill，復刻一個新嘅出嚟。

我同佢講嘅大致係：

🌰參考 PPT 製作嗰個 Skill，做一個用 GPT-image-2 出圖嘅 Skill。流程係用戶輸入內容，先問要咩類型，確認資訊齊全後問揀邊種風格，再問係自動生成提示詞定係審核後再生成，最後出圖。

Agent 就開始搞喇。

佢讀咗我之前 slide-deck 嘅結構，理解咗風格定義嘅方式，然後將成個流程重新設計咗一遍。

連續做咗好幾個 Skill，做完就開始測。

呢一測就係好幾日。提示詞太長會被 API 拒，4:3 大圖會超時，PPT 風格出嚟字太少太單調，每個問題都係一輪迭代。

最後穩定落嚟嘅版本，就係下面幾個 Skill。

03 先做單個 Skill

1 文章配圖 Skill。

畀一篇文章，自動分析每段核心內容，批量生成配圖，再插返入 markdown。一篇文章 6 張圖，10 分鐘搞掂。

下面係根據 DeepSeek v4 發佈文章出嘅配圖。

2 PPT 製作 Skill。

畀一個主題同大綱，逐頁生成幻燈片設計圖，最後可以導出 PPTX 同 PDF。

3 小紅書封面：

畀一個你嘅封面描述，選擇風格就開始製作封面圖。

4 各種圖表

流程圖、架構圖、熱力圖、四象限圖、數據可視化，都可以一句說話製作。

04 合成 image-studio Skill

幾個 Skill 各自用得，用起嚟有啲唔對路。

每次轉類型就要切 Skill，風格定義各管各，維護起嚟麻煩。

花叔做嘅 huashu-design 俾咗我啟發，佢將多種設計能力整合入一個 Skill，用一套統一嘅品牌資產協議貫穿所有輸出。

於是我叫 Agent 將上面三個合成一個，順手將風格由原本嘅幾種擴到 12 種：

每種風格係一份完整嘅設計規範：底色 hex、標題字體同字重、5-8 個顏色嘅色板、視覺元素清單、應該做咩同絕對唔做咩。

測穩定後，一個統一嘅space-image-studio Skill就成型喇。

用戶只要講一句說話，（但係唔建議一句說話，最好係描述得越詳細效果越好）

畫張小紅書封面：標題"我用AI每天讀100篇文章"，xhs-vibrant 風格
做張PPT配圖：核心觀點 Context not Prompts，minimal 風格
畫個產品路線圖，dark-atmospheric 風格

打字。回車。一張可以直接出嘅圖。

已開源：

https://github.com/zephyrwang6/space-GPT-image2-design

05 點樣 call GPT-image-2

有兩個方法我都有用。

一係用 Codex。開 ChatGPT Plus 會員就可以喺 Codex 入面 call GPT-image-2。Codex 天然同 Skill 配合，喺 Claude Code 入面配好 Skill，叫 Skill call Codex 嘅 API 出圖。Plus 一個月 20 美金，唔止傾偈，Codex 算力都包埋。將 Plus 嘅價值榨乾。

二係買 API。OpenAI 官方嘅、中轉站嘅都得。成本一毛幾一張圖。具體邊間唔推薦喇，市面上好多，自己搜下比較下價。

我兩種都有用。日常寫文章配圖行 Codex，批量生成行 API，速度更快。

06 最後

雖然內置咗 12 種風格，但更加建議攞過去之後自己再改下。

按自己常用嘅場景同審美修改風格定義，咁先係真係將佢用起嚟嘅方式。

每個人嘅設計品味唔同，我定義嘅唔一定係你鍾意嘅。將色板換成自己嘅品牌色，將字體換成順手嘅，將『應該做咩』改成自己嘅設計偏好。

有咗 Skill 同模型 API，各種 AI 產品提供嘅畫圖能力可以自己 DIY。

相當於自己擁有咗一個設計師團隊，冇必要再花幾十美金訂閲費喇。

如果你哋想更加系統咁掌握 coding Agent、Obsidian、Skill、Vibecoding 嘅技能，歡迎訂閲我嘅 AI 生產力專欄+社羣。接下來就要更新 Obsidian 更詳細系統嘅使用，仲有 vibecoding 基礎同 Coding Agent 嘅使用待更新。

我係空格，持續分享 AI 產品嘅思考同實踐。

這幾天一直沒發 GPT-image-2 的內容。

看到很多測評文章，毫無疑問它是圖片生成的最高水平，文字毫無瑕疵，風格多變，沒有 AI 味。

那我該怎麼把它用起來呢？

過去的幾天，我一直在圍繞 GPT-image2 來設計 Skill，終於有了一個穩定的 Skill。

它可以幫我產出 PPT、文章配圖、封面圖、邏輯圖、架構圖、流程圖等等等。

就像這篇文章的封面圖，我一次召喚它產出了 5 張，每張效果都巨巨好看啊🤩！

所以這篇文章我不止介紹下我的這個 Skill 可以做什麼，還要拆解我製作它的思路。

01 我的作圖場景有哪些？

對個人用戶來說，我不是設計師，但我日常工作也經常會用到配圖的場景。

最常用的作圖場景就這幾個：

1封面圖。小紅書、公眾號、視頻號，一天可能要好幾張。

2文章配圖。寫完文章要插圖，總不能全用。3 PPT 圖。演講、分享、彙報，每頁都要設計。 4 流程圖、架構圖、數據可視化。產品方案、技術分享、工作彙報。

5原型圖。產品設計、驗證、需求溝通。

剛好這幾個場景之前都做過對應的 Skill。

只是之前用的是讓 AI 生成 HTML 的方式，畫出來是網頁，截圖當圖用。

我只需要把 HTML 換成GPT-image-2 模型出圖就好了。

放在以前，我要說 html 出的 PPT、配圖和圖片模型出的各有優勢

現在可以說 GPT-image-2 的出圖完勝 html。

想清楚了，就開幹。

02 讓 AI 自己改自己的 Skill

我的做法很直接：把需求扔給 Claude Code，讓它參考之前做過的 Skill，復刻一個新的出來。

我跟它說的大致是：

🌰參考 PPT 製作那個 Skill，做一個用 GPT-image-2 出圖的 Skill。流程是用戶輸入內容，先問要什麼類型，確認信息齊全後問選哪種風格，再問是自動生成提示詞還是審核後再生成，最後出圖。

Agent 就開始幹了。

它讀了我之前 slide-deck 的結構，理解了風格定義的方式，然後把整個流程重新設計了一遍。

連着做了好幾 Skill，做完就開始測。

這一測就是好幾天。提示詞太長會被 API 拒，4:3 大圖會超時，PPT 風格出來字太少太單調，每個問題都是一輪迭代。

最後穩定下來的版本，就是下面幾個 Skill。

03 先做單個 Skill

1 文章配圖 Skill。

給一篇文章，自動分析每段核心內容，批量生成配圖，再插回 markdown。一篇文章 6 張圖，10 分鐘搞定。

下面是根據 DeepSeek v4 發佈文章出的配圖。

2 PPT 製作 Skill。

給一個主題和大綱，逐頁生成幻燈片設計圖，最後能導出 PPTX 和 PDF。

3 小紅書封面：

給一個你的封面描述，選擇風格就開始製作封面圖。

4 各種圖表

流程圖、架構圖、熱力圖、四象限圖、數據可視化，都可以一句話製作。

04 合成 image-studio Skill

幾個 Skill 各自能用，用起來得不對勁。

每次換類型就得切 Skill，風格定義各管各的，維護起來麻煩。

花叔做的 huashu-design 給了我啓發，他把多種設計能力整合進一個 Skill，用一套統一的品牌資產協議貫穿所有輸出。

於是我讓 Agent 把上面三個合成一個，順手把風格從原來的幾種擴到 12 種：

每種風格是一份完整的設計規範：底色 hex、標題字體和字重、5-8 個顏色的色板、視覺元素清單、該做什麼和絕對不做什麼。

測穩定後，一個統一的space-image-studio Skill就成型了。

用戶只要說一句話，（但是不建議一句話，最好是描述的越詳細效果越好）

畫張小紅書封面：標題"我用AI每天讀100篇文章"，xhs-vibrant 風格
做張PPT配圖：核心觀點 Context not Prompts，minimal 風格
畫個產品路線圖，dark-atmospheric 風格

打字。回車。一張能直接發的圖。

已開源：

https://github.com/zephyrwang6/space-GPT-image2-design

05 怎麼調 GPT-image-2

有兩個方法我都在用。

一是用 Codex。開 ChatGPT Plus 會員就能在 Codex 裏調 GPT-image-2。Codex 天然和 Skill 配合，在 Claude Code 裏配好 Skill，讓 Skill 調 Codex 的 API 出圖。Plus 一個月 20 美金，不光是聊天，Codex 算力也包在裏面。把 Plus 的價值榨乾。

二是買 API。OpenAI 官方的、中轉站的都行。成本一毛多一張圖。具體哪家不推薦了，市面上很多，自己搜搜比比價。

我兩種都在用。日常寫文章配圖走 Codex，批量生成走 API，速度更快。

06 最後

雖然內置了 12 種風格，但更建議拿過去之後自己再改改。

按自己常用的場景和審美修改風格定義，這才是真把它用起來的方式。

每個人的設計品味不一樣，我定義的不一定是你喜歡的。把色板換成自己的品牌色，把字體換成順手的，把"該做什麼"改成自己的設計偏好。

有了 Skill 和模型 API，各種 AI 產品提供的畫圖能力可以自己 DIY。

相當於自己擁有了一個設計師團隊，沒必要再花幾十美刀訂閲費了。

如果大家想要更系統的掌握 coding Agent、Obsidian、Skill、Vibecoding 的技能，歡迎訂閲我的 AI 生產力專欄+社羣。接下來就要更新 Obsidian 更詳細系統的使用、還有 vibecoding 基礎和 Coding Agent 的使用待更新。

我是空格，持續分享 AI 產品的思考與實踐。