GPT-image2 萬能設計 Skill,你的設計師天團已準備就緒
整理版優先睇
用 GPT-image2 自製設計 Skill,等於擁有一個設計師團隊
作者空格唔係專業設計師,但成日要出封面圖、文章配圖、PPT、流程圖等。佢圍繞 GPT-image2 設計咗一個統一嘅 image-studio Skill,將多種作圖需求整合,仲開源咗出嚟。文章拆解咗佢由單一 Skill 到合成一體嘅過程,仲分享點樣用 Codex 或 API 慳成本。
整體結論係:與其俾月費買設計工具,不如自己用 Skill 同模型 DIY,仲可以按自己審美改風格。
- GPT-image2 出圖質素超高,文字無瑕疵,風格多變,係目前最強嘅圖片生成模型。
- 作者整合咗文章配圖、PPT、封面、圖表等場景,製作咗統一嘅 image-studio Skill,開源喺 GitHub。
- 製作方法係用 Claude Code 參考舊 Skill 自動改寫,再反覆測試調整,解決咗提示詞過長、大圖超時等問題。
- 內置 12 種設計風格,每種有完整規範(底色、字體、色板、視覺元素),但建議用戶按自己品味修改。
- 日常用 Codex(Plus 會員 $20/月)出圖,批量就用 API(約 $0.1/張),慳返設計訂閲費。
space-GPT-image2-design GitHub 開源項目
包含完整嘅 image-studio Skill 檔案,可直接用或改做。
點解要整呢個 Skill?
作者唔係設計師,但日常工作成日要出封面圖、文章配圖、PPT、流程圖等。之前靠生成 HTML 截圖,而家 GPT-image2 出圖完全勝過 HTML,所以決定搞個統一嘅 Skill 搞掂曬。
- 1 封面圖:小紅書、公眾號、視頻號,一日可能要幾張。
- 2 文章配圖:寫完文要插圖,唔可以成日冇圖。
- 3 PPT 圖:演講、分享、彙報,每頁都要設計。
- 4 流程圖、架構圖、數據可視化:產品方案、技術分享。
- 5 原型圖:產品設計、驗證、需求溝通。
點樣用 AI 自動改造 Skill
作者直接將需求掟俾 Claude Code,叫佢參考之前做過嘅 PPT Skill,複製一個用 GPT-image2 出圖嘅新 Skill。流程係用戶輸入內容 -> 問類型 -> 確認齊料 -> 問風格 -> 揀自動定審核提示詞 -> 出圖。
Claude Code 自動讀取舊 Skill 結構,理解風格定義方式,然後重新設計流程。
測試過程遇到 提示詞太長被 API 拒、4:3 大圖超時、PPT 風格字太少太單調等問題,逐個迭代解決。
先做單一 Skill,再合成一個
- 文章配圖 Skill:自動分析每段核心內容,批量生成配圖並插入 markdown,一篇文章 6 張圖 10 分鐘搞掂。
- PPT 製作 Skill:俾主題同大綱,逐頁生成幻燈片設計圖,最後導出 PPTX 同 PDF。
- 小紅書封面 Skill:輸入封面描述,揀風格即刻出圖。
- 圖表流程圖 Skill:一句話整流程圖、架構圖、熱力圖、四象限圖、數據可視化。
但分開用要成日切 Skill,風格定義唔統一,維護麻煩。
最後合成 space-image-studio Skill,內置 12 種設計風格,每種包含底色 hex、標題字體字重、5-8 個顏色色板、視覺元素清單、該做同絕對唔做嘅規則。用戶只需一句話(當然越詳細越好)就可以出圖。
點樣調用 GPT-image-2
作者用兩種方法:
- 1 用 Codex:開 ChatGPT Plus 會員($20/月)就用到,Codex 包算力,仲可以配合 Skill 用 API 出圖。
- 2 買 API:官方或中轉站都得,成本大約 $0.1 一張圖。日常寫文配圖用 Codex,批量生成用 API 更快。
最後嘅建議
雖然內置咗 12 種風格,但作者強烈建議拎返去自己改。將色板換成品牌色,字體換成順手嘅,「該做乜」改成自己設計偏好。
見到好多測評文章,毫無疑問佢係圖片生成嘅最高水平,文字零瑕疵,風格多變,冇 AI 味。
咁我應該點樣用佢呢?
過去幾日,我一直圍繞住 GPT-image2 嚟設計 Skill,終於有個穩定嘅 Skill。
佢可以幫我整出 PPT、文章配圖、封面圖、邏輯圖、架構圖、流程圖等等。
就好似呢篇文章嘅封面圖,我一次叫佢整咗 5 張,每張效果都勁靚啊🤩!





所以呢篇文章唔只介紹我呢個 Skill 可以做啲乜,仲要拆解我整佢嘅思路。
對個人用戶嚟講,我唔係設計師,但我日常工作都成日要用到配圖嘅場景。
最常用嘅作圖場景就呢幾個:
1封面圖。小紅書、公眾號、視頻號,一日可能要幾張。
2文章配圖。寫完文章要插圖,總不能全部用。3 PPT 圖。演講、分享、匯報,每頁都要設計。4 流程圖、架構圖、數據可視化。產品方案、技術分享、工作匯報。
5原型圖。產品設計、驗證、需求溝通。
啱好呢幾個場景之前都做過對應嘅 Skill。
只係之前用嘅係叫 AI 生成 HTML 嘅方式,畫出嚟係網頁,截圖當圖用。
我只需要將 HTML 換成 GPT-image-2 模型出圖就得。
擺喺以前,我要講 html 出嘅 PPT、配圖同圖片模型出嘅各有優勢
而家可以話 GPT-image-2 出圖完勝 html。
諗清楚咗,就開搞。
我嘅做法好直接:將需求掉畀 Claude Code,叫佢參考之前做過嘅 Skill,復刻一個新嘅出嚟。
我同佢講嘅大致係:
Agent 就開始搞喇。
佢讀咗我之前 slide-deck 嘅結構,理解咗風格定義嘅方式,然後將成個流程重新設計咗一遍。
連續做咗好幾個 Skill,做完就開始測。
呢一測就係好幾日。提示詞太長會被 API 拒,4:3 大圖會超時,PPT 風格出嚟字太少太單調,每個問題都係一輪迭代。
最後穩定落嚟嘅版本,就係下面幾個 Skill。
畀一篇文章,自動分析每段核心內容,批量生成配圖,再插返入 markdown。一篇文章 6 張圖,10 分鐘搞掂。
下面係根據 DeepSeek v4 發佈文章出嘅配圖。



畀一個主題同大綱,逐頁生成幻燈片設計圖,最後可以導出 PPTX 同 PDF。


畀一個你嘅封面描述,選擇風格就開始製作封面圖。



流程圖、架構圖、熱力圖、四象限圖、數據可視化,都可以一句說話製作。



幾個 Skill 各自用得,用起嚟有啲唔對路。
每次轉類型就要切 Skill,風格定義各管各,維護起嚟麻煩。
花叔做嘅 huashu-design 俾咗我啟發,佢將多種設計能力整合入一個 Skill,用一套統一嘅品牌資產協議貫穿所有輸出。
於是我叫 Agent 將上面三個合成一個,順手將風格由原本嘅幾種擴到 12 種:

每種風格係一份完整嘅設計規範:底色 hex、標題字體同字重、5-8 個顏色嘅色板、視覺元素清單、應該做咩同絕對唔做咩。
測穩定後,一個統一嘅space-image-studio Skill就成型喇。
用戶只要講一句說話,(但係唔建議一句說話,最好係描述得越詳細效果越好)
打字。回車。一張可以直接出嘅圖。
已開源:
https://github.com/zephyrwang6/space-GPT-image2-design

有兩個方法我都有用。
一係用 Codex。開 ChatGPT Plus 會員就可以喺 Codex 入面 call GPT-image-2。Codex 天然同 Skill 配合,喺 Claude Code 入面配好 Skill,叫 Skill call Codex 嘅 API 出圖。Plus 一個月 20 美金,唔止傾偈,Codex 算力都包埋。將 Plus 嘅價值榨乾。
二係買 API。OpenAI 官方嘅、中轉站嘅都得。成本一毛幾一張圖。具體邊間唔推薦喇,市面上好多,自己搜下比較下價。
我兩種都有用。日常寫文章配圖行 Codex,批量生成行 API,速度更快。
雖然內置咗 12 種風格,但更加建議攞過去之後自己再改下。
按自己常用嘅場景同審美修改風格定義,咁先係真係將佢用起嚟嘅方式。
每個人嘅設計品味唔同,我定義嘅唔一定係你鍾意嘅。將色板換成自己嘅品牌色,將字體換成順手嘅,將『應該做咩』改成自己嘅設計偏好。
有咗 Skill 同模型 API,各種 AI 產品提供嘅畫圖能力可以自己 DIY。
相當於自己擁有咗一個設計師團隊,冇必要再花幾十美金訂閲費喇。
如果你哋想更加系統咁掌握 coding Agent、Obsidian、Skill、Vibecoding 嘅技能,歡迎訂閲我嘅 AI 生產力專欄+社羣。接下來就要更新 Obsidian 更詳細系統嘅使用,仲有 vibecoding 基礎同 Coding Agent 嘅使用待更新。

我係空格,持續分享 AI 產品嘅思考同實踐。
看到很多測評文章,毫無疑問它是圖片生成的最高水平,文字毫無瑕疵,風格多變,沒有 AI 味。
那我該怎麼把它用起來呢?
過去的幾天,我一直在圍繞 GPT-image2 來設計 Skill,終於有了一個穩定的 Skill。
它可以幫我產出 PPT、文章配圖、封面圖、邏輯圖、架構圖、流程圖等等等。
就像這篇文章的封面圖,我一次召喚它產出了 5 張,每張效果都巨巨好看啊🤩!





所以這篇文章我不止介紹下我的這個 Skill 可以做什麼,還要拆解我製作它的思路。
對個人用戶來說,我不是設計師,但我日常工作也經常會用到配圖的場景。
最常用的作圖場景就這幾個:
1封面圖。小紅書、公眾號、視頻號,一天可能要好幾張。
2文章配圖。寫完文章要插圖,總不能全用 。3 PPT 圖。演講、分享、彙報,每頁都要設計。 4 流程圖、架構圖、數據可視化。產品方案、技術分享、工作彙報。
5原型圖。產品設計、驗證、需求溝通。
剛好這幾個場景之前都做過對應的 Skill。
只是之前用的是讓 AI 生成 HTML 的方式,畫出來是網頁,截圖當圖用。
我只需要把 HTML 換成GPT-image-2 模型出圖就好了。
放在以前,我要說 html 出的 PPT、配圖和圖片模型出的各有優勢
現在可以說 GPT-image-2 的出圖完勝 html。
想清楚了,就開幹。
我的做法很直接:把需求扔給 Claude Code,讓它參考之前做過的 Skill,復刻一個新的出來。
我跟它說的大致是:
Agent 就開始幹了。
它讀了我之前 slide-deck 的結構,理解了風格定義的方式,然後把整個流程重新設計了一遍。
連着做了好幾 Skill,做完就開始測。
這一測就是好幾天。提示詞太長會被 API 拒,4:3 大圖會超時,PPT 風格出來字太少太單調,每個問題都是一輪迭代。
最後穩定下來的版本,就是下面幾個 Skill。
給一篇文章,自動分析每段核心內容,批量生成配圖,再插回 markdown。一篇文章 6 張圖,10 分鐘搞定。
下面是根據 DeepSeek v4 發佈文章出的配圖。



給一個主題和大綱,逐頁生成幻燈片設計圖,最後能導出 PPTX 和 PDF。


給一個你的封面描述,選擇風格就開始製作封面圖。



流程圖、架構圖、熱力圖、四象限圖、數據可視化,都可以一句話製作。



幾個 Skill 各自能用,用起來得不對勁。
每次換類型就得切 Skill,風格定義各管各的,維護起來麻煩。
花叔做的 huashu-design 給了我啓發,他把多種設計能力整合進一個 Skill,用一套統一的品牌資產協議貫穿所有輸出。
於是我讓 Agent 把上面三個合成一個,順手把風格從原來的幾種擴到 12 種:

每種風格是一份完整的設計規範:底色 hex、標題字體和字重、5-8 個顏色的色板、視覺元素清單、該做什麼和絕對不做什麼。
測穩定後,一個統一的space-image-studio Skill就成型了。
用戶只要說一句話,(但是不建議一句話,最好是描述的越詳細效果越好)
打字。回車。一張能直接發的圖。
已開源:
https://github.com/zephyrwang6/space-GPT-image2-design

有兩個方法我都在用。
一是用 Codex。開 ChatGPT Plus 會員就能在 Codex 裏調 GPT-image-2。Codex 天然和 Skill 配合,在 Claude Code 裏配好 Skill,讓 Skill 調 Codex 的 API 出圖。Plus 一個月 20 美金,不光是聊天,Codex 算力也包在裏面。把 Plus 的價值榨乾。
二是買 API。OpenAI 官方的、中轉站的都行。成本一毛多一張圖。具體哪家不推薦了,市面上很多,自己搜搜比比價。
我兩種都在用。日常寫文章配圖走 Codex,批量生成走 API,速度更快。
雖然內置了 12 種風格,但更建議拿過去之後自己再改改。
按自己常用的場景和審美修改風格定義,這才是真把它用起來的方式。
每個人的設計品味不一樣,我定義的 不一定是你喜歡的。把色板換成自己的品牌色,把字體換成順手的,把"該做什麼"改成自己的設計偏好。
有了 Skill 和模型 API,各種 AI 產品提供的畫圖能力可以自己 DIY。
相當於自己擁有了一個設計師團隊,沒必要再花幾十美刀訂閲費了。
如果大家想要更系統的掌握 coding Agent、Obsidian、Skill、Vibecoding 的技能,歡迎訂閲我的 AI 生產力專欄+社羣。接下來就要更新 Obsidian 更詳細系統的使用、還有 vibecoding 基礎和 Coding Agent 的使用待更新。

我是空格,持續分享 AI 產品的思考與實踐。