做了十年設計,這次真覺得自己多餘了|GPT-Image-2 上手實測

作者:歸藏的AI工具箱
日期:2026年4月21日 下午5:06
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

GPT-Image-2 重新定義了設計門檻,AI 不再只是「畫圖工具」,而是具備行業審美與排版邏輯的「虛擬設計師」。

  • 核心突破:模型具備極強的「世界知識」,無需複雜 Prompt,隨手輸入風格關鍵詞即可生成具備專業排版與邏輯的圖片。
  • 工作流變革:從 Apple 風格宣傳圖到 B 端官網 UI,AI 能自動腦補產品賣點與交互細節,大幅縮減設計師的基礎勞動。
  • 應用場景:覆蓋互聯網運營、知識科普長圖、遊戲 UI 截圖、網頁設計及商品海報,甚至能根據隨手拍的照片生成專業 VI。
  • 行業衝擊:設計師的價值從「能畫出來」轉向「原創審美」,AI 已吃透行業視覺語言,非設計人員的創作門檻徹底崩塌。
  • 未來趨勢:結合 GPT-5.5 Pro 的代碼還原能力,從想法到可交付產品的生產線將被 OpenAI 全自動化打包。
值得記低
Prompt

Apple 風格產品宣傳圖指令

用 gpt-image-2 為這個產品生成蘋果風格的中文卡片宣傳圖:[附上產品網址]

Prompt

遊戲 UI 概念生成指令

參考 [特定遊戲] 的風格,生成一個以 [主題] 為主題、[風格] 的 [遊戲類型] 選人界面 UI 圖片。

Prompt

論文/長文圖形化科普指令

幫我用高級、有雜誌感的排版風格,詳細且圖形化地介紹這篇內容,生成一張長圖圖片來讓我理解它。要求使用中文。

Prompt

商品海報自動優化指令

(上傳隨手拍照片)幫我為這個產品生成宣傳圖片,宣傳圖片要符合這個產品的氣質和風格。

整理重點

不再是盲目畫圖,它「懂」行業規矩

GPT-Image-2 最令人驚訝的不是畫質,而是它對「視覺語言」的理解。以前我們需要寫幾百字的 Prompt 來描述排版,現在你只要說『Apple 風格』或『OpenAI 風格』,它就能自動補全漸變配色、簡潔卡片化設計以及精準的中文排版。

整理重點

從科普長圖到遊戲原型:全場景實測

實測顯示,GPT-Image-2 在處理複雜信息時表現極佳。無論是需要大量世界知識的『茶葉科普長圖』,還是極其複雜的『黑神話風格遊戲截圖』,它都能精準還原 UI 佈局、交互邏輯甚至消除遊戲的特效細節。

它甚至能根據一張隨手拍的模糊鍵盤照片,自動腦補出產品賣點並生成高級感十足的電商海報。

整理重點

生產力革命:從想法到交付的閉環

這代模型讓「遊戲原型」和「網頁設計」的門檻降到最低。你可以直接在 GPT 裏通過對話玩遊戲(生成帶 UI 的截圖並根據選擇生成下一張),或者給它一個 GitHub 連結,讓它為你的開源項目設計全套 VI 視覺識別系統。

全套 VI 設計工作流指令 markdown
1. 提供參考圖風格
2. 提供項目 GitHub 頁面或簡介
3. 指令:基於此風格與特色,為項目設計一套 VI,包含色彩、字體、Logo 變體、品牌主張及官網示例。

INSIGHT


前幾天 GPT-Image-2 泄露了,試了一下發現非常厲害,但當時只要試一下就不給我生成了。

剛好今天終於發佈了,發佈以後我搞了不少的玩法。

它有一個非常牛逼的特點:不需要複雜提示詞,隨手幾個字就能出非常好的效果。


互聯網運營圖片

我們在 vibe coding 或者日常在互聯網的工作中,經常需要生成運營圖片。

比如產品更新公告、活動公告等,以前可能需要寫一長串複雜的提示詞。

但現在你只需要告訴它"蘋果風格"、"3D"、"簡潔卡片化"這種你能想到的詞就可以了。

比如下面兩個案例:

蘋果風格宣傳圖:

我跟它說需要一張"產品蘋果風格的中文宣傳圖",然後把介紹網頁發給它。它生成的圖片排版非常精美,而且文字完全沒問題。

提示詞:用 gpt-image-2 為這個產品生成生成蘋果風格的中文卡片宣傳圖:https://github.com/op7418/CodePilot

蘋果風格宣傳圖

OpenAI 風格宣傳圖:

我讓它基於 OpenAI 的風格生成宣傳圖,並給了它一個 OpenAI 的更新公告。結果生成的風格確實延續了 OpenAI 以往那種漸變配色、簡潔的設計感。

提示詞:根據這篇文章生成一個產品更新的介紹海報,風格需要符合 OpenAI 以往的設計風格,內容需要簡潔,整體呈現蘋果風、卡片化、高級感:

OpenAI 風格宣傳圖

以前這種圖至少得佔設計師半天,現在從工作流裏直接消失了。


知識類卡片

然後就是非常需要世界知識的"知識類卡片",這部分它也做得非常好。

排版非常豐富、內容也多樣,而且不需要多說任何提示詞。

比如第一個案例,我只是讓他用可愛的風格畫一張大語言模型的訓練過程介紹。

提示詞:用可愛的風格畫一張大語言模型的訓練過程科普圖

訓練過程科普圖

第二個案例是這種類似於雜誌和科普的內容,你經常在公眾號裏看見這種圖片排版。

這種複雜排版用來介紹一些知識和科普信息。

提示詞:用高級雜誌感風格畫一張茶葉種類和製作過程的科普圖。

茶葉科普圖

然後我發現它也能生成超級長的長圖。

比如說,這裏讓它生成北京秋季的遊覽攻略圖片,它就給了一張很長的圖片。

提示詞:生成北京秋季的遊覽攻略圖片

可以看到它把秋天的特色景點、行程,以及美食、交通出行指南和一些其他的提醒都畫上了。

就是你能想到的、你想不到的都在上面,而且排版非常精細優美。

北京秋季遊覽攻略

你不用告訴它該畫什麼,它知道一張科普圖該有哪些內容。


遊戲概念和 UI 設計

然後就想讓他試一下游戲這種非常複雜的類型。

圖片 UI 也有,可能還有 CG 角色以及一些小字。這種非常複雜的情況,測試結果非常好。

這裏先是簡單的測試。

讓他(提示詞)參考《無畏契約》(Valorant)的遊戲風格,生成一個以三國為主題、神話風格的 FPS 遊戲選人界面 UI 圖片。

可以看到模仿得非常像,就是界面的佈局和交互採用了《無畏契約》(Valorant)的選人方式,但是整個氛圍、風格、背景以及角色都變成了三國的這種感覺。

三國風格 FPS 遊戲 UI

然後我就在想,再簡單的提示詞它能不能 get 到。比如說,我直接跟它說

提示詞 :生成一個"黑神話武松"的遊戲截圖。

可以看到它真的能 get 到,包括 UI 設計、整個界面以及畫面風格,都是《黑神話》的遊戲風格。

黑神話武松遊戲截圖

在生成遊戲界面之後,心動遊戲的黃老闆演示了一個非常好玩的東西。

他轉發了我的推特,演示了生成的一個 ARPG 遊戲截圖:畫面是 3D 的,但是帶有對話的選擇框 UI。

這不就是直接能玩遊戲的嗎?我們這種 ARPG 遊戲,不就是立繪加上選擇嗎?

ARPG 遊戲截圖

你讓他給你生成一個帶立繪、帶選擇的界面,直接告訴他選哪個,他就能給你畫出下一張圖。這不就是在 GPT 裏面玩遊戲嗎?太爽了,沒想到真行,我試了一下。

遊戲截圖 1
遊戲截圖 2

之後還換了一些別的遊戲類型。比如說,最近我在玩三消遊戲。

所以就讓它生成了一個古代探寶風格的三消遊戲 UI 截圖。

可以看到這個的文字渲染和 UI 細節就非常的精細和豐富,它甚至連消除以後的特效都給你做出來了。

整個項目不只是 UI,連交互設計和整個界面該有哪些玩法都有了,非常完整。

三消遊戲 UI

說到交互,前幾天非常火的一個測試 MBTI 以這種惡搞的方式火出圈了。

然後我就在想,咱們這個是不是能整點更高級的?

於是我就讓它基於《戰錘 40K》的世界觀為我生成了一套測試題。

然後在結束之後,基於我回答的答案給我生成一個我在《戰錘 40K》裏的角色卡片和對應的性格分析。

戰錘 40K 角色卡片

結果他給的這個角色分析卡可太對味兒了!

基於我的回答,它給我分配的是一個審判官(異端審判官)。

而且還虛構了身份檔案、人物特徵、專長能力,甚至還有角色小傳。

角色小傳

一張圖加幾句對話,其實就是一個可玩的遊戲 demo,遊戲原型的門檻又塌了一層。


幫你解釋和介紹論文

前面不是說它能生成長圖嗎?我就在想能不能讓它解釋論文。

我們 AI 圈經常就是看論文,於是就把最近的 Seedance 2.0 的模型卡片(System Card)論文發給了它,沒想到真可以!

提示詞:幫我用高級、有雜誌感的排版風格,詳細且圖形化地介紹這篇論文的內容,生成一張長圖圖片來讓我理解它。要求使用中文。

論文解釋長圖

網頁設計

這是個極端挑戰:我直接從小紅書隨便找了一張汽車的圖片。

提示詞:為這個汽車生成符合其氣質和風格的官網 UI 設計稿。

原圖是一張小米 SU7 的圖片,圖上沒有任何文字,只有一個側面的汽車。

小米 SU7 原圖

但是它居然腦補出了這是小米的車,雖然把它猜成了 SU7(也很厲害了,因為它就後背那點不一樣,而且配色都是一樣的)。

它為這張圖生成了一個汽車官網,你們看一下吧,我覺得這個質量太離譜了。

他不知道學了多少。這張關於這輛車的圖片,所有的細節都是對的:

內飾、剖面圖、輪轂、大燈、尾翼、甚至價格🤣。

汽車官網設計稿

然後我又試了一下其他類型的網頁,比如說我們常見的那種 B 端官網。

我直接跟他說:為 B 端廣告投放平台生成一個官網的 UI 設計稿。

只能說他這個知識和搜索能力是非常的厲害。

他甚至知道這類型的網站上應該有哪些賣點,以及 UI 上應該展示哪些信息。太會了,這玩意兒真是完美設計。

B 端官網設計稿

它不只是會畫,它還知道這行裏每個角色該說什麼話。


商品宣傳圖

GPT-Image-2 模型甚至能給你隨手拍的任何商品生成非常高級的商品海報。

而且你不需要說更多的提示詞和內容,你只需要說一句:

提示詞:幫我為這個產品生成宣傳圖片,宣傳圖片要符合這個產品的氣質和風格

這是我隨手拍的我的鍵盤,光線非常差,鍵盤上也比較髒。

但是它把這些都處理好了,而且還加上了跟這個鍵盤真的相關的賣點,整個設計風格非常像那麼回事。

鍵盤商品圖

然後我又拿來了一盒朋友送的藍莓,還是用的上面那個提示詞,一個字都沒有變。

但是它這次生成的風格完全匹配了農產品這個路數。

商品一致性可以說是非常高了,連藍莓的位置都是對的。

但是藍莓變得更大更飽滿了。我只能說 GPT 你還是太會了。

藍莓商品圖

一張商品圖該用什麼風格、該放什麼賣點,這種判斷以前是設計師最值錢的部分。


UI 和 VI 設計

然後是 UI 設計。既然它的網頁設計那麼厲害,其實 UI 設計也不會差。

我先是找了一張參考圖。

提示詞:基於參考圖的風格,生成一個健康 App 的 UI 設計稿。

他的還原度非常高,而且參考圖其實跟這個主題沒啥關係,只有一兩個組件。

參考圖
健康 App UI 設計稿

然後我又給了他一張 VI 設計的參考圖

又給了他我用 vibe coding 開發的開源軟件 CodePilot 的 GitHub 頁面。

讓他基於這個圖片的風格和特色,為我的項目設計一套 VI。主要的項目信息在這裏:

它在讀取了我的項目信息以後,沒有簡單地照抄參考圖,而是把這些元素都提取出來,跟我本身的產品能力進行了擴展。

VI 設計參考圖

可以看到這套 VI 非常全面,該有的都有了:

色彩與字體、UI 圖與簡單的介紹、圖標貼紙與 Logo 變體、品牌主張與能力映射、宣傳海報與官網示例。

比參考圖原來的內容詳細多了。

原本參考圖裏的那些設計元素也都被保留了下來。

CodePilot VI 設計

給它一個參考,它能在這個參考上再往前走一大截。


我做了十年設計,說兩句心裏話

玩到這裏,我越來越覺得這代模型真正變強的地方,是它"知道該畫什麼"。

以前設計師值錢的地方有兩層:能畫出來、知道該畫成什麼樣。

第一層這兩年早塌了,這次連第二層也開始鬆動。

你隨手說一句"蘋果風的宣傳圖"、"B 端廣告平台的官網"、"黑神話風的遊戲截圖",它就懂你在說什麼。

因為這個行業這些年所有的視覺語言、排版規律、品牌調性,它都吃下去了。

對大部分非設計崗的人來說,這是好消息。

以前卡在"先得找個設計師"那一步的事,現在自己就能往下走。

對我們這行來說,日常那些重複性的商業設計會被收走,剩下還值錢的是原創審美和品牌高度——本來那也只是金字塔尖那一小撮人的事。

再想遠一點,Image V2 出設計稿,GPT-5.5 Pro 還原成代碼,CodeX 串成工作流。

從想法到可交付的東西,OpenAI 在把這條生產線直接打包。


如果你覺得對你有幫助可以幫我點個贊,也可以轉發給你需要的朋友。