測了 GPT-Image-2,香蕉感覺像上個時代的產物了

作者:雷子思考筆記
日期:2026年4月22日 下午4:19
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

GPT-Image-2 的出現標誌著 AI 繪圖從「實驗性生成」跨越到「商業級實用」,其文字渲染與邏輯理解力已達設計師水平。

  • 文字渲染突破:徹底解決 AI 繪圖常見的錯別字與排版混亂,能精準生成地鐵線路圖及多層次海報文案。
  • 極致一致性:無論是人物在不同場景的臉部特徵,還是產品在不同配色下的造型,均能保持高度統一,無明顯變形。
  • 複雜場景理解:具備強大的敍事能力,能處理如「四層公寓剖面」或「七個特定元素」的複雜指令,且構圖自然。
  • 商業設計降權:在詳情頁、演唱會海報、小程序 UI 等領域,AI 的執行力已足以取代預算有限的中低端設計需求。
  • 設計師轉型啟發:當執行力不再是門檻,設計師必須從單純的「繪圖員」轉向具備更高創意決策與審美把控的「導演」。
整理重點

文字排版不再是硬傷:從地鐵圖到品牌海報

以往 AI 生圖最怕見字,錯別字、字體扭曲是常態。但在 GPT-Image-2 的測試中,無論是高信息密度的杭州地鐵線路圖,還是帶有噴漆滴落感的街頭塗鴉,文字的清晰度與環境融合度都令人驚艷。

整理重點

一致性與細節:人物與產品的「分身術」

一致性一直是 AI 繪圖的軟肋,但這次 GPT-Image-2 展現了極強的控制力。同一人物在街頭、咖啡館、霓虹燈三種場景下,五官骨相完全一致,毫無破綻。

產品配色設計中,即使生成 10 款不同配色的鞋子,鞋身造型依然保持絕對不變形,這對電商應用極具價值。

在人像細節上,老人的皺紋、毛孔質感,以及眼睛反射篝火的光影邏輯,都達到了電影劇照級別的寫實度。

整理重點

複雜場景與超現實邏輯的拿捏

面對「四層公寓剖面」這種需要同時處理多個獨立故事線的指令,GPT-Image-2 能準確分配每層樓的動作與燈光氛圍。即使是包含霓虹招牌、大排檔、電車、流浪貓等七個元素的香港老街,構圖依然自然不凌亂。

超現實場景 Prompt 範例 text
一個巨大的玻璃魚缸懸浮在客廳半空中,裏面有水和遊動的金魚,水面平靜沒有晃動,魚缸下方的沙發上坐着一個人在正常看書,房間光線普通,沒有任何人對懸浮感到驚訝,超現實但畫風寫實
整理重點

編輯總結:設計師的生存空間還剩多少?

與其討論 AI 會否取代人類,不如問自己:當執行力被 AI 歸零時,你除了畫圖,還剩下什麼核心價值?

圖片
說實話,我用圖像生成工具已經有點審美疲勞了。
Midjourney 出來的時候驚豔過,DALL·E 3 出來的時候也興奮過,後來 Flux、SD3、Ideogram、Nano Banana 一個接一個,每次重大更新完確實感覺又往前邁了一大步,但離真正實用還差一口氣。
直到今天測了 GPT-Image-2,才感覺到好像快到AI設計的頂點了。
普通設計師的出路好像真的不多了
下面是我這兩天測的一些案例,從文字排版到複雜場景,每個都是真實 prompt,看看它到底到什麼水平。

圖片       
文字渲染
01

經常用nano banana生圖的人應該都知道,很頭疼的問題是生成的字裏面總有那麼幾個錯別字,也很容易扭曲和模糊。所以這次專門拿幾個"文字密集型"場景來壓測。


1. 地鐵線路圖:中文排版,高信息密度

設計一張杭州一號線地鐵線路圖,每個站用地方特色的地標的來表示,符合杭州煙雨江南的氣質,標註所有站名(中英雙語),換乘站用圓圈標註,字體需清晰可讀,需要準確的最新的站點信息,以及對的站點對應的地標

圖片
杭州的調性還是非常精準的傳達出來了,無論是水墨畫、書法字體還是中心的地鐵線路繪製融合的都非常好,完全可以用來當杭州交通景區引導圖了



2. 街頭手繪:文字融入場景

生成一張破舊磚牆上的塗鴉照片,牆上用噴漆寫着"THIS CITY NEVER SLEEPS",字母有油漆滴落痕跡,部分字母邊緣模糊,整體融入牆面質感,不像貼圖

圖片
以前生成這種圖,字母直接像貼紙糊上去的。這次滴落感、字母邊緣的虛化都有,跟牆融在一起了,有點真實。



3. 海報設計:多層次排版海報

做一張海報,一個人躺在綠色的草地上,草地是整個海報的大背景。核心文案是”在細碎裏感受生活的温度“,用手寫字體來寫。其他地方有一些適合海報的文字裝飾。

圖片
這張圖出來的時候,真的驚豔到我了,無論是背景圖、文案、字體、icon、畫面佈局傳達得都恰到好處,完全沒有AI味,像是設計師設計出來的。



4. 產品詳情頁

幫我做一下這款香水的詳情頁長圖,是由多個頁面拼接起來的。 這款香水是觀夏的東方精粹系列香水。 詳情頁裏面不僅要體現買點,還需要體現產品故事,和產品調性、高端、優雅、大氣、古典的氣質

圖片
圖片
東方美學的氣質接住了,如果直接給設計師參考,完全夠用了,甚至如果是一些小品牌沒有很多預算的話,感覺都可以直接用了。4. 喜茶新品海報
東方美學的氣質接住了,如果直接給設計師參考,完全夠用了,甚至如果是一些小品牌沒有很多預算的話,感覺都可以直接用了。


4. 喜茶新品海報

生成一張喜茶“奇蘭蘋果杏”的新品宣傳海報

圖片
圖片
品牌感出來了,水果的質感也比較真實,放到小紅書估計有人會誤以為是真稿。

圖片       
一致性(人物、產品)
02

一致性歷來是圖像生成的軟肋。換個角度、換個場景,人和產品多少都會有點變化,即使是nano banana也沒有能力做的特別好。



5. 寵物產品生成

我要做個定製的寵物骨灰盒,骨灰盒主體如圖1所示,蓋子上面插了一個3D打印的定製寵物公仔。罐子上激光雕刻了 寵物的名字:Mollyone 寵物的出生和去世年份:2022~2026 一個貓貓的腳印 居中對齊,選用合適的字體來做

圖片
圖片
圖片
刻字位置、字體、對齊都處理得挺細心。這種有點情感重量的需求,它沒有敷衍,加分。



6. 人物海報生成

生成一張圖片,裏面有同一個人物的三個場景,從左到右分別是 ①户外街頭 ②室內咖啡館 ③夜晚霓虹燈環境 下的圖像,確保人物不變

圖片
圖片
生哥的臉真的一點都沒變,絲毫沒看出任何破綻!!啊啊啊!!帥暈我!!

生成這個人,同一個場景中同一套妝造的三個不同的動作,按照上中下呈現,圖像為豎屏9:16

圖片



7. 產品配色設計

確保產品造型保持不變,生成10個這款鞋的不同配色,確保配色是好看的、舒服的、耐看的,並且說明每個配色靈感。再同一張大圖中呈現出來

圖片
圖片
配的顏色都還挺舒服的,任何一隻鞋子都沒有一點變形。這個一致性相當強了。

圖片       
人物面部細節
03



8. 老年女性肖像

一位約70歲的東南亞老年女性,戴金耳環,嘴唇塗深紅色口紅,面部有深刻皺紋但眼神鋭利,背景是色彩鮮豔的傳統布料,電影劇照質感

圖片
這張圖真的很像相機直拍的,皺紋、膚色、眼神都非常真實,這個電影感絕了



9. 本人變老照

這個是我,幫我生成我70歲時的照片,確保我的骨相、五官完全不變,穿着妝容都做響應的改變,電影劇照質感

圖片
圖片

還是挺像我本人的,骨相沒有被改造,該有的皺紋老去感也有。不過感覺眼神不太對,不像老人該有的眼神,稍稍有點假人感。



10. 篝火光影人物

一個人站在篝火旁,臉部一半被橙色火光照亮(可見毛孔和輪廓),另一半在陰影裏,眼睛反射火焰,頭髮邊緣有逆光光暈,攝影風格

圖片
這張圖真的好有感覺,這個光影邏輯其實還是挺複雜的,毛孔質感、眼睛裏的火焰反射,細節全都在。

圖片       
審美
04



11. 陳楚生演唱會海報 

你搜集互聯網上的信息,幫我做一張陳楚生 荒蕪之境 杭州演唱會的海報。

圖片
跟我說這是演唱會正式的官宣海報,我也不會有絲毫的懷疑的,質感太好了



12. 自定義主題演唱會海報

我叫雷子,我也想開一個演唱會,這是我的頭像,你幫我生成一個海報,我希望主題的關鍵詞是 自由,你幫我策劃一下

圖片

圖片
圖片

圖片
圖片
生哥的海報我還擔心是互聯網上可參考的物料很多才會讓效果這麼真實,我就那自己的照片,隨便定了一個主題來試試,效果也很絕啊。感覺要原地出道了哈哈哈哈哈哈



13. 小程序落地頁重設計

這是我們小程序的落地頁,真是太醜了,你幫我重新畫一下這個設計圖

圖片
圖片

上面的這個是用codex調用的gpt5.4來設計的,醜暈我了,用gpt-image-2重新做的這版就完全沒話說了,可以直接上線了。



14. 城市孤獨感插畫

一張豎版插畫:畫面分上下兩層,上層是白天繁忙的城市地面(人羣穿梭),下層是地鐵站台(一個人獨自坐着看手機),兩層通過剖面切割呈現,孤獨與喧囂對比,扁平插畫風格,色調剋制

圖片

圖片       
複雜場景理解
05



15. 懸浮魚缸

一個巨大的玻璃魚缸懸浮在客廳半空中,裏面有水和遊動的金魚,水面平靜沒有晃動,魚缸下方的沙發上坐着一個人在正常看書,房間光線普通,沒有任何人對懸浮感到驚訝,超現實但畫風寫實

圖片
以前的AI只能生成“對”的東西,讓他生成一些他沒見過的東西都是非常費勁的,但是現在這個浮在空中的魚缸這麼輕易就生成了。而且寫實風格配上這個荒誕設定,傳達出來的平靜的詭異感,真的被拿捏的恰到好處。



16. 四層公寓剖面

一棟四層公寓樓的剖面圖,每層都在發生不同的事:一樓一個人在開門收外賣,二樓一對情侶在吵架,三樓一個老人在澆花,四樓一個小孩趴在窗台看樓下,夜晚,每層燈光顏色和亮度不同,整體像一幅城市生活全景畫

圖片
四層故事都在,燈光各有各的氛圍,剖面沒有糊成一鍋粥。這種敍事密度,放以前穩翻。



17. 香港老街夜景

一條香港風格的老街夜景,畫面中同時包含:霓虹招牌(含中文字)、晾在繩上的衣物、街邊大排檔(有食客)、一輛停着的電車、地面濕潤反光、遠處有建築腳手架、一隻流浪貓在垃圾桶旁,構圖自然不凌亂

圖片
七個元素,一個沒落,中文霓虹沒錯字,流浪貓在對的位置,最重要的是構圖自然不凌亂

圖片       
寫在最後
06

測完這些,我把之前的幾張Nano banana生成的圖翻出來對比了一下。
差距比我想象的還要大。
我知道每次有新模型出來,都會有人說"設計師要失業了"。這話放在半年前我還不信,但這次測完,我改變看法了。
圖片
創意這件事,本來就不是每個設計師每天都在做的工作。大多數人接的活是:幫我做個海報、改個詳情頁、換個配色出幾個方案、做張宣傳圖。
這些,GPT-Image-2 現在全能接。速度比你快,不需要溝通成本,不會說"這個風格我不擅長"。
普通設計師的生存空間,說真的,已經很窄了。窄到我覺得,與其討論AI 會不會取代設計師,不如直接問自己:除了執行,我還剩什麼?



我是雷子,一個在AI大健康領域的創業者。
想要用AI探索身體,賦能你我更懂健康
我會持續分享關於AI、健康、創業的見解與思考。
如果覺得有收穫,點個「贊」和「在看」吧,你的支持對我意義重大。 很高興在這裏相遇,期待與你同行!⛽️💪