117 條 GPT Image 2 提示詞翻完,我整個人又被震驚麻了
整理版優先睇
GPT Image 2 嘅結構化提示詞(JSON)令到輸出從「畫圖」升級到「做產品」,本文整理咗 117 條案例嘅核心技巧同埋侷限。
呢篇文章係由一位 AI 應用愛好者寫嘅,佢喺 GPT Image 2 爆紅期間,花咗兩日時間翻曬一個叫 awesome-gpt-image-2-prompts 嘅 GitHub 倉庫,入面有 117 條提示詞案例。佢睇完之後好大感觸,認為大部分人用 GPT Image 2 嘅方式仲停留喺 Midjourney 嗰套——「幫我畫……」嘅描述式 prompt,但已經有一班人開始用 JSON 格式寫提示詞,將需求結構化,令到 AI 好似「做產品」咁出圖。整體結論係:掌握新寫法嘅人,已經用 GPT Image 2 出緊產品、設計同內容;未掌握嘅人,仲喺度「幫我畫一隻貓」。
作者發現 GPT Image 2 最強嘅能力係對真實世界嘅理解同結構化需求嘅執行力。例如用 JSON Prompt 可以直接生成一個完整嘅抖音直播截圖,入面嘅彈幕、商品卡片、點讚數全部按你寫嘅數字出現。呢種「畀規格,佢構建」嘅模式,同傳統「描述畫面,佢畫」完全唔同。另外,就算一句話 prompt,好似「生成宋朝人朋友圈」,都可以出到蘇東坡嘅朋友圈,有頭像、用戶名、評論區,連王安石回「呵呵」都有。呢啲案例顯示 GPT Image 2 已經能夠理解複雜場景,並將佢轉化成具象嘅視覺產物。
文章仲提到三個值得學嘅技巧:第一,上傳參考圖配合詳細文字描述,尤其係品牌設計呢類需要一致性嘅場景;第二,喺 prompt 入面直接叫 AI「先研究某個概念再設計」,將研究同出圖…
- GPT Image 2 嘅結構化理解能力令 prompt 從「描述畫面」進化到「規格構建」,JSON 格式係最高精度用法。
- 一句話 prompt 都可以產生驚人效果,例如「宋朝人朋友圈」或「UI 設計系統」,展現 AI 對真實世界嘅理解。
- 三個實用技巧:參考圖加文字、喺 prompt 內嵌「研究」過程、使用 JSON 結構化模板。
- 侷限係編輯固執、反覆迭代耗時,輸出係圖片唔係代碼,適合概念驗證同提案展示。
- 掌握新寫法嘅人已經用 GPT Image 2 出產品、做設計、做內容;否則仲停留喺「幫我畫一隻貓」嘅層次。
awesome-gpt-image-2-prompts GitHub 倉庫
收集咗 117 條 GPT Image 2 提示詞案例,作者就係睇呢個倉庫得出文章見解。
JSON 結構化 Prompt 最小可用模板
一個可以直接用嘅 JSON 模板,幫你將需求結構化,提升出圖精準度。
提示詞寫法嘅分野:描述 vs 結構
大部分用 GPT Image 2 嘅人仲係用緊 Midjourney 嗰套——「幫我畫一隻穿宇航服嘅貓」。但係另一班人已經開始用 JSON 格式寫提示詞,從「幫我畫一個」變成「幫我做一個」。呢個轉變係好大嘅躍進。
{
"type": "直播 UI 樣機",
"subject": {
"description": "Elon Musk 的肖像,面帶微笑",
"background": "左側顯示 SPACEX 屏幕,右側顯示 Tesla logo"
},
"ui_overlay": {
"top_header": {
"host_info": "頭像,名稱 Elon Musk,副標題 55.6萬本場點贊",
"viewer_stats": "總計 68.7萬"
},
"bottom_left_chat": {
"messages": [
"小火箭: 馬斯克!未來可期!",
"AI探索者: Neuralink進展如何?"
]
},
"bottom_right_product_card": {
"title": "特斯拉Cybertruck 電動皮卡",
"price": "¥ 1,618,000"
}
}
}
- JSON prompt 嘅核心係強迫你諗清需求:類型、主體、佈局、風格,每一項都要定義得明確。
- 佢本身冇魔力,但係逼你做咗一件之前成日偷懶唔做嘅事:將需求諗透。
一句話嘅威力:朋友圈、設計系統、遊戲原型
除咗 JSON,一句唔複雜嘅 prompt 都可以出到好驚人嘅結果。作者舉咗幾個例子,全部都令人眼前一亮。
「生成宋朝人朋友圈」呢句 prompt 出咗蘇東坡嘅朋友圈,頭像、用戶名、配圖、評論區全部齊全,王安石回咗「呵呵」,司馬光話「還是嗰個味道」,點讚列表有黃庭堅、秦觀等 126 人。
UI 設計師 @pfanis 一句「幫我生成一套 UI 設計系統」就出咗一套完整嘅 glassmorphism 風格設計系統,包含 Dashboard、移動端、組件庫。
仲有人用 GPT Image 2 加 Seedance 2.0 做咗一個 ARPG 遊戲《金瓶梅》嘅動態演示,所有 UI 同畫面都係 AI 生成,效果自然。呢啲案例顯示 GPT Image 2 嘅產出已經唔似「一張圖」,而似「一個產品」。
三個值得記住嘅提示詞技巧
- 1 參考圖加文字:上傳一張參考圖配合詳細文字描述,尤其係品牌設計呢類需要一致性嘅場景,效果比純文字 prompt 好一大截。你唔使描述得好精確,但係要畀 AI 一個錨點。
- 2 喺 Prompt 內嵌研究過程:直接寫「先研究 Bauhaus 設計運動嘅核心理念,然後基於幾何構圖同色彩理論設計一套品牌視覺系統」,AI 會先研究再出圖,將查資料同出圖合併做一步。
- 3 JSON 結構化 Prompt:將需求拆成 type、subject、layout、style 等字段,強迫你諗清楚每個部分。以下係一個最小可用模板。
{
"type": "你要生成的圖像類型",
"subject": {
"description": "主體描述",
"background": "背景描述"
},
"layout": {
"sections": [
{"type": "區域名稱", "elements": ["元素1", "元素2"]}
]
},
"style": "整體風格描述"
}
從呢個模板開始,比寫「幫我畫一個XX」出圖精準得多。JSON 本質上係逼你做一件你之前成日偷懶嘅事:將需求諗透。
侷限同總結:工具未變,寫法決定結果
雖然 GPT Image 2 好勁,但佢仲有明顯短板。emollick 指出佢嘅編輯好固執,改幾輪之後進展會變慢,開新對話會有幫助。如果你做緊需要反覆迭代嘅設計項目,呢種固執會浪費你唔少時間。
另外,JSON prompt 再精確,輸出嘅始終係圖片唔係代碼,你唔可以直接拎去當前端用。佢更適合做概念驗證、提案展示、內容創作。
作者喺結尾將提示詞寫法嘅演變比喻成編程語言嘅進化:最早嘅 COBOL 想似英語,但最後結構化嘅形式語言更可靠。提示詞正係行緊同一條路。掌握新寫法嘅人已經用 GPT Image 2 出產品、做設計、做內容;未掌握嘅人仲喺度「幫我畫一隻貓」。

GPT Image 2 爆咗,好火爆嗰種爆,爆到咩程度?我寫呢篇文章嘅時候,佢個網站/codex接口都一時好一時壞,連付費頁面都開唔到,應該係伺服器頂唔順。
我被GPT Image 2 嘅各種「神圖」洗版之後,特登去睇咗一個 GitHub repository。呢個repository叫 awesome-gpt-image-2-prompts,收集咗117條 prompt 案例。我用咗差唔多兩日先睇完。
睇完之後有一個好強烈嘅感受。
大部分人行GPT Image 2嘅方法,同喺Midjourney上面寫prompt冇乜本質分別。「幫我畫一隻著太空衣嘅貓」,「生成一個 cyberpunk 風格嘅城市場景」。描述需求,等佢出圖。而另一班人,已經開始用JSON格式寫 prompt 喇。
由「幫我畫一個」到「幫我做一個」
GPT Image 2 最犀利嘅能力,係佢對結構化需求嘅理解力。係佢對真實世界嘅理解,好似第一次達到咗以假亂真

佢直接俾你出一張完整嘅抖音直播截圖。彈幕係你想要嘅內容,商品卡片係你指定嘅商品,連點讚數同在線人數都係你喺JSON裏面寫嗰串數字。
你諗下呢個分別有幾大。以前係描述一下「畫一個直播界面」,而家係俾一份規格說明叫佢「構建」一個直播界面,每個元素都按你嘅定義落地。你俾咗佢結構,佢按結構嚟拼裝。呢個同「我描述一下你幫我畫」嘅邏輯完全唔同。
一句話可以出啲咩
JSON Prompt 係最高精度嘅用法。但 GPT Image 2 嘅理解力遠唔止於此,有啲案例只需要一句話,出嚟嘅嘢就可以令你呆咗。
有人喺 X 度發咗一句「生成宋朝人嘅朋友圈」。結果出咗蘇東坡嘅朋友圈,頭像、用戶名、配圖、留言區全部齊曬。留言區裏面王安石回咗個「呵呵」,司馬光話「仲係嗰個味道」。點讚列表係黃庭堅、秦觀、佛印等 126 人。狀態欄顯示「大宋移動 5G」,年份「元豐三年」。
呢個創意太絕喇。

仲有人試咗「玄武門之變嘅朋友圈」,歷史事件變咗做社交媒體信息流。

慈禧嘅 X 主頁都有人整咗出嚟,頭像、簡介、推文一應俱全。

再向實用方向走。UI 設計師 @pfanis 發咗一句「幫我生成一套 UI 設計系統,包含網頁、移動端、卡片、控件、按鈕以及其他」。出咗一套完整嘅 glassmorphism 風格設計系統。Dashboard,移動端,組件庫全部有。一個人,一句話,出咗一套設計師可能要花兩日做嘅嘢。

op7418 做嘅更加硬核。用 GPT Image 2 + 字節嘅 Seedance 2.0 做咗一個 ARPG 遊戲《金瓶梅》嘅動態演示,遊戲 UI 交互、畫面銜接、對白全部 AI 生成。續作《黑神話:林沖》效果仲好,佢話「所有交互 UI 全部都係鬱嘅,如果唔係有啲塗抹感真係睇唔出」。仲有隨手拍藍莓直接出電商宣傳圖嘅,原話係「一致性還原得太好,連藍莓位置都冇變,但變得更飽滿」。
我同你講,呢啲案例睇落嚟有一個好明顯嘅嘢。大家拎 GPT Image 2 出嚟嘅成果,已經唔似「畫咗一張圖」,更加似「做咗一個產品」。朋友圈截圖係內容產品,UI 設計系統係設計產品,遊戲原型直接就係遊戲產品。你俾佢需求嘅方式變咗,佢俾你交付嘅嘢都變咗。
三個值得講嘅 prompt 技巧
117 個案例睇落嚟,有三個技巧我覺得值得單獨拎出嚟講。由簡單嘅開始。
參考圖 + 文字組合
呢個可能好多人知道但冇當一回事。上載一張參考圖配合詳細文字描述,比純文字 prompt 效果好一大截。品牌設計、IP 周邊呢類需要保持一致嘅場景,上載參考圖幾乎係必選項。你唔需要描述得好精確,但需要俾 AI 一個錨點。佢知道你要嘅「嗰個感覺」係咩之後,後面嘅一切都變得更可控。
喺 Prompt 入面內嵌「研究」過程
呢個係我覺得最意外嘅。技巧嚟自 @old_pgmrs_will,你可以喺 prompt 裏面直接寫「先研究 Bauhaus 設計運動嘅核心理念,然後基於其幾何構圖同色彩理論,設計一套現代科技產品嘅品牌視覺系統」。佢真係會先「研究」再出圖。
以前嘅 AI 圖像生成需要你自己做完設計研究再將結論餵俾 AI,而家呢一步直接塞入 prompt 裏面就搞掂。查資料同出圖,兩步變一步。
JSON 結構化 Prompt
前面已經展示咗完整案例,呢度唔重複喇。直接俾你一個最小可用嘅模板。
由呢個模板開始,比寫「幫我畫一個XX」出圖精準得多。JSON 迫你將需求諗清楚,類型、主體、佈局、風格,每一項你都要更明確咁定義。佢本身冇魔力,但佢逼你做咗一件你之前一直偷懶冇做嘅事,就係將需求諗透。
講完能力,講下侷限
坦白講,GPT Image 2 仍然有明顯短板。emollick 指出佢嘅編輯好「固執」,改幾輪之後進展變慢,開新對話有幫助。如果你做緊需要反覆迭代嘅設計項目,呢種固執會浪費你唔少時間。
另外,JSON Prompt 再精確,輸出嘅依然係圖片,唔係 code。你唔可以直接拎去當前端用。佢更適合做概念驗證、提案展示、內容創作。
但 prompt 嘅寫法確實已經變咗。我睇到嗰啲 JSON prompt 嘅時候反應咗好一陣,因為呢件事歷史上發生過。最早嘅程式語言 COBOL 被設計成「似英文一樣」,大家覺得用自然語言寫 code 幾方便啊。結果呢,結構化嘅形式語言比自然語言精確得多、可靠得多。Prompt 正係行緊同一條路。
掌握新寫法嘅人,正係用 GPT Image 2 出產品、做設計、做內容。未掌握嘅人,仲喺度「幫我畫一隻貓」。
返去開頭嗰個比喻。你俾裝修師傅口頭描述同你俾裝修隊發施工圖,最終交付嘅嘢質量同精度完全唔同。工具冇變,你俾需求嘅方式變咗。
試下嗰個 JSON 模板啦。由一個最簡單嘅 UI mockup 開始。
啱啱醒起,如果你想要117個 prompt 原文,關注我後台私信: "image2"

GPT image 2 爆了,火爆的爆,爆到什麼程度?我寫這篇文章的時候它的網站/codex接口都時好時壞,連付費頁面都打不開,應該是服務器扛不住了。
我在被GPT Image 2 的各種「神圖」刷屏之後,特地去翻了一個 GitHub 倉庫。這個倉庫叫 awesome-gpt-image-2-prompts,收集了 117 條提示詞案例。我花了差不多兩天才翻完。
翻完之後有一個特別強烈的感受。
大部分人用 GPT Image 2 的方式,和在 Midjourney 上寫 prompt 沒什麼本質區別。「幫我畫一隻穿宇航服的貓」,「生成一個賽博朋克風格的城市場景」。描述需求,等它出圖。而另一撥人,已經開始用 JSON 格式寫提示詞了。
從「幫我畫一個」到「幫我做一個」
GPT Image 2 最夯的能力,是它對結構化需求的理解力。是它的對真實世界的理解,好像第一次達到了以假亂真

它直接給你出一張完整的抖音直播截圖。彈幕是你要的內容,商品卡片是你指定的商品,連點贊數和在線人數都是你在 JSON 裏寫的那串數字。
你想想看這個區別有多大。以前是描述一下「畫一個直播界面」,現在是給一份規格說明讓它「構建」一個直播界面,每個元素都按你的定義落地。你給了它結構,它按結構來拼裝。這和「我描述一下你幫我畫」的邏輯完全不同。
一句話能出什麼
JSON Prompt 是最高精度的用法。但 GPT Image 2 的理解力遠不止於此,有些案例只需要一句話,出來的東西就能讓你愣住。
有人在 X 上發了一句「生成宋朝人的朋友圈」。結果出了蘇東坡的朋友圈,頭像、用戶名、配圖、評論區全齊了。評論區裏王安石回了個「呵呵」,司馬光說「還是那個味道」。點贊列表是黃庭堅、秦觀、佛印等 126 人。狀態欄顯示「大宋移動 5G」,年份「元豐三年」。
這創意太絕了。

還有人試了「玄武門之變的朋友圈」,歷史事件變成了社交媒體信息流。

慈禧的 X 主頁也有人做出來了,頭像、簡介、推文一應俱全。

再往實用方向走。UI 設計師 @pfanis 發了一句「幫我生成一套 UI 設計系統,包含網頁、移動端、卡片、控件、按鈕以及其它」。出來了一套完整的 glassmorphism 風格設計系統。Dashboard,移動端,組件庫全有。一個人,一句話,出了一套設計師可能要花兩天做的活。

op7418 做的更硬核。用 GPT Image 2 + 字節的 Seedance 2.0 做了一個 ARPG 遊戲《金瓶梅》的動態演示,遊戲 UI 交互、畫面銜接、台詞全部 AI 生成。續作《黑神話:林沖》效果更好,他說「所有交互 UI 全都是動的,要不是塗抹感真看不出來」。還有隨手拍藍莓直接出電商宣傳圖的,原話是「一致性還原太好了,連藍莓位置都沒變,但變得更飽滿」。
我跟你說,這些案例看下來有一個很明顯的東西。大家拿 GPT Image 2 出來的成果,已經不像「畫了一張圖」,更像「做了一個產品」。朋友圈截圖是內容產品,UI 設計系統是設計產品,遊戲原型直接就是遊戲產品。你給它需求的方式變了,它給你交付的東西也變了。
三個值得說的提示詞技巧
117 個案例翻下來,有三個技巧我覺得值得單獨拎出來說。從簡單的開始。
參考圖 + 文字組合
這個可能很多人知道但沒當回事。上傳一張參考圖配合詳細文字描述,比純文字提示詞效果好一大截。品牌設計、IP 周邊這類需要保持一致性的場景,上傳參考圖幾乎是必選項。你不需要描述得多精確,但需要給 AI 一個錨點。它知道你要的「那個感覺」是什麼之後,後面的一切都變得更可控。
在 Prompt 中內嵌「研究」過程
這個是我覺得最意外的。技巧來自 @old_pgmrs_will,你可以在提示詞裏直接寫「先研究 Bauhaus 設計運動的核心理念,然後基於其幾何構圖和色彩理論,設計一套現代科技產品的品牌視覺系統」。它真的會先「研究」再出圖。
以前的 AI 圖像生成需要你自己做完設計研究再把結論餵給 AI,現在這一步直接塞進提示詞裏就完事了。查資料和出圖,兩步並一步。
JSON 結構化 Prompt
前面已經展示了完整案例,這裏不重複了。直接給你一個最小可用的模板。
從這個模板開始,比寫「幫我畫一個XX」出圖精準得多。JSON 強迫你把需求想清楚,類型、主體、佈局、風格,每一項你都得更明確地定義。它本身沒有魔力,但它逼你做了一件你之前一直在偷懶不做的事,把需求想透。
說完能力,說說侷限
坦率的講,GPT Image 2 仍然有明顯短板。emollick 指出它的編輯很「固執」,改幾輪後進展變慢,開新對話有幫助。如果你在做需要反覆迭代的設計項目,這個固執會浪費你不少時間。
另外,JSON Prompt 再精確,輸出的依然是圖片,不是代碼。你不能直接拿去當前端用。它更適合做概念驗證、提案展示、內容創作。
但提示詞的寫法確實已經變了。我翻到那些 JSON prompt 的時候反應了好一會兒,因為這事兒歷史上發生過。最早的編程語言 COBOL 被設計成「像英語一樣」,大家覺得用自然語言寫代碼多方便啊。結果呢,結構化的形式語言比自然語言精確得多、可靠得多。提示詞正在走同一條路。
掌握新寫法的人,正在用 GPT Image 2 出產品、做設計、做內容。沒掌握的人,還在「幫我畫一隻貓」。
回到開頭那個類比。你給裝修師傅口頭描述和你給裝修隊發施工圖,最終交付的東西質量和精度完全不同。工具沒變,你給需求的方式變了。
試試那個 JSON 模板吧。從一個最簡單的 UI mockup 開始。
對了,如果你想要117個提示詞原文,關注我後台私信: "image2"