117 條 GPT Image 2 提示詞翻完,我整個人又被震驚麻了

作者:含彰
日期:2026年4月22日 下午3:42
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

GPT Image 2 嘅結構化提示詞(JSON)令到輸出從「畫圖」升級到「做產品」,本文整理咗 117 條案例嘅核心技巧同埋侷限。

整理版摘要

呢篇文章係由一位 AI 應用愛好者寫嘅,佢喺 GPT Image 2 爆紅期間,花咗兩日時間翻曬一個叫 awesome-gpt-image-2-prompts 嘅 GitHub 倉庫,入面有 117 條提示詞案例。佢睇完之後好大感觸,認為大部分人用 GPT Image 2 嘅方式仲停留喺 Midjourney 嗰套——「幫我畫……」嘅描述式 prompt,但已經有一班人開始用 JSON 格式寫提示詞,將需求結構化,令到 AI 好似「做產品」咁出圖。整體結論係:掌握新寫法嘅人,已經用 GPT Image 2 出緊產品、設計同內容;未掌握嘅人,仲喺度「幫我畫一隻貓」。

作者發現 GPT Image 2 最強嘅能力係對真實世界嘅理解同結構化需求嘅執行力。例如用 JSON Prompt 可以直接生成一個完整嘅抖音直播截圖,入面嘅彈幕、商品卡片、點讚數全部按你寫嘅數字出現。呢種「畀規格,佢構建」嘅模式,同傳統「描述畫面,佢畫」完全唔同。另外,就算一句話 prompt,好似「生成宋朝人朋友圈」,都可以出到蘇東坡嘅朋友圈,有頭像、用戶名、評論區,連王安石回「呵呵」都有。呢啲案例顯示 GPT Image 2 已經能夠理解複雜場景,並將佢轉化成具象嘅視覺產物。

文章仲提到三個值得學嘅技巧:第一,上傳參考圖配合詳細文字描述,尤其係品牌設計呢類需要一致性嘅場景;第二,喺 prompt 入面直接叫 AI「先研究某個概念再設計」,將研究同出圖…

  • GPT Image 2 嘅結構化理解能力令 prompt 從「描述畫面」進化到「規格構建」,JSON 格式係最高精度用法。
  • 一句話 prompt 都可以產生驚人效果,例如「宋朝人朋友圈」或「UI 設計系統」,展現 AI 對真實世界嘅理解。
  • 三個實用技巧:參考圖加文字、喺 prompt 內嵌「研究」過程、使用 JSON 結構化模板。
  • 侷限係編輯固執、反覆迭代耗時,輸出係圖片唔係代碼,適合概念驗證同提案展示。
  • 掌握新寫法嘅人已經用 GPT Image 2 出產品、做設計、做內容;否則仲停留喺「幫我畫一隻貓」嘅層次。
值得記低
連結 github.com

awesome-gpt-image-2-prompts GitHub 倉庫

收集咗 117 條 GPT Image 2 提示詞案例,作者就係睇呢個倉庫得出文章見解。

Prompt

JSON 結構化 Prompt 最小可用模板

一個可以直接用嘅 JSON 模板,幫你將需求結構化,提升出圖精準度。

整理重點

提示詞寫法嘅分野:描述 vs 結構

大部分用 GPT Image 2 嘅人仲係用緊 Midjourney 嗰套——「幫我畫一隻穿宇航服嘅貓」。但係另一班人已經開始用 JSON 格式寫提示詞,從「幫我畫一個」變成「幫我做一個」。呢個轉變係好大嘅躍進。

直播 UI 樣機 JSON 示例 json
{
 "type": "直播 UI 樣機",
 "subject": {
 "description": "Elon Musk 的肖像,面帶微笑",
 "background": "左側顯示 SPACEX 屏幕,右側顯示 Tesla logo"
 },
 "ui_overlay": {
 "top_header": {
 "host_info": "頭像,名稱 Elon Musk,副標題 55.6萬本場點贊",
 "viewer_stats": "總計 68.7萬"
 },
 "bottom_left_chat": {
 "messages": [
 "小火箭: 馬斯克!未來可期!",
 "AI探索者: Neuralink進展如何?"
 ]
 },
 "bottom_right_product_card": {
 "title": "特斯拉Cybertruck 電動皮卡",
 "price": "¥ 1,618,000"
 }
 }
}
  • JSON prompt 嘅核心係強迫你諗清需求:類型、主體、佈局、風格,每一項都要定義得明確。
  • 佢本身冇魔力,但係逼你做咗一件之前成日偷懶唔做嘅事:將需求諗透。
整理重點

一句話嘅威力:朋友圈、設計系統、遊戲原型

除咗 JSON,一句唔複雜嘅 prompt 都可以出到好驚人嘅結果。作者舉咗幾個例子,全部都令人眼前一亮。

生成宋朝人朋友圈」呢句 prompt 出咗蘇東坡嘅朋友圈,頭像、用戶名、配圖、評論區全部齊全,王安石回咗「呵呵」,司馬光話「還是嗰個味道」,點讚列表有黃庭堅、秦觀等 126 人。

UI 設計師 @pfanis 一句「幫我生成一套 UI 設計系統」就出咗一套完整嘅 glassmorphism 風格設計系統,包含 Dashboard、移動端、組件庫。

仲有人用 GPT Image 2 加 Seedance 2.0 做咗一個 ARPG 遊戲《金瓶梅》嘅動態演示,所有 UI 同畫面都係 AI 生成,效果自然。呢啲案例顯示 GPT Image 2 嘅產出已經唔似「一張圖」,而似「一個產品」。

整理重點

三個值得記住嘅提示詞技巧

  1. 1 參考圖加文字:上傳一張參考圖配合詳細文字描述,尤其係品牌設計呢類需要一致性嘅場景,效果比純文字 prompt 好一大截。你唔使描述得好精確,但係要畀 AI 一個錨點。
  2. 2 喺 Prompt 內嵌研究過程:直接寫「先研究 Bauhaus 設計運動嘅核心理念,然後基於幾何構圖同色彩理論設計一套品牌視覺系統」,AI 會先研究再出圖,將查資料同出圖合併做一步。
  3. 3 JSON 結構化 Prompt:將需求拆成 type、subject、layout、style 等字段,強迫你諗清楚每個部分。以下係一個最小可用模板。
JSON 結構化 Prompt 最小可用模板 json
{
 "type": "你要生成的圖像類型",
 "subject": {
 "description": "主體描述",
 "background": "背景描述"
 },
 "layout": {
 "sections": [
 {"type": "區域名稱", "elements": ["元素1", "元素2"]}
 ]
 },
 "style": "整體風格描述"
}

從呢個模板開始,比寫「幫我畫一個XX」出圖精準得多。JSON 本質上係逼你做一件你之前成日偷懶嘅事:將需求諗透。

整理重點

侷限同總結:工具未變,寫法決定結果

雖然 GPT Image 2 好勁,但佢仲有明顯短板。emollick 指出佢嘅編輯好固執,改幾輪之後進展會變慢,開新對話會有幫助。如果你做緊需要反覆迭代嘅設計項目,呢種固執會浪費你唔少時間。

另外,JSON prompt 再精確,輸出嘅始終係圖片唔係代碼,你唔可以直接拎去當前端用。佢更適合做概念驗證、提案展示、內容創作。

作者喺結尾將提示詞寫法嘅演變比喻成編程語言嘅進化:最早嘅 COBOL 想似英語,但最後結構化嘅形式語言更可靠。提示詞正係行緊同一條路。掌握新寫法嘅人已經用 GPT Image 2 出產品、做設計、做內容;未掌握嘅人仲喺度「幫我畫一隻貓」。


alt text
 GPT Image 2 爆咗,好火爆嗰種爆,爆到咩程度?我寫呢篇文章嘅時候,佢個網站/codex接口都一時好一時壞,連付費頁面都開唔到,應該係伺服器頂唔順。

我被GPT Image 2 嘅各種「神圖」洗版之後,特登去睇咗一個 GitHub repository。呢個repository叫 awesome-gpt-image-2-prompts,收集咗117條 prompt 案例。我用咗差唔多兩日先睇完。

睇完之後有一個好強烈嘅感受。

大部分人行GPT Image 2嘅方法,同喺Midjourney上面寫prompt冇乜本質分別。「幫我畫一隻著太空衣嘅貓」,「生成一個 cyberpunk 風格嘅城市場景」。描述需求,等佢出圖。而另一班人,已經開始用JSON格式寫 prompt 喇。

由「幫我畫一個」到「幫我做一個」

GPT Image 2 最犀利嘅能力,係佢對結構化需求嘅理解力。係佢對真實世界嘅理解,好似第一次達到咗以假亂真


{
  "type""直播 UI 樣機",
  "subject": {
    "description""Elon Musk 的肖像,面帶微笑",
    "background""左側顯示 SPACEX 屏幕,右側顯示 Tesla logo"
  },
  "ui_overlay": {
    "top_header": {
      "host_info""頭像,名稱 Elon Musk,副標題 55.6萬本場點贊",
      "viewer_stats""總計 68.7萬"
    },
    "bottom_left_chat": {
      "messages": [
        "小火箭: 馬斯克!未來可期!",
        "AI探索者: Neuralink進展如何?"
      ]
    },
    "bottom_right_product_card": {
      "title""特斯拉Cybertruck 電動皮卡",
      "price""¥ 1,618,000"
    }
  }
}
JSON Prompt 生成的抖音直播 UI 樣機

佢直接俾你出一張完整嘅抖音直播截圖。彈幕係你想要嘅內容,商品卡片係你指定嘅商品,連點讚數同在線人數都係你喺JSON裏面寫嗰串數字。

你諗下呢個分別有幾大。以前係描述一下「畫一個直播界面」,而家係俾一份規格說明叫佢「構建」一個直播界面,每個元素都按你嘅定義落地。你俾咗佢結構,佢按結構嚟拼裝。呢個同「我描述一下你幫我畫」嘅邏輯完全唔同。

一句話可以出啲咩

JSON Prompt 係最高精度嘅用法。但 GPT Image 2 嘅理解力遠唔止於此,有啲案例只需要一句話,出嚟嘅嘢就可以令你呆咗。

有人喺 X 度發咗一句「生成宋朝人嘅朋友圈」。結果出咗蘇東坡嘅朋友圈,頭像、用戶名、配圖、留言區全部齊曬。留言區裏面王安石回咗個「呵呵」,司馬光話「仲係嗰個味道」。點讚列表係黃庭堅、秦觀、佛印等 126 人。狀態欄顯示「大宋移動 5G」,年份「元豐三年」。

呢個創意太絕喇。

宋朝人的朋友圈——蘇東坡的社交媒體

仲有人試咗「玄武門之變嘅朋友圈」,歷史事件變咗做社交媒體信息流。

玄武門之變的朋友圈

慈禧嘅 X 主頁都有人整咗出嚟,頭像、簡介、推文一應俱全。

慈禧的 X 主頁

再向實用方向走。UI 設計師 @pfanis 發咗一句「幫我生成一套 UI 設計系統,包含網頁、移動端、卡片、控件、按鈕以及其他」。出咗一套完整嘅 glassmorphism 風格設計系統。Dashboard,移動端,組件庫全部有。一個人,一句話,出咗一套設計師可能要花兩日做嘅嘢。

一句話生成的完整 UI 設計系統

op7418 做嘅更加硬核。用 GPT Image 2 + 字節嘅 Seedance 2.0 做咗一個 ARPG 遊戲《金瓶梅》嘅動態演示,遊戲 UI 交互、畫面銜接、對白全部 AI 生成。續作《黑神話:林沖》效果仲好,佢話「所有交互 UI 全部都係鬱嘅,如果唔係有啲塗抹感真係睇唔出」。仲有隨手拍藍莓直接出電商宣傳圖嘅,原話係「一致性還原得太好,連藍莓位置都冇變,但變得更飽滿」。

我同你講,呢啲案例睇落嚟有一個好明顯嘅嘢。大家拎 GPT Image 2 出嚟嘅成果,已經唔似「畫咗一張圖」,更加似「做咗一個產品」。朋友圈截圖係內容產品,UI 設計系統係設計產品,遊戲原型直接就係遊戲產品。你俾佢需求嘅方式變咗,佢俾你交付嘅嘢都變咗。

三個值得講嘅 prompt 技巧

117 個案例睇落嚟,有三個技巧我覺得值得單獨拎出嚟講。由簡單嘅開始。

參考圖 + 文字組合

呢個可能好多人知道但冇當一回事。上載一張參考圖配合詳細文字描述,比純文字 prompt 效果好一大截。品牌設計、IP 周邊呢類需要保持一致嘅場景,上載參考圖幾乎係必選項。你唔需要描述得好精確,但需要俾 AI 一個錨點。佢知道你要嘅「嗰個感覺」係咩之後,後面嘅一切都變得更可控。

喺 Prompt 入面內嵌「研究」過程

呢個係我覺得最意外嘅。技巧嚟自 @old_pgmrs_will,你可以喺 prompt 裏面直接寫「先研究 Bauhaus 設計運動嘅核心理念,然後基於其幾何構圖同色彩理論,設計一套現代科技產品嘅品牌視覺系統」。佢真係會先「研究」再出圖。

以前嘅 AI 圖像生成需要你自己做完設計研究再將結論餵俾 AI,而家呢一步直接塞入 prompt 裏面就搞掂。查資料同出圖,兩步變一步。

JSON 結構化 Prompt

前面已經展示咗完整案例,呢度唔重複喇。直接俾你一個最小可用嘅模板。


class="language-json">{
  "type""你要生成的圖像類型",
  "subject": {
    "description""主體描述",
    "background""背景描述"
  },
  "layout": {
    "sections": [
      {"type""區域名稱""elements": ["元素1""元素2"]}
    ]
  },
  "style""整體風格描述"
}

由呢個模板開始,比寫「幫我畫一個XX」出圖精準得多。JSON 迫你將需求諗清楚,類型、主體、佈局、風格,每一項你都要更明確咁定義。佢本身冇魔力,但佢逼你做咗一件你之前一直偷懶冇做嘅事,就係將需求諗透。

講完能力,講下侷限

坦白講,GPT Image 2 仍然有明顯短板。emollick 指出佢嘅編輯好「固執」,改幾輪之後進展變慢,開新對話有幫助。如果你做緊需要反覆迭代嘅設計項目,呢種固執會浪費你唔少時間。

另外,JSON Prompt 再精確,輸出嘅依然係圖片,唔係 code。你唔可以直接拎去當前端用。佢更適合做概念驗證、提案展示、內容創作。

但 prompt 嘅寫法確實已經變咗。我睇到嗰啲 JSON prompt 嘅時候反應咗好一陣,因為呢件事歷史上發生過。最早嘅程式語言 COBOL 被設計成「似英文一樣」,大家覺得用自然語言寫 code 幾方便啊。結果呢,結構化嘅形式語言比自然語言精確得多、可靠得多。Prompt 正係行緊同一條路。

掌握新寫法嘅人,正係用 GPT Image 2 出產品、做設計、做內容。未掌握嘅人,仲喺度「幫我畫一隻貓」。

返去開頭嗰個比喻。你俾裝修師傅口頭描述同你俾裝修隊發施工圖,最終交付嘅嘢質量同精度完全唔同。工具冇變,你俾需求嘅方式變咗。

試下嗰個 JSON 模板啦。由一個最簡單嘅 UI mockup 開始。


啱啱醒起,如果你想要117個 prompt 原文,關注我後台私信: "image2"


alt text
 GPT image 2 爆了,火爆的爆,爆到什麼程度?我寫這篇文章的時候它的網站/codex接口都時好時壞,連付費頁面都打不開,應該是服務器扛不住了。

我在被GPT Image 2 的各種「神圖」刷屏之後,特地去翻了一個 GitHub 倉庫。這個倉庫叫 awesome-gpt-image-2-prompts,收集了 117 條提示詞案例。我花了差不多兩天才翻完。

翻完之後有一個特別強烈的感受。

大部分人用 GPT Image 2 的方式,和在 Midjourney 上寫 prompt 沒什麼本質區別。「幫我畫一隻穿宇航服的貓」,「生成一個賽博朋克風格的城市場景」。描述需求,等它出圖。而另一撥人,已經開始用 JSON 格式寫提示詞了。

從「幫我畫一個」到「幫我做一個」

GPT Image 2 最夯的能力,是它對結構化需求的理解力。是它的對真實世界的理解,好像第一次達到了以假亂真


{
  "type""直播 UI 樣機",
  "subject": {
    "description""Elon Musk 的肖像,面帶微笑",
    "background""左側顯示 SPACEX 屏幕,右側顯示 Tesla logo"
  },
  "ui_overlay": {
    "top_header": {
      "host_info""頭像,名稱 Elon Musk,副標題 55.6萬本場點贊",
      "viewer_stats""總計 68.7萬"
    },
    "bottom_left_chat": {
      "messages": [
        "小火箭: 馬斯克!未來可期!",
        "AI探索者: Neuralink進展如何?"
      ]
    },
    "bottom_right_product_card": {
      "title""特斯拉Cybertruck 電動皮卡",
      "price""¥ 1,618,000"
    }
  }
}
JSON Prompt 生成的抖音直播 UI 樣機

它直接給你出一張完整的抖音直播截圖。彈幕是你要的內容,商品卡片是你指定的商品,連點贊數和在線人數都是你在 JSON 裏寫的那串數字。

你想想看這個區別有多大。以前是描述一下「畫一個直播界面」,現在是給一份規格說明讓它「構建」一個直播界面,每個元素都按你的定義落地。你給了它結構,它按結構來拼裝。這和「我描述一下你幫我畫」的邏輯完全不同。

一句話能出什麼

JSON Prompt 是最高精度的用法。但 GPT Image 2 的理解力遠不止於此,有些案例只需要一句話,出來的東西就能讓你愣住。

有人在 X 上發了一句「生成宋朝人的朋友圈」。結果出了蘇東坡的朋友圈,頭像、用戶名、配圖、評論區全齊了。評論區裏王安石回了個「呵呵」,司馬光說「還是那個味道」。點贊列表是黃庭堅、秦觀、佛印等 126 人。狀態欄顯示「大宋移動 5G」,年份「元豐三年」。

這創意太絕了。

宋朝人的朋友圈——蘇東坡的社交媒體

還有人試了「玄武門之變的朋友圈」,歷史事件變成了社交媒體信息流。

玄武門之變的朋友圈

慈禧的 X 主頁也有人做出來了,頭像、簡介、推文一應俱全。

慈禧的 X 主頁

再往實用方向走。UI 設計師 @pfanis 發了一句「幫我生成一套 UI 設計系統,包含網頁、移動端、卡片、控件、按鈕以及其它」。出來了一套完整的 glassmorphism 風格設計系統。Dashboard,移動端,組件庫全有。一個人,一句話,出了一套設計師可能要花兩天做的活。

一句話生成的完整 UI 設計系統

op7418 做的更硬核。用 GPT Image 2 + 字節的 Seedance 2.0 做了一個 ARPG 遊戲《金瓶梅》的動態演示,遊戲 UI 交互、畫面銜接、台詞全部 AI 生成。續作《黑神話:林沖》效果更好,他說「所有交互 UI 全都是動的,要不是塗抹感真看不出來」。還有隨手拍藍莓直接出電商宣傳圖的,原話是「一致性還原太好了,連藍莓位置都沒變,但變得更飽滿」。

我跟你說,這些案例看下來有一個很明顯的東西。大家拿 GPT Image 2 出來的成果,已經不像「畫了一張圖」,更像「做了一個產品」。朋友圈截圖是內容產品,UI 設計系統是設計產品,遊戲原型直接就是遊戲產品。你給它需求的方式變了,它給你交付的東西也變了。

三個值得說的提示詞技巧

117 個案例翻下來,有三個技巧我覺得值得單獨拎出來說。從簡單的開始。

參考圖 + 文字組合

這個可能很多人知道但沒當回事。上傳一張參考圖配合詳細文字描述,比純文字提示詞效果好一大截。品牌設計、IP 周邊這類需要保持一致性的場景,上傳參考圖幾乎是必選項。你不需要描述得多精確,但需要給 AI 一個錨點。它知道你要的「那個感覺」是什麼之後,後面的一切都變得更可控。

在 Prompt 中內嵌「研究」過程

這個是我覺得最意外的。技巧來自 @old_pgmrs_will,你可以在提示詞裏直接寫「先研究 Bauhaus 設計運動的核心理念,然後基於其幾何構圖和色彩理論,設計一套現代科技產品的品牌視覺系統」。它真的會先「研究」再出圖。

以前的 AI 圖像生成需要你自己做完設計研究再把結論餵給 AI,現在這一步直接塞進提示詞裏就完事了。查資料和出圖,兩步並一步。

JSON 結構化 Prompt

前面已經展示了完整案例,這裏不重複了。直接給你一個最小可用的模板。


class="language-json">{
  "type""你要生成的圖像類型",
  "subject": {
    "description""主體描述",
    "background""背景描述"
  },
  "layout": {
    "sections": [
      {"type""區域名稱""elements": ["元素1""元素2"]}
    ]
  },
  "style""整體風格描述"
}

從這個模板開始,比寫「幫我畫一個XX」出圖精準得多。JSON 強迫你把需求想清楚,類型、主體、佈局、風格,每一項你都得更明確地定義。它本身沒有魔力,但它逼你做了一件你之前一直在偷懶不做的事,把需求想透。

說完能力,說說侷限

坦率的講,GPT Image 2 仍然有明顯短板。emollick 指出它的編輯很「固執」,改幾輪後進展變慢,開新對話有幫助。如果你在做需要反覆迭代的設計項目,這個固執會浪費你不少時間。

另外,JSON Prompt 再精確,輸出的依然是圖片,不是代碼。你不能直接拿去當前端用。它更適合做概念驗證、提案展示、內容創作。

但提示詞的寫法確實已經變了。我翻到那些 JSON prompt 的時候反應了好一會兒,因為這事兒歷史上發生過。最早的編程語言 COBOL 被設計成「像英語一樣」,大家覺得用自然語言寫代碼多方便啊。結果呢,結構化的形式語言比自然語言精確得多、可靠得多。提示詞正在走同一條路。

掌握新寫法的人,正在用 GPT Image 2 出產品、做設計、做內容。沒掌握的人,還在「幫我畫一隻貓」。

回到開頭那個類比。你給裝修師傅口頭描述和你給裝修隊發施工圖,最終交付的東西質量和精度完全不同。工具沒變,你給需求的方式變了。

試試那個 JSON 模板吧。從一個最簡單的 UI mockup 開始。


對了,如果你想要117個提示詞原文,關注我後台私信: "image2"