117 條 GPT Image 2 提示詞翻完，我整個人又被震驚麻了

作者：含彰

日期：2026年4月22日下午3:42

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

GPT Image 2 嘅結構化提示詞（JSON）令到輸出從「畫圖」升級到「做產品」，本文整理咗 117 條案例嘅核心技巧同埋侷限。

整理版摘要

呢篇文章係由一位 AI 應用愛好者寫嘅，佢喺 GPT Image 2 爆紅期間，花咗兩日時間翻曬一個叫 awesome-gpt-image-2-prompts 嘅 GitHub 倉庫，入面有 117 條提示詞案例。佢睇完之後好大感觸，認為大部分人用 GPT Image 2 嘅方式仲停留喺 Midjourney 嗰套——「幫我畫……」嘅描述式 prompt，但已經有一班人開始用 JSON 格式寫提示詞，將需求結構化，令到 AI 好似「做產品」咁出圖。整體結論係：掌握新寫法嘅人，已經用 GPT Image 2 出緊產品、設計同內容；未掌握嘅人，仲喺度「幫我畫一隻貓」。

作者發現 GPT Image 2 最強嘅能力係對真實世界嘅理解同結構化需求嘅執行力。例如用 JSON Prompt 可以直接生成一個完整嘅抖音直播截圖，入面嘅彈幕、商品卡片、點讚數全部按你寫嘅數字出現。呢種「畀規格，佢構建」嘅模式，同傳統「描述畫面，佢畫」完全唔同。另外，就算一句話 prompt，好似「生成宋朝人朋友圈」，都可以出到蘇東坡嘅朋友圈，有頭像、用戶名、評論區，連王安石回「呵呵」都有。呢啲案例顯示 GPT Image 2 已經能夠理解複雜場景，並將佢轉化成具象嘅視覺產物。

文章仲提到三個值得學嘅技巧：第一，上傳參考圖配合詳細文字描述，尤其係品牌設計呢類需要一致性嘅場景；第二，喺 prompt 入面直接叫 AI「先研究某個概念再設計」，將研究同出圖…

GPT Image 2 嘅結構化理解能力令 prompt 從「描述畫面」進化到「規格構建」，JSON 格式係最高精度用法。
一句話 prompt 都可以產生驚人效果，例如「宋朝人朋友圈」或「UI 設計系統」，展現 AI 對真實世界嘅理解。
三個實用技巧：參考圖加文字、喺 prompt 內嵌「研究」過程、使用 JSON 結構化模板。
侷限係編輯固執、反覆迭代耗時，輸出係圖片唔係代碼，適合概念驗證同提案展示。
掌握新寫法嘅人已經用 GPT Image 2 出產品、做設計、做內容；否則仲停留喺「幫我畫一隻貓」嘅層次。

值得記低

連結 github.com

awesome-gpt-image-2-prompts GitHub 倉庫

收集咗 117 條 GPT Image 2 提示詞案例，作者就係睇呢個倉庫得出文章見解。

Prompt

JSON 結構化 Prompt 最小可用模板

一個可以直接用嘅 JSON 模板，幫你將需求結構化，提升出圖精準度。

整理重點

提示詞寫法嘅分野：描述 vs 結構

大部分用 GPT Image 2 嘅人仲係用緊 Midjourney 嗰套——「幫我畫一隻穿宇航服嘅貓」。但係另一班人已經開始用 JSON 格式寫提示詞，從「幫我畫一個」變成「幫我做一個」。呢個轉變係好大嘅躍進。

直播 UI 樣機 JSON 示例 json

{
 "type": "直播 UI 樣機",
 "subject": {
 "description": "Elon Musk 的肖像，面帶微笑",
 "background": "左側顯示 SPACEX 屏幕，右側顯示 Tesla logo"
 },
 "ui_overlay": {
 "top_header": {
 "host_info": "頭像，名稱 Elon Musk，副標題 55.6萬本場點贊",
 "viewer_stats": "總計 68.7萬"
 },
 "bottom_left_chat": {
 "messages": [
 "小火箭: 馬斯克！未來可期！",
 "AI探索者: Neuralink進展如何？"
 ]
 },
 "bottom_right_product_card": {
 "title": "特斯拉Cybertruck 電動皮卡",
 "price": "¥ 1,618,000"
 }
 }
}

JSON prompt 嘅核心係強迫你諗清需求：類型、主體、佈局、風格，每一項都要定義得明確。
佢本身冇魔力，但係逼你做咗一件之前成日偷懶唔做嘅事：將需求諗透。

整理重點

一句話嘅威力：朋友圈、設計系統、遊戲原型

除咗 JSON，一句唔複雜嘅 prompt 都可以出到好驚人嘅結果。作者舉咗幾個例子，全部都令人眼前一亮。

「生成宋朝人朋友圈」呢句 prompt 出咗蘇東坡嘅朋友圈，頭像、用戶名、配圖、評論區全部齊全，王安石回咗「呵呵」，司馬光話「還是嗰個味道」，點讚列表有黃庭堅、秦觀等 126 人。

UI 設計師 @pfanis 一句「幫我生成一套 UI 設計系統」就出咗一套完整嘅 glassmorphism 風格設計系統，包含 Dashboard、移動端、組件庫。

仲有人用 GPT Image 2 加 Seedance 2.0 做咗一個 ARPG 遊戲《金瓶梅》嘅動態演示，所有 UI 同畫面都係 AI 生成，效果自然。呢啲案例顯示 GPT Image 2 嘅產出已經唔似「一張圖」，而似「一個產品」。

整理重點

三個值得記住嘅提示詞技巧

1 參考圖加文字：上傳一張參考圖配合詳細文字描述，尤其係品牌設計呢類需要一致性嘅場景，效果比純文字 prompt 好一大截。你唔使描述得好精確，但係要畀 AI 一個錨點。
2 喺 Prompt 內嵌研究過程：直接寫「先研究 Bauhaus 設計運動嘅核心理念，然後基於幾何構圖同色彩理論設計一套品牌視覺系統」，AI 會先研究再出圖，將查資料同出圖合併做一步。
3 JSON 結構化 Prompt：將需求拆成 type、subject、layout、style 等字段，強迫你諗清楚每個部分。以下係一個最小可用模板。

JSON 結構化 Prompt 最小可用模板 json

{
 "type": "你要生成的圖像類型",
 "subject": {
 "description": "主體描述",
 "background": "背景描述"
 },
 "layout": {
 "sections": [
 {"type": "區域名稱", "elements": ["元素1", "元素2"]}
 ]
 },
 "style": "整體風格描述"
}

從呢個模板開始，比寫「幫我畫一個XX」出圖精準得多。JSON 本質上係逼你做一件你之前成日偷懶嘅事：將需求諗透。

整理重點

侷限同總結：工具未變，寫法決定結果

雖然 GPT Image 2 好勁，但佢仲有明顯短板。emollick 指出佢嘅編輯好固執，改幾輪之後進展會變慢，開新對話會有幫助。如果你做緊需要反覆迭代嘅設計項目，呢種固執會浪費你唔少時間。

另外，JSON prompt 再精確，輸出嘅始終係圖片唔係代碼，你唔可以直接拎去當前端用。佢更適合做概念驗證、提案展示、內容創作。

作者喺結尾將提示詞寫法嘅演變比喻成編程語言嘅進化：最早嘅 COBOL 想似英語，但最後結構化嘅形式語言更可靠。提示詞正係行緊同一條路。掌握新寫法嘅人已經用 GPT Image 2 出產品、做設計、做內容；未掌握嘅人仲喺度「幫我畫一隻貓」。

alt text
GPT Image 2 爆咗，好火爆嗰種爆，爆到咩程度？我寫呢篇文章嘅時候，佢個網站/codex接口都一時好一時壞，連付費頁面都開唔到，應該係伺服器頂唔順。

我被GPT Image 2 嘅各種「神圖」洗版之後，特登去睇咗一個 GitHub repository。呢個repository叫 awesome-gpt-image-2-prompts，收集咗117條 prompt 案例。我用咗差唔多兩日先睇完。

睇完之後有一個好強烈嘅感受。

大部分人行GPT Image 2嘅方法，同喺Midjourney上面寫prompt冇乜本質分別。「幫我畫一隻著太空衣嘅貓」，「生成一個 cyberpunk 風格嘅城市場景」。描述需求，等佢出圖。而另一班人，已經開始用JSON格式寫 prompt 喇。

由「幫我畫一個」到「幫我做一個」

GPT Image 2 最犀利嘅能力，係佢對結構化需求嘅理解力。係佢對真實世界嘅理解，好似第一次達到咗以假亂真

{
  "type": "直播 UI 樣機",
  "subject": {
    "description": "Elon Musk 的肖像，面帶微笑",
    "background": "左側顯示 SPACEX 屏幕，右側顯示 Tesla logo"
  },
  "ui_overlay": {
    "top_header": {
      "host_info": "頭像，名稱 Elon Musk，副標題 55.6萬本場點贊",
      "viewer_stats": "總計 68.7萬"
    },
    "bottom_left_chat": {
      "messages": [
        "小火箭: 馬斯克！未來可期！",
        "AI探索者: Neuralink進展如何？"
      ]
    },
    "bottom_right_product_card": {
      "title": "特斯拉Cybertruck 電動皮卡",
      "price": "¥ 1,618,000"
    }
  }
}

佢直接俾你出一張完整嘅抖音直播截圖。彈幕係你想要嘅內容，商品卡片係你指定嘅商品，連點讚數同在線人數都係你喺JSON裏面寫嗰串數字。

你諗下呢個分別有幾大。以前係描述一下「畫一個直播界面」，而家係俾一份規格說明叫佢「構建」一個直播界面，每個元素都按你嘅定義落地。你俾咗佢結構，佢按結構嚟拼裝。呢個同「我描述一下你幫我畫」嘅邏輯完全唔同。

一句話可以出啲咩

JSON Prompt 係最高精度嘅用法。但 GPT Image 2 嘅理解力遠唔止於此，有啲案例只需要一句話，出嚟嘅嘢就可以令你呆咗。

有人喺 X 度發咗一句「生成宋朝人嘅朋友圈」。結果出咗蘇東坡嘅朋友圈，頭像、用戶名、配圖、留言區全部齊曬。留言區裏面王安石回咗個「呵呵」，司馬光話「仲係嗰個味道」。點讚列表係黃庭堅、秦觀、佛印等 126 人。狀態欄顯示「大宋移動 5G」，年份「元豐三年」。

呢個創意太絕喇。

仲有人試咗「玄武門之變嘅朋友圈」，歷史事件變咗做社交媒體信息流。

慈禧嘅 X 主頁都有人整咗出嚟，頭像、簡介、推文一應俱全。

再向實用方向走。UI 設計師 @pfanis 發咗一句「幫我生成一套 UI 設計系統，包含網頁、移動端、卡片、控件、按鈕以及其他」。出咗一套完整嘅 glassmorphism 風格設計系統。Dashboard，移動端，組件庫全部有。一個人，一句話，出咗一套設計師可能要花兩日做嘅嘢。

op7418 做嘅更加硬核。用 GPT Image 2 + 字節嘅 Seedance 2.0 做咗一個 ARPG 遊戲《金瓶梅》嘅動態演示，遊戲 UI 交互、畫面銜接、對白全部 AI 生成。續作《黑神話：林沖》效果仲好，佢話「所有交互 UI 全部都係鬱嘅，如果唔係有啲塗抹感真係睇唔出」。仲有隨手拍藍莓直接出電商宣傳圖嘅，原話係「一致性還原得太好，連藍莓位置都冇變，但變得更飽滿」。

我同你講，呢啲案例睇落嚟有一個好明顯嘅嘢。大家拎 GPT Image 2 出嚟嘅成果，已經唔似「畫咗一張圖」，更加似「做咗一個產品」。朋友圈截圖係內容產品，UI 設計系統係設計產品，遊戲原型直接就係遊戲產品。你俾佢需求嘅方式變咗，佢俾你交付嘅嘢都變咗。

三個值得講嘅 prompt 技巧

117 個案例睇落嚟，有三個技巧我覺得值得單獨拎出嚟講。由簡單嘅開始。

參考圖 + 文字組合

呢個可能好多人知道但冇當一回事。上載一張參考圖配合詳細文字描述，比純文字 prompt 效果好一大截。品牌設計、IP 周邊呢類需要保持一致嘅場景，上載參考圖幾乎係必選項。你唔需要描述得好精確，但需要俾 AI 一個錨點。佢知道你要嘅「嗰個感覺」係咩之後，後面嘅一切都變得更可控。

喺 Prompt 入面內嵌「研究」過程

呢個係我覺得最意外嘅。技巧嚟自 @old_pgmrs_will，你可以喺 prompt 裏面直接寫「先研究 Bauhaus 設計運動嘅核心理念，然後基於其幾何構圖同色彩理論，設計一套現代科技產品嘅品牌視覺系統」。佢真係會先「研究」再出圖。

以前嘅 AI 圖像生成需要你自己做完設計研究再將結論餵俾 AI，而家呢一步直接塞入 prompt 裏面就搞掂。查資料同出圖，兩步變一步。

JSON 結構化 Prompt

前面已經展示咗完整案例，呢度唔重複喇。直接俾你一個最小可用嘅模板。

class="language-json">{
  "type": "你要生成的圖像類型",
  "subject": {
    "description": "主體描述",
    "background": "背景描述"
  },
  "layout": {
    "sections": [
      {"type": "區域名稱", "elements": ["元素1", "元素2"]}
    ]
  },
  "style": "整體風格描述"
}

由呢個模板開始，比寫「幫我畫一個XX」出圖精準得多。JSON 迫你將需求諗清楚，類型、主體、佈局、風格，每一項你都要更明確咁定義。佢本身冇魔力，但佢逼你做咗一件你之前一直偷懶冇做嘅事，就係將需求諗透。

講完能力，講下侷限

坦白講，GPT Image 2 仍然有明顯短板。emollick 指出佢嘅編輯好「固執」，改幾輪之後進展變慢，開新對話有幫助。如果你做緊需要反覆迭代嘅設計項目，呢種固執會浪費你唔少時間。

另外，JSON Prompt 再精確，輸出嘅依然係圖片，唔係 code。你唔可以直接拎去當前端用。佢更適合做概念驗證、提案展示、內容創作。

但 prompt 嘅寫法確實已經變咗。我睇到嗰啲 JSON prompt 嘅時候反應咗好一陣，因為呢件事歷史上發生過。最早嘅程式語言 COBOL 被設計成「似英文一樣」，大家覺得用自然語言寫 code 幾方便啊。結果呢，結構化嘅形式語言比自然語言精確得多、可靠得多。Prompt 正係行緊同一條路。

掌握新寫法嘅人，正係用 GPT Image 2 出產品、做設計、做內容。未掌握嘅人，仲喺度「幫我畫一隻貓」。

返去開頭嗰個比喻。你俾裝修師傅口頭描述同你俾裝修隊發施工圖，最終交付嘅嘢質量同精度完全唔同。工具冇變，你俾需求嘅方式變咗。

試下嗰個 JSON 模板啦。由一個最簡單嘅 UI mockup 開始。

啱啱醒起，如果你想要117個 prompt 原文，關注我後台私信: "image2"

alt text
GPT image 2 爆了，火爆的爆，爆到什麼程度？我寫這篇文章的時候它的網站/codex接口都時好時壞，連付費頁面都打不開，應該是服務器扛不住了。

我在被GPT Image 2 的各種「神圖」刷屏之後，特地去翻了一個 GitHub 倉庫。這個倉庫叫 awesome-gpt-image-2-prompts，收集了 117 條提示詞案例。我花了差不多兩天才翻完。

翻完之後有一個特別強烈的感受。

大部分人用 GPT Image 2 的方式，和在 Midjourney 上寫 prompt 沒什麼本質區別。「幫我畫一隻穿宇航服的貓」，「生成一個賽博朋克風格的城市場景」。描述需求，等它出圖。而另一撥人，已經開始用 JSON 格式寫提示詞了。

從「幫我畫一個」到「幫我做一個」

GPT Image 2 最夯的能力，是它對結構化需求的理解力。是它的對真實世界的理解，好像第一次達到了以假亂真

{
  "type": "直播 UI 樣機",
  "subject": {
    "description": "Elon Musk 的肖像，面帶微笑",
    "background": "左側顯示 SPACEX 屏幕，右側顯示 Tesla logo"
  },
  "ui_overlay": {
    "top_header": {
      "host_info": "頭像，名稱 Elon Musk，副標題 55.6萬本場點贊",
      "viewer_stats": "總計 68.7萬"
    },
    "bottom_left_chat": {
      "messages": [
        "小火箭: 馬斯克！未來可期！",
        "AI探索者: Neuralink進展如何？"
      ]
    },
    "bottom_right_product_card": {
      "title": "特斯拉Cybertruck 電動皮卡",
      "price": "¥ 1,618,000"
    }
  }
}

它直接給你出一張完整的抖音直播截圖。彈幕是你要的內容，商品卡片是你指定的商品，連點贊數和在線人數都是你在 JSON 裏寫的那串數字。

你想想看這個區別有多大。以前是描述一下「畫一個直播界面」，現在是給一份規格說明讓它「構建」一個直播界面，每個元素都按你的定義落地。你給了它結構，它按結構來拼裝。這和「我描述一下你幫我畫」的邏輯完全不同。

一句話能出什麼

JSON Prompt 是最高精度的用法。但 GPT Image 2 的理解力遠不止於此，有些案例只需要一句話，出來的東西就能讓你愣住。

有人在 X 上發了一句「生成宋朝人的朋友圈」。結果出了蘇東坡的朋友圈，頭像、用戶名、配圖、評論區全齊了。評論區裏王安石回了個「呵呵」，司馬光說「還是那個味道」。點贊列表是黃庭堅、秦觀、佛印等 126 人。狀態欄顯示「大宋移動 5G」，年份「元豐三年」。

這創意太絕了。

還有人試了「玄武門之變的朋友圈」，歷史事件變成了社交媒體信息流。

慈禧的 X 主頁也有人做出來了，頭像、簡介、推文一應俱全。

再往實用方向走。UI 設計師 @pfanis 發了一句「幫我生成一套 UI 設計系統，包含網頁、移動端、卡片、控件、按鈕以及其它」。出來了一套完整的 glassmorphism 風格設計系統。Dashboard，移動端，組件庫全有。一個人，一句話，出了一套設計師可能要花兩天做的活。

op7418 做的更硬核。用 GPT Image 2 + 字節的 Seedance 2.0 做了一個 ARPG 遊戲《金瓶梅》的動態演示，遊戲 UI 交互、畫面銜接、台詞全部 AI 生成。續作《黑神話：林沖》效果更好，他說「所有交互 UI 全都是動的，要不是塗抹感真看不出來」。還有隨手拍藍莓直接出電商宣傳圖的，原話是「一致性還原太好了，連藍莓位置都沒變，但變得更飽滿」。

我跟你說，這些案例看下來有一個很明顯的東西。大家拿 GPT Image 2 出來的成果，已經不像「畫了一張圖」，更像「做了一個產品」。朋友圈截圖是內容產品，UI 設計系統是設計產品，遊戲原型直接就是遊戲產品。你給它需求的方式變了，它給你交付的東西也變了。

三個值得說的提示詞技巧

117 個案例翻下來，有三個技巧我覺得值得單獨拎出來說。從簡單的開始。

參考圖 + 文字組合

這個可能很多人知道但沒當回事。上傳一張參考圖配合詳細文字描述，比純文字提示詞效果好一大截。品牌設計、IP 周邊這類需要保持一致性的場景，上傳參考圖幾乎是必選項。你不需要描述得多精確，但需要給 AI 一個錨點。它知道你要的「那個感覺」是什麼之後，後面的一切都變得更可控。

在 Prompt 中內嵌「研究」過程

這個是我覺得最意外的。技巧來自 @old_pgmrs_will，你可以在提示詞裏直接寫「先研究 Bauhaus 設計運動的核心理念，然後基於其幾何構圖和色彩理論，設計一套現代科技產品的品牌視覺系統」。它真的會先「研究」再出圖。

以前的 AI 圖像生成需要你自己做完設計研究再把結論餵給 AI，現在這一步直接塞進提示詞裏就完事了。查資料和出圖，兩步並一步。

JSON 結構化 Prompt

前面已經展示了完整案例，這裏不重複了。直接給你一個最小可用的模板。

class="language-json">{
  "type": "你要生成的圖像類型",
  "subject": {
    "description": "主體描述",
    "background": "背景描述"
  },
  "layout": {
    "sections": [
      {"type": "區域名稱", "elements": ["元素1", "元素2"]}
    ]
  },
  "style": "整體風格描述"
}

從這個模板開始，比寫「幫我畫一個XX」出圖精準得多。JSON 強迫你把需求想清楚，類型、主體、佈局、風格，每一項你都得更明確地定義。它本身沒有魔力，但它逼你做了一件你之前一直在偷懶不做的事，把需求想透。

說完能力，說說侷限

坦率的講，GPT Image 2 仍然有明顯短板。emollick 指出它的編輯很「固執」，改幾輪後進展變慢，開新對話有幫助。如果你在做需要反覆迭代的設計項目，這個固執會浪費你不少時間。

另外，JSON Prompt 再精確，輸出的依然是圖片，不是代碼。你不能直接拿去當前端用。它更適合做概念驗證、提案展示、內容創作。

但提示詞的寫法確實已經變了。我翻到那些 JSON prompt 的時候反應了好一會兒，因為這事兒歷史上發生過。最早的編程語言 COBOL 被設計成「像英語一樣」，大家覺得用自然語言寫代碼多方便啊。結果呢，結構化的形式語言比自然語言精確得多、可靠得多。提示詞正在走同一條路。

掌握新寫法的人，正在用 GPT Image 2 出產品、做設計、做內容。沒掌握的人，還在「幫我畫一隻貓」。

回到開頭那個類比。你給裝修師傅口頭描述和你給裝修隊發施工圖，最終交付的東西質量和精度完全不同。工具沒變，你給需求的方式變了。

試試那個 JSON 模板吧。從一個最簡單的 UI mockup 開始。

對了，如果你想要117個提示詞原文，關注我後台私信: "image2"