GPT-Image2提示詞引擎使用指南:將散文式描述轉化為結構化協議
整理版優先睇
開源項目 awesome-gpt-image-2 提供 13 套工業級模板同 350+ 案例,教你將散文式提示詞壓縮成結構化協議,實現批量、可控、可複用嘅 AI 畫圖。
呢篇文章係介紹 awesome-gpt-image-2 呢個開源項目,作者係 freestylefly。佢哋發現 GPT-Image2 全量開放之後,畫圖嘅瓶頸已經由「出唔出到圖」變咗做「點樣穩定、可控、可複用咁出圖」。傳統嗰種散文式提示詞收集方式,根本滿足唔到生產需求,所以佢哋將超過 350 個社區案例逆向工程,提煉成 13 套結構化模板,形成一套 Prompt-as-Code 資產。
整體結論係:用結構化提示詞取代散文式描述,可以大幅提升出圖嘅一致性同效率。呢篇文章詳細講解點樣用呢套系統,包括環境準備、模板使用、JSON 格式調用、每個分類嘅操作技巧,同埋點樣集成到 Agent 流水線。核心心法係「抄結構唔抄風格詞」,即係複用提示詞嘅骨架,而唔係照搬風格用詞。
呢篇文章適合需要批量出圖、搭建模板系統或者接入自動化工作流嘅開發者同工程師。唔適合單次創意探索或者高度實驗性嘅藝術表達。如果閣下已經有一定提示詞基礎,想將畫圖能力規模化,呢篇文章會係好實用嘅參考。
- 結論:awesome-gpt-image-2 將 AI 畫圖升級做工程化生產工具,提供 13 套工業級模板同 350+ 案例。
- 方法:將散文式提示詞壓縮成結構化協議,用模板填空法快速生成,支援自然語言同 JSON 雙格式。
- 差異:結構化提示詞明確比例、佈局、模塊數量等,比散文式更可控,減少試錯成本。
- 啟發:抄結構唔抄風格詞,參數化鏡頭同光影描述係提升出圖質量嘅直接方法。
- 可行動點:立即克隆項目倉庫,從 templates.md 揀選對應模板,將業務變量填入即可生成。
結構化信息圖提示詞模板
Vertical 9:16 isometric cutaway infographic "城市生命系統圖譜 / Urban Metabolism Atlas". Smart city from sky to bedrock: skyscrapers, streets, subway, utility tunnels, water/sewage/gas/heating pipes, fiber, data center, flood tanks, aquifers, geothermal wells, bedrock. Color-coded flows for power/water/data/traffic/waste. 12 numbered panels bilingual CN/EN: 能源/水循環/交通/數據/垃圾/建築/公共服務/物流/氣候韌性/生態/地質/治理看板. 24h timeline at bottom. Style: engineering white paper + scientific atlas, light paper bg, crisp lines, 8K. No cyberpunk, no gibberish text, must show both above AND below ground.
awesome-gpt-image-2 項目倉庫
GitHub 倉庫,包含 13 套工業級模板、350+ 案例及完整文檔
項目定位:從散文式到結構化協議
呢個項目嘅核心理念係將「散文式提示詞」壓縮成「結構化協議」,令到批量出圖、搭建模板系統或者接入自動化流程都變得可行。
Prompt-as-Code 資產
項目收錄咗 13 大類場景,總共超過 350 個案例,並且提煉出 13 套工業級模板。每套模板都內置咗設計規範同防坑規則,減低試錯成本。
適用對象包括 AI 產品團隊、自動化工程師、同埋想將畫圖能力工程化嘅創作者。
快速上手:三步工作流同模板填空法
作者提供咗清晰嘅三步工作流:首先喺 README 揀選輸出類型,然後去 gallery 揾相近案例學結構,最後去 templates.md 揀對應模板填入業務變量。
模板填空法
最快速嘅方式係直接複製模板,將方括號入面嘅變量替換成自己嘅內容。例如信息圖模板明確要求比例、模塊數量、中英雙語等。
Vertical 9:16 isometric cutaway infographic "城市生命系統圖譜 / Urban Metabolism Atlas".
Smart city from sky to bedrock: skyscrapers, streets, subway, utility tunnels,
water/sewage/gas/heating pipes, fiber, data center, flood tanks, aquifers,
geothermal wells, bedrock.
Color-coded flows for power/water/data/traffic/waste.
12 numbered panels bilingual CN/EN: ...
Style: engineering white paper + scientific atlas, light paper bg,
crisp lines, 8K.
No cyberpunk, no gibberish text, must show both above AND below ground.
同散文式版本相比,結構化版本明確咗比例、模塊數量、色彩編碼、雙語要求同禁止項,出圖質量明顯更可控。
先鎖定不變層,再替換可變層
核心分類操作要點
文章涵蓋 13 大類場景,以下係幾個常用分類嘅關鍵控制維度。
UI 界面生成
- 平台指定(iOS/Material Design)鎖定設計語言體系,功能點列舉 3-5 個核心卡片避免信息過載。
- 佈局約束明確導航方式同內容排列,防止模型自由發揮。
- 強制要求文字可讀,必須顯示指定中文,避免亂碼。
信息圖/圖表
- 強制指定模塊數量(例如 3-5 個或 12 個面板),避免畫面內容爆炸。
- 使用短句文案,唔好將大段正文塞進畫面。
- 對於多面板信息圖,必須喺 prompt 寫明編號體系。
商品電商主圖
- 材質關鍵詞堆疊(磨砂質感、金屬光澤)係決定高級感嘅核心。
- 燈光類型要明確(柔光箱頂光加鋭利邊緣輪廓光)。
- 促銷文案控制在 1-2 句,避免破壞畫面。
攝影寫實
- 用攝影參數代替模糊形容詞:f/1.4 代替「淺景深」,50mm 代替「半身照」。
- 加入皮膚紋理、雀斑等瑕疵描述增強真實感。
- 膠片模擬指定如 Kodak Portra 400 emulation。
最佳實踐同 Agent 集成
核心心法係「抄結構唔抄風格詞」:瀏覽案例時關注提示詞嘅骨架,例如比例約束、佈局約束、模塊數量、禁止項,而風格詞可以根據品牌自由替換。
抄結構唔抄風格詞
角色一致性係多面板生成嘅常見問題。解決方法係將「同一角色、同一服裝、同比例」寫喺 prompt 最前面,並且喺 negative prompt 排除角色變化。
角色一致性保障
Agent 集成要點:優先使用 JSON 模板格式;喺 system prompt 加禁止項模板;每次生成附加唯一標識符方便追蹤;對 JSON 做 Schema 校驗。
JSON 模板優先
呢篇文章係俾需要透過 GPT-Image2 批量出圖、搭建模板系統或者將畫圖流程接入自動化工作流嘅 AI 開發者同 Agent 工程師睇嘅。文章以 awesome-gpt-image-2 開源項目為核心,系統咁講解點樣將「散文式提示詞」壓縮成「結構化協議」,由環境準備、模板使用、JSON 格式調用、分類實戰到 Agent 集成,提供可以複製貼上嘅命令同配置示例。全篇覆蓋 13 大類 350+ 案例同 13 套工業級模板,適合已經有一定提示詞基礎、需要規模化出圖能力嘅讀者。
目錄
概述
1.1 項目背景同定位
1.2 核心特性
1.3 適合嘅讀者環境準備同安裝
2.1 前置條件
2.2 攞到項目
2.3 項目結構概覽快速上手
3.1 三步工作流
3.2 第一個結構化提示詞
3.3 模板填空法功能操作詳解
4.1 UI 同界面生成
4.2 圖表同信息可視化
4.3 海報同排版設計
4.4 商品同電商展示
4.5 品牌同標誌設計
4.6 建築同空間渲染
4.7 攝影同寫實
4.8 插畫同藝術
4.9 人物同角色設定
4.10 場景同敍事構圖
4.11 歷史同古風題材
4.12 文檔同出版物
4.13 動作分解參考表配置同定製
5.1 模板結構解析
5.2 JSON 進階模板字段參考
5.3 自定義模板嘅開發規範使用技巧同最佳實踐
6.1 抄結構唔抄風格詞
6.2 參數化嘅鏡頭同光影描述
6.3 角色一致性嘅保障策略
6.4 批量生成同系列化控制
6.5 Agent 集成要點常見問題同故障排除
7.1 文字亂碼同不可讀
7.2 畫面混亂同信息溢出
7.3 角色一致性漂移
7.4 歷史/文化錯誤實戰案例
8.1 案例一:批量生成電商主圖
8.2 案例二:Agent 驅動嘅技術信息圖流水線總結
參考文獻
1. 概述
1.1 項目背景同定位
awesome-gpt-image-2 係一個專為 GPT-Image2 構建嘅工業級提示詞引擎同模板庫。

GPT-Image2 全量開放之後,AI 畫圖嘅瓶頸從「能唔能夠出圖」轉移咗去「能唔能夠穩定、可控、可複用咁出圖」。零散嘅提示詞收集已經滿足唔到生產需求,呢個項目將 350+ 個社區案例逆向工程,提煉成 13 套結構化模板,形成一套 Prompt-as-Code 資產。
核心理念:將「散文式提示詞」壓縮成「結構化協議」。當你需要批量出圖、構建模板系統或者接入生產流程嗰陣,結構化提示詞比單純堆案例更有價值。
1.2 核心特性
原子化 Schema:將主體、光影、材質、排版呢啲視覺要素拆解成可以組合嘅獨立組件,每個組件可以獨立調參 工作流友好:提供自然語言模板同 JSON 模板兩套格式,面向 Agent、腳本同自動化系統嘅調用場景 結構化控制:透過鎖定比例、佈局、模塊數量、鏡頭語言同文字要求,提高版式同信息層級嘅可控性 防坑指南內建:每套模板附帶經過實戰驗證嘅避坑規則,減少試錯成本 覆蓋 13 大類場景:UI 界面(68)、圖表信息圖(50)、海報排版(65)、商品電商(17)、品牌標誌(16)、建築空間(25)、攝影寫實(28)、插畫藝術(24)、人物角色(12)、場景敍事(7)、歷史古風(8)、文檔出版物(7)、其他(18)
1.3 適合嘅讀者
需要批量生成一致性視覺資產嘅 AI 產品團隊 將畫圖能力接入 Agent 流水線嘅自動化工程師 希望從「手寫散文式提示詞」過渡到「工程化提示詞管理」嘅創作者 探索 Prompt-as-Code 範式嘅研究者
2. 環境準備同安裝
2.1 前置條件
一個可用嘅 GPT-Image2 訪問端點(例如 ChatGPT 入面嘅 DALL-E/GPT-Image 能力,或者對應嘅 API 接口) 基本嘅 Markdown 編輯器或代碼編輯器(用嚟瀏覽案例同編輯模板) (可選)Agent 框架環境:如果需要自動化調用,建議準備 Python 3.10+ 或 Node.js 20+ 環境 Git(用嚟克隆案例庫)
2.2 攞到項目
# 克隆項目到本地
git clone https://github.com/freestylefly/awesome-gpt-image-2.git
cd awesome-gpt-image-2克隆之後得到以下核心內容:
README.md:項目概覽、快速入口、精選案例展示 docs/templates.md:全部 13 套工業級提示詞模板同防坑指南 docs/gallery-part-1.md:案例 1-165 嘅完整提示詞同效果圖 docs/gallery-part-2.md:案例 166-351 嘅完整提示詞同效果圖 data/images/:全部案例嘅效果圖(351 張)
唔需要安裝任何依賴,所有內容係 Markdown 同圖片文件,直接用編輯器瀏覽就得。
2.3 項目結構概覽
awesome-gpt-image-2/
├── README.md # 項目首頁,精選案例與快速入口
├── LICENSE # MIT License
├── docs/
│ ├── templates.md # 13 套工業級模板 + 防坑指南
│ ├── gallery.md # 畫廊總覽與分類索引
│ ├── gallery-part-1.md # 案例 1-165 全量提示詞
│ ├── gallery-part-2.md # 案例 166-351 全量提示詞
│ └── disclaimer.md # 聲明與版權說明
└── data/
└── images/ # 351 個案例的效果圖3. 快速上手
3.1 三步工作流
項目作者提供咗清晰嘅使用路徑,三個步驟就可以完成從靈感到輸出嘅閉環:

流程執行說明:
步驟 1:先瀏覽 README 入面嘅精選案例,確定你要模仿嘅輸出類型(UI、海報、信息圖等) 步驟 2:入 gallery-part-1.md 或 gallery-part-2.md 揾相近案例,學佢哋嘅提示詞結構而唔係風格詞。然後去 templates.md 揀對應嘅通用模板或 JSON 模板 步驟 3:將你嘅業務變量填入模板,調用 GPT-Image2 生成
3.2 第一個結構化提示詞
以一個簡單信息圖為例,下面係「散文式提示詞」同「結構化提示詞」嘅對比。
散文式(唔推薦):
畫一張關於城市生命系統的信息圖,要好看,包含能源、水循環這些內容,
風格要專業一點,不要賽博朋克。結構化(推薦):
Vertical 9:16 isometric cutaway infographic "城市生命系統圖譜 / Urban Metabolism Atlas".
Smart city from sky to bedrock: skyscrapers, streets, subway, utility tunnels,
water/sewage/gas/heating pipes, fiber, data center, flood tanks, aquifers,
geothermal wells, bedrock.
Color-coded flows for power/water/data/traffic/waste.
12 numbered panels bilingual CN/EN: 能源/水循環/交通/數據/垃圾/建築/公共服務/
物流/氣候韌性/生態/地質/治理看板.
24h timeline at bottom.
Style: engineering white paper + scientific atlas, light paper bg,
crisp lines, 8K.
No cyberpunk, no gibberish text, must show both above AND below ground.區別一目瞭然:結構化版本明確咗比例(9:16)、模塊數量(12個面板)、色彩編碼規則、雙語要求、禁止項同風格錨定。
3.3 模板填空法
最快上手嘅方式係「模板填空法」——直接從 templates.md 度複製對應類別嘅模板,替換方括號入面嘅變量就得:
先明確任務類型:UI、海報、電商、信息圖、角色設定、出版物 再鎖定結構約束:比例、佈局、模塊數量、鏡頭語言、文字要求 最後補風格同材質:色彩、光線、筆觸、氛圍、材質、質感
如果係俾 Agent 或腳本調用,優先使用 JSON 格式模板(詳見第 5 節)。
4. 功能操作詳解
4.1 UI 同界面生成
常規模板結構:
為[產品類型]生成一張[平台,如 iOS/Android/Web]界面圖。
核心功能:[功能點A]、[功能點B]、[功能點C]。
視覺風格:[極簡/科技/擬物],主色[顏色],強調色[顏色]。
佈局:[頂部導航/雙欄/卡片流],信息層級清晰,留白充足。
輸出:高保真UI截圖,文字清晰可讀,比例[9:16/16:9]。關鍵控制維度:
平台指定:鎖定設計語言體系(iOS Human Interface / Material Design / Web 響應式) 功能點列舉:3-5 個核心功能卡片,避免信息過載 佈局約束:明確導航方式、內容排列方式,防止模型自由發揮 文字可讀性:強制要求「文字絕對可讀,必須顯示指定嘅中文」
JSON 格式適用於腳本調用:
{
"type": "UI Screenshot",
"platform": "iOS",
"product": "Fitness App",
"layout": "Card-based feed with bottom tab bar",
"style": {
"theme": "Dark Mode",
"primary_color": "Neon Green",
"typography": "Clean sans-serif"
},
"content": {
"header": "Today's Activity",
"cards": [
{"title": "Running", "data": "5.2 km", "button": "Start"},
{"title": "Calories", "data": "340 kcal"}
]
},
"constraints": "High fidelity, readable text, 9:16 aspect ratio"
}4.2 圖表同信息可視化

信息圖模板嘅核心係「模塊數量控制」同「文案剋制」:
生成[主題]信息圖,目標讀者為[人羣]。
結構:標題區 + [3-5]個模塊(每模塊含圖標、短標題、1-2句說明)。
圖表類型:[流程圖/對比圖/關係圖/時間線]。
風格:[專業報告/科普插畫],主色[顏色],背景[淺色/深色]。
輸出:信息層級清晰、可讀性高的中文信息圖。避坑要點:
強制指定模塊數量,避免畫面內容爆炸 圖表場景優先使用短句文案,唔好將大段正文塞入畫面 對於多面板信息圖(例如 12 或 24 面板),一定要喺 prompt 入面寫明編號體系
4.3 海報同排版設計

海報設計提供三種專用模板:
通用海報模板:
設計一張[活動/產品/電影]海報,主題為[主題詞]。
主視覺:[主體元素],標題文案:[標題],副標題:[副標題]。
版式:[居中/左對齊/對角構圖],風格:[復古/未來/極簡]。
色彩:[主色 + 輔色],氛圍:[情緒關鍵詞]。
輸出:可用於社媒傳播的高分辨率海報。運動商業 Campaign 模板:
專為運動品牌設計,額外控制要素包括:運動員姿態(坐姿/衝刺/揮拍等)、核心道具位置同比例、背景光影類型(反光地面/聚光燈)、文字排版約束。核心避坑點:先鎖定「單主視覺 / 三聯畫 / 數據塗鴉」結構再寫主體同文案。
Apple 風格自然科普海報模板:
呢個係一個高度精細化嘅模板,直接鎖定全套設計規範:純白背景、主體動物佔據 50%-70% 畫面、底部四列極簡信息欄、細豎線分隔、Apple-inspired 高級排版。呢個係模板「參數化控制」嘅典型範例——將近百個設計決策點全部硬編碼,極大降低生成嘅不確定性。
4.4 商品同電商展示
生成[商品名]電商主圖,賣點為[賣點1]、[賣點2]。
場景:[純色棚拍/生活方式場景],鏡頭:[特寫/半身/全景]。
材質細節:[材質關鍵詞],燈光:[柔光/側光/輪廓光]。
附加元素:[價格角標/賣點icon/促銷文案]。
輸出:電商平台可直接使用的商品展示圖。關鍵技巧:
材質關鍵詞堆疊(例如「磨砂質感 + 金屬光澤 + 微紋理」)係決定商品圖高級感嘅核心 燈光類型明確(柔光箱頂光 + 鋭利嘅邊緣輪廓光)能顯著提升質感 促銷文案控制在 1-2 句,避免破壞畫面
4.5 品牌同標誌設計
品牌模板強調「做減法」:
為[品牌名]設計品牌視覺方案。
品牌關鍵詞:[關鍵詞1]、[關鍵詞2]、[關鍵詞3]。
包含:Logo方向[幾何/字標/圖形]、輔助圖形、主輔色、應用示意。
風格:[現代/高級/親和],行業:[行業],受眾:[受眾]。
輸出:統一風格的品牌識別視覺圖。關鍵約束:強制純白背景方便摳圖、Logo 方向必須明確(幾何/字標/圖形)、禁止複雜插畫型 Logo。
4.6 建築同空間渲染
生成[空間類型]設計效果圖,功能定位為[用途]。
風格:[現代簡約/工業/新中式],材質:[木/石/金屬/玻璃]。
空間結構:[開敞/分區],動線:[主通道說明]。
光線:[自然採光/人工照明方案],時間:[白天/夜景]。
輸出:寫實建築空間渲染圖。核心技巧:
使用「Eye-level perspective」(人眼視角)防止透視變形 冷暖對比(室外冷光藍灰 + 室內暖光黃橙)係提升空間高級感嘅有效組合 指定渲染質量關鍵詞:「Unreal Engine 5 style」、「8K resolution」、「ray tracing」
4.7 攝影同寫實
攝影模板係「參數化提示詞」嘅最佳示例:
拍攝主題:[人物/物品/街景],場景為[地點]。
攝影參數風格:[35mm/85mm],[淺景深/深景深],[紀實/電影感]。
光線:[自然光/夜景霓虹/逆光],情緒:[情緒詞]。
細節要求:[膚質/材質/顆粒感]。
輸出:高寫實攝影風格圖像。用參數取代模糊描述係提升攝影類出圖質量嘅核心方法:
用 f/1.4代替「淺景深」用 50mm代替「半身照」加入「皮膚紋理」、「雀斑」、「輕微膠片顆粒」呢啲瑕疵描述增強真實感 膠片模擬指定: Kodak Portra 400 emulation, subtle film grain
4.8 插畫同藝術
創作[題材]插畫,主角為[角色/主體]。
畫風:[日漫/水彩/扁平/厚塗],線條:[細膩/粗獷]。
配色:[配色方案],背景:[簡潔/複雜場景]。
構圖:[近景/中景/遠景],重點表現[細節]。
輸出:可用於封面或社媒發佈的高質量插畫。避坑要點:
鎖定筆觸(例如「厚塗」、「水彩暈染」、「Cel shading」),否則模型易輸出塑料感畫風 慎用大師名字——容易導致模型原樣照搬構圖,建議提取特徵描述(例如「梵高嘅旋轉星空筆觸」)
4.9 人物同角色設定
設計[角色身份]角色設定圖。
外觀:[年齡/髮型/服飾/配件],性格:[關鍵詞]。
姿態:[站姿/動態動作],表情:[情緒]。
世界觀:[時代/陣營/職業],標誌性元素:[元素]。
輸出:角色主視圖 + 風格統一的人設圖。關鍵約束:
拆解五官(桃花眼、高鼻樑、野生眉),唔好只寫「好靚嘅女仔」 寫清服裝材質(絲綢、機能防風面料) 多面板角色表需將「同一角色、同一服裝、同比例」寫喺動作列表之前
4.10 場景同敍事構圖
敍事場景嘅核心係「讓畫面動起來」:
生成[故事主題]場景圖,發生在[時間+地點]。
主事件:[事件描述],主角:[角色],衝突點:[衝突]。
鏡頭語言:[廣角建立鏡頭/中景敍事/特寫]。
氛圍:[緊張/温暖/懸疑],色調:[冷/暖/高反差]。
輸出:具備敍事張力的場景概念圖。技巧:必須包含「動詞」類事件描述(「正在崩塌」、「啱啱點燃火把」),防止畫面變成靜態風景明信片。透過「Low angle shot」或「Dutch angle」呢啲鏡頭描述增加戲劇性。
4.11 歷史同古風題材
生成[朝代/古風設定]題材畫面,主題為[主題]。
人物:[身份/服飾/器物],場景:[宮廷/市井/山水]。
美術風格:[工筆/寫意/影視寫實],色調:[色調]。
文化細節:[紋樣/禮制/建築要素]。
輸出:歷史氛圍準確的古風題材圖。核心約束:
明確朝代(唐/宋/明),防止跨朝代元素混雜 強制添加「No modern elements」排除項,防止出現現代物品
4.12 文檔同出版物
排版類模板嘅核心係「結構優先」:
製作[文檔類型,如菜單/雜誌內頁/報紙版式]。
版面結構:[欄數/頁邊距/標題層級]。
內容模塊:[封面區/正文區/圖表區/腳註]。
字體風格:[襯線/無襯線],配色:[配色方案]。
輸出:可讀性強、版式規範的出版物視覺稿。重要提示:正文區使用「Simulated text blocks」佔位,只寫死大標題,唔好指望模型排出一整頁冇錯字嘅正文。
4.13 動作分解參考表
呢個係近期社區新增嘅一個精細化模板類型,用嚟生成角色動作分解參考圖:
生成一張[角色/人物]動作分解參考表。
風格:[黑白線稿/3D 灰階/漫畫分鏡/教學圖],背景純淨,技術參考圖氣質。
版式:4×4 網格,共 16 個等尺寸面板,細線分隔,每格左上角編號 1-16。
角色一致性:所有面板使用同一角色,保持臉型、服裝、比例和髮型一致。
每格結構:
- 頂部:動作標題
- 中央:完整身體動作姿態
- 底部:3-4 行動作說明
- 疊加:方向箭頭、旋轉箭頭或運動軌跡線
動作序列:[從基礎站姿到結束動作的完整步驟]
約束:不要複雜背景,不要新增角色,不要彩色干擾,不要改變角色身份。5. 配置同定製
5.1 模板結構解析
呢個項目每套模板由四個固定部份組成:
生成[商品名]電商主圖,賣點為[賣點1]、[賣點2] | ||
{"type": "E-commerce Hero Image", ...} | ||
"constraints": "High fidelity, readable text" | ||
5.2 JSON 進階模板字段參考
JSON 模板遵循統一嘅 Schema 結構,以下係核心字段說明:
頂層字段:
type:任務類型,對應 13 個分類之一(例如「UI Screenshot」、「Infographic」、「Movie Poster」)product/topic/theme:生成對象嘅核心標識platform/audience:目標平台或受眾layout/structure:佈局同結構約束style:視覺風格對象,包含 theme、primary_color、typography、aesthetic 等子字段content:內容模塊定義,通常為對象或數組constraints:質量約束,字符串或對象格式camera_specs(攝影類):鏡頭參數,包含 gear、aperture、lighting、film_aesthetic
常用 style 子字段:
theme:主題模式(Dark Mode / Light Mode)primary_color/palette/color_palette:色彩方案typography:字體風格描述aesthetic:審美風格關鍵詞background:背景說明
環境同鏡頭字段(建築/攝影類):
environment:環境描述camera:鏡頭角度(angle)、光照(lighting)render_quality:渲染質量標準setting:場景設置
5.3 自定義模板嘅開發規範
當你需要為新嘅場景類型創建自定義模板嗰陣,遵循以下規範:
一開頭就寫「任務目標同用途」,讓模型建立全局上下文 結構約束(比例、佈局、模塊數量)放喺風格描述之前 所有佔位變量使用方括號包裹(例如 [產品類型])喺模板末尾添加禁止項清單(constraints / negative) 為 Agent 調用場景同步提供 JSON 版本 建議要求「一次生成主方案 + 備選方案」,方便揀選
自定義 JSON 模板示例:
{
"type": "Custom Generation",
"objective": "Generate [Specific content]",
"inputs": {
"subject": "[Main subject details]",
"scene": "[Background and context]",
"style": "[Artistic/Visual style]",
"palette": "[Color scheme]"
},
"quality_constraints": {
"resolution": "8k, hyper-detailed",
"aspect_ratio": "[e.g., 16:9]",
"composition": "[e.g., Rule of thirds]"
},
"output_requirements": {
"usage": "[Intended use case]",
"focus": "[Key element to highlight]"
}
}6. 使用技巧同最佳實踐
6.1 抄結構唔抄風格詞
瀏覽案例嗰陣,關注嘅係提示詞嘅「骨架」而唔係「皮相」:
結構骨架:比例約束 → 佈局約束 → 模塊數量 → 內容分區 → 禁止項 風格皮相:色彩、氛圍、筆觸等主觀描述
風格詞需要根據你嘅品牌同場景替換,但結構骨架可以直接複用。
6.2 參數化嘅鏡頭同光影描述
用攝影參數代替模糊形容詞,係提升出圖質量最直接嘅方法:
6.3 角色一致性嘅保障策略
多面板或系列圖入面保持角色一致性嘅方法:
將「同一角色、同一服裝、同比例」約束寫喺成個 prompt 嘅最前面 明確角色嘅不可變特徵:臉型、五官比例、髮型、身高、體型 使用編號體系錨定每個面板嘅角色位置 喺 negative prompt 入面排除「角色變化、換臉、服裝不一致」
6.4 批量生成同系列化控制
批量生產場景(例如電商多 SKU、系列海報)嘅建議流程:

核心原則:先鎖定「不變層」(風格系統、比例、版式骨架),再喺「可變層」(具體內容、標題、賣點文案)度逐個替換。
6.5 Agent 集成要點
將提示詞模板集成到 Agent 工作流嗰陣嘅關鍵考慮:
優先使用 JSON 模板格式,方便 Agent 解析同變量替換 喺 Agent 嘅 system prompt 入面添加禁止項模板(例如「No cyberpunk, no gibberish text」) 為每次生成附加唯一標識符(例如 session_id + case_id),方便追蹤同 A/B 測試 對 JSON 模板做 Schema 校驗,確保所有必填字段喺調用前已經填充 批量場景下,喺 Agent 層面實現速率控制同重試邏輯
7. 常見問題同故障排除
7.1 文字亂碼同不可讀
問題:生成嘅圖片入面文字顯示為亂碼、火星文或者根本無法辨認。
原因:冇喺 prompt 入面強制指定文字內容嘅精確文本同可讀性要求。
解決方案:
所有需要顯示嘅文字必須硬編碼喺 prompt 入面,唔好只講「顯示標題」 添加約束:「文字絕對可讀,必須顯示指定嘅中文,no gibberish text」 對於複雜排版,使用「Simulated text blocks」佔位正文,只寫死標題
7.2 畫面混亂同信息溢出
問題:信息圖或海報畫面混亂,內容過多冇曬重點。
原因:冇指定模塊數量同信息密度。
解決方案:
強制指定模塊數量(例如「3-5 個模塊」或「12 numbered panels」) 使用短句而唔係段落作為信息單元 添加留白約束:「信息層級清晰,留白充足」 喺 negative prompt 入面排除雜亂元素
7.3 角色一致性漂移
問題:多面板或多圖系列入面,同一角色嘅外貌唔一致。
原因:模型喺多步驟生成入面逐步偏離初始形象。
解決方案:
將角色不變特徵寫喺成個 prompt 最前面 添加一致性約束:「所有面板使用同一角色,保持臉型、服裝、比例同髮型一致」 喺 negative prompt 入面排除「角色變化、換臉、服裝不一致」
7.4 歷史/文化錯誤
問題:古風或歷史題材畫面入面出現跨朝代或跨文化嘅元素混亂。
原因:冇鎖定具體朝代同文化參照系。
解決方案:
明確指定朝代(例如「唐代」、「宋朝」) 添加文化元素約束:「Accurate Tang architecture, historically accurate clothing structure」 喺 negative prompt 入面強制排除現代元素:「No modern elements, no anachronistic objects」
8. 實戰案例
8.1 案例一:批量生成電商主圖
場景:某電商團隊需要為 20 款耳機產品生成統一風格嘅電商主圖。
步驟:
從 templates.md 入面揀選「商品同電商」JSON 模板 鎖定不變層:純色棚拍背景、柔光箱頂光 + 輪廓光、3/4 側面角度、磨砂質感材質描述 準備變量數據(JSON 數組):每款產品嘅名稱、配色、賣點文案、價格 編寫腳本逐條調用
鎖定後嘅基礎模板:
{
"type": "E-commerce Hero Image",
"product": {
"name": "{{product_name}}",
"material": "Matte finish with metallic accents",
"angle": "3/4 profile, floating slightly"
},
"setting": {
"background": "Minimalist studio setup, soft gray gradient",
"lighting": "Softbox overhead, sharp rim light on edges"
},
"copywriting": {
"badges": ["NEW", "{{price}}"],
"slogan": "{{slogan}}"
},
"constraints": "Commercial photography quality, hyper-realistic textures, consistent lighting"
}其中 {{product_name}}、{{price}}、{{slogan}} 為每款產品嘅變量字段。
效果驗證: 20 款產品嘅出圖喺光影方向、背景色調、產品比例同材質風格上保持一致,可以直接用嚟電商平台上架。
8.2 案例二:Agent 驅動嘅技術信息圖流水線
場景:一個技術文檔團隊需要將多篇技術文章自動轉換為統一風格嘅 RAG 架構信息圖。
方案設計:

步驟分解:
Agent 接收技術文章 URL,提取標題、核心概念同流程步驟 將提取嘅內容映射到信息圖模板嘅 module 數組入面 自動設置約束條件: 模塊數量 = 提取嘅概念數量(3-5 個) 中英雙語標籤 專業報告風格 + 淺色紙張背景 禁止賽博朋克風格同亂碼文字 調用 GPT-Image2 生成,記錄 session_id 交付結果,人工複核後可以發佈
關鍵約束: 喺 Agent 嘅 system prompt 入面預設禁止項模板,確保每次調用都自動排除賽博朋克風格、亂碼文字同模塊數量溢出。
9. 總結
awesome-gpt-image-2 嘅核心價值在於將 AI 畫圖從「個人創意工具」升級為「工程化生產工具」:
350+ 個逆向工程案例覆蓋咗從 UI 界面到古風插畫嘅全場景 13 套工業級模板提供咗開箱即用嘅提示詞骨架,每套內置防坑規則 自然語言 + JSON 雙格式支持,兼顧人工使用同 Agent/腳本調用 適合需要批量化、標準化輸出嘅生產場景
適用場景:批量電商圖、系列海報、技術信息圖流水線、Agent 驅動嘅自動化畫圖。
唔適用場景:單次創意探索、高度實驗性嘅藝術表達、唔需要複用嘅個人創作。
學習資源:
項目倉庫:github.com/freestylefly/awesome-gpt-image-2 模板文件:docs/templates.md 案例畫廊 Part 1:docs/gallery-part-1.md 案例畫廊 Part 2:docs/gallery-part-2.md
參考文獻
[1] awesome-gpt-image-2 項目倉庫: https://github.com/freestylefly/awesome-gpt-image-2
[2] 工業級提示詞模板同防坑指南: https://github.com/freestylefly/awesome-gpt-image-2/blob/main/docs/templates.md
[3] 魔法畫廊 Part 1(案例 1-165): https://github.com/freestylefly/awesome-gpt-image-2/blob/main/docs/gallery-part-1.md
[4] 魔法畫廊 Part 2(案例 166-351): https://github.com/freestylefly/awesome-gpt-image-2/blob/main/docs/gallery-part-2.md
[5] GPT-Image2 官方文檔: https://platform.openai.com/docs/guides/images
本文面向需要通過 GPT-Image2 批量出圖、搭建模板系統或將畫圖流程接入自動化工作流的 AI 開發者和 Agent 工程師。文章以 awesome-gpt-image-2 開源項目為核心,系統講解如何將"散文式提示詞"壓縮為"結構化協議",從環境準備、模板使用、JSON 格式調用、分類實戰到 Agent 集成,提供可複製粘貼的命令和配置示例。全文覆蓋 13 大類 350+ 案例和 13 套工業級模板,適合已有一定提示詞基礎、需要規模化出圖能力的讀者。
目錄
概述
1.1 項目背景與定位
1.2 核心特性
1.3 適用受眾環境準備與安裝
2.1 前置條件
2.2 獲取項目
2.3 項目結構總覽快速上手
3.1 三步工作流
3.2 第一個結構化提示詞
3.3 模板填空法功能操作詳解
4.1 UI 與界面生成
4.2 圖表與信息可視化
4.3 海報與排版設計
4.4 商品與電商展示
4.5 品牌與標誌設計
4.6 建築與空間渲染
4.7 攝影與寫實
4.8 插畫與藝術
4.9 人物與角色設定
4.10 場景與敍事構圖
4.11 歷史與古風題材
4.12 文檔與出版物
4.13 動作分解參考表配置與定製
5.1 模板結構解析
5.2 JSON 進階模板字段參考
5.3 自定義模板的開發規範使用技巧與最佳實踐
6.1 抄結構不抄風格詞
6.2 參數化的鏡頭與光影描述
6.3 角色一致性的保障策略
6.4 批量生成與系列化控制
6.5 Agent 集成要點常見問題與故障排除
7.1 文字亂碼與不可讀
7.2 畫面混亂和信息溢出
7.3 角色一致性漂移
7.4 歷史/文化錯誤實戰案例
8.1 案例一:批量生成電商主圖
8.2 案例二:Agent 驅動的技術信息圖流水線總結
參考文獻
1. 概述
1.1 項目背景與定位
awesome-gpt-image-2 是一個專為 GPT-Image2 構建的工業級提示詞引擎與模板庫。

GPT-Image2 全量開放後,AI 畫圖的瓶頸從"能不能出圖"轉移到了"能不能穩定、可控、可複用地出圖"。零散的提示詞收集已經不能滿足生產需求,該項目將 350+ 個社區案例逆向工程,提煉為 13 套結構化模板,形成一套 Prompt-as-Code 資產。
核心理念:把"散文式提示詞"壓縮成"結構化協議"。當你需要批量出圖、構建模板系統或接入生產流程時,結構化提示詞比單純堆案例更有價值。
1.2 核心特性
原子化 Schema:把主體、光影、材質、排版等視覺要素拆解為可組合的獨立組件,每個組件可獨立調參 工作流友好:提供自然語言模板和 JSON 模板兩套格式,面向 Agent、腳本和自動化系統的調用場景 結構化控制:通過鎖定比例、佈局、模塊數量、鏡頭語言和文字要求,提高版式和信息層級的可控性 防坑指南內建:每套模板附帶經過實戰驗證的避坑規則,減少試錯成本 覆蓋 13 大類場景:UI 界面(68)、圖表信息圖(50)、海報排版(65)、商品電商(17)、品牌標誌(16)、建築空間(25)、攝影寫實(28)、插畫藝術(24)、人物角色(12)、場景敍事(7)、歷史古風(8)、文檔出版物(7)、其他(18)
1.3 適用受眾
需要批量生成一致性視覺資產的 AI 產品團隊 將畫圖能力接入 Agent 流水線的自動化工程師 希望從"手寫散文式提示詞"過渡到"工程化提示詞管理"的創作者 探索 Prompt-as-Code 範式的研究者
2. 環境準備與安裝
2.1 前置條件
一個可用的 GPT-Image2 訪問端點(如 ChatGPT 中的 DALL-E/GPT-Image 能力,或對應的 API 接口) 基本的 Markdown 編輯器或代碼編輯器(用於瀏覽案例和編輯模板) (可選)Agent 框架環境:如需自動化調用,建議準備 Python 3.10+ 或 Node.js 20+ 環境 Git(用於克隆案例庫)
2.2 獲取項目
# 克隆項目到本地
git clone https://github.com/freestylefly/awesome-gpt-image-2.git
cd awesome-gpt-image-2克隆後得到以下核心內容:
README.md:項目概覽、快速入口、精選案例展示 docs/templates.md:全部 13 套工業級提示詞模板與防坑指南 docs/gallery-part-1.md:案例 1-165 的完整提示詞與效果圖 docs/gallery-part-2.md:案例 166-351 的完整提示詞與效果圖 data/images/:全部案例的效果圖(351 張)
無需安裝任何依賴,所有內容為 Markdown 和圖片文件,直接用編輯器瀏覽即可。
2.3 項目結構總覽
awesome-gpt-image-2/
├── README.md # 項目首頁,精選案例與快速入口
├── LICENSE # MIT License
├── docs/
│ ├── templates.md # 13 套工業級模板 + 防坑指南
│ ├── gallery.md # 畫廊總覽與分類索引
│ ├── gallery-part-1.md # 案例 1-165 全量提示詞
│ ├── gallery-part-2.md # 案例 166-351 全量提示詞
│ └── disclaimer.md # 聲明與版權說明
└── data/
└── images/ # 351 個案例的效果圖3. 快速上手
3.1 三步工作流
項目作者提供了清晰的使用路徑,三個步驟即可完成從靈感到輸出的閉環:

流程執行說明:
步驟 1:先瀏覽 README 中的精選案例,確定你要模仿的輸出類型(UI、海報、信息圖等) 步驟 2:進入 gallery-part-1.md 或 gallery-part-2.md 找到相近案例,學習其提示詞結構而非風格詞。然後到 templates.md 中選取對應的通用模板或 JSON 模板 步驟 3:將你的業務變量填入模板,調用 GPT-Image2 生成
3.2 第一個結構化提示詞
以一個簡單信息圖為例,下面是"散文式提示詞"與"結構化提示詞"的對比。
散文式(不推薦):
畫一張關於城市生命系統的信息圖,要好看,包含能源、水循環這些內容,
風格要專業一點,不要賽博朋克。結構化(推薦):
Vertical 9:16 isometric cutaway infographic "城市生命系統圖譜 / Urban Metabolism Atlas".
Smart city from sky to bedrock: skyscrapers, streets, subway, utility tunnels,
water/sewage/gas/heating pipes, fiber, data center, flood tanks, aquifers,
geothermal wells, bedrock.
Color-coded flows for power/water/data/traffic/waste.
12 numbered panels bilingual CN/EN: 能源/水循環/交通/數據/垃圾/建築/公共服務/
物流/氣候韌性/生態/地質/治理看板.
24h timeline at bottom.
Style: engineering white paper + scientific atlas, light paper bg,
crisp lines, 8K.
No cyberpunk, no gibberish text, must show both above AND below ground.區別一目瞭然:結構化版本明確了比例(9:16)、模塊數量(12個面板)、色彩編碼規則、雙語要求、禁止項和風格錨定。
3.3 模板填空法
最快速上手的方式是"模板填空法"——直接從 templates.md 中複製對應類別的模板,替換方括號中的變量即可:
先明確任務類型:UI、海報、電商、信息圖、角色設定、出版物 再鎖定結構約束:比例、佈局、模塊數量、鏡頭語言、文字要求 最後補風格和材質:色彩、光線、筆觸、氛圍、材質、質感
如果是給 Agent 或腳本調用,優先使用 JSON 格式模板(詳見第 5 節)。
4. 功能操作詳解
4.1 UI 與界面生成
常規模板結構:
為[產品類型]生成一張[平台,如 iOS/Android/Web]界面圖。
核心功能:[功能點A]、[功能點B]、[功能點C]。
視覺風格:[極簡/科技/擬物],主色[顏色],強調色[顏色]。
佈局:[頂部導航/雙欄/卡片流],信息層級清晰,留白充足。
輸出:高保真UI截圖,文字清晰可讀,比例[9:16/16:9]。關鍵控制維度:
平台指定:鎖定設計語言體系(iOS Human Interface / Material Design / Web 響應式) 功能點列舉:3-5 個核心功能卡片,避免信息過載 佈局約束:明確導航方式、內容排列方式,防止模型自由發揮 文字可讀性:強制要求"文字絕對可讀,必須顯示指定的中文"
JSON 格式適用於腳本調用:
{
"type": "UI Screenshot",
"platform": "iOS",
"product": "Fitness App",
"layout": "Card-based feed with bottom tab bar",
"style": {
"theme": "Dark Mode",
"primary_color": "Neon Green",
"typography": "Clean sans-serif"
},
"content": {
"header": "Today's Activity",
"cards": [
{"title": "Running", "data": "5.2 km", "button": "Start"},
{"title": "Calories", "data": "340 kcal"}
]
},
"constraints": "High fidelity, readable text, 9:16 aspect ratio"
}4.2 圖表與信息可視化

信息圖模板的核心是"模塊數量控制"和"文案剋制":
生成[主題]信息圖,目標讀者為[人羣]。
結構:標題區 + [3-5]個模塊(每模塊含圖標、短標題、1-2句說明)。
圖表類型:[流程圖/對比圖/關係圖/時間線]。
風格:[專業報告/科普插畫],主色[顏色],背景[淺色/深色]。
輸出:信息層級清晰、可讀性高的中文信息圖。避坑要點:
強制指定模塊數量,避免畫面內容爆炸 圖表場景優先使用短句文案,不要把大段正文塞進畫面 對於多面板信息圖(如 12 或 24 面板),必須在 prompt 中寫明編號體系
4.3 海報與排版設計

海報設計提供三種專用模板:
通用海報模板:
設計一張[活動/產品/電影]海報,主題為[主題詞]。
主視覺:[主體元素],標題文案:[標題],副標題:[副標題]。
版式:[居中/左對齊/對角構圖],風格:[復古/未來/極簡]。
色彩:[主色 + 輔色],氛圍:[情緒關鍵詞]。
輸出:可用於社媒傳播的高分辨率海報。運動商業 Campaign 模板:
專為運動品牌設計,額外控制要素包括:運動員姿態(坐姿/衝刺/揮拍等)、核心道具位置與比例、背景光影類型(反光地面/聚光燈)、文字排版約束。核心避坑點:先鎖定"單主視覺 / 三聯畫 / 數據塗鴉"結構再寫主體和文案。
Apple 風格自然科普海報模板:
這是一個高度精細化的模板,直接鎖定全套設計規範:純白背景、主體動物佔據 50%-70% 畫面、底部四列極簡信息欄、細豎線分隔、Apple-inspired 高級排版。這是模板"參數化控制"的典型範例——將近百個設計決策點全部硬編碼,極大降低生成的不確定性。
4.4 商品與電商展示
生成[商品名]電商主圖,賣點為[賣點1]、[賣點2]。
場景:[純色棚拍/生活方式場景],鏡頭:[特寫/半身/全景]。
材質細節:[材質關鍵詞],燈光:[柔光/側光/輪廓光]。
附加元素:[價格角標/賣點icon/促銷文案]。
輸出:電商平台可直接使用的商品展示圖。關鍵技巧:
材質關鍵詞堆疊(如"磨砂質感 + 金屬光澤 + 微紋理")是決定商品圖高級感的核心 燈光類型明確(柔光箱頂光 + 鋭利的邊緣輪廓光)能顯著提升質感 促銷文案控制在 1-2 句,避免破壞畫面
4.5 品牌與標誌設計
品牌模板強調"做減法":
為[品牌名]設計品牌視覺方案。
品牌關鍵詞:[關鍵詞1]、[關鍵詞2]、[關鍵詞3]。
包含:Logo方向[幾何/字標/圖形]、輔助圖形、主輔色、應用示意。
風格:[現代/高級/親和],行業:[行業],受眾:[受眾]。
輸出:統一風格的品牌識別視覺圖。關鍵約束:強制純白背景方便摳圖、Logo 方向必須明確(幾何/字標/圖形)、禁止複雜插畫型 Logo。
4.6 建築與空間渲染
生成[空間類型]設計效果圖,功能定位為[用途]。
風格:[現代簡約/工業/新中式],材質:[木/石/金屬/玻璃]。
空間結構:[開敞/分區],動線:[主通道說明]。
光線:[自然採光/人工照明方案],時間:[白天/夜景]。
輸出:寫實建築空間渲染圖。核心技巧:
使用"Eye-level perspective"(人眼視角)防止透視變形 冷暖對比(室外冷光藍灰 + 室內暖光黃橙)是提升空間高級感的有效組合 指定渲染質量關鍵詞:"Unreal Engine 5 style"、"8K resolution"、"ray tracing"
4.7 攝影與寫實
攝影模板是"參數化提示詞"的最佳示例:
拍攝主題:[人物/物品/街景],場景為[地點]。
攝影參數風格:[35mm/85mm],[淺景深/深景深],[紀實/電影感]。
光線:[自然光/夜景霓虹/逆光],情緒:[情緒詞]。
細節要求:[膚質/材質/顆粒感]。
輸出:高寫實攝影風格圖像。用參數取代模糊描述是提升攝影類出圖質量的核心方法:
用 f/1.4代替"淺景深"用 50mm代替"半身照"加入"皮膚紋理"、"雀斑"、"輕微膠片顆粒"等瑕疵描述增強真實感 膠片模擬指定: Kodak Portra 400 emulation, subtle film grain
4.8 插畫與藝術
創作[題材]插畫,主角為[角色/主體]。
畫風:[日漫/水彩/扁平/厚塗],線條:[細膩/粗獷]。
配色:[配色方案],背景:[簡潔/複雜場景]。
構圖:[近景/中景/遠景],重點表現[細節]。
輸出:可用於封面或社媒發佈的高質量插畫。避坑要點:
鎖定筆觸(如"厚塗"、"水彩暈染"、"Cel shading"),否則模型易輸出塑料感畫風 慎用大師名字——容易導致模型原樣照搬構圖,建議提取特徵描述(如"梵高的旋轉星空筆觸")
4.9 人物與角色設定
設計[角色身份]角色設定圖。
外觀:[年齡/髮型/服飾/配件],性格:[關鍵詞]。
姿態:[站姿/動態動作],表情:[情緒]。
世界觀:[時代/陣營/職業],標誌性元素:[元素]。
輸出:角色主視圖 + 風格統一的人設圖。關鍵約束:
拆解五官(桃花眼、高鼻樑、野生眉),不要只寫"很美的女孩" 寫清服裝材質(絲綢、機能防風面料) 多面板角色表需將"同一角色、同一服裝、同比例"寫在動作列表之前
4.10 場景與敍事構圖
敍事場景的核心是"讓畫面動起來":
生成[故事主題]場景圖,發生在[時間+地點]。
主事件:[事件描述],主角:[角色],衝突點:[衝突]。
鏡頭語言:[廣角建立鏡頭/中景敍事/特寫]。
氛圍:[緊張/温暖/懸疑],色調:[冷/暖/高反差]。
輸出:具備敍事張力的場景概念圖。技巧:必須包含"動詞"類事件描述("正在崩塌"、"剛點燃火把"),防止畫面變成靜態風景明信片。通過"Low angle shot"或"Dutch angle"等鏡頭描述增加戲劇性。
4.11 歷史與古風題材
生成[朝代/古風設定]題材畫面,主題為[主題]。
人物:[身份/服飾/器物],場景:[宮廷/市井/山水]。
美術風格:[工筆/寫意/影視寫實],色調:[色調]。
文化細節:[紋樣/禮制/建築要素]。
輸出:歷史氛圍準確的古風題材圖。核心約束:
明確朝代(唐/宋/明),防止跨朝代元素混雜 強制添加"No modern elements"排除項,防止出現現代物品
4.12 文檔與出版物
排版類模板的核心是"結構優先":
製作[文檔類型,如菜單/雜誌內頁/報紙版式]。
版面結構:[欄數/頁邊距/標題層級]。
內容模塊:[封面區/正文區/圖表區/腳註]。
字體風格:[襯線/無襯線],配色:[配色方案]。
輸出:可讀性強、版式規範的出版物視覺稿。重要提示:正文區使用"Simulated text blocks"佔位,只寫死大標題,不要指望模型排出一整頁無錯字的正文。
4.13 動作分解參考表
這是近期社區新增的一個精細化模板類型,用於生成角色動作分解參考圖:
生成一張[角色/人物]動作分解參考表。
風格:[黑白線稿/3D 灰階/漫畫分鏡/教學圖],背景純淨,技術參考圖氣質。
版式:4×4 網格,共 16 個等尺寸面板,細線分隔,每格左上角編號 1-16。
角色一致性:所有面板使用同一角色,保持臉型、服裝、比例和髮型一致。
每格結構:
- 頂部:動作標題
- 中央:完整身體動作姿態
- 底部:3-4 行動作說明
- 疊加:方向箭頭、旋轉箭頭或運動軌跡線
動作序列:[從基礎站姿到結束動作的完整步驟]
約束:不要複雜背景,不要新增角色,不要彩色干擾,不要改變角色身份。5. 配置與定製
5.1 模板結構解析
該項目每套模板由四個固定部分組成:
生成[商品名]電商主圖,賣點為[賣點1]、[賣點2] | ||
{"type": "E-commerce Hero Image", ...} | ||
"constraints": "High fidelity, readable text" | ||
5.2 JSON 進階模板字段參考
JSON 模板遵循統一的 Schema 結構,以下是核心字段說明:
頂層字段:
type:任務類型,對應 13 個分類之一(如 "UI Screenshot"、"Infographic"、"Movie Poster")product/topic/theme:生成對象的核心標識platform/audience:目標平台或受眾layout/structure:佈局和結構約束style:視覺風格對象,包含 theme、primary_color、typography、aesthetic 等子字段content:內容模塊定義,通常為對象或數組constraints:質量約束,字符串或對象格式camera_specs(攝影類):鏡頭參數,包含 gear、aperture、lighting、film_aesthetic
常用 style 子字段:
theme:主題模式(Dark Mode / Light Mode)primary_color/palette/color_palette:色彩方案typography:字體風格描述aesthetic:審美風格關鍵詞background:背景說明
環境與鏡頭字段(建築/攝影類):
environment:環境描述camera:鏡頭角度(angle)、光照(lighting)render_quality:渲染質量標準setting:場景設置
5.3 自定義模板的開發規範
當你需要為新的場景類型創建自定義模板時,遵循以下規範:
一上來先寫"任務目標和用途",讓模型建立全局上下文 結構約束(比例、佈局、模塊數量)放在風格描述之前 所有佔位變量使用方括號包裹(如 [產品類型])在模板末尾添加禁止項清單(constraints / negative) 為 Agent 調用場景同步提供 JSON 版本 建議要求"一次生成主方案 + 備選方案",方便挑選
自定義 JSON 模板示例:
{
"type": "Custom Generation",
"objective": "Generate [Specific content]",
"inputs": {
"subject": "[Main subject details]",
"scene": "[Background and context]",
"style": "[Artistic/Visual style]",
"palette": "[Color scheme]"
},
"quality_constraints": {
"resolution": "8k, hyper-detailed",
"aspect_ratio": "[e.g., 16:9]",
"composition": "[e.g., Rule of thirds]"
},
"output_requirements": {
"usage": "[Intended use case]",
"focus": "[Key element to highlight]"
}
}6. 使用技巧與最佳實踐
6.1 抄結構不抄風格詞
瀏覽案例時,關注的是提示詞的"骨架"而非"皮相":
結構骨架:比例約束 → 佈局約束 → 模塊數量 → 內容分區 → 禁止項 風格皮相:色彩、氛圍、筆觸等主觀描述
風格詞需要根據你的品牌和場景替換,但結構骨架可以直接複用。
6.2 參數化的鏡頭與光影描述
用攝影參數代替模糊形容詞,是提升出圖質量最直接的方法:
6.3 角色一致性的保障策略
多面板或系列圖中保持角色一致性的方法:
將"同一角色、同一服裝、同比例"約束寫在整個 prompt 的最前面 明確角色的不可變特徵:臉型、五官比例、髮型、身高、體型 使用編號體系錨定每個面板的角色位置 在 negative prompt 中排除"角色變化、換臉、服裝不一致"
6.4 批量生成與系列化控制
批量生產場景(如電商多 SKU、系列海報)的建議流程:

核心原則:先鎖定"不變層"(風格系統、比例、版式骨架),再在"可變層"(具體內容、標題、賣點文案)中逐個替換。
6.5 Agent 集成要點
將提示詞模板集成到 Agent 工作流時的關鍵考慮:
優先使用 JSON 模板格式,方便 Agent 解析和變量替換 在 Agent 的 system prompt 中添加禁止項模板(如"No cyberpunk, no gibberish text") 為每次生成附加唯一標識符(如 session_id + case_id),方便追蹤和 A/B 測試 對 JSON 模板做 Schema 校驗,確保所有必填字段在調用前已填充 批量場景下,在 Agent 層面實現速率控制和重試邏輯
7. 常見問題與故障排除
7.1 文字亂碼與不可讀
問題:生成的圖片中文字顯示為亂碼、火星文或根本無法辨認。
原因:未在 prompt 中強制指定文字內容的精確文本和可讀性要求。
解決方案:
所有需要顯示的文字必須硬編碼在 prompt 中,不要只說"顯示標題" 添加約束:"文字絕對可讀,必須顯示指定的中文,no gibberish text" 對於複雜排版,使用"Simulated text blocks"佔位正文,只寫死標題
7.2 畫面混亂和信息溢出
問題:信息圖或海報畫面混亂,內容過多毫無重點。
原因:未指定模塊數量和信息密度。
解決方案:
強制指定模塊數量(如"3-5 個模塊"或"12 numbered panels") 使用短句而非段落作為信息單元 添加留白約束:"信息層級清晰,留白充足" 在 negative prompt 中排除雜亂元素
7.3 角色一致性漂移
問題:多面板或多圖系列中,同一角色的外貌不一致。
原因:模型在多步驟生成中逐步偏離初始形象。
解決方案:
將角色不變特徵寫在整個 prompt 最前面 添加一致性約束:"所有面板使用同一角色,保持臉型、服裝、比例和髮型一致" 在 negative prompt 中排除"角色變化、換臉、服裝不一致"
7.4 歷史/文化錯誤
問題:古風或歷史題材畫面中出現跨朝代或跨文化的元素混亂。
原因:未鎖定具體朝代和文化參照系。
解決方案:
明確指定朝代(如"唐代"、"宋朝") 添加文化元素約束:"Accurate Tang architecture, historically accurate clothing structure" 在 negative prompt 中強制排除現代元素:"No modern elements, no anachronistic objects"
8. 實戰案例
8.1 案例一:批量生成電商主圖
場景:某電商團隊需要為 20 款耳機產品生成統一風格的電商主圖。
步驟:
從 templates.md 中選取"商品與電商"JSON 模板 鎖定不變層:純色棚拍背景、柔光箱頂光 + 輪廓光、3/4 側面角度、磨砂質感材質描述 準備變量數據(JSON 數組):每款產品的名稱、配色、賣點文案、價格 編寫腳本逐條調用
鎖定後的基礎模板:
{
"type": "E-commerce Hero Image",
"product": {
"name": "{{product_name}}",
"material": "Matte finish with metallic accents",
"angle": "3/4 profile, floating slightly"
},
"setting": {
"background": "Minimalist studio setup, soft gray gradient",
"lighting": "Softbox overhead, sharp rim light on edges"
},
"copywriting": {
"badges": ["NEW", "{{price}}"],
"slogan": "{{slogan}}"
},
"constraints": "Commercial photography quality, hyper-realistic textures, consistent lighting"
}其中 {{product_name}}、{{price}}、{{slogan}} 為每款產品的變量字段。
效果驗證: 20 款產品的出圖在光影方向、背景色調、產品比例和材質風格上保持一致,可直接用於電商平台上架。
8.2 案例二:Agent 驅動的技術信息圖流水線
場景:一個技術文檔團隊需要將多篇技術文章自動轉換為統一風格的 RAG 架構信息圖。
方案設計:

步驟分解:
Agent 接收技術文章 URL,提取標題、核心概念和流程步驟 將提取的內容映射到信息圖模板的 module 數組中 自動設置約束條件: 模塊數量 = 提取的概念數量(3-5 個) 中英雙語標籤 專業報告風格 + 淺色紙張背景 禁止賽博朋克風格和亂碼文字 調用 GPT-Image2 生成,記錄 session_id 交付結果,人工複核後可發佈
關鍵約束: 在 Agent 的 system prompt 中預設禁止項模板,確保每次調用都自動排除賽博朋克風格、亂碼文字和模塊數量溢出。
9. 總結
awesome-gpt-image-2 的核心價值在於將 AI 畫圖從"個人創意工具"升級為"工程化生產工具":
350+ 個逆向工程案例覆蓋了從 UI 界面到古風插畫的全場景 13 套工業級模板提供了開箱即用的提示詞骨架,每套內置防坑規則 自然語言 + JSON 雙格式支持,兼顧人工使用和 Agent/腳本調用 適合需要批量化、標準化輸出的生產場景
適用場景:批量電商圖、系列海報、技術信息圖流水線、Agent 驅動的自動化畫圖。
不適用場景:單次創意探索、高度實驗性的藝術表達、不需要複用的個人創作。
學習資源:
項目倉庫:github.com/freestylefly/awesome-gpt-image-2 模板文件:docs/templates.md 案例畫廊 Part 1:docs/gallery-part-1.md 案例畫廊 Part 2:docs/gallery-part-2.md
參考文獻
[1] awesome-gpt-image-2 項目倉庫: https://github.com/freestylefly/awesome-gpt-image-2
[2] 工業級提示詞模板與防坑指南: https://github.com/freestylefly/awesome-gpt-image-2/blob/main/docs/templates.md
[3] 魔法畫廊 Part 1(案例 1-165): https://github.com/freestylefly/awesome-gpt-image-2/blob/main/docs/gallery-part-1.md
[4] 魔法畫廊 Part 2(案例 166-351): https://github.com/freestylefly/awesome-gpt-image-2/blob/main/docs/gallery-part-2.md
[5] GPT-Image2 官方文檔: https://platform.openai.com/docs/guides/images