GPT Image 2 提示詞最佳實踐
整理版優先睇
GPT Image 2 最好嘅用法:將 prompt 寫成製作單,唔好再堆形容詞
OpenAI 正式發佈咗 ChatGPT Images 2.0,呢一代嘅提升好明顯:世界知識更強、指令遵循更強、密集文本更強,而且開咗 thinking mode 仲可以接入網頁搜索同推理。X 同 Reddit 上面嘅反應都話文字終於睇得、地圖同 UI 似返樣,甚至有人話第一張圖可以直接用嚟做海報、做圖文、做概念稿。
呢篇文章嘅作者係一個普通創業者,佢睇曬官方文檔、X、Reddit 同國內測試之後,發現最值得關注嘅唔係審美飛昇,而係模型開始進入「可交付」嘅區間,尤其係文字可用、對現實世界理解強咗、更適合放進工作流。但要用得穩,關鍵唔係堆砌華麗提示詞,而係將 prompt 寫得似一張製作單。
全文總結出 9 個最佳實踐同 4 個實用模板,核心係先確定基礎畫面、用結構化格式寫 prompt、將文字當硬約束、改圖時講明只改邊處、做系列圖先定錨點、草稿用低質量迭代、參考圖要編號,同埋涉及事實嘅圖一定要人工複核。作者最後提醒,模型越會排字、越會似真圖、越會復刻界面,人就越要將需求講清楚,將事實核清楚。簡單講:你寫得越似製作單,模型就越似生產力。
- 先寫一句能夠成立嘅基礎畫面,確定大方向先,再逐步補充細節。
- 將 prompt 寫成製作單格式:場景/用途、主體、關鍵細節、文字內容等。
- 文字內容一定要寫清楚字體、大小、顏色、位置,最好用引號同逐字標明。
- 改圖嘅時候要講明只改邊個部分,其餘全部保持不變,每輪都要重複保留項。
- 做系列圖要先做一張「錨點圖」,鎖定角色或風格,再延伸其他場景。
公眾號封面模板
場景 / 用途:微信公眾號文章頭圖,主題係 GPT Image 2 最佳實踐。 主體:中文科技媒體風格海報。 關鍵細節:枱面上有海報草圖、產品圖、UI 線框同漫畫分鏡,好似一個正在運作嘅編輯枱。 構圖 / 視角:橫版 16:9,主標題清晰,留出副標題區域,整體適合微信頭圖裁切。 文字內容:主標題:"GPT Image 2 最佳實踐" 副標題:「別再堆提示詞了」 必須保留:中文準確,排版整潔,剋制、專業、似科技媒體封面。 明確唔要:唔好有英文亂碼,唔好有紫色霓虹,唔好有廉價科幻,唔好有多餘 logo。
小紅書封面模板
場景 / 用途:小紅書圖文封面,主題係用 GPT Image 2 做中文海報同信息圖。 主體:有設計感嘅中文封面海報。 關鍵細節:畫面裏有標題區、要點標籤、小型信息圖元素、留白區域。 構圖 / 視角:4:5 豎版,視覺中心明確,適合手機端閲讀。 文字內容:主標題:「GPT Image 2 真係可以開工啦」角標:「中文海報 / UI / 信息圖」 必須保留:文字清楚,層級強,封面感強,適合社交平台點擊。 明確唔要:唔好堆太多字,唔好花巧背景,唔好偽爆款感。
電商廣告模板
場景 / 用途:電商廣告主圖,用於展示一款極簡風保温杯。 主體:保温杯係畫面唯一主角。 關鍵細節:杯身磨砂金屬質感,品牌字清晰,桌面反射輕微,整體似高級商業攝影。 構圖 / 視角:豎版 4:5,主體居中偏下,上方留出文案空間。 文字內容:「全天保温」 必須保留:產品幾何形狀準確,標籤準確,質感真實。 明確唔要:唔好有多餘道具,唔好改變產品結構,唔好新增 logo。
局部改圖模板
只修改標題區域,將主標題放大 20%,副標題更靠近主標題。 其餘全部保持不變,包括背景、人物、配色、畫面比例、圖中物件位置同整體風格。 唔好新增任何元素,唔好改變已有文字內容。
GPT Image 2 進入可交付區間
OpenAI 正式發佈咗 ChatGPT Images 2.0。呢一代嘅提升點寫得好清楚:世界知識更強、指令遵循更強、密集文本更強;如果開咗 thinking mode,仲可以將網頁搜索同推理接入圖片生成流程。X 上大家喺度刷「文字終於可以睇啦」「地圖同 UI 終於似返樣」「呢張圖已經唔太似 AI 啦」;Reddit 上好多人第一次認真討論嘅,唔再係「佢會唔會畫」,而係「佢出嘅第一張圖,可唔可以直接拎去做海報、做圖文、做概念稿」。
文字終於可以睇啦
- 1 文字終於唔再只係點綴,而係真係開始用得。
- 2 佢對現實世界同數字世界嘅「樣貌」理解更強,例如信息圖、UI、海報、試卷、菜單、包裝呢啲過去最容易穿崩嘅嘢。
- 3 佢更適合放進工作流裏面,而唔係只係拎嚟刷朋友圈。
開始進入可交付嘅區間
文字終於唔再只係點綴,而係真係開始用得
對現實世界同數字世界嘅「樣貌」理解更強
更適合放進工作流裏面,而唔係只係拎嚟刷朋友圈
將 prompt 寫成製作單
作者綜合官方文檔、X、Reddit 同國內測試,總結出以下幾個關鍵實踐。
- 1 先寫一句能夠成立嘅基礎畫面:唔好一開波就寫 300 字,先確定大方向。例如要做公眾號封面,先寫「一張關於 GPT Image 2 最佳實踐嘅中文公眾號封面海報,橫版,科技媒體風格」,然後第二輪再補細節。
- 2 將 prompt 寫成製作單格式:用場景/用途、主體、關鍵細節、構圖/視角、文字內容、必須保留、明確唔要呢個結構,代替形容詞堆砌。
- 3 文字當硬約束:將文字內容放喺引號入面,寫清楚字體、大小、顏色、位置。難拼嘅品牌詞要逐字母寫明,要求 verbatim(逐字照抄)。
- 4 改圖時明確只改一處:講明「只修改 XX 部分,其餘全部保持不變」,而且每輪都要重複保留項。如果用 ChatGPT 產品,先用 Select tool 框選區域再修改。
- 5 系列圖先做錨點圖:做連載角色或同一品牌視覺時,先生成一張角色設定圖或封面基準版,鎖定特徵,然後每張都話「沿用同一設定」。
- 6 先低質量跑草圖:用 1024x1024 低質量版本試方向,確定構圖後再轉目標比例,最後升 medium 或 high。超過 2560x1440 嘅輸出仍係實驗性。
先寫一句能夠成立嘅基礎畫面
將 prompt 寫成製作單格式
文字當硬約束
改圖時明確只改一處
先做錨點圖
先低質量跑草圖
涉及事實嘅圖必須人工複核
另外,涉及事實、時效、名單、價格嘅圖,必須人工複核。Reddit 已經有人測試過生成當天 IPL 陣容圖,結果出舊名單。越似真嘅圖,越唔可以偷懶。
四款即用模板
以下係四個可以直接複製使用嘅 prompt 模板
場景 / 用途:微信公眾號文章頭圖,主題係 GPT Image 2 最佳實踐。
主體:中文科技媒體風格海報。
關鍵細節:枱面上有海報草圖、產品圖、UI 線框同漫畫分鏡,好似一個正在運作嘅編輯枱。
構圖 / 視角:橫版 16:9,主標題清晰,留出副標題區域,整體適合微信頭圖裁切。
文字內容:主標題:"GPT Image 2 最佳實踐" 副標題:「別再堆提示詞了」
必須保留:中文準確,排版整潔,剋制、專業、似科技媒體封面。
明確唔要:唔好有英文亂碼,唔好有紫色霓虹,唔好有廉價科幻,唔好有多餘 logo。
場景 / 用途:小紅書圖文封面,主題係用 GPT Image 2 做中文海報同信息圖。
主體:有設計感嘅中文封面海報。
關鍵細節:畫面裏有標題區、要點標籤、小型信息圖元素、留白區域。
構圖 / 視角:4:5 豎版,視覺中心明確,適合手機端閲讀。
文字內容:主標題:「GPT Image 2 真係可以開工啦」角標:「中文海報 / UI / 信息圖」
必須保留:文字清楚,層級強,封面感強,適合社交平台點擊。
明確唔要:唔好堆太多字,唔好花巧背景,唔好偽爆款感。
場景 / 用途:電商廣告主圖,用於展示一款極簡風保温杯。
主體:保温杯係畫面唯一主角。
關鍵細節:杯身磨砂金屬質感,品牌字清晰,桌面反射輕微,整體似高級商業攝影。
構圖 / 視角:豎版 4:5,主體居中偏下,上方留出文案空間。
文字內容:「全天保温」
必須保留:產品幾何形狀準確,標籤準確,質感真實。
明確唔要:唔好有多餘道具,唔好改變產品結構,唔好新增 logo。
只修改標題區域,將主標題放大 20%,副標題更靠近主標題。
其餘全部保持不變,包括背景、人物、配色、畫面比例、圖中物件位置同整體風格。
唔好新增任何元素,唔好改變已有文字內容。
OpenAI 正式發佈咗 ChatGPT Images 2.0。

OpenAI 喺 ChatGPT Images 2.0 System Card 入面,直接將呢一代嘅提升點寫得好清楚:世界知識更強、指令遵從更強、密集文本更強;如果你開 thinking mode,佢仲可以將網頁搜索同推理接入圖片生成流程入面。
X 上面大家喺度刷「文字終於睇得喇」「地圖同 UI 終於似樣喇」「呢張圖已經唔係好似 AI 喇」;Reddit 上面好多人第一次認真討論嘅,亦都唔再係「佢識唔識畫」,而係「佢出嘅第一張圖,可唔可以直接拎去做海報、做圖文、做概念稿」。
呢個其實係一個唔細嘅變化。
以前我哋用 AI 生圖,好多時都係博運氣。佢間唔中會出一張好靚嘅,但流程唔穩定。你想做中文海報,佢俾你亂碼。你想做一張好似真嘅直播介面,佢將啲掣畫到飛起。你想改一張圖,佢口話應承只係改少少,手就將成張圖重畫一次。
但係 GPT Image 2 今次,最值得留意嘅,唔係審美突然好咗好多,而係佢開始進入可以交貨嘅範圍。
尤其係三件事,變化好明顯。
第一,文字終於唔再只係點綴,而係真係開始用得。
第二,佢對現實世界同數字世界嘅「樣貌」理解強咗,例如資訊圖、UI、海報、試卷、菜單、包裝呢啲以前最容易穿崩嘅嘢。
第三,佢更加適合放落工作流程入面,而唔係只用嚟刷朋友圈。
所以呢篇文章我唔會講嗰啲空泛嘅「呢個模型太勁喇」。我更想答一個實際問題:
如果你今日就要用 GPT Image 2 出成果,最穩陣嘅用法到底係咩?
我將 OpenAI 官方文檔、X、Reddit,仲有國內公眾號測試都睇咗一次,最後嘅結論好簡單。
GPT Image 2 最好嘅使用方式,唔係堆砌華麗提示詞,而係將 prompt 寫到似一張製作單。
所以下面我總結咗一下使用 GPT Image 2 嘅幾個最佳實踐。
最佳實踐 1
唔好一開頭就寫 300 字,先寫一句成立嘅畫面
呢個係我睇完 X、Reddit 同國內測試之後最強烈嘅一個感受。
好多人見到模型變強,第一個反應就係將 prompt 寫到越來越長。恨不得將鏡頭、材質、風格、歷史背景、情緒、攝影器材、商業目標、人生理想全部塞入去。
呢招唔一定錯,但成日太早。
更穩陣嘅方式係:
先寫一句成立嘅基礎畫面,等模型先將大方向做啱。
例如你要做一張公眾號封面,唔好一開頭就寫:
一張極具未來感與高級感的科技商業海報,融合賽博朋克與現代極簡主義視覺語言,展現 OpenAI 新一代圖像模型對中文排版、世界知識、信息圖生成和真實商業場景落地能力的突破……
呢種寫法最大嘅問題,唔係佢長,而係佢太虛。
你不如先寫:
一張關於 GPT Image 2 最佳實踐的中文公眾號封面海報,橫版,科技媒體風格,主標題清晰,留出副標題區域,整體適合微信文章頭圖。
先將呢張圖立住。
然後第二輪再補:
標題使用白色粗體中文,背景是深色工作台,上面散落海報、UI 線框圖、產品圖和漫畫分鏡草圖,氣質剋制,不要炫光,不要廉價科幻感。
呢個比第一輪就將所有慾望都灌入去,穩陣得多。
OpenAI Cookbook 嗰份提示詞指南雖然寫嘅係 gpt-image-1.5,但入面有一句話我覺得對 GPT Image 2 依然成立:
Prompt 最好按固定順序組織,背景/場景 -> 主體 -> 關鍵細節 -> 約束 -> 用途複雜任務盡量拆成短段,而唔係一口氣寫成一大段。
呢個基本就係而家最實用嘅 prompt 方法。
唔係寫詩。係寫需求。
最佳實踐 2
將 prompt 寫成製作單,而唔係形容詞堆砌
如果只記一條,我建議記呢個。
GPT Image 2 明顯更食結構化要求,而唔係審美形容詞轟炸。
我而家更推薦大家用下面呢個結構寫 prompt:
場景 / 用途:
主體:
關鍵細節:
構圖 / 視角:
文字內容:
必須保留:
明確不要:
舉個例。
你要做一張小紅書圖文封面,唔好淨係講「做一張高級嘅爆款封面」。
請直接寫製作單。
場景 / 用途:
小紅書圖文封面,主題是 GPT Image 2 生圖最佳實踐。
主體:
一張帶有編輯台氣質的中文科技海報。
關鍵細節:
畫面裏有海報草圖、UI 線框、商品圖、漫畫分鏡、小塊中文標題條。
構圖 / 視角:
4:5 豎版,標題在上半區,視覺中心明確,留出安全邊距。
文字內容:
主標題:"GPT Image 2 最佳實踐"
副標題:"別再堆提示詞了"
必須保留:
中文清晰,排版整潔,科技媒體感,不要太像 AIGC 宣傳圖。
明確不要:
不要英文亂碼,不要多餘 logo,不要紫色霓虹,不要廉價科幻光效。
呢個寫法有兩個好處。
第一,佢迫你先諗清楚呢張圖係做咩嘅。
第二,佢將風格從抽象感受,變咗做可以執行嘅視覺約束。
好多人 prompt 成日飄,唔係因為模型唔得,而係自己根本冇將圖嘅用途講清楚。
最佳實踐 3
只要圖入面有文字,就將文字當做硬約束
呢條而家太關鍵喇。
GPT Image 2 今次最令人震驚嘅地方,就係文字終於開始靠譜。但係越係咁,越唔可以將文字寫得含糊。
OpenAI Cookbook 俾嘅建議好直接:
文字最好放入引號入面
寫清楚字體、大小、顏色、位置
難拼嘅品牌詞、生僻詞,最好逐個字母寫
明確要求
verbatim,即係逐字照抄,唔好額外加嘢
所以你如果要做海報,唔好寫:
加一個很有設計感的標題
你應該寫:
主標題只出現一次,文字必須逐字準確:
"GPT Image 2 最佳實踐"
副標題只出現一次:
"別再堆提示詞了"
字體風格:現代中文黑體,粗體,高對比,字距正常
位置:標題在上方三分之一處,副標題放在標題下方
要求:文字完整清晰,不要錯字,不要重複,不要新增任何英文
呢件事睇落瑣碎,但真係好重要。
因為 GPT Image 2 而家已經唔係出唔出到字嘅問題,而係你能唔能夠將版式約束講清楚嘅問題。
國內實測入面最誇張嘅例子,其實唔係藝術圖,而係試卷、報紙、書法、直播呢啲結構化中文內容。
呢個正正說明,模型而家唔怕有文字,佢怕嘅係你唔講清楚文字應該點樣出現。
最佳實踐 4
改圖時唔好講「改高級啲」,要講「只係改呢一處,其他全部唔鬱」
呢個係我從官方文檔同社區抱怨入面反覆見到嘅一條。
好多人改圖點解越改越崩?
因為佢哋講嘅係:
再高級一點
再有氛圍一點
再像大片一點
呢類指令對人類設計師都唔算清楚,對模型更加係災難。
更穩陣嘅改法係:
只修改標題區的排版,讓主標題更大,副標題更靠近主標題。
其餘元素全部保持不變,包括背景、主體、配色、畫面比例、圖中物件位置。
或者:
只把背景從純色改成淺灰紙張紋理。
不要改變人物、文字內容、構圖、比例和整體風格。
OpenAI 官方提示詞指南入面有一句好實用:改圖時要明確寫 change only X,再寫 keep everything else the same,而且每一輪都要重複一次保留項目。
呢句話我建議你直接記低。
因為 GPT Image 2 雖然編輯能力進步咗,但 OpenAI 自己喺 API 文檔入面都承認:對於精確嘅結構化佈局,佢依然可能有困難。
即係話,你越係想令佢只係鬱一毫米,你越要將唔準鬱嘅地方講得好死。
如果你喺 ChatGPT 產品入面操作,OpenAI 幫助中心都明確建議用 Select tool 先框選局部區域,再描述修改內容。呢個動作好簡單,但係好值得做。
最佳實踐 5
系列圖唔好一張一張亂咁生,先做錨點圖
呢個都係 GPT Image 2 特別適合做嘅事。
你想做漫畫分鏡、連載圖文、同一個角色嘅多張海報,或者一套同風格嘅小紅書配圖,最忌諱嘅就係每一張都由零開始寫。
咁樣當然容易飄。
更穩陣嘅做法係先做一張「錨點圖”。
例如你要做一個連載角色:
先生成一張角色設定圖:
25 歲東亞女性,短髮,深藍色西裝外套,銀色耳環,冷靜但有一點鋒利感,寫實 editorial 風格,淺灰背景,半身像。
這張滿意之後,再讓它往下延展:
沿用同一個角色。保持相同的臉部特徵、髮型、五官比例、服裝顏色和整體氣質。
現在生成她坐在會議室裏看產品原型圖的場景,橫版,適合作為文章配圖。
OpenAI Cookbook 在講兒童繪本一致性的時候,給的思路就是這個:
先做 character anchor,把角色的長相、比例、服裝、色板鎖住,再去做後續情節。
呢套方法唔止適合故事角色,都適合品牌視覺。
例如你先做出一張「我哋呢套圖嘅封面基準版」,後面每一張都講:
沿用同一套版式語言、同一配色、同一字體氣質、同一留白邏輯。
這會穩很多。
最佳實踐 6
先低質量跑草圖,定稿再升質量同解像度
呢條好樸素,但好容易俾人忽略。
OpenAI API 文檔而家寫得好清楚:gpt-image-2 支持靈活尺寸同 low / medium / high / auto 四檔質量,而且官方明確建議草圖同快速迭代先從 quality: "low" 開始。
呢個背後嘅邏輯其實好似設計流程:
• 第一步先睇方向啱唔啱 • 第二步再睇排版順唔順 • 第三步先係細節、材質同精修
你如果一開頭就 4K、高質量、複雜多元素,當然都可以出圖,但你會更唔捨得推翻佢,亦都更容易陷入「呢張已經好貴喇,我再忍一忍」嘅心態。
我更推薦嘅節奏係:
• 用 1024x1024 或目標比例嘅低質量版本先試方向 • 構圖定落嚟之後,再轉目標比例 • 最後先升到 medium 或 high
呢套方法對海報、電商圖、UI 概念稿都好好用。
仲有一個細節。
API 文檔寫得好明確:gpt-image-2 而家最大邊長支持到 3840px,但超過 2560x1440 嘅輸出而家仍然被視為實驗性。所以如果你要做極大圖,唔好將第一版嘅穩定性諗得太理所當然。
最佳實踐 7
參考圖唔好掉入去等佢自己領悟,要俾每張圖編號
呢點我特別想強調。
而家好多人一做多圖混合,就習慣將幾張圖一次過上傳,然後寫一句:
按這些參考做一張新的
這太容易失控了。
更穩陣嘅寫法,係好似 OpenAI Cookbook 建議咁,將每張參考圖都編號。
Image 1:產品主體照片
Image 2:想要的海報風格參考
Image 3:品牌字體和色板參考
請保留 Image 1 的產品外觀和標籤信息,
使用 Image 2 的構圖和氛圍,
沿用 Image 3 的配色和字體氣質。
這樣模型才知道你讓誰決定長相,誰決定風格,誰決定品牌感。
如果唔係,佢成日會擅自平均一下,然後俾你一張邊個都唔似、但亦唔係完全冇道理嘅圖。
最佳實踐 8
涉及事實、時效、名單、價格嘅圖,必須人工複核
呢條我覺得好多人會蝕底。
OpenAI 今次確實將 thinking mode、網頁搜索、多圖生成呢啲嘢接入咗。官方都明確咁樣寫咗。
但係 Reddit 上面已經有人測試過,叫佢生成當日 IPL 陣容圖,結果出嚟嘅係舊名單。
呢類錯誤最麻煩嘅地方就在於,佢唔係一眼假。佢係睇落好真,但事實錯咗。
所以你只要做下面呢啲內容,就必須人工複核:
• 當日新聞頭圖 • 賽事陣容、賽程、比分圖 • 價格表、菜單、參數表 • 公司組織架構同職位名單 • 法律、醫療、金融相關資訊圖
GPT Image 2 而家最危險嘅一點,正正係佢越來越似真嘅。
越似真嘅,越唔可以偷懶。
最佳實踐 9
遇到長對話開始飄,直接開新線程
呢個係好土炮,但好實用嘅小經驗。
社區入面已經有人反饋,喺好長嘅連續會話入面,圖片會慢慢出現噪點、漂移,或者模型越來越唔聽話。
呢個唔係 GPT Image 2 獨有嘅問題,好多生成模型嘅長鏈路工作流都會咁。
我嘅建議好簡單:
當你拎到一張滿意嘅中間版本時,唔好戀戰。
將嗰張圖當做新嘅錨點,開一個新線程繼續。
你可以將佢理解做「另存新檔」。
呢個往往比喺一條已經越來越亂嘅對話鏈入面死改,慳時間好多。
推薦 4 個模板
1. 公眾號封面模板
場景 / 用途:
微信公眾號文章頭圖,主題是 GPT Image 2 最佳實踐。
主體:
中文科技媒體風格海報。
關鍵細節:
桌面上有海報草圖、產品圖、UI 線框和漫畫分鏡,像一個正在工作的編輯台。
構圖 / 視角:
橫版 16:9,主標題清晰,留出副標題區域,整體適合微信頭圖裁切。
文字內容:
主標題:"GPT Image 2 最佳實踐"
副標題:"別再堆提示詞了"
必須保留:
中文準確,排版整潔,剋制、專業、像科技媒體封面。
明確不要:
不要英文亂碼,不要紫色霓虹,不要廉價科幻,不要多餘 logo。
2. 小紅書封面模板
場景 / 用途:
小紅書圖文封面,主題是用 GPT Image 2 做中文海報和信息圖。
主體:
有設計感的中文封面海報。
關鍵細節:
畫面裏有標題區、要點標籤、小型信息圖元素、留白區域。
構圖 / 視角:
4:5 豎版,視覺中心明確,適合手機端閲讀。
文字內容:
主標題:"GPT Image 2 真的能幹活了"
角標:"中文海報 / UI / 信息圖"
必須保留:
文字清楚,層級強,封面感強,適合社交平台點擊。
明確不要:
不要堆太多字,不要花哨背景,不要偽爆款感。
3. 電商廣告模板
場景 / 用途:
電商廣告主圖,用於展示一款極簡風保温杯。
主體:
保温杯是畫面唯一主角。
關鍵細節:
杯身磨砂金屬質感,品牌字清晰,桌面反射輕微,整體像高端商業攝影。
構圖 / 視角:
豎版 4:5,主體居中偏下,上方留出文案空間。
文字內容:
"全天保温"
必須保留:
產品幾何形狀準確,標籤準確,質感真實。
明確不要:
不要多餘道具,不要改變產品結構,不要新增 logo。
4. 局部改圖模板
只修改標題區域,把主標題放大 20%,副標題更靠近主標題。
其餘全部保持不變,包括背景、人物、配色、畫面比例、圖中物件位置和整體風格。
不要新增任何元素,不要改變已有文字內容。
最後
模型越識排字、越似真圖、越識復刻介面,人就更加要將需求講清楚,亦更加要將事實核清楚。
所以 GPT Image 2 最好嘅打開方式,其實唔神秘。
唔好將佢當許願機。
將佢當一個好強、但係都好字面、好需要 brief 嘅設計協作者。
你寫得越似製作單,佢就越似生產力。
以上,就係呢篇文章所有內容,歡迎點個讚、推薦、轉發三連,亦都歡迎關注我,一個普通嘅創業者。
特別推薦
1. 兩個系列文章
系統咁記錄咗我嘅創業週報,同埋喺 Shopify App 開發過程入面嘅一啲知識點,歡迎大家睇。
2. Shopify 開發交流社羣
目前國內 Shopify 開發資料稀缺,基本冇交流社區,所以我創建咗一個專注討論 Shopify 開發相關嘅各種技術問題嘅交流圈子。喺呢度你可以得到:
• 學習 Shopify App 開發由入門到上架嘅流程。 • 學習 Shopify 主題開發。 • 同其他 Shopify 開發者諮詢開發遇到嘅問題,交流經驗。 • 同大家一齊交流副業、創業嘅經驗同心得。 • 星主會不定期分享 Shopify 開發同建站、web 開發、移動端開發相關嘅私活,有需要嘅同學可以接。
歡迎你嚟加入,我哋知識星球見 🤝

OpenAI 正式發佈了 ChatGPT Images 2.0。

OpenAI 在 ChatGPT Images 2.0 System Card 裏,直接把這一代的提升點寫得很清楚:世界知識更強、指令遵循更強、密集文本更強;如果你開 thinking mode,它還能把網頁搜索和推理接進圖片生成流程裏。
X 上大家在刷“文字終於能看了”“地圖和 UI 終於像回事了”“這張圖已經不太像 AI 了”;Reddit 上很多人第一次認真討論的,也不再是“它會不會畫”,而是“它出的第一張圖,能不能直接拿去做海報、做圖文、做概念稿”。
這其實是個不小的變化。
以前我們用 AI 生圖,很多時候是在賭運氣。它偶爾能出一張驚豔的,但流程並不穩定。你想做中文海報,它給你亂碼。你想做一張像真的直播界面,它把按鈕畫飛。你想改一張圖,它嘴上答應只改一點,手上卻把整張圖重畫一遍。
但 GPT Image 2 這次,最值得重視的,不是審美突然飛昇,而是它開始進入可交付的區間了。
尤其是三件事,變化非常明顯。
第一,文字終於不再只是點綴,而是真的開始能用了。
第二,它對現實世界和數字世界的“長相”理解更強了,比如信息圖、UI、海報、試卷、菜單、包裝這些過去最容易穿幫的東西。
第三,它更適合放進工作流裏,而不是隻拿來刷朋友圈。
所以這篇文章我不講那種空泛的“這模型太強了”。我更想回答一個實際問題:
如果你今天就要用 GPT Image 2 出成果,最穩的用法到底是什麼?
我把 OpenAI 官方文檔、X、Reddit,還有國內公眾號測試都看了一遍,最後的結論很簡單。
GPT Image 2 最好的使用方式,不是堆砌華麗提示詞,而是把 prompt 寫得像一張製作單。
所以下面我總結了一下使用 GPT Image 2 的幾個最佳實踐。
最佳實踐 1
不要一上來寫 300 字,先寫一句能成立的畫面
這是我看完 X、Reddit 和國內測試之後最強烈的一個感受。
很多人看到模型變強,第一反應是把 prompt 寫得越來越長。恨不得把鏡頭、材質、風格、歷史背景、情緒、攝影器材、商業目標、人生理想全塞進去。
這招不一定錯,但經常太早了。
更穩的方式是:
先寫一句能成立的基礎畫面,讓模型先把大方向做對。
比如你要做一張公眾號封面,不要上來就寫:
一張極具未來感與高級感的科技商業海報,融合賽博朋克與現代極簡主義視覺語言,展現 OpenAI 新一代圖像模型對中文排版、世界知識、信息圖生成和真實商業場景落地能力的突破……
這種寫法最大的問題,不是它長,而是它太虛。
你不如先寫:
一張關於 GPT Image 2 最佳實踐的中文公眾號封面海報,橫版,科技媒體風格,主標題清晰,留出副標題區域,整體適合微信文章頭圖。
先把這張圖立住。
然後第二輪再補:
標題使用白色粗體中文,背景是深色工作台,上面散落海報、UI 線框圖、產品圖和漫畫分鏡草圖,氣質剋制,不要炫光,不要廉價科幻感。
這比第一輪就把所有慾望都灌進去,穩得多。
OpenAI Cookbook 那份提示詞指南雖然寫的是 gpt-image-1.5,但裏面有一句話我覺得對 GPT Image 2 依然成立:
Prompt 最好按固定順序組織,背景/場景 -> 主體 -> 關鍵細節 -> 約束 -> 用途。複雜任務儘量拆成短段,而不是一口氣寫成一大段。
這基本就是今天最實用的 prompt 方法。
不是寫詩。是寫需求。
最佳實踐 2
把 prompt 寫成製作單,而不是形容詞堆
如果只記一條,我建議記這個。
GPT Image 2 明顯更吃結構化要求,而不是審美形容詞轟炸。
我現在更推薦大家用下面這個結構寫 prompt:
場景 / 用途:
主體:
關鍵細節:
構圖 / 視角:
文字內容:
必須保留:
明確不要:
舉個例子。
你要做一張小紅書圖文封面,不要只說“做一張高級的爆款封面”。
請直接寫製作單。
場景 / 用途:
小紅書圖文封面,主題是 GPT Image 2 生圖最佳實踐。
主體:
一張帶有編輯台氣質的中文科技海報。
關鍵細節:
畫面裏有海報草圖、UI 線框、商品圖、漫畫分鏡、小塊中文標題條。
構圖 / 視角:
4:5 豎版,標題在上半區,視覺中心明確,留出安全邊距。
文字內容:
主標題:"GPT Image 2 最佳實踐"
副標題:"別再堆提示詞了"
必須保留:
中文清晰,排版整潔,科技媒體感,不要太像 AIGC 宣傳圖。
明確不要:
不要英文亂碼,不要多餘 logo,不要紫色霓虹,不要廉價科幻光效。
這個寫法有兩個好處。
第一,它強迫你先想清楚這張圖是幹什麼的。
第二,它把風格從抽象感受,變成了可以執行的視覺約束。
很多人 prompt 老是飄,不是因為模型不行,而是自己根本沒把圖的用途講清楚。
最佳實踐 3
只要圖裏有文字,就把文字當硬約束
這一條現在太關鍵了。
GPT Image 2 這次最讓人震驚的地方,就是文字終於開始靠譜了。但越是這樣,越不能把文字寫得含糊。
OpenAI Cookbook 給的建議非常直接:
文字最好放進引號裏
寫清楚字體、大小、顏色、位置
難拼的品牌詞、生僻詞,最好逐字母寫
明確要求
verbatim,也就是逐字照抄,不要額外發揮
所以你如果要做海報,別寫:
加一個很有設計感的標題
你應該寫:
主標題只出現一次,文字必須逐字準確:
"GPT Image 2 最佳實踐"
副標題只出現一次:
"別再堆提示詞了"
字體風格:現代中文黑體,粗體,高對比,字距正常
位置:標題在上方三分之一處,副標題放在標題下方
要求:文字完整清晰,不要錯字,不要重複,不要新增任何英文
這件事看着瑣碎,但真的很重要。
因為 GPT Image 2 現在已經不是能不能出字的問題,而是你能不能把版式約束講清楚的問題了。
國內實測裏最誇張的例子,其實不是藝術圖,而是試卷、報紙、書法、直播界面這些結構化中文內容。
這恰恰說明,模型現在不怕有文字,它怕的是你不說清楚文字該怎麼出現。
最佳實踐 4
改圖時別說“改高級一點”,要說“只改這一處,其他全部不動”
這是我從官方文檔和社區抱怨裏反覆看到的一條。
很多人改圖為什麼越改越崩?
因為他們說的是:
再高級一點
再有氛圍一點
再像大片一點
這類指令對人類設計師都不算清楚,對模型更是災難。
更穩的改法是:
只修改標題區的排版,讓主標題更大,副標題更靠近主標題。
其餘元素全部保持不變,包括背景、主體、配色、畫面比例、圖中物件位置。
或者:
只把背景從純色改成淺灰紙張紋理。
不要改變人物、文字內容、構圖、比例和整體風格。
OpenAI 官方提示詞指南里有一句很實用:改圖時要明確寫 change only X,再寫 keep everything else the same,而且每輪都要重複一遍保留項。
這句話我建議你直接記下來。
因為 GPT Image 2 雖然編輯能力進步了,但 OpenAI 自己也在 API 文檔裏承認:對於精確的結構化佈局,它依然可能有困難。
也就是說,你越是想讓它只動一毫米,你越要把不準動的地方說得很死。
如果你在 ChatGPT 產品裏操作,OpenAI 幫助中心也明確建議用 Select tool 先框選局部區域,再描述修改內容。 這個動作很簡單,但非常值。
最佳實踐 5
系列圖不要一張一張瞎生,先做錨點圖
這個也是 GPT Image 2 特別適合做的事。
你想做漫畫分鏡、連載圖文、同一角色的多張海報,或者一套同風格的小紅書配圖,最忌諱的就是每一張都從零開始寫。
那樣當然容易漂。
更穩的辦法是先做一張“錨點圖”。
比如你要做一個連載角色:
先生成一張角色設定圖:
25 歲東亞女性,短髮,深藍色西裝外套,銀色耳環,冷靜但有一點鋒利感,寫實 editorial 風格,淺灰背景,半身像。
這張滿意之後,再讓它往下延展:
沿用同一個角色。保持相同的臉部特徵、髮型、五官比例、服裝顏色和整體氣質。
現在生成她坐在會議室裏看產品原型圖的場景,橫版,適合作為文章配圖。
OpenAI Cookbook 在講兒童繪本一致性的時候,給的思路就是這個:
先做 character anchor,把角色的長相、比例、服裝、色板鎖住,再去做後續情節。
這套方法不只適合故事角色,也適合品牌視覺。
比如你先做出一張“我們這套圖的封面基準版”,後面每張都說:
沿用同一套版式語言、同一配色、同一字體氣質、同一留白邏輯。
這會穩很多。
最佳實踐 6
先低質量跑草圖,定稿再升質量和分辨率
這條很樸素,但很容易被忽略。
OpenAI API 文檔現在寫得很清楚:gpt-image-2 支持靈活尺寸和 low / medium / high / auto 四檔質量,而且官方明確建議草稿和快速迭代先從 quality: "low" 開始。
這背後的邏輯其實很像設計流程:
• 第一步先看方向對不對 • 第二步再看排版順不順 • 第三步才是細節、材質和精修
你如果一上來就 4K、高質量、複雜多元素,當然也能出圖,但你會更捨不得推翻它,也更容易陷入“這張已經很貴了,我再忍一忍”的心態。
我更推薦的節奏是:
• 用 1024x1024 或目標比例的低質量版本先試方向 • 構圖定下來之後,再切目標比例 • 最後才升到 medium 或 high
這套方法對海報、電商圖、UI 概念稿都很好用。
還有一個細節。
API 文檔寫得很明確:gpt-image-2 現在最大邊長支持到 3840px,但超過 2560x1440 的輸出目前仍被視為實驗性。 所以如果你要做極大圖,別把第一版的穩定性想得太理所當然。
最佳實踐 7
參考圖不要扔進去讓它自己悟,要給每張圖編號
這點我特別想強調。
現在很多人一做多圖混合,就習慣把幾張圖一股腦上傳,然後寫一句:
按這些參考做一張新的
這太容易失控了。
更穩的寫法,是像 OpenAI Cookbook 建議的那樣,把每張參考圖都編號。
Image 1:產品主體照片
Image 2:想要的海報風格參考
Image 3:品牌字體和色板參考
請保留 Image 1 的產品外觀和標籤信息,
使用 Image 2 的構圖和氛圍,
沿用 Image 3 的配色和字體氣質。
這樣模型才知道你讓誰決定長相,誰決定風格,誰決定品牌感。
否則它經常會擅自平均一下,然後給你一張誰都不像、但也不是完全沒道理的圖。
最佳實踐 8
涉及事實、時效、名單、價格的圖,必須人工複核
這條我覺得很多人會吃虧。
OpenAI 這次確實把 thinking mode、網頁搜索、多圖生成這些東西接進來了。官方也明確這麼寫了。
但是 Reddit 上已經有人測試過,讓它生成當天 IPL 陣容圖,結果出來的是舊名單。
這類錯誤最麻煩的地方就在於,它不是一眼假。它是看上去很真,但事實錯了。
所以你只要做下面這些內容,就必須人工複核:
• 當天新聞頭圖 • 賽事陣容、賽程、比分圖 • 價格表、菜單、參數表 • 公司組織架構和職位名單 • 法律、醫療、金融相關信息圖
GPT Image 2 現在最危險的一點,恰恰是它越來越像真的。
越像真的,越不能偷懶。
最佳實踐 9
遇到長對話開始漂,直接開新線程
這是個很土,但很實用的小經驗。
社區裏已經有人反饋,在很長的連續會話裏,圖片會慢慢出現噪點、漂移,或者模型越來越不聽話。
這不是 GPT Image 2 獨有的問題,很多生成模型的長鏈路工作流都會這樣。
我的建議很簡單:
當你拿到一張滿意的中間版本時,不要戀戰。
把那張圖當成新的錨點,開一個新線程繼續。
你可以把它理解成“另存為”。
這往往比在一條已經越來越髒的對話鏈裏死改,省時間得多。
推薦 4 個模板
1. 公眾號封面模板
場景 / 用途:
微信公眾號文章頭圖,主題是 GPT Image 2 最佳實踐。
主體:
中文科技媒體風格海報。
關鍵細節:
桌面上有海報草圖、產品圖、UI 線框和漫畫分鏡,像一個正在工作的編輯台。
構圖 / 視角:
橫版 16:9,主標題清晰,留出副標題區域,整體適合微信頭圖裁切。
文字內容:
主標題:"GPT Image 2 最佳實踐"
副標題:"別再堆提示詞了"
必須保留:
中文準確,排版整潔,剋制、專業、像科技媒體封面。
明確不要:
不要英文亂碼,不要紫色霓虹,不要廉價科幻,不要多餘 logo。
2. 小紅書封面模板
場景 / 用途:
小紅書圖文封面,主題是用 GPT Image 2 做中文海報和信息圖。
主體:
有設計感的中文封面海報。
關鍵細節:
畫面裏有標題區、要點標籤、小型信息圖元素、留白區域。
構圖 / 視角:
4:5 豎版,視覺中心明確,適合手機端閲讀。
文字內容:
主標題:"GPT Image 2 真的能幹活了"
角標:"中文海報 / UI / 信息圖"
必須保留:
文字清楚,層級強,封面感強,適合社交平台點擊。
明確不要:
不要堆太多字,不要花哨背景,不要偽爆款感。
3. 電商廣告模板
場景 / 用途:
電商廣告主圖,用於展示一款極簡風保温杯。
主體:
保温杯是畫面唯一主角。
關鍵細節:
杯身磨砂金屬質感,品牌字清晰,桌面反射輕微,整體像高端商業攝影。
構圖 / 視角:
豎版 4:5,主體居中偏下,上方留出文案空間。
文字內容:
"全天保温"
必須保留:
產品幾何形狀準確,標籤準確,質感真實。
明確不要:
不要多餘道具,不要改變產品結構,不要新增 logo。
4. 局部改圖模板
只修改標題區域,把主標題放大 20%,副標題更靠近主標題。
其餘全部保持不變,包括背景、人物、配色、畫面比例、圖中物件位置和整體風格。
不要新增任何元素,不要改變已有文字內容。
最後
模型越會排字、越會像真圖、越會復刻界面,人就越要把需求講清楚,也越要把事實核清楚。
所以 GPT Image 2 最好的打開方式,其實不神秘。
別把它當許願機。
把它當一個很強、但也很字面、很需要 brief 的設計協作者。
你寫得越像製作單,它就越像生產力。
以上,就是本篇文章所有內容,歡迎點個贊、推薦、轉發三連,也歡迎關注我,一個普通的創業者。
特別推薦
1. 兩個系列文章
系統地記錄了我的創業週報,以及在Shopify App開發過程中的一些知識點,歡迎大家查看。
2. Shopify 開發交流社羣
目前國內Shopify開發資料稀缺,基本沒有交流社區,所以我創建了一個專注討論Shopify開發相關的各種技術問題的交流圈子。在這裏你可以獲得:
• 學習Shopify App開發從入門到上架的流程。 • 學習 Shopify 主題開發。 • 和其他Shopify開發者諮詢開發遇到的問題,交流經驗。 • 和大家一起交流副業、創業的經驗和心得。 • 星主會不定期分享Shopify開發&建站、web開發、移動端開發相關的私活,有需要的同學可以接。
歡迎你來加入,我們知識星球見 🤝
