深扒 Nano Banana 2 超多趣味玩法,速度快還要效果好!

作者:阿真Irene
日期:2026年3月4日 上午10:20
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Nano Banana 2 以更快速度同更強可控性,用更低成本擴展圖像生成場景,尤其適合批量探索與快速迭代。

整理版摘要

呢篇文章係由阿真寫嘅,佢喺假期後抽時間試玩 Google 喺 2 月底發佈嘅 Gemini 3.1 Flash Image(即 Nano Banana 2)。作者想分享呢個新模型嘅進步同實際玩法,尤其係佢點樣喺性價比同可控性上做出擴展。整體結論係:Nano Banana 2 雖然喺細節同畫質上仲差 Nano Banana Pro 少少,但佢快好多、成本低好多,而且支援工作流同 Grounding,好適合用嚟探索階段。

文章詳細介紹咗五大進步方向:速度提升到 Flash 級別、指令遵循更強令到圖片更貼近描述、文字生成可靠仲支援翻譯本地化、結合 Search Grounding 令生成更貼合真實數據、角色一致性加強同新增多個特殊比例(如 1:8、8:1)。作者仲透過大量實例展示咗呢啲功能,例如多語言海報生成、真實世界知識問答、15 個角色同場一致性、極端比例長圖等。

最後,作者建議如果只能用一個,要求高嘅場景揀 Pro;但如果講求性價比,可以將兩者分工:探索階段用 Nano Banana 2 快速跑方向、測構圖,交付階段先用 Pro 提升最終品質。呢篇文對於想了解 Nano Banana 2 實際能力同點樣用嘅讀者好有參考價值。

  • Nano Banana 2 主打快、可控、能進工作流,性價比高,適合批量迭代同快速試錯。
  • JSON 格式提示詞生成人物,真實感比自然語言更好;多語言海報可以直接翻譯圖片內文字,效果好。
  • 整體畫質同細節精度仍唔及 Pro,但速度同成本優勢明顯,建議探索用 2,交付用 Pro
  • 角色一致性支援最多 14 個對象組合同 5 個角色,無需參考圖即可維持風格統一,適合繪本、品牌 IP 等多場景內容。
  • 新增多比例(1:8、8:1)同長圖生成,雖然目前細節仲有提升空間,但已經好有潛力做時間軸、海報等設計。
值得記低
Prompt

城市福字打卡元提示詞

一個內嵌 Search Grounding 嘅提示詞模板,用嚟生成任意城市嘅「福字鏤空打卡圖」。用戶輸入城市名,模版會自動檢索該城市真實地標、生成指定構圖同文字排版。可以直接用喺 Gemini 或其他生圖工具。

結構示例

內容片段

內容片段 css
畫面目標與主題:多語言歡迎信息圖,採用包豪斯現代主義設計感,幾何圖形與文字共同構建理性又有温度的視覺。
構圖與鏡頭語言:橫版結構,左側為圓形色塊與箭頭流程,右側為多語言歡迎詞矩陣,頂部標題橫跨兩區,底部細條信息帶收束。
主體元素與層次:第一層是幾何圖形(圓、矩形、斜切塊);第二層是主副標題與語言矩陣;第三層是小型編號、座標刻度與註腳。無人物,強調系統化視覺語言。
光線與色彩材質:高質感平面印刷,主色鈷藍、奶白、炭黑,點綴朱橙;材質乾淨平滑,氛圍理性、明快、展覽級。
主標題:"WELCOME ACROSS BORDERS";字體風格:現代無襯線粗體;視覺效果:平面高對比印刷;字號等級:最大;位置:頂部居中跨欄。
副標題:"全球問候語可視化圖譜";字體風格:中黑人文黑體;視覺效果:細描邊+淺陰影;字號等級:中號;位置:主標題下方左對齊。
說明文字:在右側文本矩陣中按多列展示“歡迎”詞並保留語言含義,包含 Welcome(英語,歡迎)、Bienvenido(西班牙語,歡迎)、Bienvenue(法語,歡迎)、Willkommen(德語,歡迎)、Benvenuto(意大利語,歡迎)、Bem-vindo(葡萄牙語,歡迎)、歡迎(漢語,歡迎)、ようこそ(日語,歡迎)、환영합니다(韓語,歡迎)、أهلاً وسهلاً(阿拉伯語,歡迎)、स्वागत है(印地語,歡迎)、Karibu(斯瓦希里語,歡迎)、Selamat datang(印尼語/馬來語,歡迎)、Maligayang pagdating(菲律賓語,歡迎)、Hoş geldiniz(土耳其語,歡迎)、Welkom(荷蘭語/南非語,歡迎)、Chào mừng(越南語,歡迎)。
符號文字:僅放圖例與導航詞,不新增歡迎詞,如 Legend / Direction / Entry Point / Exit Flow;字體風格:技術等寬體;視覺效果:低對比細線;字號等級:最小;位置:底部圖例條與角落標記。
可讀性與排版約束:圖形不壓住正文,語言矩陣行距一致,主副標題區分明顯,所有文本可一眼辨認。
整理重點

Nano Banana 2 嘅核心進步

阿真喺假期後試玩咗 Google 嘅新模型 Nano Banana 2(官方名係 Gemini 3.1 Flash Image)。佢話呢個模型嘅重點係快、可控、能進工作流,仲用更低成本覆蓋更多應用場景。

Nano Banana 2 將速度拉到 Flash 級別,批量出圖同快速迭代嘅成本同等待時間都砍咗好多,性價比好高。

官方講咗五個進步方向:速度提升、指令遵循更強、文字生成可靠兼支援翻譯、更適合配合圖像搜索 Grounding、角色一致性增強同新增多比例。

整理重點

圖文渲染同真實世界知識

Nano Banana 2 嘅中英文渲染準確率好高,多行文字、菜單排版都可以處理。仲支援將英文字直接翻譯成日語、法語等本地化版本,唔只文字連視覺元素都會調整。

以後做多語言海報,直接將海報圖片俾 AI 做參考,再要其他語言版本,線條穩定、文字和諧,字體效果都有照顧到。

真實世界知識方面,佢可以結合 Search Grounding,先檢索真實數據再生成圖片。例如輸入一個城市名,佢會自動鎖定真實機位同地標關係,生成福字打卡圖。

  1. 1 用元提示詞內嵌 Grounding 流程,輸入城市名即生成指定構圖同文字排版,效果幾好。
  2. 2 百科長圖、歷史人物生平之類嘅主題,佢都做到,但細節仲有錯,要核實。

雖然真實世界知識有進步,但細節問題依然存在,生成嘅圖片唔可以百分百信賴。

整理重點

角色一致性同多比例支持

Nano Banana 2 可以喺同一場景入面保持 14 個對象同 5 個角色嘅一致性。阿真直接一把直出 15 個角色,然後將佢哋放到同一張圖,角色細節都保持得好好。

佢哋官方話同一工作流最多支援 5 個角色嘅相似度保持同 14 個對象嘅保真度,做繪本系列、品牌 IP 多場景超方便。

  • 唔需要參考圖,單靠文字描述就可以維持多個角色一致性,例如四格漫畫、法律庭審場景。
  • 吉祥物「咖小豆」喺六個唔同場景(包裝、社交頭像、節日活動)都保持到身份一致性,包括 LOGO 細節。
  • 支援 14 種寬高比,包括 1:4 同 1:8 極端長圖,適合做時間軸、攻略長圖等。
整理重點

使用建議同小結

阿真總結:如果只能用一個,要求高嘅場景揀 ProNano Banana 2 喺整體畫質同細節精度上確實差 Pro 一點。

最佳用法係分工合作Banana 2 負責探索階段,快速跑方向、測構圖、出變體;Pro 負責交付階段,將選定方案推到最終品質。

另外,生成中文長圖如果效果唔滿意,可以試嚇先出英文版,再將滿意嘅英文版翻譯成中文,效果會好好多。

多輪編輯同 Thinking 模式都值得玩,不過篇幅太長,阿真話下次再分享。

圖片


嗨大家好!我係阿真!


假都放曬啦,終於有時間試下 Google 喺2月底推出嘅 Nano Banana 2,官方正式名係 Gemini 3.1 Flash Image。


雖然細節上大部分時候整體可能仲爭啲,比唔上 Nano Banana Pro,但係佢嘅性價比同可控性真係擴展咗好多,用更低成本覆蓋咗更多應用場景。


Nano Banana 2 而家喺 Gemini、Lovart、TapNow、ComfyUI 呢啲平台都支援咗,自己駁 API 都得。


圖片

呢度應該有贊助商廣告㗎,嗚嗚甲方爸爸下次記得揾我。


今日內容可能比較長。文字同圖片都長哈哈哈。但係好得意㗎,一齊睇下啦~


究竟強咗喺邊?


先講結論:Nano Banana 2 嘅重點係快、可控、可以入工作流。


根據官方講法有五個方向嘅進步:


首先,佢將速度拉上 Flash 級別。核心係更快出結果,批量出圖、快速迭代、反覆調整,成本同等待時間都減咗。價格方面,之前講 2K 解像度嘅價格對比 4K 解像度減半,仲有好多渠道費用更抵。


其次係指令跟從更強,可控性提升。同樣嘅提示詞下,更容易按要求去構圖、安排風格同元素,唔使反覆抽卡。描述嘅同佢輸出嘅更接近,要求好多都可以精細實現。


然後係文字生成更可靠 + 支援翻譯/本地化。圖入面嘅中英文可讀性同排版準確性有明顯提升。更重要係佢支援直接將圖片入面嘅文字翻譯甚至本地化。二次修改非常友好。呢個對做海報、資訊卡、電商圖等嚟講會更方便。


以及,更適合結合圖像搜索 Grounding 嘅流程。佢更加似一個可以同檢索參考鏈路配合嘅圖像模型。會先揾依據、揾參考,再基於真實數據生成更貼合需求嘅圖。


Grounding:將一個講法、判斷或模型輸出,建立喺可驗證嘅事實來源上,而唔係只靠猜測。


如果涉及好多知識內容同數據嘅話,生成圖片細節仲有好多問題,有進步,但依然未到完全可靠嘅程度。


最後,依然支援知名 IP 形象;新增咗多個特殊比例支援。尤其係長比例 1:8、8:1、1:4、4:1 嘅效果,對設計有利。雖然效果仲未算好好,但係未來可期,好有潛力。


1. 圖文渲染


Nano Banana 2 中英文渲染準確率都算幾好,多行文字、價格標籤、菜單列表呢啲複雜排版都可以處理得幾好。佢仲支援多語言翻譯,例如上傳一張英文廣告圖,可以直接生成日文、法文等本地化版本,唔止翻譯文字,仲會調整視覺元素嚟配合。


最初我試咗4組 Pro 同 2 嘅對比,之後發現分別唔算太大,除非係非常細小嘅字體或細節,呢節之後我就冇再放 Pro 嘅圖。下面左邊係 Pro ,右邊係 Nano Banana 2 👇


多語言混排:


圖片
圖片
畫面目標與主題:多語言歡迎信息圖,採用包豪斯現代主義設計感,幾何圖形與文字共同構建理性又有温度的視覺。
構圖與鏡頭語言:橫版結構,左側為圓形色塊與箭頭流程,右側為多語言歡迎詞矩陣,頂部標題橫跨兩區,底部細條信息帶收束。
主體元素與層次:第一層是幾何圖形(圓、矩形、斜切塊);第二層是主副標題與語言矩陣;第三層是小型編號、座標刻度與註腳。無人物,強調系統化視覺語言。
光線與色彩材質:高質感平面印刷,主色鈷藍、奶白、炭黑,點綴朱橙;材質乾淨平滑,氛圍理性、明快、展覽級。
主標題:"WELCOME ACROSS BORDERS";字體風格:現代無襯線粗體;視覺效果:平面高對比印刷;字號等級:最大;位置:頂部居中跨欄。
副標題:"全球問候語可視化圖譜";字體風格:中黑人文黑體;視覺效果:細描邊+淺陰影;字號等級:中號;位置:主標題下方左對齊。
說明文字:在右側文本矩陣中按多列展示“歡迎”詞並保留語言含義,包含 Welcome(英語,歡迎)、Bienvenido(西班牙語,歡迎)、Bienvenue(法語,歡迎)、Willkommen(德語,歡迎)、Benvenuto(意大利語,歡迎)、Bem-vindo(葡萄牙語,歡迎)、歡迎(漢語,歡迎)、ようこそ(日語,歡迎)、환영합니다(韓語,歡迎)、أهلاً وسهلاً(阿拉伯語,歡迎)、स्वागत है(印地語,歡迎)、Karibu(斯瓦希里語,歡迎)、Selamat datang(印尼語/馬來語,歡迎)、Maligayang pagdating(菲律賓語,歡迎)、Hoş geldiniz(土耳其語,歡迎)、Welkom(荷蘭語/南非語,歡迎)、Chào mừng(越南語,歡迎)。
符號文字:僅放圖例與導航詞,不新增歡迎詞,如 Legend / Direction / Entry Point / Exit Flow;字體風格:技術等寬體;視覺效果:低對比細線;字號等級:最小;位置:底部圖例條與角落標記。
可讀性與排版約束:圖形不壓住正文,語言矩陣行距一致,主副標題區分明顯,所有文本可一眼辨認。


高密度文字:


圖片
圖片
生成 4:5 豎版新裝飾藝術(neo-art-deco)會議海報,文字密集但完全可讀,版面對齊嚴格。採用階梯式幾何結構、深祖母綠與金屬象牙色,主標題用高反差襯線體。主標題“FUTURE DESIGN FORUM”,副標題“VISUAL SYSTEMS 2026”,說明行強調微文案清晰與層級優先。底部加入 3 個可讀信息膠囊(演講者、城市、工作坊),右上角加入機構徽章,底部加入法律微文案。要求邊緣鋭利、拼寫準確、無字符變形,可直接發佈。


以後做多語言嘅海報,直接將海報圖片畀 AI 佢做參考,再畀我其他語言嘅,線條好穩,文字亦都幾和諧,字體效果都有照顧到(下面呢排圖片都係 2生成嘅)👇


圖片
圖片
圖片
把海報中的全部文字內容都翻譯成阿拉伯語/韓語/日語。


縱深透視都排到,下面兩個我感覺 Pro 嘅處理係更高級:


圖片
圖片
反戰社會議題海報,極簡但強衝擊,中心透視通道由“WEAPONS”構成多層遞進門洞,外層巨字壓向畫面中心,內層紅光漸亮,一名兒童與成人剪影牽手站在遠端,地面黑色瀝青與紅色導向塊形成節奏,整體黑底血紅字、硬陰影、舊印刷紙張紋理與噪點;上圖文字:主標題“把武器放下,把明天還給他們”使用幾何無襯線重黑體、厚描邊與輕凹凸壓印、字號最大、底部居中,副標題“戰爭結束的那一刻,童年才重新開始”畫面中下部居中,說明文字“不是誰贏了,而是誰終於不再失去”使小號、底部單行橫排,符號文字“DISARM / PEACE CORRIDOR / SAFE EXIT”使用等寬斜體粗字、透視扭曲連續複製、字號隨縱深遞減、覆蓋頂面與左右牆體;排版要求主次分明、留白合理、所有文字邊界清晰可讀


圖片
圖片

上圖係 Nano Banana Pro 生成

畫面目標與主題:治癒奇幻角色卡,主角為少年植物師“林沐舟”,十六歲,揹着玻璃温室箱在漂浮島羣採集夜光種子;主題強調成長、修復生態、温柔冒險。  
構圖與鏡頭語言:明快橫版,主角蹲姿觀察發光苔蘚,前景有透明水滴與嫩葉,背景為層疊漂浮島與木橋;左上為角色表情小圖,右側為服裝與工具分解,底部為任務日誌。  
主體元素與層次:主角短捲髮、淺卡其工裝、草綠色圍巾、軟底靴、玻璃採樣瓶、摺疊鏟與手賬;環境元素有藤蔓燈、雲霧、風車温室、微型飛鳥。  
光線、色彩、材質與氛圍:主色調為薄荷綠、奶油黃、天空藍、木棕;光線採用晨霧逆光與植物自發光;材質強調亞麻布、木紋、玻璃通透、濕潤土壤;氛圍輕鬆清新。  
上圖文字重寫與排版:  
主標題:文字“林沐舟”;字體風格圓角無襯線體;視覺效果柔光描邊+輕浮起陰影;字號等級最大;擺放位置左下橫排。  
副標題:文字“漂浮羣島生態修復記錄”;字體風格人文黑體;視覺效果淺綠底條+深色字;字號等級中號;擺放位置主標題上方。  
說明文字:文字“他把每一粒微光種子都編號入冊,用最慢的步伐讓枯萎地帶重新長出風與花。”;字體風格手寫感印刷體;視覺效果紙張顆粒+低飽和墨色;字號等級小號;擺放位置底部中段日誌框。  
符號文字:文字“採樣瓶”“夜光苔”“摺疊鏟”“温室箱”“任務點D3”“今日風向”;字體風格等寬體;視覺效果奶油黃標籤+草綠字+細描邊;字號等級最小;擺放位置對應工具與植物旁註。  
可讀性與排版約束:標題與日誌區分層清楚,註釋不遮擋主動作,文字對比適中,保證柔和色調下依舊清晰可讀。


之前大家討論有提到 Nano Banana 2 嘅人物仲係會出現比較油嘅情況。我個人體驗完之後,想順便再提一點:


如果係用 Gemini 嘅話,我建議大家喺生成人物時,考慮用 JSON 格式對比一下,概率上更容易得到更好嘅人物真實感。大家可以對比自然語言同用 JSON 格式呢兩種唔同類型嘅提示詞所生成嘅圖片效果。呢度我都係用 2K 圖片,如果想要細字細節更好,可以考慮生成 4K 圖片。


下面左邊係自然語言生成,右邊係 JSON 格式提示詞生成。不過呢個圖問題比較明顯,50毫升應該冇咁大👇


圖片
圖片
奢侈香水品牌平面海報,法國高級時裝語境,巴黎左岸夜色靈感, 構圖;主角為一位法式冷豔氣質女性模特(高定黑色緞面禮服,剋制珠寶,濕潤微卷發,淡妝但輪廓立體),手持一隻切割感強的水晶香水瓶,瓶身琥珀色液體在邊緣高光中微微發亮;場景為現代法式公寓與古典石膏線元素融合的室內佈景,背景有柔焦城市夜景與輕微雨痕玻璃反射;整體色彩採用深黑、香檳金、煙灰藍、琥珀金,低飽和但高對比,強調“剋制奢華”。

鏡頭語言:85mm 人像鏡頭質感,淺景深,模特三分之二側身,視線略偏離鏡頭,留白充足用於文案;光線採用電影級三點布光 + 輪廓邊光,皮膚高光細膩,玻璃與金屬反射干淨,陰影層次豐富;材質表現突出絲緞、玻璃、金屬噴頭、石材牆面微紋理;整體呈現虛幻引擎級超寫實渲染質感(UE5 look),全局光照、體積霧極輕、微顆粒膠片感,4K 商業廣告成片品質。

版式與文案(法語):
頂部小號襯線字:MAISON ÉTOILE
中部大標題(高奢襯線,字距拉開):L’OMBRE DORÉE
副標題(無襯線小號):Parfum Intense
底部信息:50 ML • EXTRAIT DE PARFUM
文字排版極簡、呼吸感強、對齊嚴格,避免擁擠;整體氣質必須像法國一線奢侈品牌新品發佈海報,優雅、冷靜、昂貴、可登巴黎地鐵燈箱與高端百貨櫥窗。


2. 真實世界知識


例如玩啲得意嘢,任意城市、任意景點嘅福字打卡(下面係元提示詞,如果係設計 Agent 直接發全文講城市,如果普通生圖工具就畀 AI 再輸入城市得到提示詞):


圖片
圖片
圖片
你是海報生圖提示詞生成器。

任務:用戶只輸入一個城市名,你只輸出一條完整“生圖提示詞”(不要解釋、不要分析)。

強制要求:你輸出的這條生圖提示詞中,必須包含以下執行指令(作為畫面生成約束):
1) 先進行圖像檢索,鎖定該城市真實機位與地標關係,確保建築站位、岸線/山體輪廓、空間透視與真實觀察一致。  

風格與構圖固定要求:
- 豎版3:4,超寫實,節慶電影感,高級審美。  
- 僅出現一隻手:成年女性的手,單手入鏡,禁止雙手、禁止多餘手指或額外肢體。  
- 女性單手從畫面下方自然舉起紅色宣紙卡。  
- 紅紙中央為“福”字鏤空,鏤空後是該城市真實天際線。  
- “福”字佔比控制在紅紙可視面積的50%-55%,筆畫舒展且留白均衡。  
- 50mm真實攝影;淺景深但“福”字邊緣與核心地標同時清晰。  
- 紅紙啞光纖維質感,輕微摺痕,刀刻微毛邊。  

文字與圖標排版固定要求(寫進最終生圖提示詞):
- 主標題僅“福”,最大字,居中。  
- 所有輔助元素必須在紅紙內部下方,且位於“福”字下方,不得落到背景。  
- 左下兩行:  
  - 第一行:城市中文名 + 英文名(例:香港 Hong Kong)  
  - 第二行:固定祝福短句 `WISHING YOU PROSPERITY AND PEACE`  
- 右下元素為“馬頭造型的2026實心填充圖標”透明度80%(塊面填充,非線框,數字與馬頭形體融合,清晰可讀)。  
- 嚴格尺寸規則(必須同時滿足):  
  - 先計算左下兩行文字總高度 `H_text`(含行高與行間距)。  
  - 圖標外接框高度 `H_icon` 必須滿足 `H_icon = H_text`。  
  - 若發生衝突或模型不穩定,強制回退為 `H_icon = 0.90 × H_text`(寧小勿大)。  
  - 絕對禁止 `H_icon > H_text`(硬上限)。  
- 圖標與左下文字組底邊對齊;圖標頂部不得高於左下第一行文字頂部。  
- 圖標僅放在右下安全區,不得侵入“福”字主體區域。  
- 負面約束:禁止 oversized logo、禁止大徽章感、禁止圖標搶主視覺。  
- 輔助元素區域總高度不超過紅紙高度的12%-15%。  
- 除“福”外禁止其他大字;其餘元素低干擾,清晰無重影無亂碼。  
- “福”字以外所有文字與圖標顏色統一為“帶環境色偏移的白”,透明度85%。  

輸出規則:
- 只輸出一條最終生圖提示詞。  
- 不要輸出解釋,不要輸出元提示詞說明。  
- 若文字或圖標尺寸衝突,優先縮小右下圖標,不得放大圖標。


百科全書嗰啲都可以試下,喺真實世界知識上佢都有提升。但係都係嗰句,細節問題仲係有,要核實清楚。


圖片
 搜索王維生平,生成百科全書式長圖,中文。16:9,2K


Search Grounding 本質上係令模型喺生成時可以調用實時搜索結果作為依據。睇落好似有啲料到,但係細節問題都係比較多。


嚟個長圖,呢個係 1:4 同 4:1 嘅比例,目前效果仲爭啲,但係按呢個發展速度,可能到 2 Pro 就可以輕鬆做長圖。


圖片


寬圖:


圖片
創作一張縱向一鏡到底的信息敍事長圖,主題是“碎片化信息如何侵略你的大腦”。畫面按因果連續推進。要求空間與時間無縫流動、視覺隱喻清晰、信息層級明確、畫面連貫無硬切、超長畫幅、科普敍事感強。中文。
風格要求:現代醫學科普視覺風格,乾淨、理性、可信;以高明度白色與冷灰為底,主色為醫療藍+青藍+少量薄荷綠,低飽和且通透;用少量珊瑚橙僅作風險預警點綴;平滑背景、輕微玻璃質感和柔和陰影;線條精確、圖標符號化、留白充足,整體呈現醫院導視/醫學期刊信息圖的專業潔淨感。


呢度有個小技巧,如果安裝咗 Google 瀏覽器嘅 AI,就可以喺搜索完結果之後直接喺結果下面點擊生成資訊圖,生成嘅圖片大約係 1K,畫質比較一般,但係咁出快速資訊圖真係好快。用嚟即時快速內容分享好方便。


圖片


圖片


到呢度我對於麪包與馬戲政策有啲好奇,於是我追問並叫佢保持風格唔變繼續生成,呢個時候可以保持格式更加一致啲:


圖片


3. 角色一致性


超多角色都得。例如我首先直接一次過出 15 個角色,呢度大家都可以睇下佢喺角色細節上嘅跟從程度。


圖片
電影級3D卡通大場景,15個原創IP角色同處一個熱鬧的“森林創意嘉年華廣場”,黃昏暖光,體積光與柔和環境光並存,PBR材質,細節清晰,色彩明快統一。鏡頭為廣角全景、略微俯視,畫面有前景-中景-背景層次,所有角色完整可見、互相有互動、不重疊遮擋關鍵特徵。場景中心是圓形木質舞台與發光地磚,周圍有小攤位、花箱、工具台、全息屏裝置、懸掛彩旗與燈串,地面有自然投影與微反射,整體童趣、電影感、故事性強。

15個角色全部出現且彼此不同,並在同一時刻進行各自動作:
1. 熊貓宇航員在舞台左側調試噴氣揹包;
2. 狐狸魔法師在舞台前方揮動法杖釋放紫色微光粒子;
3. 企鵝廚師在餐車前翻鍋,鍋裏有可控火焰;
4. 青蛙快遞員踩滑板穿過廣場遞送包裹;
5. 考拉搖滾吉他手在小舞台彈奏電吉他;
6. 柴犬偵探在路燈旁拿放大鏡觀察線索;
7. 兔子機械師在工具台維修機械臂零件;
8. 小鹿花藝師在花箱邊整理花束與藤蔓;
9. 章魚程序員在全息終端前用多觸手同時操作透明屏幕;
10. 小雞牛仔甩動套索與觀眾互動;
11. 浣熊攝影師半蹲抓拍全場活動;
12. 海狸木匠在木工區敲打併拼裝小木牌;
13. 貓咪調酒師在吧枱搖雪克杯調製飲品;
14. 刺蝟園丁給盆栽澆水並擺放幼苗;
15. 小龍甜品師端着紙杯蛋糕托盤從甜品攤走出微笑招手。

統一要求:每個角色體型比例、服裝結構、道具、主色調、表情氣質都明顯不同;角色之間有視線與動作呼應,形成“嘉年華協作”敍事;不出現文字、logo、水印、邊框;不裁切角色;高分辨率,超精細,乾淨背景控制,整體像一張可用於IP世界觀海報的3D羣像場景圖。


然後我可以叫呢 15 個角色出現喺同一個場景入面,並且保持佢哋細節上嘅一致性。


圖片
電影級3D卡通大場景,15個原創IP角色同處一個熱鬧的“森林創意嘉年華廣場”,黃昏暖光,體積光與柔和環境光並存,PBR材質,細節清晰,色彩明快統一。鏡頭為廣角全景、略微俯視,畫面有前景-中景-背景層次,所有角色完整可見、互相有互動、不重疊遮擋關鍵特徵。場景中心是圓形木質舞台與發光地磚,周圍有小攤位、花箱、工具台、全息屏裝置、懸掛彩旗與燈串,地面有自然投影與微反射,整體童趣、電影感、故事性強。

15個角色全部出現且彼此不同,並在同一時刻進行各自動作:
1. 熊貓宇航員在舞台左側調試噴氣揹包;
2. 狐狸魔法師在舞台前方揮動法杖釋放紫色微光粒子;
3. 企鵝廚師在餐車前翻鍋,鍋裏有可控火焰;
4. 青蛙快遞員踩滑板穿過廣場遞送包裹;
5. 考拉搖滾吉他手在小舞台彈奏電吉他;
6. 柴犬偵探在路燈旁拿放大鏡觀察線索;
7. 兔子機械師在工具台維修機械臂零件;
8. 小鹿花藝師在花箱邊整理花束與藤蔓;
9. 章魚程序員在全息終端前用多觸手同時操作透明屏幕;
10. 小雞牛仔甩動套索與觀眾互動;
11. 浣熊攝影師半蹲抓拍全場活動;
12. 海狸木匠在木工區敲打併拼裝小木牌;
13. 貓咪調酒師在吧枱搖雪克杯調製飲品;
14. 刺蝟園丁給盆栽澆水並擺放幼苗;
15. 小龍甜品師端着紙杯蛋糕托盤從甜品攤走出微笑招手。

統一要求:每個角色體型比例、服裝結構、道具、主色調、表情氣質都明顯不同;角色之間有視線與動作呼應,形成“嘉年華協作”敍事;不出現文字、logo、水印、邊框;不裁切角色;高分辨率,超精細,乾淨背景控制,整體像一張可用於IP世界觀海報的3D羣像場景圖。


有角色設定圖嘅情況下,長提示詞同自由發揮佢都可以控制得幾好👇


圖片
3D卡通電影質感,4x4十六宮格分鏡海報,統一世界觀與統一角色建模(沿用同一套15個IP角色設定),每個格子為獨立小場景,單格只出現1-2個角色,鏡頭語言清晰,整體從左到右、從上到下形成完整故事線。畫面要求:正方形總畫幅,16個格子邊距一致、留白均勻、排版整齊,柔和體積光,PBR材質,色彩明快,表情誇張可愛,動作有戲劇性,不出現文字、logo、水印。

故事主題:森林創意嘉年華從籌備到突發停電再到重啓,最後以“開場瞬間”收束。

第1格(清晨)熊貓宇航員獨自在廣場中央檢查噴氣揹包,晨光灑下。
第2格 狐狸魔法師與小鹿花藝師佈置入口花環與彩旗,輕鬆微笑。
第3格 企鵝廚師與小龍甜品師在餐車前備餐,鍋中微火與甜點蒸汽。
第4格 青蛙快遞員滑板送來“核心零件箱”,兔子機械師在門口接貨。
第5格 浣熊攝影師單人測試相機機位,低角度取景嘉年華主舞台。
第6格 海狸木匠與刺蝟園丁搭建木質指示牌和盆栽邊界,細節忙碌。
第7格 貓咪調酒師與小雞牛仔試營業互動,套索在空中形成弧線。
第8格 章魚程序員獨自在全息控制枱前調試燈光系統,藍色屏幕發光。
第9格(突發)全場突然斷電,章魚程序員與柴犬偵探在黑暗中發現異常線纜。
第10格 兔子機械師與熊貓宇航員聯手修復主電機,工具火花飛濺。
第11格 狐狸魔法師與青蛙快遞員在高處重新連接能量導管,動態感強。
第12格 企鵝廚師與小龍甜品師安撫排隊觀眾,遞出熱食和紙杯蛋糕。
第13格(恢復)全場燈串重新點亮,浣熊攝影師抓拍關鍵瞬間。
第14格 柴犬偵探與海狸木匠確認結構安全,二人擊掌慶祝。
第15格 考拉吉他手與小雞牛仔在舞台熱場演出,節奏歡快。
第16格(新結局)熊貓宇航員按下“開場按鈕”,狐狸魔法師在旁釋放金色粒子,主舞台燈光同時點亮,遠處可見模糊人羣與其他角色剪影,形成“慶典正式開始”的收束畫面。

統一約束:角色外觀必須與設定一致且彼此明顯不同;每格情節連續、光色連貫;每格最多2個角色;鏡頭多樣化(遠景、中景、近景交替);整體是一張可讀故事的十六宮格3D卡通敍事海報。無文字


Nano Banana 2 官方話同一工作流入面最多支援 5 個角色嘅相似度保持,同 14 個對象嘅保真度。可以更穩定咁做連續內容,繪本系列、品牌 IP 多場景、教程分步圖、打卡系列等等,角色唔走樣,內容都更方便積累成系列。


真實人物嘅都得。


圖片
超寫實攝影拼圖肖像,橫幅構圖,畫面嚴格五等分並保持每一格視覺權重一致,每格1位不同人物+不同場景,五人身高比例自然,頭部位置統一在上三分線附近,整體像國際人物專題攝影。第1格:22歲中東女性,深棕捲髮,雀斑明顯,穿淺灰連帽衞衣,背景是大學圖書館窗邊,暖陽斜射到木質書架。第2格:47歲東亞男性,寸頭,輕微胡茬,穿深色西裝外套和高領針織衫,背景是現代辦公室會議室,玻璃牆和城市天際線。第3格:29歲非裔女性,髒辮盤發,金屬圓環耳環,穿橄欖綠飛行夾克,背景是地鐵站台,熒光燈與列車虛化光帶。第4格:33歲白人男性,長髮扎低馬尾,牛仔襯衫疊穿皮圍裙,背景是木工工作室,工具牆和木屑細節清晰。第5格:26歲拉丁裔男性,短捲髮,淺色亞麻襯衫,背景是海邊漁港黃昏,船隻和濕潤空氣層次分明。光線設定:每格依據環境獨立布光但整體色調統一為自然電影感,中等對比度,真實陰影過渡;鏡頭35mm,ISO 200,快門1/160,真實膚色與細節,絕對寫實,無插畫感,無AI塑料皮膚,無logo無字幕。


將上面5個角色放喺一個場景入面:


圖片
超寫實電影級羣像攝影,單一連貫場景,不分屏不拼圖:黃昏時分的濱海創意園共享大廳,左側是木質書牆與閲讀窗位,中部是玻璃會議區與開放通道,右側延伸到木工工作台和可見船隻的港口露台,五人同時出現在同一空間並保持自然社交距離,整體敍事為“跨職業人羣在同一場域協作交流”。人物設定與動作:22歲中東女性,深棕捲髮、明顯雀斑、淺灰連帽衞衣,站在書架旁翻閲一本筆記並抬眼傾聽;47歲東亞男性,寸頭、輕微胡茬、深色西裝外套+高領針織衫,站在玻璃牆前手勢講解;29歲非裔女性,髒辮盤發、金屬圓環耳環、橄欖綠飛行夾克,邊看手機上的路線圖邊轉身回應同伴;33歲白人男性,長髮低馬尾、牛仔襯衫疊穿皮圍裙,在木工台上輕扶木板並暫停操作加入對話;26歲拉丁裔男性,短捲髮、淺色亞麻襯衫,站在露台入口手持咖啡望向眾人點頭示意。五人身高比例自然,頭部高度大致落在同一上三分線附近,人物前後層次清晰但視覺權重均衡。光線為統一自然電影感:室內暖色環境光+窗外冷色天光混合,中等對比度,真實陰影過渡,膚色準確,空氣中輕微濕潤感,細節清晰可見(木紋、玻璃反射、金屬工具、遠處船體)。鏡頭35mm,ISO 200,快門1/160,淺景深但五人面部均清楚可辨,紀實風格,絕對寫實,無插畫感,無AI塑料皮膚,無logo無字幕。


Nano Banana 2 唔使參考圖,同一張圖入面出現角色多次,出現多個角色,都可以維持一致性。


呢個喺需要做連續內容嘅時候真係會好方便,細節上更加有說服力。例如下面呢度,完全靠文生圖佢喺多個形象上都維持得幾好一致性。唔需要好長嘅提示詞都可以有幾好嘅效果,只要有諗頭都可以輕鬆做出屬於自己嘅漫畫小場景👇


圖片
四格漫畫;主體:主角、左肩天使、右肩惡魔、第三隻小動物;動作:天使勸學習、惡魔勸躺平,第三隻提議先吃東西;場景:房間書桌前;鏡頭:肩部近景+三方對峙;風格:可愛寓言式漫畫;中文;約束:三角色造型差異明顯、結尾温柔搞笑。


圖片
四格漫畫;主體:法官貓、被告人類、陪審團小貓;動作:審理“為何又熬夜”,判決沒收手機、強制睡覺、獎勵小魚乾(給貓);場景:迷你法庭;鏡頭:法庭全景+法槌特寫;風格:可愛嚴肅擬人漫畫,中文;約束:貓咪權威感與可愛並存。


包括 IP 嘅都係,細到 LOGO 嘅細節都可以維持到,做延伸更方便👇


圖片
創建一組6幀的品牌吉祥物多場景應用系列圖。在所有畫面中保持吉祥物角色的身份一致性。

角色設定:
- 吉祥物"咖小豆":一顆擬人化的咖啡豆角色,深棕色橢圓形身體,有兩隻圓圓的大眼睛和微笑的嘴巴,短小的四肢,頭頂冒着一縷熱氣(像剛烘焙好的咖啡豆),始終佩戴一個微型咖啡師圍裙(白色,上面有一個小咖啡杯圖標)

六幀場景內容:

第一幀·產品包裝場景:
咖小豆站在一個咖啡袋包裝的正面,雙手舉起一面小旗幟,上面寫着"新鮮烘焙",背景是簡潔的牛皮紙色。
第二幀·社交媒體頭像場景:
咖小豆的大頭特寫,一隻手托腮,歪頭微笑,眨眼表情,背景是品牌色漸變(深棕到焦糖色)。圓形構圖。
第三幀·節日營銷場景:
咖小豆穿着聖誕老人帽和紅色斗篷,站在一棵用咖啡杯和咖啡豆裝飾的聖誕樹旁邊,手中端着一杯拉花熱巧克力,周圍飄着雪花。
第四幀·教學科普場景:
咖小豆穿着教授的畢業帽和小眼鏡,手持教鞭指向一塊黑板,黑板上畫着"咖啡豆烘焙程度"的三個階段(淺烘中烘深烘),表情認真嚴肅但可愛。
第五幀·運動活力場景:
咖小豆穿着運動頭帶和跑鞋,正在慢跑,身後留下一串咖啡豆形狀的腳印,背景是清晨的公園綠道,周圍有幾杯咖啡外帶杯在為他加油。
第六幀·睡覺晚安場景:
咖小豆穿着小睡衣和睡帽,抱着一個咖啡杯形狀的抱枕,閉着眼睛甜甜地睡在一片咖啡豆堆成的小牀上,頭頂的熱氣變成了ZZZ睡眠符號,周圍點綴着星星和月亮。
視覺風格:3D卡通渲染風格,類似Line Friends的質感——圓潤光滑的表面、柔和的陰影、明亮友好的配色。所有畫面分辨率4K。中文。


單張插圖嘅穩定性越來越好,扁平轉 3D 效果都好和諧:


圖片
圖片
一組扁平化矢量風格的辦公場景插畫:一個戴眼鏡的男性角色坐在電腦前工作,桌上有咖啡杯、文件和枱燈,背景是簡約的辦公室環境(書架、窗户、綠植),使用明亮的藍色、橙色和白色配色方案,類似Google Material Design的扁平插畫風格,乾淨簡潔的線條,沒有任何文字。
/第2個
保持畫面中的所有元素不變(人物、電腦、咖啡杯、文件、枱燈、書架、窗户、綠植),保持整體構圖和藍色+橙色+白色的配色方案不變。將視覺風格從扁平化矢量插畫改為3D卡通渲染風格:
1. 所有物體添加立體感,具有柔和的圓角和厚度
2. 人物從扁平剪影變為Q版3D卡通角色,保留眼鏡和坐姿
3. 桌面物品變為3D等距視角的微縮模型質感
4. 添加柔和的環境光遮蔽(AO)陰影效果
5. 材質質感從純色色塊變為類似黏土/塑料的啞光質感
6. 保持明亮友好的整體氛圍
整體效果類似Pixar/Nintendo風格的3D卡通渲染。


4. 多比例圖片


Nano Banana 2 支援 14 種寬高比,解像度由 512px 到 4K。常見嘅 9:16、16:9、1:1 自然唔使多講,非常得意嘅係佢而家已經支援 1:4 甚至 1:8 呢啲極端長圖比例。以後想做長圖攻略、時間軸資訊圖、豎版故事條、全景海報,有咗更多可能性。


圖片


跟住嚟睇啲長比例同全景比例。下面係 1:4 嘅效果👇


圖片
搜索達芬奇生平,生成洛可可風格百科全書式長圖,中文。


講真而家極長比例嘅質素仲未達到常規比例咁嘅水準,但已經好唔錯,好有潛力。


相比 8:1 嘅話,4:1 會控制得好啲,畢竟細節都少啲。


圖片
超高審美二次元電影感羣像海報,夜色霓虹雨後街區,鏡頭為24mm廣角低機位,前中後景分層清晰,20位日本動漫角色同場但保持各自核心辨識特徵,整體美術統一為高對比賽博霓虹+膠片顆粒:五條悟穿白色高領風衣單手撥開發光雨幕;虎杖悠仁穿學院長外套躍起落地;伏黑惠穿機能斗篷召出黑色影犬輪廓;禪院真希穿街頭護具扛金屬長棍;炭治郎穿城市偵探大衣握髮光指南針;禰豆子穿暗紅機車夾克踩滑板急停;我妻善逸穿DJ耳機外套在電光中轉身;嘴平伊之助穿拳擊斗篷站上消防栓;阿尼亞穿星空斗篷舉放大鏡;約爾穿黑金晚禮戰術裙持雨傘回眸;洛伊德穿特工三件套整理手套;芙莉蓮穿現代極簡長風衣托起藍色魔法粒子;欣梅爾穿復古騎士休閒裝微笑側立;瑪奇瑪穿導演風黑西裝打板;電次穿塗鴉圍裙舉起鏈鋸形霓虹道具;帕瓦穿紅色棒球夾克踩欄杆;星野愛穿舞台機能服甩出彩光絲帶;後藤一里穿黑粉搖滾演出服抱吉他縮肩;潔世一穿高街訓練服高速盤球;蜂樂回穿彩繪衞衣倒掛在路牌。背景是多層城市遊樂夜市:空中輕軌、透明天橋、懸浮廣告屏改為抽象光塊、蒸汽井蓋、遠景摩天輪,主光紫藍、補光暖橙,濕地反射、體積霧、動態光斑、布料與金屬材質細節拉滿,畫面乾淨高級、角色不擁擠、動勢互補。純畫面輸出:無任何文字、無字幕、無logo、無水印、無UI


做全景圖好適合。


修仙全景:


圖片
東方奇幻水墨與3D融合的超寬卷軸場景,畫面像一幅會呼吸的山海長卷:左側是雲海中的懸崖古寺與晨鐘薄霧,中段是層疊山谷、飛瀑、古橋、竹林與流光神獸羣,右側是夜色初臨的星湖、浮島與遠古天門。要求同一畫幅內出現時間流動感:從左到右由清晨過渡到黃昏再到藍夜,光色自然銜接。材質融合宣紙肌理、水墨暈染邊緣、半透明靈氣粒子、石木建築真實體積。鏡頭採用高空俯瞰並結合局部貼近景,前景有飛鳥與雲絲引導視線,中段主敍事最密集,右側以寧靜神秘收束。整體氛圍空靈壯闊、詩性敍事、層次深遠,細節精緻、清晰度高、電影級環境設計,不出現文字、logo、水印。


蒸汽全景:


圖片
超寬幅電影概念圖,蒸汽朋克天空港口在日落時分全面運轉:畫面最左側是巨型銅製飛艇船塢與升降吊臂,中段是多層步道、齒輪塔樓、玻璃穹頂與人流市場,最右側是雲海邊緣的離港跑道與遠處懸浮城。大量動態元素同時發生:飛艇起降、機械信使穿梭、蒸汽閥門噴薄、空中軌道車交錯,形成強烈“忙碌文明”敍事。材質重點表現拉絲黃銅、舊化鋼鐵、皮革、木質甲板、霧化玻璃;光照為金色逆光、側向體積光、局部煤氣燈暖光,煙霧層次明顯,遠近景清晰分離。鏡頭語言為高位廣角全景,前景有鏈條和管道壓景,中景突出港口核心活動,遠景展示天空城輪廓。整體色彩為琥珀金、氧化銅綠、煙灰藍,細節密度高但構圖有秩序,超清、鋭利、電影級質感,不出現文字、logo、水印。


未來全景:


圖片
復古未來主義太空殖民地超寬場景,靈感來自七十年代科幻海報但以現代3D渲染完成:左側是紅色荒漠中的圓頂農場與太陽能陣列,中段是主城交通環與透明穹頂生態區,右側是發射井、軌道電梯基座與遠處星環天際線。強調人類日常與宏大工程並存:工程車編隊、維護機器人、温室作業、觀景平台人羣、遠處火箭準備升空。色彩控制為奶油白、復古橙、陶土紅、鈷藍,輕微膠片顆粒疊加但主體鋭利。光線為低角度斜陽與環境冷補光,陰影長且清晰,空間透視強烈。鏡頭為橫向超廣角,前景放置設備與岩石增強尺度感,中景突出城市結構,遠景給出行星地平線與軌道設施。整體風格懷舊卻先進,敍事完整、信息飽滿、可作為超寬海報主視覺,不出現文字、logo、水印。


油畫史詩全景:


圖片
圖片
超寬幅文藝復興宗教神話壁畫場景,西斯廷穹頂敍事美學,但整體氣質更柔和、更温馨:天穹被分為連續敍事區,中心是温暖神聖之光輕柔灑下,四周環繞天使、先知與人間家庭羣像,人物表情平靜慈愛,姿態優雅舒展,強調守護、祝福與希望。採用古典濕壁畫質感,保留石灰牆體與手工顏料層次,但弱化厚重衝突感,突出細膩筆觸與柔和過渡。色彩改為低飽和暖調:奶油白、淺金、蜜桃粉、鼠尾草綠、霧藍、暖赭石;光線為晨曦般漫射光與邊緣柔光,減少強烈明暗對比,增強空氣感與親和力。構圖保持莊重對稱與穹頂宏偉尺度,雲層與布幔作為柔性引導線,前中後景清晰但不壓迫。整體氛圍寧靜、撫慰、神聖而親近,博物館級細節,不出現現代物件,不出現文字、logo、水印。,中文文字


講到穹頂,我放假喺意大利同西班牙睇咗好鬼多,如果有一期唔係 AI 主題,純粹傾旅行同經歷,傾文藝復興三傑同高迪、多美內克,我分享嘅話大家會想睇嗎🤔


上面嘅做豎版都可以試下,呢度唔想篇幅太長我就唔放啦。大家都可以直接用我上面嘅提示詞試下超長豎版。


詳情頁,文案同賣點都掌握到,一致性都幾好。不過細節上都仲係有問題。我都係嗰句,有潛力,仲有較大進步空間。以後如果可以穩定咁出就真係好刺激。


圖片
設計感手袋白底三視圖,極簡雲朵包(柔軟鼓感輪廓、磁吸開合、短提手+可拆肩帶、霧麪皮革),一張圖橫向並列 front side back,白底無縫,鏡頭一致,棚拍柔光,細節高清,風格清新時髦,適合年輕女性市場


圖片
圖片
為這款奶油白雲朵褶皺女包生成一張中文電商長圖詳情頁:整體保持極簡高級調性,先展示產品主視覺和三視圖(正面/側面/背面),再依次覆蓋設計賣點、材質與工藝細節、背法與上身效果、容量展示、尺寸參數、細節特寫、配色與適用場景、售後與購買引導;要求圖文層級清晰、移動端易讀、中文文案完整無錯字亂碼,重點突出質感、實用性、百搭性和購買轉化。
輕奢品牌物件插畫化低密度視覺風格,主視覺居中懸浮,大面積留白增強高級感。配色採用低飽和體系,情緒温和、統一度高。線條細而柔,環境元素極簡,重點突出產品本體與品牌識別。整體更偏情緒廣告畫面而非信息承載型信息圖。
/
為這款奶油白雲朵褶皺女包生成一張中文電商長圖詳情頁:整體保持極簡高級調性,先展示產品主視覺和三視圖(正面/側面/背面),再依次覆蓋設計賣點、材質與工藝細節、背法與上身效果、容量展示、尺寸參數、細節特寫、配色與適用場景、售後與購買引導;要求圖文層級清晰、移動端易讀、中文文案完整無錯字亂碼,重點突出質感、實用性、百搭性和購買轉化。電商時尚廣告頁”風格:用中軸大產品圖做絕對主角,上下分層文案完成轉化閉環。
色彩以黑白灰秩序承載信息,以單一深色產品製造焦點與品牌記憶。字體採用高端襯線標題 + 現代無襯線正文的經典雜誌廣告組合,兼顧調性與可讀性。背景以線稿城市和生活道具補足場景,但不搶產品主視覺。適合新品上新、爆款推廣與品牌社媒廣告素材。保持留白提升高級感。


仲有卡通科普長圖,英文版效果都係更好,我有一個鬼主意,如果中文效果你始終唔滿意,可以先生成英文版,然後將滿意嘅英文版圖片畀佢翻譯成中文版,效果幾好㗎。


圖片
圖片
生成《社區文明養犬規則卡》
內容結構:(牽引繩、清理糞便、禁入區域、疫苗、噪音、投訴渠道)。
信息圖風格:以白底和綠色主色建立清晰秩序,用黃色做情緒化提醒。版式採用豎向單欄編號遞進,配合大圓角氣泡容器與Q版情境插畫,使規則內容更易讀、易記。文字系統強調標題強識別、正文高可讀、註釋弱化,整體信息密度適中。圖形語言以粗線手繪輪廓與輕裝飾符號為核心,兼顧親和感與規範感。比例:1:8,4K圖片,非常清晰,非常精細的文字渲染


同埋實際應用中直接叫佢修改比例嘅時候,佢嘅比例填充修改效果都係幾唔錯。


再嚟就係多輪編輯同 Thinking 模式,其實都幾好。篇幅真係太長,下次有機會再寫啦🤔


小結


我個人建議:如果只能用一個,質量要求高嘅場景都係揀 Pro。Nano Banana 2 喺整體畫質同細節精度上確實仲爭 Pro 少少,呢個唔使迴避。


如果想性價比更高,可以當成兩個工序咁做。


Banana 2 負責探索階段,快速跑方向、測構圖、測文字排版、出 10 個變體睇邊個感覺啱,成本低、速度快,試錯唔肉痛。Pro 負責交付階段,方向定咗,將選定方案推到最終交付嘅品質。


咁樣既保證咗效率,又冇犧牲最終完成度。當然大家都可以根據自己嘅預算同需求來判斷點樣搭配。


好啦,關於 Nano Banana 2 嘅分享先到呢度,仲有好多實用用法同創意,下次有機會再分享。如果你都有更多 Nano Banana 2 嘅趣味玩法,或者有啲咩用法想傾,歡迎評論區一齊交流,都期待大家猛猛三連鼓勵阿真!


下期見~


往期回顧


Nano Banana Pro 超多用法合集

Nano Banana Pro 一手體驗

Nano Banana 超多玩法分享

16 組案例測試 Gemini 2.0


圖片


嗨大家好!我是阿真!


假都放完了,終於有時間來嘗試一下 Google 在 2 月底發佈的 Nano Banana 2 了,官方正式名稱是 Gemini 3.1 Flash Image 。


雖然從細節上大部分時候整體可能還比不上 Nano Banana Pro,但是它也確實在性價比和可控性上做了很大擴展,用更低的成本覆蓋了更多的應用場景。


Nano Banana 2 目前在 Gemini 和 Lovart、TapNow 、ComfyUI 等平台也都支持了,另外自己接 API 也可以。


圖片

此處應有贊助商廣告的,嗚嗚甲方霸霸下次記得找我。


今天的內容可能比較長。文字內容和圖片都長哈哈哈。但是很有意思的,一起來看看吧~


到底變強在哪?


先說結論:Nano Banana 2 的重點是快、可控 、能進工作流。


根據官方的說法有五個方向的進步:


首先,它把速度拉到 Flash 級別了。核心就是更快出結果,批量出圖、快速迭代、反覆調整,成本和等待時間都砍了下來。價格上,之前說 2K 分辨率的價格對比 4K 分辨率對半砍了,還有很多渠道費用更划算。


其次是指令遵循更強,可控性提升。同樣的提示詞下,更容易按要求去構圖、安排風格和元素,不用反覆抽卡。描述的和它輸出的更接近了,要求很多也能精細實現了。


然後就是文字生成更可靠 + 支持翻譯/本地化。圖裏的中英文可讀性和排版準確性有明顯提升。更重要的是它支持直接把圖片裏的文字翻譯甚至本地化。二次修改非常友好。這對做海報、信息卡、電商圖等來說會更方便了。


以及,更適合結合圖像搜索 Grounding 的流程。它更像一個能和檢索參考鏈路配合的圖像模型。會先找依據、找參考,再基於真實數據生成更貼合需求的圖。


Grounding :把一個說法、判斷或模型輸出,建立在可驗證的事實來源上,而不是隻靠猜測。


如果涉及很多知識內容和數據的話,生成圖片細節還是有很多問題的,有進步,但還是依然沒到完全可靠的程度。


最後,依然支持知名 IP 形象 ;新增了多個特殊比例支持。尤其是長比例 1:8、8:1、1:4、4:1 的效果,利好設計。雖然效果還不算太好,但是未來可期,很有潛力。


1. 圖文渲染


Nano Banana 2 中英文渲染準確率還是很不錯的,多行文字、價格標籤、菜單列表這種複雜排版也能比較好地處理。它還支持多語言翻譯,比如上傳一張英文廣告圖,可以直接生成日語、法語等本地化版本,不只是翻譯文字,還會調整視覺元素來適配。


最開始我嘗試了4 組 Pro 和 2 的對比,後面發現差別不算太大,除非是非常細小的字體或者細節,這一節以後我就沒有再放 Pro 的圖了。下方左邊是 Pro ,右邊是 Nano Banana 2 👇


多語言混排:


圖片
圖片
畫面目標與主題:多語言歡迎信息圖,採用包豪斯現代主義設計感,幾何圖形與文字共同構建理性又有温度的視覺。
構圖與鏡頭語言:橫版結構,左側為圓形色塊與箭頭流程,右側為多語言歡迎詞矩陣,頂部標題橫跨兩區,底部細條信息帶收束。
主體元素與層次:第一層是幾何圖形(圓、矩形、斜切塊);第二層是主副標題與語言矩陣;第三層是小型編號、座標刻度與註腳。無人物,強調系統化視覺語言。
光線與色彩材質:高質感平面印刷,主色鈷藍、奶白、炭黑,點綴朱橙;材質乾淨平滑,氛圍理性、明快、展覽級。
主標題:"WELCOME ACROSS BORDERS";字體風格:現代無襯線粗體;視覺效果:平面高對比印刷;字號等級:最大;位置:頂部居中跨欄。
副標題:"全球問候語可視化圖譜";字體風格:中黑人文黑體;視覺效果:細描邊+淺陰影;字號等級:中號;位置:主標題下方左對齊。
說明文字:在右側文本矩陣中按多列展示“歡迎”詞並保留語言含義,包含 Welcome(英語,歡迎)、Bienvenido(西班牙語,歡迎)、Bienvenue(法語,歡迎)、Willkommen(德語,歡迎)、Benvenuto(意大利語,歡迎)、Bem-vindo(葡萄牙語,歡迎)、歡迎(漢語,歡迎)、ようこそ(日語,歡迎)、환영합니다(韓語,歡迎)、أهلاً وسهلاً(阿拉伯語,歡迎)、स्वागत है(印地語,歡迎)、Karibu(斯瓦希里語,歡迎)、Selamat datang(印尼語/馬來語,歡迎)、Maligayang pagdating(菲律賓語,歡迎)、Hoş geldiniz(土耳其語,歡迎)、Welkom(荷蘭語/南非語,歡迎)、Chào mừng(越南語,歡迎)。
符號文字:僅放圖例與導航詞,不新增歡迎詞,如 Legend / Direction / Entry Point / Exit Flow;字體風格:技術等寬體;視覺效果:低對比細線;字號等級:最小;位置:底部圖例條與角落標記。
可讀性與排版約束:圖形不壓住正文,語言矩陣行距一致,主副標題區分明顯,所有文本可一眼辨認。


高密度文字:


圖片
圖片
生成 4:5 豎版新裝飾藝術(neo-art-deco)會議海報,文字密集但完全可讀,版面對齊嚴格。採用階梯式幾何結構、深祖母綠與金屬象牙色,主標題用高反差襯線體。主標題“FUTURE DESIGN FORUM”,副標題“VISUAL SYSTEMS 2026”,說明行強調微文案清晰與層級優先。底部加入 3 個可讀信息膠囊(演講者、城市、工作坊),右上角加入機構徽章,底部加入法律微文案。要求邊緣鋭利、拼寫準確、無字符變形,可直接發佈。


以後做多語言的海報,直接把海報圖片給 AI 讓他做參考,再給我其他語言的,線條穩穩的,文字也比較和諧,字體效果也有照顧到(下面這排圖片都是 2生成的)👇


圖片
圖片
圖片
把海報中的全部文字內容都翻譯成阿拉伯語/韓語/日語。


縱深透視也能排,下面兩個我感覺Pro的處理是更高級的:


圖片
圖片
反戰社會議題海報,極簡但強衝擊,中心透視通道由“WEAPONS”構成多層遞進門洞,外層巨字壓向畫面中心,內層紅光漸亮,一名兒童與成人剪影牽手站在遠端,地面黑色瀝青與紅色導向塊形成節奏,整體黑底血紅字、硬陰影、舊印刷紙張紋理與噪點;上圖文字:主標題“把武器放下,把明天還給他們”使用幾何無襯線重黑體、厚描邊與輕凹凸壓印、字號最大、底部居中,副標題“戰爭結束的那一刻,童年才重新開始”畫面中下部居中,說明文字“不是誰贏了,而是誰終於不再失去”使小號、底部單行橫排,符號文字“DISARM / PEACE CORRIDOR / SAFE EXIT”使用等寬斜體粗字、透視扭曲連續複製、字號隨縱深遞減、覆蓋頂面與左右牆體;排版要求主次分明、留白合理、所有文字邊界清晰可讀


圖片
圖片

上圖為Nano Banana Pro生成

畫面目標與主題:治癒奇幻角色卡,主角為少年植物師“林沐舟”,十六歲,揹着玻璃温室箱在漂浮島羣採集夜光種子;主題強調成長、修復生態、温柔冒險。  
構圖與鏡頭語言:明快橫版,主角蹲姿觀察發光苔蘚,前景有透明水滴與嫩葉,背景為層疊漂浮島與木橋;左上為角色表情小圖,右側為服裝與工具分解,底部為任務日誌。  
主體元素與層次:主角短捲髮、淺卡其工裝、草綠色圍巾、軟底靴、玻璃採樣瓶、摺疊鏟與手賬;環境元素有藤蔓燈、雲霧、風車温室、微型飛鳥。  
光線、色彩、材質與氛圍:主色調為薄荷綠、奶油黃、天空藍、木棕;光線採用晨霧逆光與植物自發光;材質強調亞麻布、木紋、玻璃通透、濕潤土壤;氛圍輕鬆清新。  
上圖文字重寫與排版:  
主標題:文字“林沐舟”;字體風格圓角無襯線體;視覺效果柔光描邊+輕浮起陰影;字號等級最大;擺放位置左下橫排。  
副標題:文字“漂浮羣島生態修復記錄”;字體風格人文黑體;視覺效果淺綠底條+深色字;字號等級中號;擺放位置主標題上方。  
說明文字:文字“他把每一粒微光種子都編號入冊,用最慢的步伐讓枯萎地帶重新長出風與花。”;字體風格手寫感印刷體;視覺效果紙張顆粒+低飽和墨色;字號等級小號;擺放位置底部中段日誌框。  
符號文字:文字“採樣瓶”“夜光苔”“摺疊鏟”“温室箱”“任務點D3”“今日風向”;字體風格等寬體;視覺效果奶油黃標籤+草綠字+細描邊;字號等級最小;擺放位置對應工具與植物旁註。  
可讀性與排版約束:標題與日誌區分層清楚,註釋不遮擋主動作,文字對比適中,保證柔和色調下依舊清晰可讀。


之前大家討論有提到 Nano Banana 2 的人物還是會出現比較油的情況。在我個人體驗後,想順便再提一點:


如果是使用 Gemini 的話,我推薦大家在生成人物時,考慮使用 JSON 格式對比一下,概率上更容易獲得更好的人物真實感。大家可以對比一下自然語言和使用 JSON 格式這兩種不同類型的提示詞所生成的圖片效果。這裏我都使用的是 2K 圖片,如果想要小字細節更好,可以考慮生成 4K 圖片。


下方左邊是自然語言生成,右邊是 JSON 格式提示詞生成。不過這個圖問題比較明顯,50毫升應該沒有這麼大的👇


圖片
圖片
奢侈香水品牌平面海報,法國高級時裝語境,巴黎左岸夜色靈感, 構圖;主角為一位法式冷豔氣質女性模特(高定黑色緞面禮服,剋制珠寶,濕潤微卷發,淡妝但輪廓立體),手持一隻切割感強的水晶香水瓶,瓶身琥珀色液體在邊緣高光中微微發亮;場景為現代法式公寓與古典石膏線元素融合的室內佈景,背景有柔焦城市夜景與輕微雨痕玻璃反射;整體色彩採用深黑、香檳金、煙灰藍、琥珀金,低飽和但高對比,強調“剋制奢華”。

鏡頭語言:85mm 人像鏡頭質感,淺景深,模特三分之二側身,視線略偏離鏡頭,留白充足用於文案;光線採用電影級三點布光 + 輪廓邊光,皮膚高光細膩,玻璃與金屬反射干淨,陰影層次豐富;材質表現突出絲緞、玻璃、金屬噴頭、石材牆面微紋理;整體呈現虛幻引擎級超寫實渲染質感(UE5 look),全局光照、體積霧極輕、微顆粒膠片感,4K 商業廣告成片品質。

版式與文案(法語):
頂部小號襯線字:MAISON ÉTOILE
中部大標題(高奢襯線,字距拉開):L’OMBRE DORÉE
副標題(無襯線小號):Parfum Intense
底部信息:50 ML • EXTRAIT DE PARFUM
文字排版極簡、呼吸感強、對齊嚴格,避免擁擠;整體氣質必須像法國一線奢侈品牌新品發佈海報,優雅、冷靜、昂貴、可登巴黎地鐵燈箱與高端百貨櫥窗。


2. 真實世界知識


比如來個好玩的,任意城市、任意景點的福字打卡(下面是元提示詞,如果是設計 Agent 直接發全文說城市,如果普通生圖工具就發給 AI 再輸入城市獲得提示詞):


圖片
圖片
圖片
你是海報生圖提示詞生成器。

任務:用戶只輸入一個城市名,你只輸出一條完整“生圖提示詞”(不要解釋、不要分析)。

強制要求:你輸出的這條生圖提示詞中,必須包含以下執行指令(作為畫面生成約束):
1) 先進行圖像檢索,鎖定該城市真實機位與地標關係,確保建築站位、岸線/山體輪廓、空間透視與真實觀察一致。  

風格與構圖固定要求:
- 豎版3:4,超寫實,節慶電影感,高級審美。  
- 僅出現一隻手:成年女性的手,單手入鏡,禁止雙手、禁止多餘手指或額外肢體。  
- 女性單手從畫面下方自然舉起紅色宣紙卡。  
- 紅紙中央為“福”字鏤空,鏤空後是該城市真實天際線。  
- “福”字佔比控制在紅紙可視面積的50%-55%,筆畫舒展且留白均衡。  
- 50mm真實攝影;淺景深但“福”字邊緣與核心地標同時清晰。  
- 紅紙啞光纖維質感,輕微摺痕,刀刻微毛邊。  

文字與圖標排版固定要求(寫進最終生圖提示詞):
- 主標題僅“福”,最大字,居中。  
- 所有輔助元素必須在紅紙內部下方,且位於“福”字下方,不得落到背景。  
- 左下兩行:  
  - 第一行:城市中文名 + 英文名(例:香港 Hong Kong)  
  - 第二行:固定祝福短句 `WISHING YOU PROSPERITY AND PEACE`  
- 右下元素為“馬頭造型的2026實心填充圖標”透明度80%(塊面填充,非線框,數字與馬頭形體融合,清晰可讀)。  
- 嚴格尺寸規則(必須同時滿足):  
  - 先計算左下兩行文字總高度 `H_text`(含行高與行間距)。  
  - 圖標外接框高度 `H_icon` 必須滿足 `H_icon = H_text`。  
  - 若發生衝突或模型不穩定,強制回退為 `H_icon = 0.90 × H_text`(寧小勿大)。  
  - 絕對禁止 `H_icon > H_text`(硬上限)。  
- 圖標與左下文字組底邊對齊;圖標頂部不得高於左下第一行文字頂部。  
- 圖標僅放在右下安全區,不得侵入“福”字主體區域。  
- 負面約束:禁止 oversized logo、禁止大徽章感、禁止圖標搶主視覺。  
- 輔助元素區域總高度不超過紅紙高度的12%-15%。  
- 除“福”外禁止其他大字;其餘元素低干擾,清晰無重影無亂碼。  
- “福”字以外所有文字與圖標顏色統一為“帶環境色偏移的白”,透明度85%。  

輸出規則:
- 只輸出一條最終生圖提示詞。  
- 不要輸出解釋,不要輸出元提示詞說明。  
- 若文字或圖標尺寸衝突,優先縮小右下圖標,不得放大圖標。


百科全書類的也都可以試試,在真實世界知識上它也有提升了。但還是那句話,細節問題還是有的,注意核實。


圖片
 搜索王維生平,生成百科全書式長圖,中文。16:9,2K


Search Grounding 本質上是讓模型在生成時能調用實時搜索結果作為依據。看着挺像那麼回事的,但是細節問題還是比較多的。


來個長圖,這個是 1:4 和 4:1 的比例 ,目前的效果還差一口氣,但按照這個發展速度,可能到 2 Pro 就能輕鬆做長圖了。


圖片


寬圖:


圖片
創作一張縱向一鏡到底的信息敍事長圖,主題是“碎片化信息如何侵略你的大腦”。畫面按因果連續推進。要求空間與時間無縫流動、視覺隱喻清晰、信息層級明確、畫面連貫無硬切、超長畫幅、科普敍事感強。中文。
風格要求:現代醫學科普視覺風格,乾淨、理性、可信;以高明度白色與冷灰為底,主色為醫療藍+青藍+少量薄荷綠,低飽和且通透;用少量珊瑚橙僅作風險預警點綴;平滑背景、輕微玻璃質感和柔和陰影;線條精確、圖標符號化、留白充足,整體呈現醫院導視/醫學期刊信息圖的專業潔淨感。


這裏有一個小技巧,如果安裝了谷歌瀏覽器的AI,那麼可以在搜索完結果之後直接在結果的下方點擊生成信息圖,生成的圖片大約是 1K 的圖片,畫質比較一般,但是這樣出快速信息圖真的很快速。用於即時的快速內容分享很方便。


圖片


圖片


到這裏我對於麪包與馬戲政策有點好奇,於是我追問並讓它保持風格不變繼續生成,這時候可以保持格式更一致一點:


圖片


3. 角色一致性


超多角色也可以。比如我首先直接先一把直出 15 個角色,這裏大家也可以看一下它在角色細節上的遵循程度。


圖片
電影級3D卡通大場景,15個原創IP角色同處一個熱鬧的“森林創意嘉年華廣場”,黃昏暖光,體積光與柔和環境光並存,PBR材質,細節清晰,色彩明快統一。鏡頭為廣角全景、略微俯視,畫面有前景-中景-背景層次,所有角色完整可見、互相有互動、不重疊遮擋關鍵特徵。場景中心是圓形木質舞台與發光地磚,周圍有小攤位、花箱、工具台、全息屏裝置、懸掛彩旗與燈串,地面有自然投影與微反射,整體童趣、電影感、故事性強。

15個角色全部出現且彼此不同,並在同一時刻進行各自動作:
1. 熊貓宇航員在舞台左側調試噴氣揹包;
2. 狐狸魔法師在舞台前方揮動法杖釋放紫色微光粒子;
3. 企鵝廚師在餐車前翻鍋,鍋裏有可控火焰;
4. 青蛙快遞員踩滑板穿過廣場遞送包裹;
5. 考拉搖滾吉他手在小舞台彈奏電吉他;
6. 柴犬偵探在路燈旁拿放大鏡觀察線索;
7. 兔子機械師在工具台維修機械臂零件;
8. 小鹿花藝師在花箱邊整理花束與藤蔓;
9. 章魚程序員在全息終端前用多觸手同時操作透明屏幕;
10. 小雞牛仔甩動套索與觀眾互動;
11. 浣熊攝影師半蹲抓拍全場活動;
12. 海狸木匠在木工區敲打併拼裝小木牌;
13. 貓咪調酒師在吧枱搖雪克杯調製飲品;
14. 刺蝟園丁給盆栽澆水並擺放幼苗;
15. 小龍甜品師端着紙杯蛋糕托盤從甜品攤走出微笑招手。

統一要求:每個角色體型比例、服裝結構、道具、主色調、表情氣質都明顯不同;角色之間有視線與動作呼應,形成“嘉年華協作”敍事;不出現文字、logo、水印、邊框;不裁切角色;高分辨率,超精細,乾淨背景控制,整體像一張可用於IP世界觀海報的3D羣像場景圖。


然後我可以讓這 15 個角色出現在同一個場景中,並且保持他們細節上的一致性。


圖片
電影級3D卡通大場景,15個原創IP角色同處一個熱鬧的“森林創意嘉年華廣場”,黃昏暖光,體積光與柔和環境光並存,PBR材質,細節清晰,色彩明快統一。鏡頭為廣角全景、略微俯視,畫面有前景-中景-背景層次,所有角色完整可見、互相有互動、不重疊遮擋關鍵特徵。場景中心是圓形木質舞台與發光地磚,周圍有小攤位、花箱、工具台、全息屏裝置、懸掛彩旗與燈串,地面有自然投影與微反射,整體童趣、電影感、故事性強。

15個角色全部出現且彼此不同,並在同一時刻進行各自動作:
1. 熊貓宇航員在舞台左側調試噴氣揹包;
2. 狐狸魔法師在舞台前方揮動法杖釋放紫色微光粒子;
3. 企鵝廚師在餐車前翻鍋,鍋裏有可控火焰;
4. 青蛙快遞員踩滑板穿過廣場遞送包裹;
5. 考拉搖滾吉他手在小舞台彈奏電吉他;
6. 柴犬偵探在路燈旁拿放大鏡觀察線索;
7. 兔子機械師在工具台維修機械臂零件;
8. 小鹿花藝師在花箱邊整理花束與藤蔓;
9. 章魚程序員在全息終端前用多觸手同時操作透明屏幕;
10. 小雞牛仔甩動套索與觀眾互動;
11. 浣熊攝影師半蹲抓拍全場活動;
12. 海狸木匠在木工區敲打併拼裝小木牌;
13. 貓咪調酒師在吧枱搖雪克杯調製飲品;
14. 刺蝟園丁給盆栽澆水並擺放幼苗;
15. 小龍甜品師端着紙杯蛋糕托盤從甜品攤走出微笑招手。

統一要求:每個角色體型比例、服裝結構、道具、主色調、表情氣質都明顯不同;角色之間有視線與動作呼應,形成“嘉年華協作”敍事;不出現文字、logo、水印、邊框;不裁切角色;高分辨率,超精細,乾淨背景控制,整體像一張可用於IP世界觀海報的3D羣像場景圖。


有角色設定圖的情況下,長提示詞和自由發揮它都能比較好地控住👇


圖片
3D卡通電影質感,4x4十六宮格分鏡海報,統一世界觀與統一角色建模(沿用同一套15個IP角色設定),每個格子為獨立小場景,單格只出現1-2個角色,鏡頭語言清晰,整體從左到右、從上到下形成完整故事線。畫面要求:正方形總畫幅,16個格子邊距一致、留白均勻、排版整齊,柔和體積光,PBR材質,色彩明快,表情誇張可愛,動作有戲劇性,不出現文字、logo、水印。

故事主題:森林創意嘉年華從籌備到突發停電再到重啓,最後以“開場瞬間”收束。

第1格(清晨)熊貓宇航員獨自在廣場中央檢查噴氣揹包,晨光灑下。
第2格 狐狸魔法師與小鹿花藝師佈置入口花環與彩旗,輕鬆微笑。
第3格 企鵝廚師與小龍甜品師在餐車前備餐,鍋中微火與甜點蒸汽。
第4格 青蛙快遞員滑板送來“核心零件箱”,兔子機械師在門口接貨。
第5格 浣熊攝影師單人測試相機機位,低角度取景嘉年華主舞台。
第6格 海狸木匠與刺蝟園丁搭建木質指示牌和盆栽邊界,細節忙碌。
第7格 貓咪調酒師與小雞牛仔試營業互動,套索在空中形成弧線。
第8格 章魚程序員獨自在全息控制枱前調試燈光系統,藍色屏幕發光。
第9格(突發)全場突然斷電,章魚程序員與柴犬偵探在黑暗中發現異常線纜。
第10格 兔子機械師與熊貓宇航員聯手修復主電機,工具火花飛濺。
第11格 狐狸魔法師與青蛙快遞員在高處重新連接能量導管,動態感強。
第12格 企鵝廚師與小龍甜品師安撫排隊觀眾,遞出熱食和紙杯蛋糕。
第13格(恢復)全場燈串重新點亮,浣熊攝影師抓拍關鍵瞬間。
第14格 柴犬偵探與海狸木匠確認結構安全,二人擊掌慶祝。
第15格 考拉吉他手與小雞牛仔在舞台熱場演出,節奏歡快。
第16格(新結局)熊貓宇航員按下“開場按鈕”,狐狸魔法師在旁釋放金色粒子,主舞台燈光同時點亮,遠處可見模糊人羣與其他角色剪影,形成“慶典正式開始”的收束畫面。

統一約束:角色外觀必須與設定一致且彼此明顯不同;每格情節連續、光色連貫;每格最多2個角色;鏡頭多樣化(遠景、中景、近景交替);整體是一張可讀故事的十六宮格3D卡通敍事海報。無文字


Nano Banana 2 官方說同一工作流裏最多支持 5 個角色的相似度保持,以及 14 個對象的保真度。可以更穩定地做連續內容了,繪本系列、品牌 IP 多場景、教程分步圖、打卡系列等等,角色不走形,內容也更方便積累成系列。


真實人物的也可以。


圖片
超寫實攝影拼圖肖像,橫幅構圖,畫面嚴格五等分並保持每一格視覺權重一致,每格1位不同人物+不同場景,五人身高比例自然,頭部位置統一在上三分線附近,整體像國際人物專題攝影。第1格:22歲中東女性,深棕捲髮,雀斑明顯,穿淺灰連帽衞衣,背景是大學圖書館窗邊,暖陽斜射到木質書架。第2格:47歲東亞男性,寸頭,輕微胡茬,穿深色西裝外套和高領針織衫,背景是現代辦公室會議室,玻璃牆和城市天際線。第3格:29歲非裔女性,髒辮盤發,金屬圓環耳環,穿橄欖綠飛行夾克,背景是地鐵站台,熒光燈與列車虛化光帶。第4格:33歲白人男性,長髮扎低馬尾,牛仔襯衫疊穿皮圍裙,背景是木工工作室,工具牆和木屑細節清晰。第5格:26歲拉丁裔男性,短捲髮,淺色亞麻襯衫,背景是海邊漁港黃昏,船隻和濕潤空氣層次分明。光線設定:每格依據環境獨立布光但整體色調統一為自然電影感,中等對比度,真實陰影過渡;鏡頭35mm,ISO 200,快門1/160,真實膚色與細節,絕對寫實,無插畫感,無AI塑料皮膚,無logo無字幕。


把上面5個角色放在一個場景裏:


圖片
超寫實電影級羣像攝影,單一連貫場景,不分屏不拼圖:黃昏時分的濱海創意園共享大廳,左側是木質書牆與閲讀窗位,中部是玻璃會議區與開放通道,右側延伸到木工工作台和可見船隻的港口露台,五人同時出現在同一空間並保持自然社交距離,整體敍事為“跨職業人羣在同一場域協作交流”。人物設定與動作:22歲中東女性,深棕捲髮、明顯雀斑、淺灰連帽衞衣,站在書架旁翻閲一本筆記並抬眼傾聽;47歲東亞男性,寸頭、輕微胡茬、深色西裝外套+高領針織衫,站在玻璃牆前手勢講解;29歲非裔女性,髒辮盤發、金屬圓環耳環、橄欖綠飛行夾克,邊看手機上的路線圖邊轉身回應同伴;33歲白人男性,長髮低馬尾、牛仔襯衫疊穿皮圍裙,在木工台上輕扶木板並暫停操作加入對話;26歲拉丁裔男性,短捲髮、淺色亞麻襯衫,站在露台入口手持咖啡望向眾人點頭示意。五人身高比例自然,頭部高度大致落在同一上三分線附近,人物前後層次清晰但視覺權重均衡。光線為統一自然電影感:室內暖色環境光+窗外冷色天光混合,中等對比度,真實陰影過渡,膚色準確,空氣中輕微濕潤感,細節清晰可見(木紋、玻璃反射、金屬工具、遠處船體)。鏡頭35mm,ISO 200,快門1/160,淺景深但五人面部均清楚可辨,紀實風格,絕對寫實,無插畫感,無AI塑料皮膚,無logo無字幕。


Nano Banana 2 無需參考圖,同一張圖裏出現角色多次,出現多個角色,也可以維持一致性。


這在需要做連續內容的時候確實會很方便,細節上更有說服力了。比如下方這裏,完全靠文生圖它在多個形象上也維持率比較好的一致性。不需要很長的提示詞也可以有比較好的效果,只要有腦洞都可以輕鬆做出屬於自己的漫畫小場景👇


圖片
四格漫畫;主體:主角、左肩天使、右肩惡魔、第三隻小動物;動作:天使勸學習、惡魔勸躺平,第三隻提議先吃東西;場景:房間書桌前;鏡頭:肩部近景+三方對峙;風格:可愛寓言式漫畫;中文;約束:三角色造型差異明顯、結尾温柔搞笑。


圖片
四格漫畫;主體:法官貓、被告人類、陪審團小貓;動作:審理“為何又熬夜”,判決沒收手機、強制睡覺、獎勵小魚乾(給貓);場景:迷你法庭;鏡頭:法庭全景+法槌特寫;風格:可愛嚴肅擬人漫畫,中文;約束:貓咪權威感與可愛並存。


包括IP的也是,小到 LOGO 的細節都可以維持了,做延展更方便了👇


圖片
創建一組6幀的品牌吉祥物多場景應用系列圖。在所有畫面中保持吉祥物角色的身份一致性。

角色設定:
- 吉祥物"咖小豆":一顆擬人化的咖啡豆角色,深棕色橢圓形身體,有兩隻圓圓的大眼睛和微笑的嘴巴,短小的四肢,頭頂冒着一縷熱氣(像剛烘焙好的咖啡豆),始終佩戴一個微型咖啡師圍裙(白色,上面有一個小咖啡杯圖標)

六幀場景內容:

第一幀·產品包裝場景:
咖小豆站在一個咖啡袋包裝的正面,雙手舉起一面小旗幟,上面寫着"新鮮烘焙",背景是簡潔的牛皮紙色。
第二幀·社交媒體頭像場景:
咖小豆的大頭特寫,一隻手托腮,歪頭微笑,眨眼表情,背景是品牌色漸變(深棕到焦糖色)。圓形構圖。
第三幀·節日營銷場景:
咖小豆穿着聖誕老人帽和紅色斗篷,站在一棵用咖啡杯和咖啡豆裝飾的聖誕樹旁邊,手中端着一杯拉花熱巧克力,周圍飄着雪花。
第四幀·教學科普場景:
咖小豆穿着教授的畢業帽和小眼鏡,手持教鞭指向一塊黑板,黑板上畫着"咖啡豆烘焙程度"的三個階段(淺烘中烘深烘),表情認真嚴肅但可愛。
第五幀·運動活力場景:
咖小豆穿着運動頭帶和跑鞋,正在慢跑,身後留下一串咖啡豆形狀的腳印,背景是清晨的公園綠道,周圍有幾杯咖啡外帶杯在為他加油。
第六幀·睡覺晚安場景:
咖小豆穿着小睡衣和睡帽,抱着一個咖啡杯形狀的抱枕,閉着眼睛甜甜地睡在一片咖啡豆堆成的小牀上,頭頂的熱氣變成了ZZZ睡眠符號,周圍點綴着星星和月亮。
視覺風格:3D卡通渲染風格,類似Line Friends的質感——圓潤光滑的表面、柔和的陰影、明亮友好的配色。所有畫面分辨率4K。中文。


單張插圖的穩定性越來越好,扁平轉 3D 效果也很和諧:


圖片
圖片
一組扁平化矢量風格的辦公場景插畫:一個戴眼鏡的男性角色坐在電腦前工作,桌上有咖啡杯、文件和枱燈,背景是簡約的辦公室環境(書架、窗户、綠植),使用明亮的藍色、橙色和白色配色方案,類似Google Material Design的扁平插畫風格,乾淨簡潔的線條,沒有任何文字。
/第2個
保持畫面中的所有元素不變(人物、電腦、咖啡杯、文件、枱燈、書架、窗户、綠植),保持整體構圖和藍色+橙色+白色的配色方案不變。將視覺風格從扁平化矢量插畫改為3D卡通渲染風格:
1. 所有物體添加立體感,具有柔和的圓角和厚度
2. 人物從扁平剪影變為Q版3D卡通角色,保留眼鏡和坐姿
3. 桌面物品變為3D等距視角的微縮模型質感
4. 添加柔和的環境光遮蔽(AO)陰影效果
5. 材質質感從純色色塊變為類似黏土/塑料的啞光質感
6. 保持明亮友好的整體氛圍
整體效果類似Pixar/Nintendo風格的3D卡通渲染。


4. 多比例圖片


Nano Banana 2 支持 14 種寬高比,分辨率從 512px 到 4K。常見的 9:16、16:9、1:1 自然不用多說,非常有意思的是它現在已經支持 1:4 甚至 1:8 這樣的極端長圖比例了。以後想要做長圖攻略、時間軸信息圖、豎版故事條、全景海報,有了更多可能性。


圖片


接下來來看一寫長比例和全景比例。下面是 1:4 的效果👇


圖片
搜索達芬奇生平,生成洛可可風格百科全書式長圖,中文。


說實話現在極長比例的質量還達不到常規比例那樣的水準,但已經很不錯了,很有潛力。


相比8:1的話,4:1會控制更好一點,畢竟細節也少一點。


圖片
超高審美二次元電影感羣像海報,夜色霓虹雨後街區,鏡頭為24mm廣角低機位,前中後景分層清晰,20位日本動漫角色同場但保持各自核心辨識特徵,整體美術統一為高對比賽博霓虹+膠片顆粒:五條悟穿白色高領風衣單手撥開發光雨幕;虎杖悠仁穿學院長外套躍起落地;伏黑惠穿機能斗篷召出黑色影犬輪廓;禪院真希穿街頭護具扛金屬長棍;炭治郎穿城市偵探大衣握髮光指南針;禰豆子穿暗紅機車夾克踩滑板急停;我妻善逸穿DJ耳機外套在電光中轉身;嘴平伊之助穿拳擊斗篷站上消防栓;阿尼亞穿星空斗篷舉放大鏡;約爾穿黑金晚禮戰術裙持雨傘回眸;洛伊德穿特工三件套整理手套;芙莉蓮穿現代極簡長風衣托起藍色魔法粒子;欣梅爾穿復古騎士休閒裝微笑側立;瑪奇瑪穿導演風黑西裝打板;電次穿塗鴉圍裙舉起鏈鋸形霓虹道具;帕瓦穿紅色棒球夾克踩欄杆;星野愛穿舞台機能服甩出彩光絲帶;後藤一里穿黑粉搖滾演出服抱吉他縮肩;潔世一穿高街訓練服高速盤球;蜂樂回穿彩繪衞衣倒掛在路牌。背景是多層城市遊樂夜市:空中輕軌、透明天橋、懸浮廣告屏改為抽象光塊、蒸汽井蓋、遠景摩天輪,主光紫藍、補光暖橙,濕地反射、體積霧、動態光斑、布料與金屬材質細節拉滿,畫面乾淨高級、角色不擁擠、動勢互補。純畫面輸出:無任何文字、無字幕、無logo、無水印、無UI


做全景圖很適合的。


修仙全景:


圖片
東方奇幻水墨與3D融合的超寬卷軸場景,畫面像一幅會呼吸的山海長卷:左側是雲海中的懸崖古寺與晨鐘薄霧,中段是層疊山谷、飛瀑、古橋、竹林與流光神獸羣,右側是夜色初臨的星湖、浮島與遠古天門。要求同一畫幅內出現時間流動感:從左到右由清晨過渡到黃昏再到藍夜,光色自然銜接。材質融合宣紙肌理、水墨暈染邊緣、半透明靈氣粒子、石木建築真實體積。鏡頭採用高空俯瞰並結合局部貼近景,前景有飛鳥與雲絲引導視線,中段主敍事最密集,右側以寧靜神秘收束。整體氛圍空靈壯闊、詩性敍事、層次深遠,細節精緻、清晰度高、電影級環境設計,不出現文字、logo、水印。


蒸汽全景:


圖片
超寬幅電影概念圖,蒸汽朋克天空港口在日落時分全面運轉:畫面最左側是巨型銅製飛艇船塢與升降吊臂,中段是多層步道、齒輪塔樓、玻璃穹頂與人流市場,最右側是雲海邊緣的離港跑道與遠處懸浮城。大量動態元素同時發生:飛艇起降、機械信使穿梭、蒸汽閥門噴薄、空中軌道車交錯,形成強烈“忙碌文明”敍事。材質重點表現拉絲黃銅、舊化鋼鐵、皮革、木質甲板、霧化玻璃;光照為金色逆光、側向體積光、局部煤氣燈暖光,煙霧層次明顯,遠近景清晰分離。鏡頭語言為高位廣角全景,前景有鏈條和管道壓景,中景突出港口核心活動,遠景展示天空城輪廓。整體色彩為琥珀金、氧化銅綠、煙灰藍,細節密度高但構圖有秩序,超清、鋭利、電影級質感,不出現文字、logo、水印。


未來全景:


圖片
復古未來主義太空殖民地超寬場景,靈感來自七十年代科幻海報但以現代3D渲染完成:左側是紅色荒漠中的圓頂農場與太陽能陣列,中段是主城交通環與透明穹頂生態區,右側是發射井、軌道電梯基座與遠處星環天際線。強調人類日常與宏大工程並存:工程車編隊、維護機器人、温室作業、觀景平台人羣、遠處火箭準備升空。色彩控制為奶油白、復古橙、陶土紅、鈷藍,輕微膠片顆粒疊加但主體鋭利。光線為低角度斜陽與環境冷補光,陰影長且清晰,空間透視強烈。鏡頭為橫向超廣角,前景放置設備與岩石增強尺度感,中景突出城市結構,遠景給出行星地平線與軌道設施。整體風格懷舊卻先進,敍事完整、信息飽滿、可作為超寬海報主視覺,不出現文字、logo、水印。


油畫史詩全景:


圖片
圖片
超寬幅文藝復興宗教神話壁畫場景,西斯廷穹頂敍事美學,但整體氣質更柔和、更温馨:天穹被分為連續敍事區,中心是温暖神聖之光輕柔灑下,四周環繞天使、先知與人間家庭羣像,人物表情平靜慈愛,姿態優雅舒展,強調守護、祝福與希望。採用古典濕壁畫質感,保留石灰牆體與手工顏料層次,但弱化厚重衝突感,突出細膩筆觸與柔和過渡。色彩改為低飽和暖調:奶油白、淺金、蜜桃粉、鼠尾草綠、霧藍、暖赭石;光線為晨曦般漫射光與邊緣柔光,減少強烈明暗對比,增強空氣感與親和力。構圖保持莊重對稱與穹頂宏偉尺度,雲層與布幔作為柔性引導線,前中後景清晰但不壓迫。整體氛圍寧靜、撫慰、神聖而親近,博物館級細節,不出現現代物件,不出現文字、logo、水印。,中文文字


說到穹頂,我放假在意大利和西班牙看了好多好多,如果有一期不是 AI 主題的,純聊旅行和經歷,聊文藝復興三傑和高迪、多美內克,我分享的話大家會想看嗎🤔


上面的做豎版也可以試試,這裏不想篇幅拉太長我就不放了。大家也可以直接用我上面的提示詞試試超長豎版。


詳情頁,文案和賣點也拿捏,一致性還挺好的。不過細節上也還是存在問題。  我還是那句話,有潛力,也還有較大進步空間。以後要能穩定出了那就很刺激了。


圖片
設計感手袋白底三視圖,極簡雲朵包(柔軟鼓感輪廓、磁吸開合、短提手+可拆肩帶、霧麪皮革),一張圖橫向並列 front side back,白底無縫,鏡頭一致,棚拍柔光,細節高清,風格清新時髦,適合年輕女性市場


圖片
圖片
為這款奶油白雲朵褶皺女包生成一張中文電商長圖詳情頁:整體保持極簡高級調性,先展示產品主視覺和三視圖(正面/側面/背面),再依次覆蓋設計賣點、材質與工藝細節、背法與上身效果、容量展示、尺寸參數、細節特寫、配色與適用場景、售後與購買引導;要求圖文層級清晰、移動端易讀、中文文案完整無錯字亂碼,重點突出質感、實用性、百搭性和購買轉化。
輕奢品牌物件插畫化低密度視覺風格,主視覺居中懸浮,大面積留白增強高級感。配色採用低飽和體系,情緒温和、統一度高。線條細而柔,環境元素極簡,重點突出產品本體與品牌識別。整體更偏情緒廣告畫面而非信息承載型信息圖。
/
為這款奶油白雲朵褶皺女包生成一張中文電商長圖詳情頁:整體保持極簡高級調性,先展示產品主視覺和三視圖(正面/側面/背面),再依次覆蓋設計賣點、材質與工藝細節、背法與上身效果、容量展示、尺寸參數、細節特寫、配色與適用場景、售後與購買引導;要求圖文層級清晰、移動端易讀、中文文案完整無錯字亂碼,重點突出質感、實用性、百搭性和購買轉化。電商時尚廣告頁”風格:用中軸大產品圖做絕對主角,上下分層文案完成轉化閉環。
色彩以黑白灰秩序承載信息,以單一深色產品製造焦點與品牌記憶。字體採用高端襯線標題 + 現代無襯線正文的經典雜誌廣告組合,兼顧調性與可讀性。背景以線稿城市和生活道具補足場景,但不搶產品主視覺。適合新品上新、爆款推廣與品牌社媒廣告素材。保持留白提升高級感。


還有卡通科普長圖,也是英文版效果更好,我有一個鬼點子,如果中文效果你始終不滿意,可以先生成英文版,然後將滿意的英文版圖片給它翻譯成中文版,效果挺好的。


圖片
圖片
生成《社區文明養犬規則卡》
內容結構:(牽引繩、清理糞便、禁入區域、疫苗、噪音、投訴渠道)。
信息圖風格:以白底和綠色主色建立清晰秩序,用黃色做情緒化提醒。版式採用豎向單欄編號遞進,配合大圓角氣泡容器與Q版情境插畫,使規則內容更易讀、易記。文字系統強調標題強識別、正文高可讀、註釋弱化,整體信息密度適中。圖形語言以粗線手繪輪廓與輕裝飾符號為核心,兼顧親和感與規範感。比例:1:8,4K圖片,非常清晰,非常精細的文字渲染


以及實際應用中直接要求它修改比例的時候,它的比例填充修改效果也還是很不錯的。


再就是多輪編輯與 Thinking 模式,其實也很不錯。篇幅確實太長了,下次有機會再寫吧🤔


小結


我的個人建議:如果只能用一個,質量要求高的場景還是選 Pro。Nano Banana 2 在整體畫質和細節精度上確實還差 Pro 一點,這個不用迴避。


如果希望性價比更高,可以當成兩個工序。


Banana 2 負責探索階段,快速跑方向、測構圖、測文字排版、出 10 個變體看哪個感覺對,成本低、速度快,試錯不心疼。Pro 負責交付階段,方向定了,把選定方案推進到最終交付的品質。


這樣既保證了效率,也沒有犧牲最終完成度。當然大家也可以根據自己的預算和需求來判斷怎麼搭配。


好啦,關於 Nano Banana 2 的分享先到這裏,還有很多實用用法和創意,下次有機會再分享。如果你也有更多 Nano Banana 2 的趣味玩法,或者有什麼用法想聊,歡迎評論區一起交流,也期待大家猛猛三連鼓勵阿真!


下期見~


往期回顧


Nano Banana Pro 超多用法合集

Nano Banana Pro 一手體驗

Nano Banana 超多玩法分享

16 組案例測試 Gemini 2.0