為什麼 AI 生成的 UI 圖很漂亮，落到頁面卻總是跑偏？

作者：MaxKing寶藏

日期：2026年4月30日下午2:22

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

AI生成嘅UI圖好靚但落地總係跑偏？關鍵在於補一層UI Spec

整理版摘要

呢篇文章嘅作者MaxKing係一位全棧開發者兼量化交易者，亦係AI重度用戶。佢收到一條留言，話image2生成嘅圖好靚，但一落地頁面就唔掂。呢個留言點出咗一個好多人都經歷過嘅問題：圖靚唔等於頁面可以正常運作。

作者分析，問題嘅根源在於大家成日將「睇落似界面嘅圖片」當成「UI設計稿」。圖片只負責外觀，但UI設計稿需要交代結構、狀態、響應式呢啲工程信息。image-to-code工具係根據視覺表象去猜結構，所以好容易跑偏。

破局嘅關鍵係喺「圖」同「代碼」之間補一層UI Spec（結構化界面規範）。先寫清楚頁面嘅問題、主路徑、複用模塊、狀態同響應式規則，然後AI先去做視覺探索，最後先落碼。咁樣圖片就退返做情緒板，而家系統先會穩定。

結論：AI生成嘅UI圖靚但落地跑偏，因為圖片同UI設計稿本質唔同。
方法：先寫UI Spec（結構化規範），再視覺探索，最後落碼。
差異：圖片係外觀，UI Spec係骨架；image-to-code喺猜結構而唔係翻譯結構。
啟發：頁面能否落地取決於結構判斷，唔係像素完整度。
可行動點：從而家開始，喺AI出圖前先寫一份UI Spec，定義組件、狀態、響應式。

整理重點

一條留言揭開嘅現實問題

後台彈出嗰條留言嘅時候，我正盯住一張剛生成嘅SaaS後台圖。圖好順，陰影、留白、層級都似樣，第一眼真係會令人放鬆警惕。

image2 圖生成得很漂亮，但要落地到頁面就不行了

真係將佢塞入瀏覽器，啲嘢就變曬：數據一長，卡片開始互相擠；屏幕一縮，按鈕同列表就逼埋一齊；幾個狀態頁未補齊，頁面睇落就似冇咗骨架。

整理重點

圖片同UI設計稿嘅本質分別

好多人會下意識將「睇落似界面嘅圖片」當成「UI設計稿」，因為第一眼太似。但它們嘅職責完全唔同。

圖片負責嘅係『長咩樣』，UI設計稿負責嘅係『點組織、點響應、點切換、點複用』

組件層級嵌套缺失：頁面容易被平鋪成一堆div，睇落似但結構散。
交互與頁面狀態缺失：冇Hover、Loading、Empty、Error，頁面似靜止嘅海報。
響應式規則缺失：一到手機端就跑版，文字擠壓，模塊互相頂撞。
設計Token缺失：顏色、字號、間距只能靠估，好難接入統一體系。
真實數據邊界缺失：佔位符一換成長文本，卡片馬上撐爆。

整理重點

點解image-to-code總係跑偏

image-to-code真正嘅難點，唔係將圖翻譯成代碼，而係根據視覺表象猜結構。

根據視覺表象猜結構

佢睇到三個好似嘅卡片，但未必知道要抽成同一個組件；睇到一個好光嘅按鈕，但未必知係主操作定次要。

1 生成速度快，但返工都快。
2 第一眼覺得用得，第二眼就開始改，第三眼已經手動重構。
3 問題唔在於工具唔會畫，而喺佢唔知應該先理解咩。

整理重點

破局關鍵：補一層UI Spec

如果只係喺「圖」同「代碼」之間來回跳，終究大概率會回到手改。更穩嘅做法，係喺中間補一層UI Spec。

先寫結構，再談好看

UI Spec本質上係一份結構化界面規範，可以係YAML或JSON，重點係將工程判斷提前寫清楚：頁面解決咩問題、主次路徑、可複用模塊、必須補嘅狀態、響應式規則。

1 將需求意圖收窄，確認頁面要解決咩問題。
2 將UI Spec寫實，講清楚結構、狀態、響應式、複用關係。
3 用gpt-image-2做視覺探索，確認氛圍同密度。
4 用Codex/Cursor等工具攞住Spec同圖一齊落碼。
5 頁面跑起後用截圖對比睇差異，局部修正，形成閉環。

整理重點

下一步：14天實戰系列

呢篇文章係系列開篇，接下來14日我會將呢套工作流掰開揉碎，一步步帶住你實操落地。

唔好再喺圖同代碼之間來回跳，補一層Spec，成條路就通咗

如果你都厭倦咗每次用AI寫前端都要手動重構，呢條鏈路值得繼續睇落去。下一篇會講點解唔建議直接image-to-code，而係先讓AI寫一份UI Spec。

MaxKing寶藏

全棧開發者 × 量化交易 × AI 重度用戶。呢度記錄我用 AI 提升效率、解決問題、優化流程 嘅真實實踐，亦都分享工具背後嘅判斷、踩坑同可複用方法。

AI 生成嘅 UI 圖睇落好順嘅時候，最易令人放鬆警惕。後台彈出嗰條留言嘅時候，我正係睇緊一張啱啱生成嘅 SaaS 後台圖。圖好順，陰影、留白、層級都好似係咁回事，第一眼真係會令人心入面一鬆：今次應該可以直接落碼啦。

但係真係將佢塞入瀏覽器，事情即刻變咗。數據一長，卡片開始互相逼；屏幕一縮，按鈕同列表就逼埋一齊；幾個狀態頁未補齊，頁面睇落就好似少咗骨架。嗰一刻好直觀：靚，係視覺嘅事；跑得鬱，係結構嘅事。

嗰條留言將呢件事講得好直接：

“image2 圖生成得好靚，但要落地到頁面就唔得啦，畢竟 image2 成張圖，唔係真正嘅 UI 設計。”

呢句話冇喺抬槓，佢只係將好多人都有經歷過嗰道坎，直接擺咗上枱面。圖靚，唔等於頁面跑得鬱。

-MaxKing.cc-

留言裏面露出嘅唔係挑剔，係現場

呢條留言最有價值嘅地方，唔係佢“評價咗 image2”，而係佢將真正嘅問題講清楚咗：你最終要交付嘅，唔係圖，而係頁面。AI 生成嘅 UI 圖再靚，都唔能夠代替頁面本身嘅結構判斷。

好多人第一次見到 AI 生成嘅 UI 圖，都會先俾外觀呃到。深色背景、柔和陰影、整齊卡片、似樣嘅圖標，放喺一張圖裏面睇，真係好有完成度。但係一旦將佢掟入真實業務裏面，事情即刻變複雜：數據一長，卡片就撐；屏幕一窄，佈局就塌；按鈕一多，主次就亂。

呢個唔係“AI 唔得”咁簡單。更準確咁講，係你俾佢嘅輸入，本來就唔夠佢做工程判斷。

-MaxKing.cc-

圖片同 UI 設計稿，本來就唔係一回事

好多人會下意識將“睇落似介面嘅圖片”當成“UI 設計稿”。呢個誤會好常見，因為佢哋喺第一眼上太似啦。

但佢哋嘅職責完全唔同。圖片負責嘅係“生咩樣”，UI 設計稿負責嘅係“點樣組織、點樣響應、點樣切換、點樣複用”。前者係外觀，後者係骨架。

一張圖可以話俾你知顏色同氛圍，但好難話俾你知層級、約束同狀態。

而前端真正要落地嘅，就係呢啲工程資訊。

喺評審會上將同一張圖放到大屏同手機預覽裏面，差異會放大得好快。大屏上睇落完整嘅模塊，一入窄屏就逼成兩層；原本睇落舒服嘅留白，換成真實數據之後就會被撐得發緊。嗰種“圖好穩、頁面好飄”嘅感覺，幾乎都係呢一步暴露出來嘅。

你可以將佢理解成睇效果圖起樓。效果圖可以睇到大約嘅風格，但唔會話俾你知承重牆、管線、樓板同動線點樣排。頁面都係一樣，得圖，代碼工具只能靠估。

圖片唔係源頭，佢只係視覺表達。

頁面跑唔跑得鬱，決定權在結構，唔在像素。

-MaxKing.cc-

呢張表最能夠說明問題

前端真正需要嘅資訊	單張圖片係咪提供？	缺失之後嘅結果
組件層級嵌套	❌	頁面容易俾人平鋪成一堆 `div`，睇落似，結構卻散。
交互同頁面狀態	❌	冇 Hover、Loading、Empty、Error，頁面似靜止嘅海報。
響應式規則	❌	一到手機端就跑版，文字擠壓，模塊互相頂撞。
設計 Token	❌	顏色、字號、間距只能靠估，後面好難接入統一體系。
真實數據邊界	❌	佔位符一換成長文本，卡片即刻撐爆。

呢張表嘅意思其實好簡單：單張圖唔係唔用得，而係唔可以單獨當源頭。

佢可以幫你定風格、定氛圍、定視覺密度，但佢解決唔到頁面落地最麻煩嗰部分事情。嗰啲事情唔係“好睇”，而係“可實現、可維護、可擴展”。

-MaxKing.cc-

點解 image-to-code 總會跑偏

image-to-code 真正嘅難點，唔係“將圖翻譯成代碼”，而係“根據視覺表象估結構”。

佢睇得到三個好似嘅卡片，但未必知道呢三個卡片其實應該抽成同一個組件。佢睇得到一個好光嘅按鈕，但未必知道佢係業務主操作定次要操作。佢睇得到一塊炫光效果，但未必知道嗰只係裝飾，唔應該變成複雜嘅絕對定位。

所以你會見到一種好典型嘅結果：生成速度好快，返工亦好快。第一眼覺得用得，第二眼就開始改，第三眼已經喺手動重構。

問題唔在於工具唔識畫，而在於佢唔知道應該先理解啲咩。

佢係喺估結構，唔係喺翻譯結構。

-MaxKing.cc-

破局嘅關鍵，係先補 UI Spec

如果只係喺“圖”同“代碼”之間來回跳，最終大概率都係會返到手改。更穩陣嘅做法，係喺中間補一層 UI Spec。好多人將呢一步理解成概念包裝，其實佢解決嘅就係 AI 生成嘅 UI 圖落地跑偏時最缺嗰層結構判斷。

呢層嘢唔需要寫得好玄，佢本質上就係一份結構化界面規範。可以係 YAML，亦可以係 JSON，重點唔係格式，而係將工程判斷提早寫清楚：

1. 頁面要解決啲咩問題。 2. 主路徑同次路徑分別係乜嘢。 3. 邊啲模塊可以複用。 4. 邊啲狀態必須補齊。 5. 響應式規則點樣變。

先寫結構，再講好睇。

有咗呢層嘢，gpt-image-2 呢類模型再去出圖，就唔再係“憑感覺畫一張靚圖”，而係圍繞一個已經被約束過嘅結構去做視覺探索。圖嘅角色亦都會變輕：佢更似情緒板，唔係唯一標準。

新嘅工作流可以理解成呢一條鏈：

需求意圖 -> UI Spec -> 視覺探索 -> 代碼實現 -> 截圖對比 -> 局部修正

呢條鏈裏面最關鍵嘅一步，唔係視覺圖，而係 UI Spec。因為佢決定咗你後面係喺“估頁面”，定係喺“按結構執行”。

-MaxKing.cc-

呢套流程，先更接近真實工作流

如果將順序理順，成條鏈路會更似真實工作現場，而唔係一次性嘅演示。

1. 先將需求意圖收窄，確認頁面到底要解決啲咩問題。 2. 再將 UI Spec 寫實，將結構、狀態、響應式、複用關係講清楚。 3. 然後俾 gpt-image-2 去做視覺探索，用圖確認氛圍同密度。 4. 接着俾 Codex / Cursor 呢類嘅代碼工具拎住 Spec 同圖一齊落碼。 5. 頁面跑起咗之後，再用截圖對比去睇差異，局部修正，形成閉環。

圖片退返到情緒板嘅位置，系統先開始穩定。

先要落地，再講精緻。

真正決定頁面質量嘅，唔係某張圖嘅完成度，而係中間有冇嗰層結構約束。

喺呢套工作流裏面，圖片俾人拉落咗神壇，佢唔再係唯一嘅準則，而只係一個視覺參照。真正嘅中樞大腦，係嗰份 UI Spec。

-MaxKing.cc-

接下來嘅14天，我哋要講透呢套體系

呢篇文章係呢個系列嘅開篇。如果你都厭倦咗“每次用 AI 寫前端都要手動重構”嘅痛苦，呢條鏈路值得繼續睇落去。

接下來嘅14日裏面，我會將呢套工作流掰開揉碎，一步步帶住你實操落地。我哋會繼續拆，由0到1跑完整條鏈路。

UI工作流嘅合集：AI UI 落地工作流實戰：由靚圖到可上線頁面

配圖3

-MaxKing.cc-

資料包、互動同下一篇預告

🎁 粉絲專屬福利：我將上面呢套底層邏輯同核心 Prompt 整理成咗一份《AI UI 落地工作流資料包》。後續如果你要繼續做系列內容，可以沿住呢條鏈路繼續補。

💬 你而家用 AI 做 UI 或者寫頁面，最卡頸嘅環節係邊一步？係唔識出圖，定係結構冇寫清，定係代碼落地後返工太重？

👉 下一篇預告：點解我唔建議直接 image-to-code，而係先俾 AI 寫一份 UI Spec。

下一步可以咁樣做

收藏呢篇，後面翻睇 UI Spec、image-to-code 同截圖對比呢條鏈路。

評論區寫低你卡住嗰一步，我會優先按“出圖 / 結構 / 落碼”三種情況拆。

如果你打算繼續睇呢個系列，可以將呢篇留喺收藏夾裏面，方便後面對照。

- END -

關於 MaxKing寶藏

我係 MaxKing，全棧開發者、量化交易實踐者，亦係 AI 重度用戶。呢度分享嘅唔係遙遠概念，而係我喺真實使用、搭建同踩坑之後留低嘅判斷。

如果呢篇文章對你有啟發，歡迎點讚、在看、轉發，唔好唔記得關注我啊，亦歡迎加我好友交流 AI 工具同自動化實踐。

MaxKing寶藏

全棧開發者 × 量化交易 × AI 重度用戶。這裏記錄我用 AI 提升效率、解決問題、優化流程 的真實實踐，也分享工具背後的判斷、踩坑和可複用方法。

AI 生成的 UI 圖看起來很順的時候，最容易讓人放鬆警惕。後台彈出那條留言的時候，我正盯着一張剛生成的 SaaS 後台圖看。圖很順，陰影、留白、層級都像那麼回事，第一眼確實會讓人心裏一鬆：這次應該能直接落碼了。

可真把它塞進瀏覽器，事情馬上變了。數據一長，卡片開始互相擠；屏幕一縮，按鈕和列表就擠成一團；幾個狀態頁沒補齊，頁面看着就像少了骨架。那一刻很直觀：漂亮，是視覺的事；能跑，是結構的事。

那條留言把這件事說得很直接：

“image2 圖生成得很漂亮，但要落地到頁面就不行了，畢竟 image2 是整張圖，不是真正的 UI 設計。”

這句話沒有在抬槓，它只是把很多人都經歷過的那道坎，直接擺到了桌面上。圖漂亮，不等於頁面能跑。

-MaxKing.cc-

留言裏露出的不是挑刺，是現場

這條留言最有價值的地方，不是它“評價了 image2”，而是它把真正的問題說清楚了：你終究要交付的，不是圖，而是頁面。AI 生成的 UI 圖再漂亮，也不能替代頁面本身的結構判斷。

很多人第一次看到 AI 生成的 UI 圖，都會先被外觀騙到。深色背景、柔和陰影、整齊卡片、像樣的圖標，放在一張圖裏看，確實很有完成度。可一旦把它扔進真實業務裏，事情馬上變複雜：數據一長，卡片就撐；屏幕一窄，佈局就塌；按鈕一多，主次就亂。

這不是“AI 不行”這麼簡單。更準確地說，是你給它的輸入，本來就不夠它做工程判斷。

-MaxKing.cc-

圖片和 UI 設計稿，本來就不是一回事

很多人會下意識把“看起來像界面的圖片”當成“UI 設計稿”。這個誤會很常見，因為它們在第一眼上太像了。

但它們的職責完全不同。圖片負責的是“長什麼樣”，UI 設計稿負責的是“怎麼組織、怎麼響應、怎麼切換、怎麼複用”。前者是外觀，後者是骨架。

一張圖能告訴你顏色和氛圍，卻很難告訴你層級、約束和狀態。

而前端真正要落地的，恰恰就是這些工程信息。

在評審會上把同一張圖放到大屏和手機預覽裏，差異會被放大得很快。大屏上看着完整的模塊，一進窄屏就擠成兩層；原本看起來舒服的留白，換成真實數據以後就會被撐得發緊。那種“圖很穩、頁面很飄”的感覺，幾乎都是這一步暴露出來的。

你可以把它理解成看效果圖蓋房子。效果圖能看出大概的風格，卻不會告訴你承重牆、管線、樓板和動線怎麼排。頁面也是一樣，光有圖，代碼工具只能猜。

圖片不是源頭，它只是視覺表達。

頁面能不能跑，決定權在結構，不在像素。

-MaxKing.cc-

這張表最能說明問題

前端真正需要的信息	單張圖片是否提供？	缺失後的結果
組件層級嵌套	❌	頁面容易被平鋪成一堆 `div`，看着像，結構卻散。
交互與頁面狀態	❌	沒有 Hover、Loading、Empty、Error，頁面像靜止的海報。
響應式規則	❌	一到手機端就跑版，文字擠壓，模塊互相頂撞。
設計 Token	❌	顏色、字號、間距只能靠猜，後面很難接入統一體系。
真實數據邊界	❌	佔位符一換成長文本，卡片馬上撐爆。

這張表的意思其實很簡單：單張圖不是不能用，而是不能單獨當源頭。

它可以幫你定風格、定氛圍、定視覺密度，但它解決不了頁面落地最麻煩的那部分事情。那些事情不是“好看”，而是“可實現、可維護、可擴展”。

-MaxKing.cc-

為什麼 image-to-code 總會跑偏

image-to-code 真正的難點，不是“把圖翻譯成代碼”，而是“根據視覺表象猜結構”。

它看得到三個很像的卡片，卻未必知道這三個卡片其實應該抽成同一個組件。它看得到一個很亮的按鈕，卻未必知道它是業務主操作還是次要操作。它看得到一塊炫光效果，卻未必知道那只是裝飾，不該變成複雜的絕對定位。

所以你會看到一種很典型的結果：生成速度很快，返工也很快。第一眼覺得能用，第二眼就開始改，第三眼已經在手動重構。

問題不在於工具不會畫，而在於它不知道該先理解什麼。

它是在猜結構，不是在翻譯結構。

-MaxKing.cc-

破局的關鍵，是先補 UI Spec

如果只是在“圖”和“代碼”之間來回跳，終究大概率還是會回到手改。更穩的做法，是在中間補一層 UI Spec。很多人把這一步理解成概念包裝，其實它解決的就是 AI 生成的 UI 圖落地跑偏時最缺的那層結構判斷。

這層東西不需要寫得很玄，它本質上就是一份結構化界面規範。可以是 YAML，也可以是 JSON，重點不是格式，而是把工程判斷提前寫清楚：

1. 頁面要解決什麼問題。 2. 主路徑和次路徑分別是什麼。 3. 哪些模塊可以複用。 4. 哪些狀態必須補齊。 5. 響應式規則怎麼變。

先寫結構，再談好看。

有了這層東西，gpt-image-2 之類的模型再去出圖，就不再是“憑感覺畫一張漂亮圖”，而是圍繞一個已經被約束過的結構去做視覺探索。圖的角色也會變輕：它更像情緒板，不是唯一標準。

新的工作流可以理解成這一條鏈：

需求意圖 -> UI Spec -> 視覺探索 -> 代碼實現 -> 截圖對比 -> 局部修正

這條鏈裏最關鍵的一步，不是視覺圖，而是 UI Spec。因為它決定了你後面是在“猜頁面”，還是在“按結構執行”。

-MaxKing.cc-

這套流程，才更接近真實工作流

如果把順序理順，整個鏈路會更像真實工作現場，而不是一次性的演示。

1. 先把需求意圖收窄，確認頁面到底要解決什麼問題。 2. 再把 UI Spec 寫實，把結構、狀態、響應式、複用關係講清楚。 3. 然後讓 gpt-image-2 去做視覺探索，用圖確認氛圍和密度。 4. 接着讓 Codex / Cursor 之類的代碼工具拿着 Spec 和圖一起落碼。 5. 頁面跑起來以後，再用截圖對比去看差異，局部修正，形成閉環。

圖片退回到情緒板的位置，系統才開始穩定。

先能落地，再談精緻。

真正決定頁面質量的，不是某張圖的完成度，而是中間有沒有那層結構約束。

在這套工作流裏，圖片被拉下了神壇，它不再是唯一的準則，而只是一個視覺參照。真正的中樞大腦，是那份 UI Spec。

-MaxKing.cc-

接下來的 14 天，我們要講透這套體系

這篇文章是這個系列的開篇。如果你也厭倦了“每次用 AI 寫前端都要手動重構”的痛苦，這條鏈路值得繼續往下看。

接下來的 14 天裏，我會把這套工作流掰開揉碎，一步步帶着你實操落地。我們會繼續拆，從 0 到 1 跑完整條鏈路。

UI工作流的合集：AI UI 落地工作流實戰：從漂亮圖到可上線頁面

配圖3

-MaxKing.cc-

資料包、互動和下一篇預告

🎁 粉絲專屬福利：我把上面這套底層邏輯和核心 Prompt 整理成了一份《AI UI 落地工作流資料包》。後續如果你要繼續做系列內容，可以沿着這條鏈路繼續補。

💬 你現在用 AI 做 UI 或寫頁面，最卡脖子的環節是哪一步？是不會出圖，還是結構沒寫清，或者是代碼落地後返工太重？

👉 下一篇預告：為什麼我不建議直接 image-to-code，而是先讓 AI 寫一份 UI Spec。

下一步可以這樣做

收藏這篇，後面回看 UI Spec、image-to-code 和截圖對比這條鏈路。

評論區寫出你卡住的那一步，我會優先按“出圖 / 結構 / 落碼”三種情況拆。

如果你打算繼續看這個系列，可以先把這篇留在收藏夾裏，方便後面對照。

- END -

關於 MaxKing寶藏

我是 MaxKing，全棧開發者、量化交易實踐者，也是 AI 重度用戶。這裏分享的不是遙遠概念，而是我在真實使用、搭建和踩坑後留下的判斷。

如果這篇文章對你有啓發，歡迎點贊、在看、轉發，不要忘記關注我哦，也歡迎加我好友交流 AI 工具和自動化實踐。