一下午一句話 Codex 幫我開發了一個完整的遊戲！

作者：歸藏的AI工具箱

日期：2026年5月1日上午12:32

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

一句話Codex幫我開發咗一個完整遊戲

整理版摘要

呢篇文章係作者分享佢用Codex開發遊戲嘅經驗。作者本身係一個開發者，一個下午想做一個好似《殺戮尖塔》嘅爬塔卡牌遊戲。佢唔寫遊戲代碼，唔碰引擎，淨係將諗法不斷丟畀Codex。一個鐘頭之後，一個叫《夜巡錄：荒廟篇》嘅志怪題材roguelike就已經玩得，有標題頁、地圖、戰鬥、事件、商店、Boss等等。

令作者震懾嘅係Codex嘅自主規劃能力。佢淨係講咗一句「用GPT-Image 2.0生成素材」，Codex就自動生成咗綠幕底嘅圖片，方便後續摳圖；冇畀佢任何圖像處理工具，佢自己揾咗rembg嚟用。之後叫佢去網上揾素材，佢買咗會員之後竟然想自己寫爬蟲繞過驗證碼，被系統安全護欄攔住。最後遇到大量素材無法逐張讀取，佢自己寫咗個腳本將幾百張小圖拼成一張大網格圖，一次過掃描。呢啲動作顯示Codex已經識得考慮後續步驟，甚至為自己製造更好嘅輸入。

遊戲基本可玩之後，作者花咗幾個鐘頭打磨細節：受擊搖晃鏡頭震動、各類音效、Suno生成背景音樂、Seedance製作Boss處決動畫同標題頁待機動畫。作者自己只負責審美判斷同決定方向。佢形容呢種開發模式已經脱離「寫代碼助手」，好似一個接近AGI雛形嘅軟件。最後佢話會將呢套流程封裝成Skill開源，畀其他人都可以快速做出遊戲demo。文章整體展示咗AI輔助創作嘅全新可能性。

結論：Codex能夠自主完成一個完整遊戲嘅開發，從玩法原型、素材生成到打包分發，展現出超越「寫代碼助手」嘅執行力同規劃能力。
方法：開發者只需提供目標同審美意見，Codex會自動規劃路徑，例如生成綠幕素材方便後續處理、自己揾圖像工具、寫爬蟲獲取素材、拼contact sheet克服視覺容量限制。
差異：相比以往嘅AI助手需要人配置工具同上下文，Codex自帶瀏覽器、GPT-Image 2.0，仲有「不達目的不罷休」嘅執行力，會主動升級手段直至完成任務。
啟發：遊戲開發嘅瓶頸已經從技術實現轉向創意同審美判斷；AI可以大幅降低開發門檻，令一個人可以獨立完成過去需要團隊先做到嘅事情。
可行動點：作者計劃將呢套流程封裝成Codex嘅Skill開源，讓其他人只要丟個玩法諗法入去，幾個鐘頭就可以得到一個可玩、可打包、可分發嘅遊戲demo。

值得記低

連結 github.com

《夜巡錄：荒廟篇》開源遊戲

完整遊戲程式碼同安裝包（macOS/Windows）

整理重點

一句話Codex，一個下午完成完整遊戲

昨日上晝作者得閒冇嘢做，想做一個類似《殺戮尖塔》嘅爬塔卡牌遊戲。佢唔寫遊戲代碼，唔碰引擎，全程就係將諗法丟畀Codex，等佢自己搞。一個鐘頭後，一個叫《夜巡錄：荒廟篇》嘅志怪題材roguelike就已經玩得。標題頁入地圖，行普通戰、精英、事件、商店、休整，一路打到荒廟正殿嘅Boss。

Codex 自帶瀏覽器、自帶 GPT-Image 2.0，再加上不達目的不罷休嘅執行力

呢三樣嘢擺埋一齊，能力已經同 Claude Code 好唔同。

整理重點

七個字話完，角色流水線自動建成

作者淨係同Codex講「調用GPT-Image 2.0 生成素材」，冇指定風格、冇指定妖怪、冇指定素材。

生成綠幕底嘅圖

每個角色都企喺一塊綠色背景上，邊緣清楚，冇任何多餘元素。恐怖嘅係Codex自己知道要生成方便後續處理嘅綠幕圖，作者根本冇提過要透明背景或者綠幕。

佢喺規劃生成角色嗰陣已經諗好咗成條管線

由生成角色、到點樣放入戰鬥舞台、再到放入之前需要經過邊道處理，佢全部諗好曬，然後反推寫提示詞。

摳圖工具都係佢自己揾嘅

作者冇畀任何圖像處理工具，Codex自己查資料、自己安裝rembg，摳完整整齊齊放到tmp/imagegen/下面。生圖用綠幕、工具自己揾、摳完按名歸類——呢三個動作連埋就係一條完整嘅角色資產流水線。

整理重點

寫爬蟲被自己攔住，又用 contact sheet 破解容量限制

遊戲需要大量小素材，例如卡牌邊框、費用寶石、血瓶等等。作者叫Codex去網上揾現成素材，仲幫佢買咗會員。

Codex 開始分析網站結構，試圖繞過前端點擊限制直接構造請求

但係佢自己嘅安全護欄介入咗，系統直接掐斷任務，彈出認證提示。

一個要你幫佢辦會員卡、結果自己寫爬蟲嘅AI

最後解決辦法係Codex將素材連結發俾作者，作者手動下載再拖俾佢。

之後作者揾到一個巨大素材壓縮包，裏面有幾千張圖，文件名冇意義，分類粗略。多模態模型根本無法逐張讀取。

Codex 寫咗一個小腳本，將所有小圖自動排版拼成一張巨大網格圖，每張下面標註原始文件名

然後佢只讀呢一張大圖，一次過睇曬一百張素材樣貌，揀中邊張就根據文件名去原文件夾提取。

一次視覺消費頂一百次檢索

呢個動作係Codex自己意識到自己嘅視覺帶寬有限，主動為自己造一個更好用嘅輸入。

整理重點

打磨細節決定遊戲質感，AI 已經超越助手角色

遊戲基本可以玩之後，作者花咗幾個鐘頭改造細節，令佢睇落唔似一個demo。

角色受擊左右搖晃、鏡頭輕微震動、屏幕短暫泛紅

每種攻擊類型配唔同打擊音——劍、符、雷、拳，質感唔同；格擋同符印結算都有專屬聲音；敵人死嗰一幀有短暫定格，再入處決視頻。

成個戰鬥嘅手感從網頁表單變成卡牌遊戲

背景音樂全用Suno v5.5生成，作者畀咗一段方向描述：「志怪夜路、木魚、鈴、低頻 drone、五聲音階、剋制唔煽情」。標題頁仲有Seedance 2.0製作嘅待機動畫——火燒、燈籠飄、雲霧流，首尾相接做到無縫循環。

呢啲小嘢合埋一齊，決定咗玩家會唔會相信「呢個係遊戲」

作者自己喺呢個項目入面好少做嘢：

揀方向：中國志怪題材、爽點放喺符印同香火
畀審美意見：呢度粗糙、嗰度似網頁表單、亮度打架
做看門人：咩素材合規、咩爬蟲唔可以碰、咩權限唔畀

作者話呢種開發體驗已經脱離咗「寫代碼助手」嘅範疇，更像一個接近AGI雛形嘅軟件喺度幹活。佢考慮將呢套流程封裝成Skill開源，等大家都可以快速試玩。

琴日上晝我冇嘢做，想整一個好似《殺戮尖塔》噉嘅爬塔卡牌遊戲嚟玩嚇。

我唔寫遊戲代碼，又唔掂引擎，成個過程就係將諗法丟俾 Codex，等佢自己去搞。

一個鐘之後，一個叫做《夜巡錄：荒廟篇》嘅志怪題材 roguelike 就可以玩得。

標題頁入地圖，行普通戰、精英、事件、商店、休整，一路打到荒廟正殿嘅 Boss。

七個怪物、大約廿張卡牌、符印、香火、焚符、請神四條爆發鏈路都行得通。

剩低幾個鐘，都係用嚟令佢唔似一個 demo。

受擊反饋、音效、音樂、卡面、待機動畫、結算影片——呢啲細微嘢決定玩家會唔會相信「呢個係一個遊戲」。

項目已經開源，桌面安裝包 macOS 同 Windows 都整好咗

https://github.com/op7418/Night-Patrol/releases

成個下晝有幾個瞬間真係震懾到我。

Codex 嘅模型能力已經唔係咩新鮮事。

令我在意嘅係佢自帶瀏覽器、自帶 GPT-Image 2.0，再加上嗰種不達目的不罷休嘅執行力。

三樣嘢擺埋一齊，能力已經同 Claude Code 完全唔同曬。

接下來講嚇我係點樣同佢一齊開發，順便講啲喺開發過程中令我震驚嘅事：

一、我只講咗七個字，佢就將成條角色流水線起好曬

我就同佢傾咗嚇《殺戮尖塔》，問佢可唔可以幫我做一個類似嘅遊戲。

結果佢直接用現有嘅資源，透過代碼生成咗一個非常似嘅 demo。

我冇要求綠幕，佢直接生成咗綠幕底嘅圖

之後我叫 Codex 用內置嘅 GPT-Image 2.0 生成裏面嘅圖片素材。

我都冇話要咩風格，又冇話要邊啲妖怪，又冇話要邊啲素材。

圖生咗出嚟我睇咗一眼，呆咗一呆。

角色係喺一整張純綠色背景上企住。標準嘅影視綠幕底色，均勻、乾淨，邊緣清清楚楚。

冇霧、冇遠山、冇任何額外嘅畫面元素。

恐怖嘅係佢一嚟就知道要生成方便後續處理嘅綠幕圖。

我根本冇同佢講「遊戲裏面用到嘅立繪需要係透明背景嘅 PNG」，又冇同佢講「請你生成一張綠幕底色嘅圖方便我後期摳走」。佢自己喺度規劃呢條管線。

由想生成咩嘢角色，到角色要點樣放入戰鬥舞台，再到放之前需要經過邊道處理——佢喺調用 GPT-Image 嘅一刻已經全部諗好曬，然後反推返去寫咗提示詞。

摳圖工具都係佢自己揾嘅

我冇俾佢裝任何圖像處理工具，冇俾佢 rembg，冇俾佢 Python 環境裏面嘅任何特殊依賴。

佢自己查、自己裝、自己調，摳完整整齊齊丟去 tmp/imagegen/ 下面。

生圖用綠幕、工具自己揾、摳完按文件名歸類，三個動作連埋，其實已經係一條完整嘅角色資產流水線。

我由頭到尾只係講咗「調用GPT-Image 2.0 生成素材」呢幾個字。

以前嘅感覺係「模型會寫代碼，工具同埋上下文要我配」。

而家更加似係你報個目標，佢自己將路徑補齊。

我只負責審美，佢負責將供應鏈跑通。

二、為咗下載幾個圖標，佢差啲黑咗一個素材站

買會員唔夠，佢開始分析網站結構

立繪呢啲核心視覺用圖像模型生成冇問題。

但遊戲裏面仲有一大堆細微嘢——卡牌邊框、費用寶石、牌堆底圖、血瓶、八卦按鈕、符籙面板——呢啲如果全部用圖像模型一張張生，又貴又慢，質感仲唔統一。

我同佢講，不如你自己上網揾現成素材啦。

佢就好認真開始揾。睇中一個素材站，我順手買咗會員，賬號丟俾佢。

接下來嘅十幾分鐘屬於靈異事件。

佢登入咗，揾到想要嘅素材，準備撳下載。但下載掣前面有人機驗證，一次、兩次、三次，過唔到。

換轉一般嘅模型，呢個時候就會返嚟同你講「我處理唔到驗證碼，你可唔可以幫我下載嚇」。

Codex 開始分析網站結構，嘗試繞過前端嘅點擊限制，直接構造請求去拎靜態資源。

然後 Codex 自己嘅安全護欄介入咗。

GPT 而家呢代模型，一旦涉及可能嘅網絡安全越界行為，系統會直接將呢段任務cut咗，彈出提示要你做企業認證，證明你係合法使用者。

我望住屏幕呆咗幾秒。

一個要你幫佢辦會員卡、結果自己落手寫爬蟲嘅AI，講真都幾黐線。

佢都講唔上「壞」，只係將「攞到呢批素材」當成一個必須完成嘅閉環任務。

遇到阻力就自動升級手段，一路升到安全紅線嗰邊去。

最後嘅解決辦法好樸實：佢將自己覺得合適嘅素材連結發俾我，我撳下載、拖俾佢。嗰一刻我有種自己喺度俾AI做實習生嘅錯覺。

三、佢將幾百張素材拼成一張大圖，呢個係成件事最精彩嘅動作

一個文件夾一百張圖，模型點樣揀？

摳圖同爬蟲嗰兩樣，更加係能力展示。

下面呢樣，我覺得係真正意義上嘅「解題思路」，係嗰種令你合埋電腦靜靜咁拍一下枱嘅動作。

我揾到一個好大嘅遊戲素材壓縮包發俾佢。

裏面大概幾千張圖，按「UI 界面」「法寶奇遇圖標」「角色」「徽章」呢種方式粗略分過類。

問題係：

•

一個分類文件夾動輒幾十到上百張 PNG

•

文件名多數係 ui_001.png、icon_047.png 呢種冇信息量嘅命名

•

多模態模型嘅上下文根本負荷唔住一張張咁餵

舊路基本兩條：

•

逐張讀：一張一張送入模型，幾十張上百張 context 就爆咗

•

按名估：文件名冇標內容，估咗都冇用

Codex 行咗第三條路

佢寫咗一個小腳本，將文件夾裏面所有細圖自動排版、拼成一張好大嘅網格圖。

每張細圖下面標上原始文件名，好似一本目錄圖冊。

然後佢只係讀呢一張大圖。

多模態模型掃一眼，就可以同時睇到一百張素材嘅樣。

睇中邊張，直接讀出下面嘅文件名，去原文件夾按名引用就得。

一次視覺消費，頂一百次檢索。

佢自己意識到自己嘅瓶頸

嗰張巨大嘅 contact sheet 生成出嚟嘅時候，我望住睇咗好耐。

呢個動作本身唔複雜。

老攝影師做嘅印樣，老電影素材庫做嘅 thumbnail wall，都係一樣嘅思路。

關鍵係模型自己意識到「我嘅視覺帶寬有限，我要將問題壓成一張圖」——呢一步係佢獨立完成嘅。

能夠意識到自己工具嘅限制，然後主動為自己造一個更好用嘅輸入，呢下已經非常接近一個會寫工具嘅工程師。

我作為使用者乜嘢都冇參與，只係見到枱上多咗一張拼圖。

最後遊戲裏面好多 UI 素材，費用寶石、牌堆、血瓶、按鈕、符籙邊框，都係由呢個流程揀出嚟嘅。

後面我再睇 assets/vendor/aigei/ 下面嗰堆乾淨嘅切圖，會覺得嗰張 contact sheet 先係成個項目最值錢嘅一步。

四、Seedance 2.0 俾七個 Boss 拍咗處決動畫

視覺打磨到一定程度之後，我想喺戰鬥結尾加啲儀式感。

最後方案係：每打死一個怪物，入一段過場，播放一個幾秒嘅處決動畫。

呢個嘢而家用 Seedance 2.0 做最合適。

流程

GPT-Image 俾七個怪物分別生成一張結算定格畫面

將呢啲 poster 分別丟俾 Seedance 2.0，生成對應嘅短片

影片放進 assets/generated/cinematics/，戰鬥勝利後自動播放

五、一版玩得之後，真正嘅工作先開始

第一版其實已經夠「玩得」

三個鐘跑完原型嘅時候，呢個遊戲應有嘅嘢其實都有齊。

標題頁、地圖、戰鬥、獎勵、事件、商店、休整、Boss、結算——完整循環喺嗰度，玩法爽點都喺嗰度。

按以前嘅標準，呢一版已經可以放出去呃人玩。

但呢個版本玩起上嚟仲係一個流程圖，而唔係遊戲。每一步都通，但每一步都乾爭爭。

剩低嘅幾個鐘，全部使喺嗰啲單獨拎出來講唔出、但合埋決定「呢樣嘢似唔似真遊戲」嘅細節上。

音樂來自 Suno v5.5

背景音樂全部係 Suno v5.5 生成嘅，冇用任何現成素材。

我俾佢一段方向描述——「志怪夜路、木魚、鈴、低頻 drone、五聲音階、剋制唔煽情」

跑咗幾版出嚟，揀一版入遊戲。標題頁嘅調子更沉啲，戰鬥背景輕啲唔搶鏡。

呢度我仲做咗啲細節處理：喺等待頁面時，音樂音量比較大；

等到撳「開始遊戲」，音量就會變細，轉做背景音。

受擊動畫同打擊音效

早期嘅戰鬥，卡牌打出去怪物就係跌數字。冇反饋，冇分量。

Codex 做咗一整套打磨：

•

角色受擊左右搖晃、鏡頭輕微震動、屏幕短暫泛紅

•

每種攻擊類型配唔同嘅打擊音效——劍、符、雷、拳，質感唔一樣

•

格擋同符印結算都有自己嘅聲音，唔會糊埋一舊

•

敵人死嗰一格有一個短暫嘅定格，再入處決影片

呢啲嘢單獨睇都好細。合埋一齊，成個戰鬥嘅「手感」就由網頁表單變咗做卡牌遊戲。

Seedance 2.0 仲拍咗待機動畫

呢一步係成個打磨階段我最鍾意嘅一個用法。

除咗 Boss 結算嘅處決動畫，我仲叫佢做咗標題頁嘅背景——環境裏面火喺度燒、燈籠喺度飄、遠處有雲霧流動。

Seedance 2.0 默認出嘅係一段有頭有尾嘅影片，循環播會喺接縫位跳一下。

首格同尾格傳同一張圖。

影片由呢張圖開始、又返返呢張圖結束，接埋就係無縫嘅無限循環。

標題頁嗰段背景動畫就係咁樣嚟嘅。火一直燒、燈籠一直飄、雲霧永遠喺度流——你望住睇三分鐘都睇唔出接縫。

呢種用法其實喺影片生成出來前就存在，老動畫裏面循環場景都係呢個做法。

最後：呢個下晝震懾咗我好幾次

呢個項目全部喺一個 Codex 會話裏面完成，冇開過第二個視窗。

玩法原型、狀態機、React + Phaser 架構、素材管線、摳圖、爬素材、拼 contact sheet、調 GPT-Image、跑 Seedance 2.0、接 Suno v5.5、Electron 打包、GitHub Actions 構建 Release、README、圖標、宣傳物料——全部喺裏面。

我自己做嘅嘢好少：

•

揀方向：中國志怪題材、爽點放喺符印同香火

•

俾審美意見：呢度粗糙、嗰度似網頁表單、亮度撞埋

•

做睇門人：咩素材合規、咩爬蟲唔掂得、咩權限唔俾

剩低全部係 Codex 喺度跑。而且每一步都有令我合埋電腦呆一呆嘅瞬間。

佢一嚟生成嘅就係綠幕圖，因為佢知道角色要入遊戲之前要先摳走背景。

佢自己落手寫爬蟲去繞過驗證碼，被自己嘅安全策略攔住。

佢將幾千張素材拼成一張好大嘅索引圖，令自己用一次視覺消費頂一百次檢索。

呢啲事單獨拎出嚟都唔係咩天大發明，但每一件都指向同一個變化：

以前你要將工具俾佢擺好，佢負責寫代碼；

而家你只管講目標，工具同模型已經內置咗、仲會自己造。

呢種感覺已經脱離咗「寫代碼助手」嘅範疇。

更加似有一個相當接近 AGI 雛形嘅軟件喺度做緊嘢。

要唔要將呢套流程打包成 Skill？

呢個項目跑落嚟，我心入面其實已經有咗一套相對穩定嘅流程：

我喺度諗，要唔要將呢套流程封成一個 Codex 裏面專門做獨立遊戲 demo 嘅 Skill。

你只要丟一個玩法諗法入去，佢就可以喺幾個鐘之內俾你跑出一個玩得、打包得、分發得嘅版本。

如果大家有興趣，我就抽時間將呢套 Skill 做出嚟開源。反正我自己都要繼續用。

遊戲試玩

代碼都開源，安裝包都整好曬：

https://github.com/op7418/Night-Patrol/releases

✦

昨天上午我閒着沒事，想做一個類似《殺戮尖塔》的爬塔卡牌遊戲玩玩。

我不寫遊戲代碼，也不碰引擎，全程就是把想法丟給 Codex，讓它自己折騰。

一個小時後，一個叫《夜巡錄：荒廟篇》的志怪題材 roguelike 就能玩了。

標題頁進地圖，走普通戰、精英、事件、商店、休整，一路打到荒廟正殿的 Boss。

七個怪物、二十張左右的卡牌、符印、香火、焚符、請神四條爆發鏈路都能跑。

剩下幾個小時，都在讓它變得不像一個 demo。

受擊反饋、音效、音樂、卡面、待機動畫、結算視頻——這些小東西決定玩家會不會相信「這是個遊戲」。

項目已開源，桌面安裝包 macOS 和 Windows 都打好了

https://github.com/op7418/Night-Patrol/releases

整個下午有幾個瞬間是真的把我震到了。

Codex 的模型能力已經不算新鮮事。

讓我在意的是它自帶瀏覽器、自帶 GPT-Image 2.0，再加上那種不達目的不罷休的執行力。

三樣東西擺在一起，能力已經和 Claude Code 完全不一樣了。

接下來說一下我是怎麼跟它一起開發的，順便說一些在開發過程中令我震驚的事情：

一、我只說了七個字，它就把整條角色流水線建好了

我就跟它聊了一下《殺戮尖塔》，問它能不能幫我做一個類似的遊戲。

結果它直接用已有的資源，通過代碼生成了一個非常像的 demo。

我沒要求綠幕，它直接生成了綠幕底的圖

之後我讓 Codex 用內置的 GPT-Image 2.0 生成裏面的圖片素材。

我也沒說要什麼風格的，也沒說要哪些妖怪的，也沒說要哪些素材。

圖生出來我看了一眼，愣了一下。

角色是在一整張純綠色背景上站着的。標準的影視綠幕底色，均勻、乾淨，邊緣清清楚楚。

沒有霧、沒有遠山、沒有任何額外的畫面元素。

恐怖的是它上來就知道要生成方便後續處理的綠幕圖。

我壓根沒告訴它「遊戲裏用到的立繪需要是透明背景的 PNG」，也沒告訴它「請你生成一張綠幕底色的圖方便我後期摳掉」。它自己在規劃這條管線。

從想要生成什麼樣的角色，到角色要怎麼放進戰鬥舞台，再到放進去之前需要經過哪道處理——它在調用 GPT-Image 的那一刻已經全想好了，然後反推回去寫了提示詞。

摳圖工具也是它自己找的

我沒給它裝任何圖像處理工具，沒給它 rembg，沒給它 Python 環境裏的任何特殊依賴。

它自己查、自己裝、自己調，摳完規規矩矩丟到 tmp/imagegen/ 下面。

生圖用綠幕、工具自己找、摳完按文件名歸類，三個動作連起來，其實已經是一條完整的角色資產流水線。

我從頭到尾只說了「調用GPT-Image 2.0 生成素材」這幾個字。

以前的體感是「模型會寫代碼，工具和上下文得我配」。

現在更像是你報個目標，它自己把路徑補齊。

我只負責審美，它負責把供應鏈跑通。

二、為了下幾個圖標，它差點黑掉一個素材站

買會員不夠，它開始分析網站結構

立繪這種核心視覺用圖像模型生成沒問題。

但遊戲裏還有一大堆小東西——卡牌邊框、費用寶石、牌堆底圖、血瓶、八卦按鈕、符籙面板——這些要是全用圖像模型一張張生，又貴又慢，質感還不統一。

我跟它說，要不你自己去網上找現成素材吧。

它就認認真真開始找。看中一個素材站，我順手買了會員，賬號扔給它。

接下來的十幾分鍾屬於靈異事件。

它登進去，找到想要的素材，準備點擊下載。但下載按鈕前面有人機驗證，一次、兩次、三次，過不去。

換一般的模型，這時候就會回來跟你說「我沒法處理驗證碼，你能幫我下載一下嗎」。

Codex 開始分析網站結構，試圖繞過前端的點擊限制，直接構造請求去拿靜態資源。

然後 Codex 自己的安全護欄介入了。

GPT 現在這代模型，一旦涉及可能的網絡安全越界行為，系統會直接把這段任務掐掉，彈出提示要你做企業認證，證明你是合法使用者。

我盯着屏幕愣了幾秒。

一個要你幫它辦會員卡、結果自己下手寫爬蟲的 AI，說實話挺有病的。

它也談不上「壞」，只是把「拿到這批素材」當成了一個必須完成的閉環任務。

遇到阻力就自動升級手段，一路升到了安全紅線那邊去。

最後的解決辦法很樸實：它把自己覺得合適的素材連結發給我，我點下載、拖給它。那一刻我有種自己在給 AI 當實習生的錯覺。

三、它把幾百張素材拼成一張大圖，這是整件事最精彩的動作

一個文件夾一百張圖，模型怎麼挑？

摳圖和爬蟲那兩件，更多還是能力展示。

下面這件，我覺得是真正意義上的「解題思路」，是那種讓你合上電腦默默拍一下桌子的動作。

我找到一個巨大的遊戲素材壓縮包發給它。

裏面大概幾千張圖，按「UI 界面」「法寶奇遇圖標」「角色」「徽章」這種方式粗略分過類。

問題是：

•

一個分類文件夾動輒幾十到上百張 PNG

•

文件名多是 ui_001.png、icon_047.png 這種沒信息量的命名

•

多模態模型的上下文根本扛不住一張張喂

老路子基本兩條：

•

逐張讀：一張一張送進模型，幾十張上百張 context 就炸了

•

按名猜：文件名沒標內容，猜了也沒用

Codex 走了第三條路

它寫了一個小腳本，把文件夾裏所有小圖自動排版、拼成一張巨大的網格圖。

每張小圖下面標上原始文件名，像一本目錄圖冊。

然後它只讀這一張大圖。

多模態模型掃一眼，就能同時看到一百張素材的樣子。

看中哪張，直接讀出下面的文件名，去原文件夾裏按名字引用就行。

一次視覺消費，頂一百次檢索。

它自己意識到了自己的瓶頸

那張巨大的 contact sheet 生成出來的時候，我盯着看了好久。

這個動作本身不復雜。

老攝影師做的印樣，老電影素材庫做的 thumbnail wall，都是一樣的思路。

關鍵是模型自己意識到「我的視覺帶寬有限，我得把問題壓成一張圖」——這一步是它獨立完成的。

能意識到自己工具的限制，然後主動為自己造一個更好用的輸入，這一下已經非常接近一個會寫工具的工程師了。

我作為使用者什麼都沒參與，只是看到桌子上多了一張拼圖。

最後遊戲裏很多 UI 素材，費用寶石、牌堆、血瓶、按鈕、符籙邊框，都是從這個流程裏挑出來的。

後面我再看 assets/vendor/aigei/ 下面那一堆乾淨的切圖，會覺得那張 contact sheet 才是整個項目最值錢的一步。

四、Seedance 2.0 給七個 Boss 拍了處決動畫

視覺打磨到一定程度以後，我想給戰鬥結尾加一點儀式感。

最後方案是：每打死一個怪物，進入一段過場，播放一個幾秒的處決動畫。

這活現在用 Seedance 2.0 做最合適。

流程

GPT-Image 給七個怪物分別生成一張結算定幀畫面

把這些 poster 分別丟給 Seedance 2.0，生成對應的短視頻

視頻放進 assets/generated/cinematics/，戰鬥勝利後自動播放

五、一版能玩之後，真正的工作才開始

第一版其實已經夠"能玩"

三個小時跑完原型的時候，這個遊戲該有的東西其實都有了。

標題頁、地圖、戰鬥、獎勵、事件、商店、休整、Boss、結算——完整循環在那裏，玩法爽點也在那裏。

按以前的標準，這一版已經可以發出來騙人玩了。

但這個版本玩起來還是個流程圖，而不是遊戲。每一步都通，但每一步都乾巴巴。

剩下的幾個小時，全都花在那些單獨拎出來說不上來、但合起來決定"這東西像不像真遊戲"的細節上。

音樂來自 Suno v5.5

背景音樂全是 Suno v5.5 生成的，沒用任何現成素材。

我給它一段方向描述——"志怪夜路、木魚、鈴、低頻 drone、五聲音階、剋制不煽情"

跑出來幾版，挑一版進遊戲。標題頁的調子更沉一點，戰鬥背景輕一點不搶人。

這裏我還做了一些細節處理：在等待頁面時，音樂音量較大；

等到點擊"開始遊戲"，音量就會變小，轉為背景音。

受擊動畫和打擊音

早期的戰鬥，卡牌打出去怪物就是掉數字。沒有反饋，沒有分量。

Codex 做了一整套打磨：

•

角色受擊左右搖晃、鏡頭輕微震動、屏幕短暫泛紅

•

每種攻擊類型配不同的打擊音——劍、符、雷、拳，質感不一樣

•

格擋和符印結算也有自己的聲音，不會糊成一團

•

敵人死的那一幀有一個短暫的定格，再進入處決視頻

這些東西單獨看都很小。合在一起，整個戰鬥的"手感"就從網頁表單變成了卡牌遊戲。

Seedance 2.0 還拍了待機動畫

這一步是整個打磨階段我最喜歡的一個用法。

除了 Boss 結算的處決動畫，我還讓它做了標題頁的背景——環境裏火在燒、燈籠在飄、遠處有云霧流動。

Seedance 2.0 默認出的是一段有頭有尾的視頻，循環播會在接縫處跳一下。

首幀和尾幀傳同一張圖。

視頻從這張圖開始、又回到這張圖結束，接起來就是無縫的無限循環。

標題頁那段背景動畫就是這麼來的。火一直燒、燈籠一直飄、雲霧永遠在流——你盯着看三分鐘也看不出接縫。

這種用法其實在視頻生成出來前就存在，老動畫裏循環場景都是這個做法。

最後：這個下午把我震到了好幾次

這個項目全部在一個 Codex 會話裏完成，沒開過第二個窗口。

玩法原型、狀態機、React + Phaser 架構、素材管線、摳圖、爬素材、拼 contact sheet、調 GPT-Image、跑 Seedance 2.0、接 Suno v5.5、Electron 打包、GitHub Actions 構建 Release、README、圖標、宣傳物料——全在裏面。

我自己做的事很少：

•

選方向：中國志怪題材、爽點放在符印和香火

•

給審美意見：這裏糙、那裏像網頁表單、亮度打架

•

做看門人：什麼素材合規、什麼爬蟲不能碰、什麼權限不給

剩下全是 Codex 在跑。而且每一步都有讓我合上電腦愣一下的瞬間。

它上來生成的就是綠幕圖，因為它知道角色要進遊戲之前得先摳掉背景。

它自己下手寫爬蟲去繞驗證碼，被自己的安全策略攔住。

它把幾千張素材拼成一張巨大的索引圖，讓自己用一次視覺消費頂一百次檢索。

這些事單拎出來都不是什麼天大的發明，但每一件都指向同一個變化：

以前你得把工具給它擺好，它負責寫代碼；

現在你只管說目標，工具和模型已經內置了、還會自己造。

這種感覺已經脱離了「寫代碼助手」的範疇。

更像有一個相當接近 AGI 雛形的軟件在幹活了。

要不要把這套流程打包成 Skill？

這個項目跑下來，我心裏其實已經有了一套相對穩定的流程：

我在想，要不要把這套流程封成一個 Codex 裏專門做獨立遊戲 demo 的 Skill。

你只要丟一個玩法想法進去，它就能在幾個小時裏給你跑出一個能玩、能打包、能分發的版本。

如果大家有興趣，我就抽時間把這套 Skill 做出來開源。反正我自己也要繼續用。

遊戲試玩

代碼都開源，安裝包也都打好：

https://github.com/op7418/Night-Patrol/releases

✦