一下午一句話 Codex 幫我開發了一個完整的遊戲!
整理版優先睇
一句話Codex幫我開發咗一個完整遊戲
呢篇文章係作者分享佢用Codex開發遊戲嘅經驗。作者本身係一個開發者,一個下午想做一個好似《殺戮尖塔》嘅爬塔卡牌遊戲。佢唔寫遊戲代碼,唔碰引擎,淨係將諗法不斷丟畀Codex。一個鐘頭之後,一個叫《夜巡錄:荒廟篇》嘅志怪題材roguelike就已經玩得,有標題頁、地圖、戰鬥、事件、商店、Boss等等。
令作者震懾嘅係Codex嘅自主規劃能力。佢淨係講咗一句「用GPT-Image 2.0生成素材」,Codex就自動生成咗綠幕底嘅圖片,方便後續摳圖;冇畀佢任何圖像處理工具,佢自己揾咗rembg嚟用。之後叫佢去網上揾素材,佢買咗會員之後竟然想自己寫爬蟲繞過驗證碼,被系統安全護欄攔住。最後遇到大量素材無法逐張讀取,佢自己寫咗個腳本將幾百張小圖拼成一張大網格圖,一次過掃描。呢啲動作顯示Codex已經識得考慮後續步驟,甚至為自己製造更好嘅輸入。
遊戲基本可玩之後,作者花咗幾個鐘頭打磨細節:受擊搖晃鏡頭震動、各類音效、Suno生成背景音樂、Seedance製作Boss處決動畫同標題頁待機動畫。作者自己只負責審美判斷同決定方向。佢形容呢種開發模式已經脱離「寫代碼助手」,好似一個接近AGI雛形嘅軟件。最後佢話會將呢套流程封裝成Skill開源,畀其他人都可以快速做出遊戲demo。文章整體展示咗AI輔助創作嘅全新可能性。
- 結論:Codex能夠自主完成一個完整遊戲嘅開發,從玩法原型、素材生成到打包分發,展現出超越「寫代碼助手」嘅執行力同規劃能力。
- 方法:開發者只需提供目標同審美意見,Codex會自動規劃路徑,例如生成綠幕素材方便後續處理、自己揾圖像工具、寫爬蟲獲取素材、拼contact sheet克服視覺容量限制。
- 差異:相比以往嘅AI助手需要人配置工具同上下文,Codex自帶瀏覽器、GPT-Image 2.0,仲有「不達目的不罷休」嘅執行力,會主動升級手段直至完成任務。
- 啟發:遊戲開發嘅瓶頸已經從技術實現轉向創意同審美判斷;AI可以大幅降低開發門檻,令一個人可以獨立完成過去需要團隊先做到嘅事情。
- 可行動點:作者計劃將呢套流程封裝成Codex嘅Skill開源,讓其他人只要丟個玩法諗法入去,幾個鐘頭就可以得到一個可玩、可打包、可分發嘅遊戲demo。
《夜巡錄:荒廟篇》開源遊戲
完整遊戲程式碼同安裝包(macOS/Windows)
一句話Codex,一個下午完成完整遊戲
昨日上晝作者得閒冇嘢做,想做一個類似《殺戮尖塔》嘅爬塔卡牌遊戲。佢唔寫遊戲代碼,唔碰引擎,全程就係將諗法丟畀Codex,等佢自己搞。一個鐘頭後,一個叫《夜巡錄:荒廟篇》嘅志怪題材roguelike就已經玩得。標題頁入地圖,行普通戰、精英、事件、商店、休整,一路打到荒廟正殿嘅Boss。
Codex 自帶瀏覽器、自帶 GPT-Image 2.0,再加上不達目的不罷休嘅執行力
呢三樣嘢擺埋一齊,能力已經同 Claude Code 好唔同。
七個字話完,角色流水線自動建成
作者淨係同Codex講「調用GPT-Image 2.0 生成素材」,冇指定風格、冇指定妖怪、冇指定素材。
生成綠幕底嘅圖
每個角色都企喺一塊綠色背景上,邊緣清楚,冇任何多餘元素。恐怖嘅係Codex自己知道要生成方便後續處理嘅綠幕圖,作者根本冇提過要透明背景或者綠幕。
佢喺規劃生成角色嗰陣已經諗好咗成條管線
由生成角色、到點樣放入戰鬥舞台、再到放入之前需要經過邊道處理,佢全部諗好曬,然後反推寫提示詞。
摳圖工具都係佢自己揾嘅
作者冇畀任何圖像處理工具,Codex自己查資料、自己安裝rembg,摳完整整齊齊放到tmp/imagegen/下面。生圖用綠幕、工具自己揾、摳完按名歸類——呢三個動作連埋就係一條完整嘅角色資產流水線。
寫爬蟲被自己攔住,又用 contact sheet 破解容量限制
遊戲需要大量小素材,例如卡牌邊框、費用寶石、血瓶等等。作者叫Codex去網上揾現成素材,仲幫佢買咗會員。
Codex 開始分析網站結構,試圖繞過前端點擊限制直接構造請求
但係佢自己嘅安全護欄介入咗,系統直接掐斷任務,彈出認證提示。
一個要你幫佢辦會員卡、結果自己寫爬蟲嘅AI
最後解決辦法係Codex將素材連結發俾作者,作者手動下載再拖俾佢。
之後作者揾到一個巨大素材壓縮包,裏面有幾千張圖,文件名冇意義,分類粗略。多模態模型根本無法逐張讀取。
Codex 寫咗一個小腳本,將所有小圖自動排版拼成一張巨大網格圖,每張下面標註原始文件名
然後佢只讀呢一張大圖,一次過睇曬一百張素材樣貌,揀中邊張就根據文件名去原文件夾提取。
一次視覺消費頂一百次檢索
呢個動作係Codex自己意識到自己嘅視覺帶寬有限,主動為自己造一個更好用嘅輸入。
打磨細節決定遊戲質感,AI 已經超越助手角色
遊戲基本可以玩之後,作者花咗幾個鐘頭改造細節,令佢睇落唔似一個demo。
角色受擊左右搖晃、鏡頭輕微震動、屏幕短暫泛紅
每種攻擊類型配唔同打擊音——劍、符、雷、拳,質感唔同;格擋同符印結算都有專屬聲音;敵人死嗰一幀有短暫定格,再入處決視頻。
成個戰鬥嘅手感從網頁表單變成卡牌遊戲
背景音樂全用Suno v5.5生成,作者畀咗一段方向描述:「志怪夜路、木魚、鈴、低頻 drone、五聲音階、剋制唔煽情」。標題頁仲有Seedance 2.0製作嘅待機動畫——火燒、燈籠飄、雲霧流,首尾相接做到無縫循環。
呢啲小嘢合埋一齊,決定咗玩家會唔會相信「呢個係遊戲」
作者自己喺呢個項目入面好少做嘢:
- 揀方向:中國志怪題材、爽點放喺符印同香火
- 畀審美意見:呢度粗糙、嗰度似網頁表單、亮度打架
- 做看門人:咩素材合規、咩爬蟲唔可以碰、咩權限唔畀
作者話呢種開發體驗已經脱離咗「寫代碼助手」嘅範疇,更像一個接近AGI雛形嘅軟件喺度幹活。佢考慮將呢套流程封裝成Skill開源,等大家都可以快速試玩。
琴日上晝我冇嘢做,想整一個好似《殺戮尖塔》噉嘅爬塔卡牌遊戲嚟玩嚇。
我唔寫遊戲代碼,又唔掂引擎,成個過程就係將諗法丟俾 Codex,等佢自己去搞。
一個鐘之後,一個叫做《夜巡錄:荒廟篇》嘅志怪題材 roguelike 就可以玩得。
標題頁入地圖,行普通戰、精英、事件、商店、休整,一路打到荒廟正殿嘅 Boss。
七個怪物、大約廿張卡牌、符印、香火、焚符、請神四條爆發鏈路都行得通。
剩低幾個鐘,都係用嚟令佢唔似一個 demo。
受擊反饋、音效、音樂、卡面、待機動畫、結算影片——呢啲細微嘢決定玩家會唔會相信「呢個係一個遊戲」。
項目已經開源,桌面安裝包 macOS 同 Windows 都整好咗
https://github.com/op7418/Night-Patrol/releases
成個下晝有幾個瞬間真係震懾到我。
Codex 嘅模型能力已經唔係咩新鮮事。
令我在意嘅係佢自帶瀏覽器、自帶 GPT-Image 2.0,再加上嗰種不達目的不罷休嘅執行力。
三樣嘢擺埋一齊,能力已經同 Claude Code 完全唔同曬。
接下來講嚇我係點樣同佢一齊開發,順便講啲喺開發過程中令我震驚嘅事:
一、我只講咗七個字,佢就將成條角色流水線起好曬
我就同佢傾咗嚇《殺戮尖塔》,問佢可唔可以幫我做一個類似嘅遊戲。

結果佢直接用現有嘅資源,透過代碼生成咗一個非常似嘅 demo。

我冇要求綠幕,佢直接生成咗綠幕底嘅圖
之後我叫 Codex 用內置嘅 GPT-Image 2.0 生成裏面嘅圖片素材。
我都冇話要咩風格,又冇話要邊啲妖怪,又冇話要邊啲素材。
圖生咗出嚟我睇咗一眼,呆咗一呆。
角色係喺一整張純綠色背景上企住。標準嘅影視綠幕底色,均勻、乾淨,邊緣清清楚楚。
冇霧、冇遠山、冇任何額外嘅畫面元素。

恐怖嘅係佢一嚟就知道要生成方便後續處理嘅綠幕圖。
我根本冇同佢講「遊戲裏面用到嘅立繪需要係透明背景嘅 PNG」,又冇同佢講「請你生成一張綠幕底色嘅圖方便我後期摳走」。佢自己喺度規劃呢條管線。
由想生成咩嘢角色,到角色要點樣放入戰鬥舞台,再到放之前需要經過邊道處理——佢喺調用 GPT-Image 嘅一刻已經全部諗好曬,然後反推返去寫咗提示詞。
摳圖工具都係佢自己揾嘅
我冇俾佢裝任何圖像處理工具,冇俾佢 rembg,冇俾佢 Python 環境裏面嘅任何特殊依賴。
佢自己查、自己裝、自己調,摳完整整齊齊丟去 tmp/imagegen/ 下面。
生圖用綠幕、工具自己揾、摳完按文件名歸類,三個動作連埋,其實已經係一條完整嘅角色資產流水線。
我由頭到尾只係講咗「調用GPT-Image 2.0 生成素材」呢幾個字。

以前嘅感覺係「模型會寫代碼,工具同埋上下文要我配」。
而家更加似係你報個目標,佢自己將路徑補齊。
我只負責審美,佢負責將供應鏈跑通。
二、為咗下載幾個圖標,佢差啲黑咗一個素材站
買會員唔夠,佢開始分析網站結構
立繪呢啲核心視覺用圖像模型生成冇問題。
但遊戲裏面仲有一大堆細微嘢——卡牌邊框、費用寶石、牌堆底圖、血瓶、八卦按鈕、符籙面板——呢啲如果全部用圖像模型一張張生,又貴又慢,質感仲唔統一。
我同佢講,不如你自己上網揾現成素材啦。
佢就好認真開始揾。睇中一個素材站,我順手買咗會員,賬號丟俾佢。

接下來嘅十幾分鐘屬於靈異事件。
佢登入咗,揾到想要嘅素材,準備撳下載。但下載掣前面有人機驗證,一次、兩次、三次,過唔到。
換轉一般嘅模型,呢個時候就會返嚟同你講「我處理唔到驗證碼,你可唔可以幫我下載嚇」。
Codex 開始分析網站結構,嘗試繞過前端嘅點擊限制,直接構造請求去拎靜態資源。
然後 Codex 自己嘅安全護欄介入咗。
GPT 而家呢代模型,一旦涉及可能嘅網絡安全越界行為,系統會直接將呢段任務cut咗,彈出提示要你做企業認證,證明你係合法使用者。

我望住屏幕呆咗幾秒。
一個要你幫佢辦會員卡、結果自己落手寫爬蟲嘅AI,講真都幾黐線。
佢都講唔上「壞」,只係將「攞到呢批素材」當成一個必須完成嘅閉環任務。
遇到阻力就自動升級手段,一路升到安全紅線嗰邊去。
最後嘅解決辦法好樸實:佢將自己覺得合適嘅素材連結發俾我,我撳下載、拖俾佢。嗰一刻我有種自己喺度俾AI做實習生嘅錯覺。

三、佢將幾百張素材拼成一張大圖,呢個係成件事最精彩嘅動作
一個文件夾一百張圖,模型點樣揀?
摳圖同爬蟲嗰兩樣,更加係能力展示。
下面呢樣,我覺得係真正意義上嘅「解題思路」,係嗰種令你合埋電腦靜靜咁拍一下枱嘅動作。
我揾到一個好大嘅遊戲素材壓縮包發俾佢。
裏面大概幾千張圖,按「UI 界面」「法寶奇遇圖標」「角色」「徽章」呢種方式粗略分過類。
問題係:
一個分類文件夾動輒幾十到上百張 PNG
文件名多數係 ui_001.png、icon_047.png 呢種冇信息量嘅命名
多模態模型嘅上下文根本負荷唔住一張張咁餵

舊路基本兩條:
逐張讀:一張一張送入模型,幾十張上百張 context 就爆咗
按名估:文件名冇標內容,估咗都冇用
Codex 行咗第三條路
佢寫咗一個小腳本,將文件夾裏面所有細圖自動排版、拼成一張好大嘅網格圖。
每張細圖下面標上原始文件名,好似一本目錄圖冊。
然後佢只係讀呢一張大圖。
多模態模型掃一眼,就可以同時睇到一百張素材嘅樣。
睇中邊張,直接讀出下面嘅文件名,去原文件夾按名引用就得。

一次視覺消費,頂一百次檢索。
佢自己意識到自己嘅瓶頸
嗰張巨大嘅 contact sheet 生成出嚟嘅時候,我望住睇咗好耐。
呢個動作本身唔複雜。
老攝影師做嘅印樣,老電影素材庫做嘅 thumbnail wall,都係一樣嘅思路。
關鍵係模型自己意識到「我嘅視覺帶寬有限,我要將問題壓成一張圖」——呢一步係佢獨立完成嘅。
能夠意識到自己工具嘅限制,然後主動為自己造一個更好用嘅輸入,呢下已經非常接近一個會寫工具嘅工程師。
我作為使用者乜嘢都冇參與,只係見到枱上多咗一張拼圖。
最後遊戲裏面好多 UI 素材,費用寶石、牌堆、血瓶、按鈕、符籙邊框,都係由呢個流程揀出嚟嘅。
後面我再睇 assets/vendor/aigei/ 下面嗰堆乾淨嘅切圖,會覺得嗰張 contact sheet 先係成個項目最值錢嘅一步。
四、Seedance 2.0 俾七個 Boss 拍咗處決動畫
視覺打磨到一定程度之後,我想喺戰鬥結尾加啲儀式感。
最後方案係:每打死一個怪物,入一段過場,播放一個幾秒嘅處決動畫。
呢個嘢而家用 Seedance 2.0 做最合適。

流程
GPT-Image 俾七個怪物分別生成一張結算定格畫面
將呢啲 poster 分別丟俾 Seedance 2.0,生成對應嘅短片
影片放進 assets/generated/cinematics/,戰鬥勝利後自動播放

五、一版玩得之後,真正嘅工作先開始
第一版其實已經夠「玩得」
三個鐘跑完原型嘅時候,呢個遊戲應有嘅嘢其實都有齊。
標題頁、地圖、戰鬥、獎勵、事件、商店、休整、Boss、結算——完整循環喺嗰度,玩法爽點都喺嗰度。
按以前嘅標準,呢一版已經可以放出去呃人玩。

但呢個版本玩起上嚟仲係一個流程圖,而唔係遊戲。每一步都通,但每一步都乾爭爭。
剩低嘅幾個鐘,全部使喺嗰啲單獨拎出來講唔出、但合埋決定「呢樣嘢似唔似真遊戲」嘅細節上。
音樂來自 Suno v5.5
背景音樂全部係 Suno v5.5 生成嘅,冇用任何現成素材。
我俾佢一段方向描述——「志怪夜路、木魚、鈴、低頻 drone、五聲音階、剋制唔煽情」
跑咗幾版出嚟,揀一版入遊戲。標題頁嘅調子更沉啲,戰鬥背景輕啲唔搶鏡。

呢度我仲做咗啲細節處理:喺等待頁面時,音樂音量比較大;
等到撳「開始遊戲」,音量就會變細,轉做背景音。
受擊動畫同打擊音效
早期嘅戰鬥,卡牌打出去怪物就係跌數字。冇反饋,冇分量。
Codex 做咗一整套打磨:
角色受擊左右搖晃、鏡頭輕微震動、屏幕短暫泛紅
每種攻擊類型配唔同嘅打擊音效——劍、符、雷、拳,質感唔一樣
格擋同符印結算都有自己嘅聲音,唔會糊埋一舊
敵人死嗰一格有一個短暫嘅定格,再入處決影片
呢啲嘢單獨睇都好細。合埋一齊,成個戰鬥嘅「手感」就由網頁表單變咗做卡牌遊戲。

Seedance 2.0 仲拍咗待機動畫
呢一步係成個打磨階段我最鍾意嘅一個用法。
除咗 Boss 結算嘅處決動畫,我仲叫佢做咗標題頁嘅背景——環境裏面火喺度燒、燈籠喺度飄、遠處有雲霧流動。
Seedance 2.0 默認出嘅係一段有頭有尾嘅影片,循環播會喺接縫位跳一下。
首格同尾格傳同一張圖。
影片由呢張圖開始、又返返呢張圖結束,接埋就係無縫嘅無限循環。

標題頁嗰段背景動畫就係咁樣嚟嘅。火一直燒、燈籠一直飄、雲霧永遠喺度流——你望住睇三分鐘都睇唔出接縫。
呢種用法其實喺影片生成出來前就存在,老動畫裏面循環場景都係呢個做法。

最後:呢個下晝震懾咗我好幾次
呢個項目全部喺一個 Codex 會話裏面完成,冇開過第二個視窗。
玩法原型、狀態機、React + Phaser 架構、素材管線、摳圖、爬素材、拼 contact sheet、調 GPT-Image、跑 Seedance 2.0、接 Suno v5.5、Electron 打包、GitHub Actions 構建 Release、README、圖標、宣傳物料——全部喺裏面。
我自己做嘅嘢好少:
揀方向:中國志怪題材、爽點放喺符印同香火
俾審美意見:呢度粗糙、嗰度似網頁表單、亮度撞埋
做睇門人:咩素材合規、咩爬蟲唔掂得、咩權限唔俾
剩低全部係 Codex 喺度跑。而且每一步都有令我合埋電腦呆一呆嘅瞬間。
佢一嚟生成嘅就係綠幕圖,因為佢知道角色要入遊戲之前要先摳走背景。
佢自己落手寫爬蟲去繞過驗證碼,被自己嘅安全策略攔住。
佢將幾千張素材拼成一張好大嘅索引圖,令自己用一次視覺消費頂一百次檢索。
呢啲事單獨拎出嚟都唔係咩天大發明,但每一件都指向同一個變化:
以前你要將工具俾佢擺好,佢負責寫代碼;
而家你只管講目標,工具同模型已經內置咗、仲會自己造。
呢種感覺已經脱離咗「寫代碼助手」嘅範疇。
更加似有一個相當接近 AGI 雛形嘅軟件喺度做緊嘢。
要唔要將呢套流程打包成 Skill?
呢個項目跑落嚟,我心入面其實已經有咗一套相對穩定嘅流程:
我喺度諗,要唔要將呢套流程封成一個 Codex 裏面專門做獨立遊戲 demo 嘅 Skill。
你只要丟一個玩法諗法入去,佢就可以喺幾個鐘之內俾你跑出一個玩得、打包得、分發得嘅版本。
如果大家有興趣,我就抽時間將呢套 Skill 做出嚟開源。反正我自己都要繼續用。
遊戲試玩
代碼都開源,安裝包都整好曬:
https://github.com/op7418/Night-Patrol/releases
✦
昨天上午我閒着沒事,想做一個類似《殺戮尖塔》的爬塔卡牌遊戲玩玩。
我不寫遊戲代碼,也不碰引擎,全程就是把想法丟給 Codex,讓它自己折騰。
一個小時後,一個叫《夜巡錄:荒廟篇》的志怪題材 roguelike 就能玩了。
標題頁進地圖,走普通戰、精英、事件、商店、休整,一路打到荒廟正殿的 Boss。
七個怪物、二十張左右的卡牌、符印、香火、焚符、請神四條爆發鏈路都能跑。
剩下幾個小時,都在讓它變得不像一個 demo。
受擊反饋、音效、音樂、卡面、待機動畫、結算視頻——這些小東西決定玩家會不會相信「這是個遊戲」。
項目已開源,桌面安裝包 macOS 和 Windows 都打好了
https://github.com/op7418/Night-Patrol/releases
整個下午有幾個瞬間是真的把我震到了。
Codex 的模型能力已經不算新鮮事。
讓我在意的是它自帶瀏覽器、自帶 GPT-Image 2.0,再加上那種不達目的不罷休的執行力。
三樣東西擺在一起,能力已經和 Claude Code 完全不一樣了。
接下來說一下我是怎麼跟它一起開發的,順便說一些在開發過程中令我震驚的事情:
一、我只說了七個字,它就把整條角色流水線建好了
我就跟它聊了一下《殺戮尖塔》,問它能不能幫我做一個類似的遊戲。

結果它直接用已有的資源,通過代碼生成了一個非常像的 demo。

我沒要求綠幕,它直接生成了綠幕底的圖
之後我讓 Codex 用內置的 GPT-Image 2.0 生成裏面的圖片素材。
我也沒說要什麼風格的,也沒說要哪些妖怪的,也沒說要哪些素材。
圖生出來我看了一眼,愣了一下。
角色是在一整張純綠色背景上站着的。標準的影視綠幕底色,均勻、乾淨,邊緣清清楚楚。
沒有霧、沒有遠山、沒有任何額外的畫面元素。

恐怖的是它上來就知道要生成方便後續處理的綠幕圖。
我壓根沒告訴它「遊戲裏用到的立繪需要是透明背景的 PNG」,也沒告訴它「請你生成一張綠幕底色的圖方便我後期摳掉」。它自己在規劃這條管線。
從想要生成什麼樣的角色,到角色要怎麼放進戰鬥舞台,再到放進去之前需要經過哪道處理——它在調用 GPT-Image 的那一刻已經全想好了,然後反推回去寫了提示詞。
摳圖工具也是它自己找的
我沒給它裝任何圖像處理工具,沒給它 rembg,沒給它 Python 環境裏的任何特殊依賴。
它自己查、自己裝、自己調,摳完規規矩矩丟到 tmp/imagegen/ 下面。
生圖用綠幕、工具自己找、摳完按文件名歸類,三個動作連起來,其實已經是一條完整的角色資產流水線。
我從頭到尾只說了「調用GPT-Image 2.0 生成素材」這幾個字。

以前的體感是「模型會寫代碼,工具和上下文得我配」。
現在更像是你報個目標,它自己把路徑補齊。
我只負責審美,它負責把供應鏈跑通。
二、為了下幾個圖標,它差點黑掉一個素材站
買會員不夠,它開始分析網站結構
立繪這種核心視覺用圖像模型生成沒問題。
但遊戲裏還有一大堆小東西——卡牌邊框、費用寶石、牌堆底圖、血瓶、八卦按鈕、符籙面板——這些要是全用圖像模型一張張生,又貴又慢,質感還不統一。
我跟它說,要不你自己去網上找現成素材吧。
它就認認真真開始找。看中一個素材站,我順手買了會員,賬號扔給它。

接下來的十幾分鍾屬於靈異事件。
它登進去,找到想要的素材,準備點擊下載。但下載按鈕前面有人機驗證,一次、兩次、三次,過不去。
換一般的模型,這時候就會回來跟你說「我沒法處理驗證碼,你能幫我下載一下嗎」。
Codex 開始分析網站結構,試圖繞過前端的點擊限制,直接構造請求去拿靜態資源。
然後 Codex 自己的安全護欄介入了。
GPT 現在這代模型,一旦涉及可能的網絡安全越界行為,系統會直接把這段任務掐掉,彈出提示要你做企業認證,證明你是合法使用者。

我盯着屏幕愣了幾秒。
一個要你幫它辦會員卡、結果自己下手寫爬蟲的 AI,說實話挺有病的。
它也談不上「壞」,只是把「拿到這批素材」當成了一個必須完成的閉環任務。
遇到阻力就自動升級手段,一路升到了安全紅線那邊去。
最後的解決辦法很樸實:它把自己覺得合適的素材連結發給我,我點下載、拖給它。那一刻我有種自己在給 AI 當實習生的錯覺。

三、它把幾百張素材拼成一張大圖,這是整件事最精彩的動作
一個文件夾一百張圖,模型怎麼挑?
摳圖和爬蟲那兩件,更多還是能力展示。
下面這件,我覺得是真正意義上的「解題思路」,是那種讓你合上電腦默默拍一下桌子的動作。
我找到一個巨大的遊戲素材壓縮包發給它。
裏面大概幾千張圖,按「UI 界面」「法寶奇遇圖標」「角色」「徽章」這種方式粗略分過類。
問題是:
一個分類文件夾動輒幾十到上百張 PNG
文件名多是 ui_001.png、icon_047.png 這種沒信息量的命名
多模態模型的上下文根本扛不住一張張喂

老路子基本兩條:
逐張讀:一張一張送進模型,幾十張上百張 context 就炸了
按名猜:文件名沒標內容,猜了也沒用
Codex 走了第三條路
它寫了一個小腳本,把文件夾裏所有小圖自動排版、拼成一張巨大的網格圖。
每張小圖下面標上原始文件名,像一本目錄圖冊。
然後它只讀這一張大圖。
多模態模型掃一眼,就能同時看到一百張素材的樣子。
看中哪張,直接讀出下面的文件名,去原文件夾裏按名字引用就行。

一次視覺消費,頂一百次檢索。
它自己意識到了自己的瓶頸
那張巨大的 contact sheet 生成出來的時候,我盯着看了好久。
這個動作本身不復雜。
老攝影師做的印樣,老電影素材庫做的 thumbnail wall,都是一樣的思路。
關鍵是模型自己意識到「我的視覺帶寬有限,我得把問題壓成一張圖」——這一步是它獨立完成的。
能意識到自己工具的限制,然後主動為自己造一個更好用的輸入,這一下已經非常接近一個會寫工具的工程師了。
我作為使用者什麼都沒參與,只是看到桌子上多了一張拼圖。
最後遊戲裏很多 UI 素材,費用寶石、牌堆、血瓶、按鈕、符籙邊框,都是從這個流程裏挑出來的。
後面我再看 assets/vendor/aigei/ 下面那一堆乾淨的切圖,會覺得那張 contact sheet 才是整個項目最值錢的一步。
四、Seedance 2.0 給七個 Boss 拍了處決動畫
視覺打磨到一定程度以後,我想給戰鬥結尾加一點儀式感。
最後方案是:每打死一個怪物,進入一段過場,播放一個幾秒的處決動畫。
這活現在用 Seedance 2.0 做最合適。

流程
GPT-Image 給七個怪物分別生成一張結算定幀畫面
把這些 poster 分別丟給 Seedance 2.0,生成對應的短視頻
視頻放進 assets/generated/cinematics/,戰鬥勝利後自動播放

五、一版能玩之後,真正的工作才開始
第一版其實已經夠"能玩"
三個小時跑完原型的時候,這個遊戲該有的東西其實都有了。
標題頁、地圖、戰鬥、獎勵、事件、商店、休整、Boss、結算——完整循環在那裏,玩法爽點也在那裏。
按以前的標準,這一版已經可以發出來騙人玩了。

但這個版本玩起來還是個流程圖,而不是遊戲。每一步都通,但每一步都乾巴巴。
剩下的幾個小時,全都花在那些單獨拎出來說不上來、但合起來決定"這東西像不像真遊戲"的細節上。
音樂來自 Suno v5.5
背景音樂全是 Suno v5.5 生成的,沒用任何現成素材。
我給它一段方向描述——"志怪夜路、木魚、鈴、低頻 drone、五聲音階、剋制不煽情"
跑出來幾版,挑一版進遊戲。標題頁的調子更沉一點,戰鬥背景輕一點不搶人。

這裏我還做了一些細節處理:在等待頁面時,音樂音量較大;
等到點擊"開始遊戲",音量就會變小,轉為背景音。
受擊動畫和打擊音
早期的戰鬥,卡牌打出去怪物就是掉數字。沒有反饋,沒有分量。
Codex 做了一整套打磨:
角色受擊左右搖晃、鏡頭輕微震動、屏幕短暫泛紅
每種攻擊類型配不同的打擊音——劍、符、雷、拳,質感不一樣
格擋和符印結算也有自己的聲音,不會糊成一團
敵人死的那一幀有一個短暫的定格,再進入處決視頻
這些東西單獨看都很小。合在一起,整個戰鬥的"手感"就從網頁表單變成了卡牌遊戲。

Seedance 2.0 還拍了待機動畫
這一步是整個打磨階段我最喜歡的一個用法。
除了 Boss 結算的處決動畫,我還讓它做了標題頁的背景——環境裏火在燒、燈籠在飄、遠處有云霧流動。
Seedance 2.0 默認出的是一段有頭有尾的視頻,循環播會在接縫處跳一下。
首幀和尾幀傳同一張圖。
視頻從這張圖開始、又回到這張圖結束,接起來就是無縫的無限循環。

標題頁那段背景動畫就是這麼來的。火一直燒、燈籠一直飄、雲霧永遠在流——你盯着看三分鐘也看不出接縫。
這種用法其實在視頻生成出來前就存在,老動畫裏循環場景都是這個做法。

最後:這個下午把我震到了好幾次
這個項目全部在一個 Codex 會話裏完成,沒開過第二個窗口。
玩法原型、狀態機、React + Phaser 架構、素材管線、摳圖、爬素材、拼 contact sheet、調 GPT-Image、跑 Seedance 2.0、接 Suno v5.5、Electron 打包、GitHub Actions 構建 Release、README、圖標、宣傳物料——全在裏面。
我自己做的事很少:
選方向:中國志怪題材、爽點放在符印和香火
給審美意見:這裏糙、那裏像網頁表單、亮度打架
做看門人:什麼素材合規、什麼爬蟲不能碰、什麼權限不給
剩下全是 Codex 在跑。而且每一步都有讓我合上電腦愣一下的瞬間。
它上來生成的就是綠幕圖,因為它知道角色要進遊戲之前得先摳掉背景。
它自己下手寫爬蟲去繞驗證碼,被自己的安全策略攔住。
它把幾千張素材拼成一張巨大的索引圖,讓自己用一次視覺消費頂一百次檢索。
這些事單拎出來都不是什麼天大的發明,但每一件都指向同一個變化:
以前你得把工具給它擺好,它負責寫代碼;
現在你只管說目標,工具和模型已經內置了、還會自己造。
這種感覺已經脱離了「寫代碼助手」的範疇。
更像有一個相當接近 AGI 雛形的軟件在幹活了。
要不要把這套流程打包成 Skill?
這個項目跑下來,我心裏其實已經有了一套相對穩定的流程:
我在想,要不要把這套流程封成一個 Codex 裏專門做獨立遊戲 demo 的 Skill。
你只要丟一個玩法想法進去,它就能在幾個小時裏給你跑出一個能玩、能打包、能分發的版本。
如果大家有興趣,我就抽時間把這套 Skill 做出來開源。反正我自己也要繼續用。
遊戲試玩
代碼都開源,安裝包也都打好:
https://github.com/op7418/Night-Patrol/releases
✦