一下午一句話 Codex 幫我開發了一個完整的遊戲!

作者:歸藏的AI工具箱
日期:2026年5月1日 上午12:32
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

一句話Codex幫我開發咗一個完整遊戲

整理版摘要

呢篇文章係作者分享佢用Codex開發遊戲嘅經驗。作者本身係一個開發者,一個下午想做一個好似《殺戮尖塔》嘅爬塔卡牌遊戲。佢唔寫遊戲代碼,唔碰引擎,淨係將諗法不斷丟畀Codex。一個鐘頭之後,一個叫《夜巡錄:荒廟篇》嘅志怪題材roguelike就已經玩得,有標題頁、地圖、戰鬥、事件、商店、Boss等等。

令作者震懾嘅係Codex嘅自主規劃能力。佢淨係講咗一句「用GPT-Image 2.0生成素材」,Codex就自動生成咗綠幕底嘅圖片,方便後續摳圖;冇畀佢任何圖像處理工具,佢自己揾咗rembg嚟用。之後叫佢去網上揾素材,佢買咗會員之後竟然想自己寫爬蟲繞過驗證碼,被系統安全護欄攔住。最後遇到大量素材無法逐張讀取,佢自己寫咗個腳本將幾百張小圖拼成一張大網格圖,一次過掃描。呢啲動作顯示Codex已經識得考慮後續步驟,甚至為自己製造更好嘅輸入。

遊戲基本可玩之後,作者花咗幾個鐘頭打磨細節:受擊搖晃鏡頭震動、各類音效、Suno生成背景音樂、Seedance製作Boss處決動畫同標題頁待機動畫。作者自己只負責審美判斷同決定方向。佢形容呢種開發模式已經脱離「寫代碼助手」,好似一個接近AGI雛形嘅軟件。最後佢話會將呢套流程封裝成Skill開源,畀其他人都可以快速做出遊戲demo。文章整體展示咗AI輔助創作嘅全新可能性。

  • 結論Codex能夠自主完成一個完整遊戲嘅開發,從玩法原型、素材生成到打包分發,展現出超越「寫代碼助手」嘅執行力同規劃能力。
  • 方法:開發者只需提供目標同審美意見,Codex會自動規劃路徑,例如生成綠幕素材方便後續處理、自己揾圖像工具、寫爬蟲獲取素材、拼contact sheet克服視覺容量限制。
  • 差異:相比以往嘅AI助手需要人配置工具同上下文,Codex自帶瀏覽器、GPT-Image 2.0,仲有「不達目的不罷休」嘅執行力,會主動升級手段直至完成任務。
  • 啟發:遊戲開發嘅瓶頸已經從技術實現轉向創意同審美判斷;AI可以大幅降低開發門檻,令一個人可以獨立完成過去需要團隊先做到嘅事情
  • 可行動點:作者計劃將呢套流程封裝成Codex嘅Skill開源,讓其他人只要丟個玩法諗法入去,幾個鐘頭就可以得到一個可玩、可打包、可分發嘅遊戲demo。
值得記低
連結 github.com

《夜巡錄:荒廟篇》開源遊戲

完整遊戲程式碼同安裝包(macOS/Windows)

整理重點

一句話Codex,一個下午完成完整遊戲

昨日上晝作者得閒冇嘢做,想做一個類似《殺戮尖塔》嘅爬塔卡牌遊戲。佢唔寫遊戲代碼,唔碰引擎,全程就係將諗法丟畀Codex,等佢自己搞。一個鐘頭後,一個叫《夜巡錄:荒廟篇》嘅志怪題材roguelike就已經玩得。標題頁入地圖,行普通戰、精英、事件、商店、休整,一路打到荒廟正殿嘅Boss

Codex 自帶瀏覽器、自帶 GPT-Image 2.0,再加上不達目的不罷休嘅執行力

呢三樣嘢擺埋一齊,能力已經同 Claude Code 好唔同。

整理重點

七個字話完,角色流水線自動建成

作者淨係同Codex講「調用GPT-Image 2.0 生成素材」,冇指定風格、冇指定妖怪、冇指定素材。

生成綠幕底嘅圖

每個角色都企喺一塊綠色背景上,邊緣清楚,冇任何多餘元素。恐怖嘅係Codex自己知道要生成方便後續處理嘅綠幕圖,作者根本冇提過要透明背景或者綠幕。

佢喺規劃生成角色嗰陣已經諗好咗成條管線

由生成角色、到點樣放入戰鬥舞台、再到放入之前需要經過邊道處理,佢全部諗好曬,然後反推寫提示詞。

摳圖工具都係佢自己揾嘅

作者冇畀任何圖像處理工具,Codex自己查資料、自己安裝rembg,摳完整整齊齊放到tmp/imagegen/下面。生圖用綠幕、工具自己揾、摳完按名歸類——呢三個動作連埋就係一條完整嘅角色資產流水線。

整理重點

寫爬蟲被自己攔住,又用 contact sheet 破解容量限制

遊戲需要大量小素材,例如卡牌邊框、費用寶石、血瓶等等。作者叫Codex去網上揾現成素材,仲幫佢買咗會員。

Codex 開始分析網站結構,試圖繞過前端點擊限制直接構造請求

但係佢自己嘅安全護欄介入咗,系統直接掐斷任務,彈出認證提示。

一個要你幫佢辦會員卡、結果自己寫爬蟲嘅AI

最後解決辦法係Codex將素材連結發俾作者,作者手動下載再拖俾佢。

之後作者揾到一個巨大素材壓縮包,裏面有幾千張圖,文件名冇意義,分類粗略。多模態模型根本無法逐張讀取。

Codex 寫咗一個小腳本,將所有小圖自動排版拼成一張巨大網格圖,每張下面標註原始文件名

然後佢只讀呢一張大圖,一次過睇曬一百張素材樣貌,揀中邊張就根據文件名去原文件夾提取。

一次視覺消費頂一百次檢索

呢個動作係Codex自己意識到自己嘅視覺帶寬有限,主動為自己造一個更好用嘅輸入。

整理重點

打磨細節決定遊戲質感,AI 已經超越助手角色

遊戲基本可以玩之後,作者花咗幾個鐘頭改造細節,令佢睇落唔似一個demo。

角色受擊左右搖晃、鏡頭輕微震動、屏幕短暫泛紅

每種攻擊類型配唔同打擊音——劍、符、雷、拳,質感唔同;格擋同符印結算都有專屬聲音;敵人死嗰一幀有短暫定格,再入處決視頻。

成個戰鬥嘅手感從網頁表單變成卡牌遊戲

背景音樂全用Suno v5.5生成,作者畀咗一段方向描述:「志怪夜路、木魚、鈴、低頻 drone、五聲音階、剋制唔煽情」。標題頁仲有Seedance 2.0製作嘅待機動畫——火燒、燈籠飄、雲霧流,首尾相接做到無縫循環。

呢啲小嘢合埋一齊,決定咗玩家會唔會相信「呢個係遊戲

作者自己喺呢個項目入面好少做嘢

  • 揀方向:中國志怪題材、爽點放喺符印同香火
  • 畀審美意見:呢度粗糙、嗰度似網頁表單、亮度打架
  • 做看門人:咩素材合規、咩爬蟲唔可以碰、咩權限唔畀

作者話呢種開發體驗已經脱離咗「寫代碼助手」嘅範疇,更像一個接近AGI雛形嘅軟件喺度幹活。佢考慮將呢套流程封裝成Skill開源,等大家都可以快速試玩。

琴日上晝我冇嘢做,想整一個好似《殺戮尖塔》噉嘅爬塔卡牌遊戲嚟玩嚇。

我唔寫遊戲代碼,又唔掂引擎,成個過程就係將諗法丟俾 Codex,等佢自己去搞。

一個鐘之後,一個叫做《夜巡錄:荒廟篇》嘅志怪題材 roguelike 就可以玩得。

標題頁入地圖,行普通戰、精英、事件、商店、休整,一路打到荒廟正殿嘅 Boss。

七個怪物、大約廿張卡牌、符印、香火、焚符、請神四條爆發鏈路都行得通。

剩低幾個鐘,都係用嚟令佢唔似一個 demo。

受擊反饋、音效、音樂、卡面、待機動畫、結算影片——呢啲細微嘢決定玩家會唔會相信「呢個係一個遊戲」。

項目已經開源,桌面安裝包 macOS 同 Windows 都整好咗

https://github.com/op7418/Night-Patrol/releases

成個下晝有幾個瞬間真係震懾到我。

Codex 嘅模型能力已經唔係咩新鮮事。

令我在意嘅係佢自帶瀏覽器、自帶 GPT-Image 2.0,再加上嗰種不達目的不罷休嘅執行力。

三樣嘢擺埋一齊,能力已經同 Claude Code 完全唔同曬。

接下來講嚇我係點樣同佢一齊開發,順便講啲喺開發過程中令我震驚嘅事:


一、我只講咗七個字,佢就將成條角色流水線起好曬

我就同佢傾咗嚇《殺戮尖塔》,問佢可唔可以幫我做一個類似嘅遊戲。

遊戲截圖

結果佢直接用現有嘅資源,透過代碼生成咗一個非常似嘅 demo。

遊戲截圖

我冇要求綠幕,佢直接生成咗綠幕底嘅圖

之後我叫 Codex 用內置嘅 GPT-Image 2.0 生成裏面嘅圖片素材。

我都冇話要咩風格,又冇話要邊啲妖怪,又冇話要邊啲素材。

圖生咗出嚟我睇咗一眼,呆咗一呆。

角色係喺一整張純綠色背景上企住。標準嘅影視綠幕底色,均勻、乾淨,邊緣清清楚楚。

冇霧、冇遠山、冇任何額外嘅畫面元素。

綠幕角色圖

恐怖嘅係佢一嚟就知道要生成方便後續處理嘅綠幕圖。

我根本冇同佢講「遊戲裏面用到嘅立繪需要係透明背景嘅 PNG」,又冇同佢講「請你生成一張綠幕底色嘅圖方便我後期摳走」。佢自己喺度規劃呢條管線。

由想生成咩嘢角色,到角色要點樣放入戰鬥舞台,再到放之前需要經過邊道處理——佢喺調用 GPT-Image 嘅一刻已經全部諗好曬,然後反推返去寫咗提示詞。


摳圖工具都係佢自己揾嘅

我冇俾佢裝任何圖像處理工具,冇俾佢 rembg,冇俾佢 Python 環境裏面嘅任何特殊依賴。

佢自己查、自己裝、自己調,摳完整整齊齊丟去 tmp/imagegen/ 下面。

生圖用綠幕、工具自己揾、摳完按文件名歸類,三個動作連埋,其實已經係一條完整嘅角色資產流水線。

我由頭到尾只係講咗「調用GPT-Image 2.0 生成素材」呢幾個字。

工作流程截圖

以前嘅感覺係「模型會寫代碼,工具同埋上下文要我配」。

而家更加似係你報個目標,佢自己將路徑補齊。

我只負責審美,佢負責將供應鏈跑通。


二、為咗下載幾個圖標,佢差啲黑咗一個素材站


買會員唔夠,佢開始分析網站結構

立繪呢啲核心視覺用圖像模型生成冇問題。

但遊戲裏面仲有一大堆細微嘢——卡牌邊框、費用寶石、牌堆底圖、血瓶、八卦按鈕、符籙面板——呢啲如果全部用圖像模型一張張生,又貴又慢,質感仲唔統一。

我同佢講,不如你自己上網揾現成素材啦。

佢就好認真開始揾。睇中一個素材站,我順手買咗會員,賬號丟俾佢。

素材站截圖

接下來嘅十幾分鐘屬於靈異事件。

佢登入咗,揾到想要嘅素材,準備撳下載。但下載掣前面有人機驗證,一次、兩次、三次,過唔到。

換轉一般嘅模型,呢個時候就會返嚟同你講「我處理唔到驗證碼,你可唔可以幫我下載嚇」。

Codex 開始分析網站結構,嘗試繞過前端嘅點擊限制,直接構造請求去拎靜態資源。

然後 Codex 自己嘅安全護欄介入咗。

GPT 而家呢代模型,一旦涉及可能嘅網絡安全越界行為,系統會直接將呢段任務cut咗,彈出提示要你做企業認證,證明你係合法使用者。

安全提示截圖

我望住屏幕呆咗幾秒。

一個要你幫佢辦會員卡、結果自己落手寫爬蟲嘅AI,講真都幾黐線。

佢都講唔上「壞」,只係將「攞到呢批素材」當成一個必須完成嘅閉環任務。

遇到阻力就自動升級手段,一路升到安全紅線嗰邊去。

最後嘅解決辦法好樸實:佢將自己覺得合適嘅素材連結發俾我,我撳下載、拖俾佢。嗰一刻我有種自己喺度俾AI做實習生嘅錯覺。

工作截圖

三、佢將幾百張素材拼成一張大圖,呢個係成件事最精彩嘅動作


一個文件夾一百張圖,模型點樣揀?

摳圖同爬蟲嗰兩樣,更加係能力展示。

下面呢樣,我覺得係真正意義上嘅「解題思路」,係嗰種令你合埋電腦靜靜咁拍一下枱嘅動作。

我揾到一個好大嘅遊戲素材壓縮包發俾佢。

裏面大概幾千張圖,按「UI 界面」「法寶奇遇圖標」「角色」「徽章」呢種方式粗略分過類。

問題係:

一個分類文件夾動輒幾十到上百張 PNG

文件名多數係 ui_001.png、icon_047.png 呢種冇信息量嘅命名

多模態模型嘅上下文根本負荷唔住一張張咁餵

文件夾截圖

舊路基本兩條:

逐張讀:一張一張送入模型,幾十張上百張 context 就爆咗

按名估:文件名冇標內容,估咗都冇用


Codex 行咗第三條路

佢寫咗一個小腳本,將文件夾裏面所有細圖自動排版、拼成一張好大嘅網格圖。

每張細圖下面標上原始文件名,好似一本目錄圖冊。

然後佢只係讀呢一張大圖。

多模態模型掃一眼,就可以同時睇到一百張素材嘅樣。

睇中邊張,直接讀出下面嘅文件名,去原文件夾按名引用就得。

拼圖截圖

一次視覺消費,頂一百次檢索。


佢自己意識到自己嘅瓶頸

嗰張巨大嘅 contact sheet 生成出嚟嘅時候,我望住睇咗好耐。

呢個動作本身唔複雜。

老攝影師做嘅印樣,老電影素材庫做嘅 thumbnail wall,都係一樣嘅思路。

關鍵係模型自己意識到「我嘅視覺帶寬有限,我要將問題壓成一張圖」——呢一步係佢獨立完成嘅。

能夠意識到自己工具嘅限制,然後主動為自己造一個更好用嘅輸入,呢下已經非常接近一個會寫工具嘅工程師。

我作為使用者乜嘢都冇參與,只係見到枱上多咗一張拼圖。

最後遊戲裏面好多 UI 素材,費用寶石、牌堆、血瓶、按鈕、符籙邊框,都係由呢個流程揀出嚟嘅。

後面我再睇 assets/vendor/aigei/ 下面嗰堆乾淨嘅切圖,會覺得嗰張 contact sheet 先係成個項目最值錢嘅一步。


四、Seedance 2.0 俾七個 Boss 拍咗處決動畫

視覺打磨到一定程度之後,我想喺戰鬥結尾加啲儀式感。

最後方案係:每打死一個怪物,入一段過場,播放一個幾秒嘅處決動畫。

呢個嘢而家用 Seedance 2.0 做最合適。

Seedance 截圖

流程

1.

GPT-Image 俾七個怪物分別生成一張結算定格畫面

2.

將呢啲 poster 分別丟俾 Seedance 2.0,生成對應嘅短片

3.

影片放進 assets/generated/cinematics/,戰鬥勝利後自動播放

工作流程截圖

五、一版玩得之後,真正嘅工作先開始


第一版其實已經夠「玩得」

三個鐘跑完原型嘅時候,呢個遊戲應有嘅嘢其實都有齊。

標題頁、地圖、戰鬥、獎勵、事件、商店、休整、Boss、結算——完整循環喺嗰度,玩法爽點都喺嗰度。

按以前嘅標準,呢一版已經可以放出去呃人玩。

遊戲截圖

但呢個版本玩起上嚟仲係一個流程圖,而唔係遊戲。每一步都通,但每一步都乾爭爭。

剩低嘅幾個鐘,全部使喺嗰啲單獨拎出來講唔出、但合埋決定「呢樣嘢似唔似真遊戲」嘅細節上。


音樂來自 Suno v5.5

背景音樂全部係 Suno v5.5 生成嘅,冇用任何現成素材。

我俾佢一段方向描述——「志怪夜路、木魚、鈴、低頻 drone、五聲音階、剋制唔煽情」

跑咗幾版出嚟,揀一版入遊戲。標題頁嘅調子更沉啲,戰鬥背景輕啲唔搶鏡。

圖片

呢度我仲做咗啲細節處理:喺等待頁面時,音樂音量比較大;

等到撳「開始遊戲」,音量就會變細,轉做背景音。


受擊動畫同打擊音效

早期嘅戰鬥,卡牌打出去怪物就係跌數字。冇反饋,冇分量。

Codex 做咗一整套打磨:

角色受擊左右搖晃、鏡頭輕微震動、屏幕短暫泛紅

每種攻擊類型配唔同嘅打擊音效——劍、符、雷、拳,質感唔一樣

格擋同符印結算都有自己嘅聲音,唔會糊埋一舊

敵人死嗰一格有一個短暫嘅定格,再入處決影片

呢啲嘢單獨睇都好細。合埋一齊,成個戰鬥嘅「手感」就由網頁表單變咗做卡牌遊戲。

戰鬥截圖

Seedance 2.0 仲拍咗待機動畫

呢一步係成個打磨階段我最鍾意嘅一個用法。

除咗 Boss 結算嘅處決動畫,我仲叫佢做咗標題頁嘅背景——環境裏面火喺度燒、燈籠喺度飄、遠處有雲霧流動。

Seedance 2.0 默認出嘅係一段有頭有尾嘅影片,循環播會喺接縫位跳一下。

首格同尾格傳同一張圖。

影片由呢張圖開始、又返返呢張圖結束,接埋就係無縫嘅無限循環。

Seedance 截圖

標題頁嗰段背景動畫就係咁樣嚟嘅。火一直燒、燈籠一直飄、雲霧永遠喺度流——你望住睇三分鐘都睇唔出接縫。

呢種用法其實喺影片生成出來前就存在,老動畫裏面循環場景都係呢個做法。

標題頁截圖

最後:呢個下晝震懾咗我好幾次

呢個項目全部喺一個 Codex 會話裏面完成,冇開過第二個視窗。

玩法原型、狀態機、React + Phaser 架構、素材管線、摳圖、爬素材、拼 contact sheet、調 GPT-Image、跑 Seedance 2.0、接 Suno v5.5、Electron 打包、GitHub Actions 構建 Release、README、圖標、宣傳物料——全部喺裏面。

我自己做嘅嘢好少:

揀方向:中國志怪題材、爽點放喺符印同香火

俾審美意見:呢度粗糙、嗰度似網頁表單、亮度撞埋

做睇門人:咩素材合規、咩爬蟲唔掂得、咩權限唔俾

剩低全部係 Codex 喺度跑。而且每一步都有令我合埋電腦呆一呆嘅瞬間。

佢一嚟生成嘅就係綠幕圖,因為佢知道角色要入遊戲之前要先摳走背景。

佢自己落手寫爬蟲去繞過驗證碼,被自己嘅安全策略攔住。

佢將幾千張素材拼成一張好大嘅索引圖,令自己用一次視覺消費頂一百次檢索。

呢啲事單獨拎出嚟都唔係咩天大發明,但每一件都指向同一個變化:

以前你要將工具俾佢擺好,佢負責寫代碼;

而家你只管講目標,工具同模型已經內置咗、仲會自己造。

呢種感覺已經脱離咗「寫代碼助手」嘅範疇。

更加似有一個相當接近 AGI 雛形嘅軟件喺度做緊嘢。


要唔要將呢套流程打包成 Skill?

呢個項目跑落嚟,我心入面其實已經有咗一套相對穩定嘅流程:

我喺度諗,要唔要將呢套流程封成一個 Codex 裏面專門做獨立遊戲 demo 嘅 Skill。

你只要丟一個玩法諗法入去,佢就可以喺幾個鐘之內俾你跑出一個玩得、打包得、分發得嘅版本。

如果大家有興趣,我就抽時間將呢套 Skill 做出嚟開源。反正我自己都要繼續用。


遊戲試玩

代碼都開源,安裝包都整好曬:

https://github.com/op7418/Night-Patrol/releases


昨天上午我閒着沒事,想做一個類似《殺戮尖塔》的爬塔卡牌遊戲玩玩。

我不寫遊戲代碼,也不碰引擎,全程就是把想法丟給 Codex,讓它自己折騰。

一個小時後,一個叫《夜巡錄:荒廟篇》的志怪題材 roguelike 就能玩了。

標題頁進地圖,走普通戰、精英、事件、商店、休整,一路打到荒廟正殿的 Boss。

七個怪物、二十張左右的卡牌、符印、香火、焚符、請神四條爆發鏈路都能跑。

剩下幾個小時,都在讓它變得不像一個 demo。

受擊反饋、音效、音樂、卡面、待機動畫、結算視頻——這些小東西決定玩家會不會相信「這是個遊戲」。

項目已開源,桌面安裝包 macOS 和 Windows 都打好了

https://github.com/op7418/Night-Patrol/releases

整個下午有幾個瞬間是真的把我震到了。

Codex 的模型能力已經不算新鮮事。

讓我在意的是它自帶瀏覽器、自帶 GPT-Image 2.0,再加上那種不達目的不罷休的執行力。

三樣東西擺在一起,能力已經和 Claude Code 完全不一樣了。

接下來說一下我是怎麼跟它一起開發的,順便說一些在開發過程中令我震驚的事情:


一、我只說了七個字,它就把整條角色流水線建好了

我就跟它聊了一下《殺戮尖塔》,問它能不能幫我做一個類似的遊戲。

遊戲截圖

結果它直接用已有的資源,通過代碼生成了一個非常像的 demo。

遊戲截圖

我沒要求綠幕,它直接生成了綠幕底的圖

之後我讓 Codex 用內置的 GPT-Image 2.0 生成裏面的圖片素材。

我也沒說要什麼風格的,也沒說要哪些妖怪的,也沒說要哪些素材。

圖生出來我看了一眼,愣了一下。

角色是在一整張純綠色背景上站着的。標準的影視綠幕底色,均勻、乾淨,邊緣清清楚楚。

沒有霧、沒有遠山、沒有任何額外的畫面元素。

綠幕角色圖

恐怖的是它上來就知道要生成方便後續處理的綠幕圖。

我壓根沒告訴它「遊戲裏用到的立繪需要是透明背景的 PNG」,也沒告訴它「請你生成一張綠幕底色的圖方便我後期摳掉」。它自己在規劃這條管線。

從想要生成什麼樣的角色,到角色要怎麼放進戰鬥舞台,再到放進去之前需要經過哪道處理——它在調用 GPT-Image 的那一刻已經全想好了,然後反推回去寫了提示詞。


摳圖工具也是它自己找的

我沒給它裝任何圖像處理工具,沒給它 rembg,沒給它 Python 環境裏的任何特殊依賴。

它自己查、自己裝、自己調,摳完規規矩矩丟到 tmp/imagegen/ 下面。

生圖用綠幕、工具自己找、摳完按文件名歸類,三個動作連起來,其實已經是一條完整的角色資產流水線。

我從頭到尾只說了「調用GPT-Image 2.0 生成素材」這幾個字。

工作流程截圖

以前的體感是「模型會寫代碼,工具和上下文得我配」。

現在更像是你報個目標,它自己把路徑補齊。

我只負責審美,它負責把供應鏈跑通。


二、為了下幾個圖標,它差點黑掉一個素材站


買會員不夠,它開始分析網站結構

立繪這種核心視覺用圖像模型生成沒問題。

但遊戲裏還有一大堆小東西——卡牌邊框、費用寶石、牌堆底圖、血瓶、八卦按鈕、符籙面板——這些要是全用圖像模型一張張生,又貴又慢,質感還不統一。

我跟它說,要不你自己去網上找現成素材吧。

它就認認真真開始找。看中一個素材站,我順手買了會員,賬號扔給它。

素材站截圖

接下來的十幾分鍾屬於靈異事件。

它登進去,找到想要的素材,準備點擊下載。但下載按鈕前面有人機驗證,一次、兩次、三次,過不去。

換一般的模型,這時候就會回來跟你說「我沒法處理驗證碼,你能幫我下載一下嗎」。

Codex 開始分析網站結構,試圖繞過前端的點擊限制,直接構造請求去拿靜態資源。

然後 Codex 自己的安全護欄介入了。

GPT 現在這代模型,一旦涉及可能的網絡安全越界行為,系統會直接把這段任務掐掉,彈出提示要你做企業認證,證明你是合法使用者。

安全提示截圖

我盯着屏幕愣了幾秒。

一個要你幫它辦會員卡、結果自己下手寫爬蟲的 AI,說實話挺有病的。

它也談不上「壞」,只是把「拿到這批素材」當成了一個必須完成的閉環任務。

遇到阻力就自動升級手段,一路升到了安全紅線那邊去。

最後的解決辦法很樸實:它把自己覺得合適的素材連結發給我,我點下載、拖給它。那一刻我有種自己在給 AI 當實習生的錯覺。

工作截圖

三、它把幾百張素材拼成一張大圖,這是整件事最精彩的動作


一個文件夾一百張圖,模型怎麼挑?

摳圖和爬蟲那兩件,更多還是能力展示。

下面這件,我覺得是真正意義上的「解題思路」,是那種讓你合上電腦默默拍一下桌子的動作。

我找到一個巨大的遊戲素材壓縮包發給它。

裏面大概幾千張圖,按「UI 界面」「法寶奇遇圖標」「角色」「徽章」這種方式粗略分過類。

問題是:

一個分類文件夾動輒幾十到上百張 PNG

文件名多是 ui_001.png、icon_047.png 這種沒信息量的命名

多模態模型的上下文根本扛不住一張張喂

文件夾截圖

老路子基本兩條:

逐張讀:一張一張送進模型,幾十張上百張 context 就炸了

按名猜:文件名沒標內容,猜了也沒用


Codex 走了第三條路

它寫了一個小腳本,把文件夾裏所有小圖自動排版、拼成一張巨大的網格圖。

每張小圖下面標上原始文件名,像一本目錄圖冊。

然後它只讀這一張大圖。

多模態模型掃一眼,就能同時看到一百張素材的樣子。

看中哪張,直接讀出下面的文件名,去原文件夾裏按名字引用就行。

拼圖截圖

一次視覺消費,頂一百次檢索。


它自己意識到了自己的瓶頸

那張巨大的 contact sheet 生成出來的時候,我盯着看了好久。

這個動作本身不復雜。

老攝影師做的印樣,老電影素材庫做的 thumbnail wall,都是一樣的思路。

關鍵是模型自己意識到「我的視覺帶寬有限,我得把問題壓成一張圖」——這一步是它獨立完成的。

能意識到自己工具的限制,然後主動為自己造一個更好用的輸入,這一下已經非常接近一個會寫工具的工程師了。

我作為使用者什麼都沒參與,只是看到桌子上多了一張拼圖。

最後遊戲裏很多 UI 素材,費用寶石、牌堆、血瓶、按鈕、符籙邊框,都是從這個流程裏挑出來的。

後面我再看 assets/vendor/aigei/ 下面那一堆乾淨的切圖,會覺得那張 contact sheet 才是整個項目最值錢的一步。


四、Seedance 2.0 給七個 Boss 拍了處決動畫

視覺打磨到一定程度以後,我想給戰鬥結尾加一點儀式感。

最後方案是:每打死一個怪物,進入一段過場,播放一個幾秒的處決動畫。

這活現在用 Seedance 2.0 做最合適。

Seedance 截圖

流程

1.

GPT-Image 給七個怪物分別生成一張結算定幀畫面

2.

把這些 poster 分別丟給 Seedance 2.0,生成對應的短視頻

3.

視頻放進 assets/generated/cinematics/,戰鬥勝利後自動播放

工作流程截圖

五、一版能玩之後,真正的工作才開始


第一版其實已經夠"能玩"

三個小時跑完原型的時候,這個遊戲該有的東西其實都有了。

標題頁、地圖、戰鬥、獎勵、事件、商店、休整、Boss、結算——完整循環在那裏,玩法爽點也在那裏。

按以前的標準,這一版已經可以發出來騙人玩了。

遊戲截圖

但這個版本玩起來還是個流程圖,而不是遊戲。每一步都通,但每一步都乾巴巴。

剩下的幾個小時,全都花在那些單獨拎出來說不上來、但合起來決定"這東西像不像真遊戲"的細節上。


音樂來自 Suno v5.5

背景音樂全是 Suno v5.5 生成的,沒用任何現成素材。

我給它一段方向描述——"志怪夜路、木魚、鈴、低頻 drone、五聲音階、剋制不煽情"

跑出來幾版,挑一版進遊戲。標題頁的調子更沉一點,戰鬥背景輕一點不搶人。

圖片

這裏我還做了一些細節處理:在等待頁面時,音樂音量較大;

等到點擊"開始遊戲",音量就會變小,轉為背景音。


受擊動畫和打擊音

早期的戰鬥,卡牌打出去怪物就是掉數字。沒有反饋,沒有分量。

Codex 做了一整套打磨:

角色受擊左右搖晃、鏡頭輕微震動、屏幕短暫泛紅

每種攻擊類型配不同的打擊音——劍、符、雷、拳,質感不一樣

格擋和符印結算也有自己的聲音,不會糊成一團

敵人死的那一幀有一個短暫的定格,再進入處決視頻

這些東西單獨看都很小。合在一起,整個戰鬥的"手感"就從網頁表單變成了卡牌遊戲。

戰鬥截圖

Seedance 2.0 還拍了待機動畫

這一步是整個打磨階段我最喜歡的一個用法。

除了 Boss 結算的處決動畫,我還讓它做了標題頁的背景——環境裏火在燒、燈籠在飄、遠處有云霧流動。

Seedance 2.0 默認出的是一段有頭有尾的視頻,循環播會在接縫處跳一下。

首幀和尾幀傳同一張圖。

視頻從這張圖開始、又回到這張圖結束,接起來就是無縫的無限循環。

Seedance 截圖

標題頁那段背景動畫就是這麼來的。火一直燒、燈籠一直飄、雲霧永遠在流——你盯着看三分鐘也看不出接縫。

這種用法其實在視頻生成出來前就存在,老動畫裏循環場景都是這個做法。

標題頁截圖

最後:這個下午把我震到了好幾次

這個項目全部在一個 Codex 會話裏完成,沒開過第二個窗口。

玩法原型、狀態機、React + Phaser 架構、素材管線、摳圖、爬素材、拼 contact sheet、調 GPT-Image、跑 Seedance 2.0、接 Suno v5.5、Electron 打包、GitHub Actions 構建 Release、README、圖標、宣傳物料——全在裏面。

我自己做的事很少:

選方向:中國志怪題材、爽點放在符印和香火

給審美意見:這裏糙、那裏像網頁表單、亮度打架

做看門人:什麼素材合規、什麼爬蟲不能碰、什麼權限不給

剩下全是 Codex 在跑。而且每一步都有讓我合上電腦愣一下的瞬間。

它上來生成的就是綠幕圖,因為它知道角色要進遊戲之前得先摳掉背景。

它自己下手寫爬蟲去繞驗證碼,被自己的安全策略攔住。

它把幾千張素材拼成一張巨大的索引圖,讓自己用一次視覺消費頂一百次檢索。

這些事單拎出來都不是什麼天大的發明,但每一件都指向同一個變化:

以前你得把工具給它擺好,它負責寫代碼;

現在你只管說目標,工具和模型已經內置了、還會自己造。

這種感覺已經脱離了「寫代碼助手」的範疇。

更像有一個相當接近 AGI 雛形的軟件在幹活了。


要不要把這套流程打包成 Skill?

這個項目跑下來,我心裏其實已經有了一套相對穩定的流程:

我在想,要不要把這套流程封成一個 Codex 裏專門做獨立遊戲 demo 的 Skill。

你只要丟一個玩法想法進去,它就能在幾個小時裏給你跑出一個能玩、能打包、能分發的版本。

如果大家有興趣,我就抽時間把這套 Skill 做出來開源。反正我自己也要繼續用。


遊戲試玩

代碼都開源,安裝包也都打好:

https://github.com/op7418/Night-Patrol/releases