誰說不能在一起：Codex+Claude Code並行開發實踐

作者：Zerox在探索

日期：2026年5月28日上午8:20

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Codex + Claude Code 並行開發實踐：2 億 Token 零介入，24 小時產出 2 萬行產品

整理版摘要

呢篇文章係由 Zerox 分享嘅親身經驗。佢領到 2 億 Token 額度後，直接叫 Codex 自己規劃項目，再串聯 Claude Code 同 MiMo 模型，24 小時內自動完成一個 2 萬行代碼嘅投資輔助工具。作者想解決嘅問題係：一般人點樣有效利用大量 Token 做真實產品，而唔係浪費。

整體結論係：AI 工具組合能力比單一工具更強；人嘅角色從「審代碼」進化成「只需要想清楚要咩結果」；2 億 Token 大概夠做一個中型 Web 應用，性價比遠超頂尖模型。

呢篇文偏向作者自身經驗，佢詳細講述咗點樣用 Codex 嘅 /goal 功能、computer use 能力，同埋 superpowers 嘅「鐵律」審查機制，實現從人審到機審嘅轉變。最後仲畀出 2 億 Token 嘅實際錨點，幫讀者具體理解 Token 嘅購買力。

用 Codex 嘅 /goal 同 computer use 串聯 Claude Code 同 MiMo，實現自動駕駛開發，人只需定義目標
superpowers 嘅「鐵律」機制：冇失敗測試就唔可以寫生產代碼，實現機審取代人審
2 億 Token 用 MiMo V2.5 Pro 只需 $900，同等量用 Claude Opus 4.7 要 $19,000，差 20 倍
實際開發中大量 Token 花喺上下文理解同除錯，真正寫代碼只係小部分，2 億 Token 夠做 5 萬行嘅中型 Web App
Vibe Coding 最大瓶頸係清晰需求，冇規劃嘅 Token 會浪費到渣都唔剩

整理重點

點解揀 Codex 串 Claude Code？

作者話，Codex 雖然唔可以直接調第三方模型，但有 computer use 能力，可以睇屏幕、操作界面、好似人咁點擊輸入。所以佢做法係：Codex 做調度，決定做咩同順序，然後操作本地嘅 Claude Code，而 Claude Code 入面已經配好 MiMo 模型。

Codex 用咗新嘅 /goal 功能，可以設目標然後完全自動駕駛。如果遇到 5 小時額度限制，自動化模塊配一個 2.5 小時嘅 heartbeat，就能自動恢復繼續跑。成個過程作者幾乎 0 介入。

整理重點

從「審代碼」進化到「機審」

好多人都話 AI 編程令人從「寫代碼」變咗做「審代碼」，但作者話呢句已經過時。佢呢個項目 AI 全程自主開發，佢幾乎冇審過一行代碼。原因係用咗 superpowers 嘅 skill 體系，核心係「鐵律」。

冇失敗嘅測試，就唔可以寫生產代碼
聲稱完成之前，一定要跑驗證睇結果
實現者唔可以自己批准自己嘅工作，由獨立嘅子 Agent 做審查

鐵律係硬約束，唔滿足就卡住。從人審到機審，人只需要諗清楚「我要咩結果」。

整理重點

2 億 Token 嘅實際錨點

用 MiMo V2.5 Pro，2 億 Token 大約值 900 蚊。同樣 Token 量，用 Claude Opus 4.7 要約 19,000 蚊，用 GPT-5.5 要約 22,000 蚊，差距超過 20 倍。國產模型嘅性價比好明顯。

作者個項目 2 萬行代碼消耗 2 億 Token，聽落效率好似唔高，但實際編碼中大量 Token 用喺理解上下文、除錯、迭代、反覆驗證</highlight>，真正寫代碼只係一小部分。所以 2 億 Token 大概夠做一個 5 萬行嘅中型 Web 應用，從零到可用，綽綽有餘。

全文大約1800字 | 睇完大概要5分鐘

2億Token，0接管，24小時，一個2萬行代碼嘅完整產品。呢個係我用Codex+Claude Code串出嚟嘅。

作者 | Zerox在探索
編輯 | Zerox在探索

前排小米推MiMo系列模型，畀申請者送Token額度。我拎到2億。

但係，面對2億嘅token，我其實完全冇頭緒到底要做啲乜，可以支撐幾大規模嘅項目開發，我冇辦法判斷得好清楚。

所以我諗，既然唔知2億Token可以做啲乜，咁就不如直接問。

於是打開Codex，叫佢讀取我電腦入面最近嘅所有項目、瀏覽器記錄、社交媒體關注嘅方向。然後叫佢自己規劃一個最合適嘅項目，直接開發。

揀Codex唔係隨便揀嘅。嗰排Codex啱啱上線咗/goal功能，可以設定一個目標然後完全自動駕駛。如果遇到5小時額度限制，自動化模塊配一個2.5小時嘅heartbeat，就可以自動恢復繼續行。等於我將方向盤交出去，佢自己揸。

成個過程，我幾乎0介入。24小時之後，我直接拎結果。

到手嘅係一個叫invest-signal-kit嘅項目，係幫我做輔助決策嘅。我一直想做一個嘢，幫普通人做投資決策嘅時候少啲踩坑。呢個項目就係我嘅答案。

佢大概2萬行代碼，純Python，零外部依賴。後端有15個CLI命令，覆蓋信號驗證、評分、專業分析框架、投資組合風控、蒙特卡洛模擬、回測、優化器、決策日誌、再平衡，基本將一個專業投資者嘅研究流程數字化咗一次。

前端有一個面向普通人嘅Web界面，三個入口：買前檢查、持倉體檢、檢查記錄。全部本地運行，唔上傳任何數據。

系統有機會完善得更好，再詳細講啦，呢篇文章唔多講，留個懸念。

講返嗰2億Token。項目做完，我回頭睇，有三件事值得講。

01.大人就係我全部都要

有人見到Codex唔支持直接調第三方模型，覺得呢條路行唔通。

但其實Codex有computer use嘅能力。佢可以睇屏幕，可以操作界面，可以似人咁點擊同輸入。所以我嘅做法係：叫Codex去操作本地嘅Claude Code，Claude Code入面我已經配好咗MiMo模型。Codex做調度，決定做啲乜、乜嘢順序做。Claude Code加MiMo做執行，寫代碼、跑測試。兩個工具串成一條流水線，各有各做自己擅長嘅嘢。

我覺得呢個思路會越來越常出現喺我嘅實踐入面。AI工具越來越多，每一個都有自己嘅長處同短處。用得一個就用一個，可以串兩個就串兩個。組合能力比單一能力更加有價值。

[圖片：Codex + Claude Code協作流程示意]

02.由人審到機審，人只需要諗

個個都話，AI編程令人由「寫代碼」變咗做「審代碼」。呢句話啱，但已經過時啦。

我呢個項目，AI全程自主開發，我幾乎冇審過一行代碼。唔係偷懶，係真係唔需要。

原因除咗上面講嘅自動化流程之外，仲有大名鼎鼎嘅superpowers嘅skill體系。

真係強烈推薦！！！

佢嘅核心設計係「鐵律」：冇失敗嘅測試，就唔可以寫生產代碼。聲稱完成之前，要跑驗證睇結果。實現者唔可以自己批准自己嘅工作，由獨立嘅子Agent嚟做審查。鐵律係硬約束，唔滿足就卡住。

當然，superpowers仲有好多其他嘅能力，再次建議去體驗一下完整嘅開發。

由人審到機審，人只需要諗清楚「我要啲咩結果」。

[圖片：superpowers的skill審查流程或項目代碼截圖]

03.2億Token，普通人應該有嘅錨點

2億Token，900蚊，24小時，一個2萬行代碼嘅完整產品。

用MiMo V2.5 Pro，2億Token大概值900蚊。同樣嘅量，用當前最強嘅Claude Opus 4.7，要大概19,000蚊。用GPT-5.5，要大概22,000蚊。差咗20幾倍。國產模型嘅性價比，喺呢度體現得好直觀。甚至琴日MiMo再次調價添！

再講可以做啲乜。我呢個項目2萬行代碼，消耗咗2億Token。你可能覺得2億Token換2萬行代碼效率唔高。但實際編碼入面，大量Token花咗喺理解上下文、調試、迭代、反覆驗證上面，真正寫代碼只係好少一部分。

所以2億Token大概可以支撐啲乜？一個5萬行代碼嘅中型Web應用，由零到用得，AI輔助開發，綽綽有餘。

回頭睇，都係想講：Vibe Coding目前最大嘅瓶頸，係你可唔可以將需求諗清楚。2億Token畀咗一個唔知要做啲乜嘅人，唔規劃清楚，咁就真係會浪費到渣都冇得剩。

互動話題

你有冇試過將多個AI工具串埋一齊用？遇到過啲咩限制係點樣繞過嘅？留言區傾下。

呢篇文章係原創內容，版權歸「Zerox在探索」所有

歡迎關注、點讚、在看、轉發去朋友圈

全文約1800字 | 閲讀大約需要5分鐘

2億Token，0接管，24小時，一個2萬行代碼的完整產品。這是我用Codex+Claude Code串出來的。

作者 | Zerox在探索
編輯 | Zerox在探索

前段時間小米推MiMo系列模型，給申請者送Token額度。我領到了2億。

但是，面對2億的token，我其實毫無頭緒到底要做啥，能支撐多大規模項目的開發，我沒辦法判斷得很清晰。

所以我想，既然不知道2億Token能幹嘛，那就直接問。

於是打開Codex，讓它讀取我電腦裏最近的所有項目、瀏覽器記錄、社交媒體關注的方向。然後讓它自己規劃一個最合適的項目，直接開發。

選Codex不是隨便選的。那段時間Codex剛上線了/goal功能，可以設一個目標然後完全自動駕駛。如果遇到5小時額度限制，自動化模塊配一個2.5小時的heartbeat，就能自動恢復繼續跑。等於我把方向盤交出去，它自己開。

整個過程，我幾乎0介入。24小時後，我直接拿結果。

拿到手的是一個叫invest-signal-kit的項目，是幫我做輔助決策的。我一直想做一個東西，幫普通人做投資決策的時候少踩坑。這個項目就是我的答案。

它大概2萬行代碼，純Python，零外部依賴。後端有15個CLI命令，覆蓋信號驗證、評分、專業分析框架、投資組合風控、蒙特卡洛模擬、回測、優化器、決策日誌、再平衡，基本把一個專業投資者的研究流程數字化了一遍。

前端有一個面向普通人的Web界面，三個入口：買前檢查、持倉體檢、檢查記錄。全部本地運行，不上傳任何數據。

系統有機會完善的更好在展開吧，本文不多說了，留個懸念。

說回那2億Token。項目做完，我回頭看，有三件事值得說。

01.成年人就是我都要

有人看到Codex不支持直接調第三方模型，覺得這是死路。

但其實Codex有computer use的能力。它能看屏幕，能操作界面，能像人一樣點擊和輸入。所以我的做法是：讓Codex去操作本地的Claude Code，Claude Code裏我已經配好了MiMo模型。Codex做調度，決定做什麼、什麼順序做。Claude Code加MiMo做執行，寫代碼、跑測試。兩個工具串成一條流水線，各幹各擅長的。

我覺得這個思路會越來多的出現在我的實踐中。AI工具越來越多，每一個都有自己的長板和短板。能用一個就用一個，能串兩個就串兩個。組合能力比單一能力更有價值。

[圖片：Codex + Claude Code協作流程示意]

02.從人審到機審，人只需要想

大家都在說，AI編程讓人從"寫代碼"變成了"審代碼"。這句話對，但已經過時了。

我這個項目，AI全程自主開發，我幾乎沒審過一行代碼。不是偷懶，是真的不需要。

原因除了上述自動化流程外，還有大名鼎鼎的superpowers的skill體系。

真的強烈推薦！！！

它的核心設計是"鐵律"：沒有失敗的測試，就不能寫生產代碼。聲稱完成之前，得跑驗證看結果。實現者不能自己批准自己的工作，由獨立的子Agent來做審查。鐵律是硬約束，不滿足就卡住。

當然，superpowers還有好多其他的能力，再次建議去體驗一下完整的開發。

從人審到機審，人只需要想清楚"我要什麼結果"。

[圖片：superpowers的skill審查流程或項目代碼截圖]

03.2億Token，普通人該有的錨點

2億Token，900塊錢，24小時，一個2萬行代碼的完整產品。

用MiMo V2.5 Pro，2億Token大概值900塊錢。同樣的量，用當前最強的Claude Opus 4.7，要約19,000元。用GPT-5.5，要約22,000元。差了20多倍。國產模型的性價比，在這裏體現得很直觀。甚至昨天MiMo再次調價了！

再說能做什麼。我這個項目2萬行代碼，消耗了2億Token。你可能覺得2億Token換2萬行代碼效率不高。但實際編碼中，大量Token花在理解上下文、調試、迭代、反覆驗證上，真正寫代碼只是一小部分。

所以2億Token大概能支撐什麼？一個5萬行代碼的中型Web應用，從零到可用，AI輔助開發，綽綽有餘。普通人想做一個副業工具、一個小產品，2億Token是夠用的。

回頭看，還是想說：Vibe Coding當前最大的瓶頸，是你能不能把需求想清楚。2億Token給了一個不知道要做什麼的人，不規劃清楚，那也真的會浪費到渣都不剩。

互動話題

你有沒有試過把多個AI工具串起來用？遇到過什麼限制是怎麼繞過去的？評論區聊聊。

本文為原創內容，版權歸「Zerox在探索」所有

歡迎關注、點贊、在看、轉發到朋友圈