誰說不能在一起:Codex+Claude Code並行開發實踐
整理版優先睇
Codex + Claude Code 並行開發實踐:2 億 Token 零介入,24 小時產出 2 萬行產品
呢篇文章係由 Zerox 分享嘅親身經驗。佢領到 2 億 Token 額度後,直接叫 Codex 自己規劃項目,再串聯 Claude Code 同 MiMo 模型,24 小時內自動完成一個 2 萬行代碼嘅投資輔助工具。作者想解決嘅問題係:一般人點樣有效利用大量 Token 做真實產品,而唔係浪費。
整體結論係:AI 工具組合能力比單一工具更強;人嘅角色從「審代碼」進化成「只需要想清楚要咩結果」;2 億 Token 大概夠做一個中型 Web 應用,性價比遠超頂尖模型。
呢篇文偏向作者自身經驗,佢詳細講述咗點樣用 Codex 嘅 /goal 功能、computer use 能力,同埋 superpowers 嘅「鐵律」審查機制,實現從人審到機審嘅轉變。最後仲畀出 2 億 Token 嘅實際錨點,幫讀者具體理解 Token 嘅購買力。
- 用 Codex 嘅 /goal 同 computer use 串聯 Claude Code 同 MiMo,實現自動駕駛開發,人只需定義目標
- superpowers 嘅「鐵律」機制:冇失敗測試就唔可以寫生產代碼,實現機審取代人審
- 2 億 Token 用 MiMo V2.5 Pro 只需 $900,同等量用 Claude Opus 4.7 要 $19,000,差 20 倍
- 實際開發中大量 Token 花喺上下文理解同除錯,真正寫代碼只係小部分,2 億 Token 夠做 5 萬行嘅中型 Web App
- Vibe Coding 最大瓶頸係清晰需求,冇規劃嘅 Token 會浪費到渣都唔剩
點解揀 Codex 串 Claude Code?
作者話,Codex 雖然唔可以直接調第三方模型,但有 computer use 能力,可以睇屏幕、操作界面、好似人咁點擊輸入。所以佢做法係:Codex 做調度,決定做咩同順序,然後操作本地嘅 Claude Code,而 Claude Code 入面已經配好 MiMo 模型。
Codex 用咗新嘅 /goal 功能,可以設目標然後完全自動駕駛。如果遇到 5 小時額度限制,自動化模塊配一個 2.5 小時嘅 heartbeat,就能自動恢復繼續跑。成個過程作者幾乎 0 介入。
從「審代碼」進化到「機審」
好多人都話 AI 編程令人從「寫代碼」變咗做「審代碼」,但作者話呢句已經過時。佢呢個項目 AI 全程自主開發,佢幾乎冇審過一行代碼。原因係用咗 superpowers 嘅 skill 體系,核心係「鐵律」。
- 冇失敗嘅測試,就唔可以寫生產代碼
- 聲稱完成之前,一定要跑驗證睇結果
- 實現者唔可以自己批准自己嘅工作,由獨立嘅子 Agent 做審查
鐵律係 硬約束,唔滿足就卡住。從人審到機審,人只需要諗清楚「我要咩結果」。
2 億 Token 嘅實際錨點
用 MiMo V2.5 Pro,2 億 Token 大約值 900 蚊。同樣 Token 量,用 Claude Opus 4.7 要約 19,000 蚊,用 GPT-5.5 要約 22,000 蚊,差距超過 20 倍。國產模型嘅性價比好明顯。
作者個項目 2 萬行代碼消耗 2 億 Token,聽落效率好似唔高,但實際編碼中大量 Token 用喺 理解上下文、除錯、迭代、反覆驗證</highlight>,真正寫代碼只係一小部分。所以 2 億 Token 大概夠做一個 5 萬行嘅中型 Web 應用,從零到可用,綽綽有餘。
全文大約1800字 | 睇完大概要5分鐘
2億Token,0接管,24小時,一個2萬行代碼嘅完整產品。呢個係我用Codex+Claude Code串出嚟嘅。
作者 | Zerox在探索
編輯 | Zerox在探索
前排小米推MiMo系列模型,畀申請者送Token額度。我拎到2億。
但係,面對2億嘅token,我其實完全冇頭緒到底要做啲乜,可以支撐幾大規模嘅項目開發,我冇辦法判斷得好清楚。
所以我諗,既然唔知2億Token可以做啲乜,咁就不如直接問。
於是打開Codex,叫佢讀取我電腦入面最近嘅所有項目、瀏覽器記錄、社交媒體關注嘅方向。然後叫佢自己規劃一個最合適嘅項目,直接開發。
揀Codex唔係隨便揀嘅。嗰排Codex啱啱上線咗/goal功能,可以設定一個目標然後完全自動駕駛。如果遇到5小時額度限制,自動化模塊配一個2.5小時嘅heartbeat,就可以自動恢復繼續行。等於我將方向盤交出去,佢自己揸。
成個過程,我幾乎0介入。24小時之後,我直接拎結果。
到手嘅係一個叫invest-signal-kit嘅項目,係幫我做輔助決策嘅。我一直想做一個嘢,幫普通人做投資決策嘅時候少啲踩坑。呢個項目就係我嘅答案。
佢大概2萬行代碼,純Python,零外部依賴。後端有15個CLI命令,覆蓋信號驗證、評分、專業分析框架、投資組合風控、蒙特卡洛模擬、回測、優化器、決策日誌、再平衡,基本將一個專業投資者嘅研究流程數字化咗一次。
前端有一個面向普通人嘅Web界面,三個入口:買前檢查、持倉體檢、檢查記錄。全部本地運行,唔上傳任何數據。
系統有機會完善得更好,再詳細講啦,呢篇文章唔多講,留個懸念。
講返嗰2億Token。項目做完,我回頭睇,有三件事值得講。

有人見到Codex唔支持直接調第三方模型,覺得呢條路行唔通。
但其實Codex有computer use嘅能力。佢可以睇屏幕,可以操作界面,可以似人咁點擊同輸入。所以我嘅做法係:叫Codex去操作本地嘅Claude Code,Claude Code入面我已經配好咗MiMo模型。Codex做調度,決定做啲乜、乜嘢順序做。Claude Code加MiMo做執行,寫代碼、跑測試。兩個工具串成一條流水線,各有各做自己擅長嘅嘢。
我覺得呢個思路會越來越常出現喺我嘅實踐入面。AI工具越來越多,每一個都有自己嘅長處同短處。用得一個就用一個,可以串兩個就串兩個。組合能力比單一能力更加有價值。

[圖片:Codex + Claude Code協作流程示意]
個個都話,AI編程令人由「寫代碼」變咗做「審代碼」。呢句話啱,但已經過時啦。
我呢個項目,AI全程自主開發,我幾乎冇審過一行代碼。唔係偷懶,係真係唔需要。
原因除咗上面講嘅自動化流程之外,仲有大名鼎鼎嘅superpowers嘅skill體系。
真係強烈推薦!!!
佢嘅核心設計係「鐵律」:冇失敗嘅測試,就唔可以寫生產代碼。聲稱完成之前,要跑驗證睇結果。實現者唔可以自己批准自己嘅工作,由獨立嘅子Agent嚟做審查。鐵律係硬約束,唔滿足就卡住。
當然,superpowers仲有好多其他嘅能力,再次建議去體驗一下完整嘅開發。
由人審到機審,人只需要諗清楚「我要啲咩結果」。

[圖片:superpowers的skill審查流程或項目代碼截圖]
2億Token,900蚊,24小時,一個2萬行代碼嘅完整產品。
用MiMo V2.5 Pro,2億Token大概值900蚊。同樣嘅量,用當前最強嘅Claude Opus 4.7,要大概19,000蚊。用GPT-5.5,要大概22,000蚊。差咗20幾倍。國產模型嘅性價比,喺呢度體現得好直觀。甚至琴日MiMo再次調價添!
再講可以做啲乜。我呢個項目2萬行代碼,消耗咗2億Token。你可能覺得2億Token換2萬行代碼效率唔高。但實際編碼入面,大量Token花咗喺理解上下文、調試、迭代、反覆驗證上面,真正寫代碼只係好少一部分。
所以2億Token大概可以支撐啲乜?一個5萬行代碼嘅中型Web應用,由零到用得,AI輔助開發,綽綽有餘。
回頭睇,都係想講:Vibe Coding目前最大嘅瓶頸,係你可唔可以將需求諗清楚。2億Token畀咗一個唔知要做啲乜嘅人,唔規劃清楚,咁就真係會浪費到渣都冇得剩。
互動話題
你有冇試過將多個AI工具串埋一齊用?遇到過啲咩限制係點樣繞過嘅?留言區傾下。
呢篇文章係原創內容,版權歸「Zerox在探索」所有
歡迎關注、點讚、在看、轉發去朋友圈
全文約1800字 | 閲讀大約需要5分鐘
2億Token,0接管,24小時,一個2萬行代碼的完整產品。這是我用Codex+Claude Code串出來的。
作者 | Zerox在探索
編輯 | Zerox在探索
前段時間小米推MiMo系列模型,給申請者送Token額度。我領到了2億。
但是,面對2億的token,我其實毫無頭緒到底要做啥,能支撐多大規模項目的開發,我沒辦法判斷得很清晰。
所以我想,既然不知道2億Token能幹嘛,那就直接問。
於是打開Codex,讓它讀取我電腦裏最近的所有項目、瀏覽器記錄、社交媒體關注的方向。然後讓它自己規劃一個最合適的項目,直接開發。
選Codex不是隨便選的。那段時間Codex剛上線了/goal功能,可以設一個目標然後完全自動駕駛。如果遇到5小時額度限制,自動化模塊配一個2.5小時的heartbeat,就能自動恢復繼續跑。等於我把方向盤交出去,它自己開。
整個過程,我幾乎0介入。24小時後,我直接拿結果。
拿到手的是一個叫invest-signal-kit的項目,是幫我做輔助決策的。我一直想做一個東西,幫普通人做投資決策的時候少踩坑。這個項目就是我的答案。
它大概2萬行代碼,純Python,零外部依賴。後端有15個CLI命令,覆蓋信號驗證、評分、專業分析框架、投資組合風控、蒙特卡洛模擬、回測、優化器、決策日誌、再平衡,基本把一個專業投資者的研究流程數字化了一遍。
前端有一個面向普通人的Web界面,三個入口:買前檢查、持倉體檢、檢查記錄。全部本地運行,不上傳任何數據。
系統有機會完善的更好在展開吧,本文不多說了,留個懸念。
說回那2億Token。項目做完,我回頭看,有三件事值得說。

有人看到Codex不支持直接調第三方模型,覺得這是死路。
但其實Codex有computer use的能力。它能看屏幕,能操作界面,能像人一樣點擊和輸入。所以我的做法是:讓Codex去操作本地的Claude Code,Claude Code裏我已經配好了MiMo模型。Codex做調度,決定做什麼、什麼順序做。Claude Code加MiMo做執行,寫代碼、跑測試。兩個工具串成一條流水線,各幹各擅長的。
我覺得這個思路會越來多的出現在我的實踐中。AI工具越來越多,每一個都有自己的長板和短板。能用一個就用一個,能串兩個就串兩個。組合能力比單一能力更有價值。

[圖片:Codex + Claude Code協作流程示意]
大家都在說,AI編程讓人從"寫代碼"變成了"審代碼"。這句話對,但已經過時了。
我這個項目,AI全程自主開發,我幾乎沒審過一行代碼。不是偷懶,是真的不需要。
原因除了上述自動化流程外,還有大名鼎鼎的superpowers的skill體系。
真的強烈推薦!!!
它的核心設計是"鐵律":沒有失敗的測試,就不能寫生產代碼。聲稱完成之前,得跑驗證看結果。實現者不能自己批准自己的工作,由獨立的子Agent來做審查。鐵律是硬約束,不滿足就卡住。
當然,superpowers還有好多其他的能力,再次建議去體驗一下完整的開發。
從人審到機審,人只需要想清楚"我要什麼結果"。

[圖片:superpowers的skill審查流程或項目代碼截圖]
2億Token,900塊錢,24小時,一個2萬行代碼的完整產品。
用MiMo V2.5 Pro,2億Token大概值900塊錢。同樣的量,用當前最強的Claude Opus 4.7,要約19,000元。用GPT-5.5,要約22,000元。差了20多倍。國產模型的性價比,在這裏體現得很直觀。甚至昨天MiMo再次調價了!
再說能做什麼。我這個項目2萬行代碼,消耗了2億Token。你可能覺得2億Token換2萬行代碼效率不高。但實際編碼中,大量Token花在理解上下文、調試、迭代、反覆驗證上,真正寫代碼只是一小部分。
所以2億Token大概能支撐什麼?一個5萬行代碼的中型Web應用,從零到可用,AI輔助開發,綽綽有餘。普通人想做一個副業工具、一個小產品,2億Token是夠用的。
回頭看,還是想說:Vibe Coding當前最大的瓶頸,是你能不能把需求想清楚。2億Token給了一個不知道要做什麼的人,不規劃清楚,那也真的會浪費到渣都不剩。
互動話題
你有沒有試過把多個AI工具串起來用?遇到過什麼限制是怎麼繞過去的?評論區聊聊。
本文為原創內容,版權歸「Zerox在探索」所有
歡迎關注、點贊、在看、轉發到朋友圈