Codex 實測一個月,替代了我的 Claude Code

作者:SunyataAI
日期:2026年5月5日 上午7:17
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Codex vs Claude Code:一個月實測,成本低10倍但有限制

整理版摘要

呢篇文章係由AI工具分享公眾號SunyataAI嘅作者寫嘅,佢用咗一個月時間實測CodexClaude Code嘅表現,想搞清楚Codex係咪可以取代Claude Code。作者本身每月AI編程工具支出$600,包括兩個Claude Code訂閲同一個Codex Pro,佢發現Codex實際做嘅嘢比Claude Code仲要多。整體結論係:Codex已經係Claude Code嘅完全平替,除咗爬蟲同逆向工程呢類受安全限制嘅任務。

作者詳細比較咗成本、能力、配置同使用技巧。成本方面,同一自動化任務,Claude Code行一次要$155,Codex只需要$15,相差成10倍,主要原因GPT-5.5效率更高。Codex仲有開源、安全限制強、社區活躍等優點,但複雜重構能力稍遜,可以用Superpowers呢類工具補足。

最後,作者分享咗實用配置同多路並行嘅方法,提醒讀者注意會話容量上限同擴展管理。核心變化係一個人可以調動嘅AI算力急劇增加,從去年一個Claude Code到而家可以一個CC加七八個Codex並行工作,效率大幅提升。

  • 成本差距巨大:同一任務Codex只需$15,Claude Code要$155,相差10倍,因為GPT-5.5效率更高。
  • Codex開源、安全限制強,灰色任務做唔到;複雜重構能力不如CC,但可用Superpowers補足。
  • 配置貼士AGENTS.md要簡潔,權限設全自動(需git),caveman模式可慳65%額度,用量監控用ccusage。
  • 多路並行可大幅提升效率:拆任務畀多個Codex同時做,但要確保一個文件只分俾一個Codex
  • 踩坑經驗:會話容量上限後品質下降,唔好續命;唔好裝太多擴展,每輪對話會多燒token。
值得記低
工具

caveman模式指令

export CODEX_RESPONSE_STYLE=caveman

工具

用量監控工具ccusage

pip install ccusage

整理重點

成本差距:$155 vs $15

作者實測一個月,發現同一自動化任務,Claude Code行一次燒$155額度,Codex只需要$15,相差成10倍。主因係GPT-5.5資源消耗效率更高,用更少「思考量」就搞掂。

作者每月AI編程工具支出$600,包括兩個Claude Code訂閲($400)同一個Codex Pro($200),但Codex呢$200實際做嘅嘢比CC嘅$400仲多。中轉站價格係關鍵:Codex中轉站價格往往係官方一折甚至更低,而且OpenAI比Anthropic穩定得多。

$0.155 vs $0.15

10倍

GPT-5.5

整理重點

Codex vs Claude Code:各有千秋

CodexClaude Code直接對標,都係喺終端入面行,可以讀代碼、改文件、執行命令。但Codex有幾個關鍵差異:開源(GitHub 7.5萬星)、社區活躍、安全限制好強(爬蟲同逆向工程會直接拒絕),係「道德標兵」。

  • 開源:代碼全部公開,現成技能50多個可直接裝。
  • 安全甲強:灰色地帶任務幫唔到你。
  • GPT-5.5加持:速度快,每秒約90 token,輸出自然咗好多。

複雜重構方面,Claude Code理解能力更強,盲審測試顯示CC代碼質量勝率67%。不過可以用Superpowers呢套工具強制AI按流程幹活,補足差距,CC、CursorGemini都用得。

道德標兵

Superpowers

盲審測試勝率67%

整理重點

安裝到高效使用要點

  1. 1 安裝:將「我用係Mac/Windows,幫我安裝Codex CLI」交畀任何AI,佢會一步步教你。裝完終端輸入codex,用ChatGPT賬號登錄就得,唔使配密鑰或設環境變數。費用包含喺ChatGPT訂閲,$20 Plus就用得;重度建議Pro,有5倍用量。
  2. 2 AGENTS.md:放喺項目根目錄,寫項目規矩。建議唔超過一頁紙,只寫AI自己發現唔到嘅嘢(構建命令、禁止操作嘅文件、提交信息格式)。研究發現,讓AI自動生成嘅AGENTS.md反而會降低任務成功率。
  3. 3 權限配置:喺~/.codex/config.toml set approval_policy = "never"同sandbox_mode = "workspace-write",咁就可以全自動,但前提係一定要開git兜底。
  4. 4 caveman模式:export CODEX_RESPONSE_STYLE=caveman,開咗之後Codex唔再廢話,直接幹活,可以慳65%額度。
  5. 5 用量監控:pip install ccusage,裝咗之後可以睇到每日燒咗幾多額度,避免任務循環燒token。

AGENTS.md

caveman

ccusage

整理重點

一個人調動的算力急增

作者認為最值得關注嘅用法係多路並行:將大任務拆成多個獨立項目副本,每個Codex分配一個,同時行,互不幹擾。關鍵規則係一個文件只能分畀一個Codex,否則兩個同時改會出問題。實測7個Codex同時幹活,25分鐘搞掂一個人串行要做兩三日的量。

  • 踩坑1:每個Codex會話有容量上限,用盡之後唔會報錯,但開始寫不靠譜代碼。規則:感覺不對勁就開新會話,唔好續命。
  • 踩坑2:唔好裝太多擴展,每個工具都會食額外資源。有人接咗一個GitHub工具包有93個功能,每輪對話多燒五萬幾token。只留用得上的,其他全砍。

多路並行

一個文件只能分畀一個Codex

會話容量上限

$155 vs $15:我用一個月實測話你知,Codex 已經可以取代 Claude Code 啦

同一個自動化任務,Claude Code 跑一次 $155 額度,Codex 跑一次 $15 額度。呢個係我用一個月實測得到嘅核心結論。


圖片




Codex 係咩?

Codex 係 OpenAI 整嘅編程工具,同 Claude Code 直接對標。都係喺終端裏面行,可以讀代碼、改文件、執行命令,基本能力一樣,但係有幾個關鍵唔同:


  • 開源:代碼全部公開,GitHub 有 7.5 萬人俾星。社區活躍,現成技能有 50 幾個可以直接安裝。
  • 安全甲好強:爬蟲、逆向工程呢類任務會直接拒絕,佢係『道德標兵』。如果你需要做灰色地帶嘅嘢,佢幫唔到你。
  • GPT-5.5 加持:4 月 24 日默認轉咗去 GPT-5.5,速度快咗,每秒大約 90 token,輸出自然咗好多,冇咗嗰陣『AI味』



成本差距:$155 vs $15


呢個係最令我意外嘅數字。


實測數據:同一個自動化任務,Claude Code 跑一次大約消耗 $155 額度,Codex 跑一次大約 $15 額度。差咗成 10 倍。

圖片


原因在於 GPT-5.5 嘅資源消耗效率更高,同樣嘅任務,佢用更少嘅『思考量』就搞得掂。

作者每月 AI 編程工具支出 $600:兩個 Claude Code 訂閲 $400 + 一個 Codex Pro $200。佢嘅結論係:Codex 呢 $200 實際上做嘅嘢,比 CC 嘅 $400 仲要多。


中轉站嘅價格更低都係關鍵因素。Codex 嘅中轉站價格往往係官方一折甚至更低,而且 OpenAI 比 Anthropic 穩定好多,唔會成日無啦啦壞。呢個都係實實在在嘅成本優勢。




Codex 嘅侷限

唔係所有場景都適用。


  • 爬蟲、逆向工程:安全甲會直接拒絕,冇辦法突破。
  • 複雜重構:同時改十幾個文件、需要理解整個項目架構嘅場景,Claude Code 嘅理解能力仍然更加強。盲審測試顯示 CC 代碼質量勝率 67%。

但係有一個工具可以補足呢個差距,Superpowers,一套強制 AI 按流程做嘢嘅規矩,複雜任務完成質量穩定好多,CC、Cursor、Gemini 都用得。


圖片




實用配置:由安裝到高效使用


1. 安裝

將『我用嘅係 Mac/Windows,幫我安裝 Codex CLI』send 畀任何一個 AI,佢會一步一步教你。裝完之後喺終端輸入 codex,用 ChatGPT 賬號登錄就可以,唔需要配密鑰、唔需要設定環境變量。

費用:包含喺 ChatGPT 訂閲裏面,$20 嘅 Plus 就用得。重度使用建議 Pro,有 5 倍用量(目前促銷期有 10 倍,6 月 1 日結束)。


2. AGENTS.md 點樣寫

CC 用 CLAUDE.md,Codex 用 AGENTS.md,功能一樣,放喺項目根目錄,話畀佢知項目規矩。

寫法建議:唔好超過一頁紙,只寫佢自己發現唔到嘅嘢(構建命令、禁止操作嘅文件、提交信息格式)。研究發現,讓 AI 自動生成嘅 AGENTS.md 會降低任務成功率,因為 Codex 本身識讀代碼,說明太多反而會受幹擾。


圖片


3. 權限配置

Codex 默認每個操作都要確認,好煩。喺 ~/.codex/config.toml 裏面配置一次:

approval_policy = "never" sandbox_mode = "workspace-write"

咁樣佢就可以喺項目目錄裏面隨便改文件、執行命令,唔再問你。

前提:一定要開 git 兜底。Codex 開咗全自動之後改代碼仲激進,有 git 先可以回滾,冇 git 只能重寫。


4. 一條命令慳 65% 額度

export CODEX_RESPONSE_STYLE=caveman

開咗之後 Codex 唔再廢話,唔解釋、唔寒暄、淨係做嘢。而家所有 Codex 會話默認開咗呢個。


5. 用量監控

pip install ccusage

裝咗之後可以睇到每日燒咗幾多額度。作者有一次任務行咗入循環,幾分鐘燒咗成幾萬 token,裝咗監控先發現呢啲事比想像中常見。





多路並行:一個人調動嘅算力喺急劇增加


呢個係我認為最值得關注嘅用法。

將大任務拆成多路並行:每個 Codex 分配一個獨立項目副本,同時行,互相唔幹擾。關鍵規則:一個文件只能分畀一個 Codex,兩個同時改一定會出問題。


實測數據:7 個 Codex 同時做嘢,25 分鐘搞得掂一個人串住做要兩三日嘅量。

圖片




踩過嘅坑


1. 用到後面開始亂咁講嘢

每個 Codex 會話有容量上限,用完咗佢唔會報錯,而係開始寫唔靠譜嘅代碼,比報錯更加慘,因為質量靜靜雞咁跌咗你可能仲唔知道。

規則:覺得唔對路嘅時候,直接開新會話,唔好續命。寧願重新畀上下文,都唔好喺疲勞嘅會話裏面死撐。


2. 唔好裝太多擴展

每個工具都會食額外資源。有人接咗一個 GitHub 工具包,裏面有 93 個功能,每輪對話直接多燒咗五萬幾 token。淨係留真正用得着嘅,其他全部砍咗。


圖片




結論

Codex 而家已經係 Claude Code 嘅完全平替(爬蟲同逆向除外)。作者仲留咗 CC 主要係習慣加上某啲需求,其餘工作全部喺 Codex 上面做。


核心變化係:一個人可以調動嘅 AI 算力急劇增加。舊年係一個人 CC 做嘢,今年係一個 CC 加七八個 Codex 並行。


如果你已經在用緊 Claude Code 覺得仲未夠,加一個 Codex,你就會明我講緊乜。


圖片





圖片



呢度係 SunyataAI,分享 AI 前沿資訊、工具、技術嘅公眾號。如果你喺 AI 使用中遇到咩問題可以揾我傾下。【關注我,唔講虛嘅概念,只係傾 AI 真正適合你嘅嘢】


往期好文

GPT-Image-2 × 寧波嘅 9 張視覺實驗

由 LLM 到 Agent:七個核心概念徹底搞清楚

AI 2.0 時代嘅創業生存手冊:李開復三條建議嘅深度拆解同實戰路徑

Hermes Agent 評測:首個內置『自我進化』嘅 AI Agent,比 OpenClaw 更識得學習



$155 vs $15:我用一個月實測告訴你,Codex 已經能替代 Claude Code 了

同一個自動化任務,Claude Code 跑一遍 $155 額度,Codex 跑一遍 $15 額度。 這是我一個月實測的核心結論。


圖片




Codex 是什麼

Codex 是 OpenAI 做的編程工具,和 Claude Code 直接對標。也是在終端裏跑,能讀代碼、改文件、執行命令,基本能力一樣,但有幾個關鍵差異:


  • 開源:代碼全部公開,GitHub 7.5 萬人星。社區活躍,現成技能 50 多個可直接裝。
  • 安全甲很強:爬蟲、逆向工程這類任務會直接拒絕,它是”道德標兵”。如果你需要做灰色地帶的事,它幫不了你。
  • GPT-5.5 加持:4 月 24 日默認切換到 GPT-5.5,速度快,每秒約 90 token,輸出自然了很多,不再有那股”AI味”



成本差距:$155 vs $15


這是最讓我意外的數字。


實測數據:同一個自動化任務,Claude Code 跑一遍約消耗 $155 額度,Codex 跑一遍約 $15 額度。差了整整 10 倍。

圖片


原因在於 GPT-5.5 的資源消耗效率更高,同樣的任務,它用更少的”思考量”就能搞定。

作者每月 AI 編程工具支出 $600:兩個 Claude Code 訂閲 $400 + 一個 Codex Pro $200。他的結論是:Codex 這 $200 實際乾的活,比 CC 的 $400 還多。


中轉站的價格更低也是關鍵因素。Codex 的中轉站價格往往是官方一折甚至更低,且 OpenAI 比 Anthropic 穩定得多,不會動不動抽風。這也是實打實的成本優勢。




Codex 的侷限

不是所有場景都適用。


  • 爬蟲、逆向工程:安全甲會直接拒絕,無法突破。
  • 複雜重構:同時改十幾個文件、需要理解整個項目架構的場景,Claude Code 的理解能力仍更強。盲審測試顯示 CC 代碼質量勝率 67%。

但有一個工具可以補足這個差距,Superpowers,一套強制 AI 按流程幹活的規矩,複雜任務完成質量穩定很多,CC、Cursor、Gemini 都能用。


圖片




實用配置:從安裝到高效使用


1. 安裝

把「我用的是 Mac/Windows,幫我安裝 Codex CLI」發給任何一個 AI,它會一步一步教你。裝完終端輸入 codex,用 ChatGPT 賬號登錄即可,不需要配密鑰、不需要設環境變量。

費用:包含在 ChatGPT 訂閲裏,$20 的 Plus 就能用。重度使用建議 Pro,有 5 倍用量(目前促銷期 10 倍,6 月 1 日結束)。


2. AGENTS.md 怎麼寫

CC 用 CLAUDE.md,Codex 用 AGENTS.md,功能一樣,放在項目根目錄,告訴它項目規矩。

寫法建議:不超過一頁紙,只寫它自己發現不了的東西(構建命令、禁止操作的文件、提交信息格式)。研究發現,讓 AI 自動生成的 AGENTS.md 會降低任務成功率,因為 Codex 本身能讀代碼,說明太多反而受干擾。


圖片


3. 權限配置

Codex 默認每個操作都要確認,很煩。在 ~/.codex/config.toml 裏配置一次:

approval_policy = "never" sandbox_mode = "workspace-write"

這樣它可以在項目目錄裏隨便改文件、跑命令,不再問你。

前提:必須開 git 兜底。Codex 開了全自動後改代碼更激進,有 git 才能回滾,沒 git 只能重寫。


4. 一條命令省 65% 額度

export CODEX_RESPONSE_STYLE=caveman

開了之後 Codex 不再廢話,不解釋、不寒暄、只幹活。現在所有 Codex 會話默認開這個。


5. 用量監控

pip install ccusage

裝了之後能看到每天燒了多少額度。作者有一次任務跑進循環,幾分鐘燒掉好幾萬 token,裝了監控才發現這種事比想象中常見。





多路並行:一個人調動的算力在急劇增加


這是我認為最值得關注的用法。

把大任務拆成多路並行:每個 Codex 分配一個獨立項目副本,同時跑,互不干擾。關鍵規則:一個文件只能分給一個 Codex,兩個同時改必定出問題。


實測數據:7 個 Codex 同時幹活,25 分鐘搞定一個人串行做要兩三天的量。

圖片




踩過的坑


1. 用到後面開始胡說八道

每個 Codex 會話有容量上限,用完了它不會報錯,而是開始寫不靠譜的代碼,比報錯更坑,因為質量悄悄滑坡你可能還不知道。

規則:感覺不對勁了,直接開新會話,別續命。寧可重新給上下文,也不要在疲勞的會話裏硬撐。


2. 別裝太多擴展

每個工具都會吃額外資源。有人接了一個 GitHub 工具包,裏面 93 個功能,每輪對話直接多燒五萬多 token。只留真正用得上的,其他全砍。


圖片




結論

Codex 現在已經是 Claude Code 的完全平替(爬蟲和逆向除外)。作者還留着 CC 主要是習慣加上某些需求,其餘活全在 Codex 上。


核心變化是:一個人能調動的 AI 算力在急劇增加。去年是一個人 CC 幹活,今年是一個 CC 加七八個 Codex 並行。


如果你已經在用 Claude Code 覺得還不夠,加一個 Codex,你會明白我在說什麼。


圖片





圖片



這裏是 SunyataAI,分享 AI 前沿資訊、工具、技術的公眾號。如果你在 AI 使用中遇到什麼問題可以找我探討。【關注我,不講虛的概念,只聊 AI 真正適合你的東西】


往期好文

GPT-Image-2 × 寧波的 9 張視覺實驗

從LLM到Agent:七個核心概念徹底搞清楚

AI 2.0時代的創業生存手冊:李開復三條建議的深度拆解與實戰路徑

Hermes Agent 評測:首個內置「自我進化」的AI Agent,比OpenClaw更懂學習