燒了 20 億 token 總結的 Codex 使用指南
整理版優先睇
作者 Feisky 分享用 Codex 桌面版嘅 20 億 token 實戰經驗,總結 10 個實用心得,強調驗證、工具配置同人機協作嘅重要性。
呢篇文章係 Feisky 基於自己燒咗 20 幾億 token 嘅 Codex 使用經驗寫成嘅指南。佢發現好多人仲係將 Codex 當成普通 coding agent,但其實桌面客戶端已經進化成通用 Agent 客戶端,支援 Skills、Computer Use、瀏覽器操控、Gmail 插件等,甚至可以用 DeepSeek 等第三方模型。佢想解決嘅問題係:點樣先可以真正用盡 Codex 嘅能力,唔係淨係靠 prompt 亂試。整體結論係要建立系統化嘅用法,而唔係靠單次對話。
Feisky 強調,Codex 最強大嘅地方唔係寫 code,而係可以持續處理複雜任務,前提係要用啱方法。佢提出咗幾個核心原則:先畀足 project 背景同規則(AGENTS.md),等 AI 唔好靠幻覺開工;驗證比生成重要,要帶住清晰嘅驗證指標先開始任務;批量操作前一定要加審查,避免 AI 機械式執行而搞出大頭佛。佢仲提醒,工具配置比模型本身更重要,插件同 Skills 決定咗 AI 可以掂到咩世界,而 Skills 最值錢嘅部分係記錄「踩坑經驗」,唔係流程。
最後,Feisky 認為人唔應該退到系統外面,而係要留喺 loop 入面負責糾偏同驗收。佢推介咗 Side Panel 邊睇邊改、遠程接入、定時自動化等進階用法,仲提醒要將重要嘅決策寫入外部文件,而唔係依賴會話壓縮。總括而言,呢篇係一份非常貼地嘅 Codex 進階使用手冊,適合想由「…
- 先喺 project 根目錄放 AGENTS.md,等 Codex 每次打開都知背景同規則,避免靠幻覺亂做。
- 驗證比生成重要:任何長任務都要帶住明確嘅驗證條件(例如通過測試、瀏覽器檢查),否則只係願望。
- 批量修改或刪除前,一定要叫 Codex 先列出所有命中並分組,等你確認先好執行。
- 工具配置(插件、Skills)決定 Codex 嘅能力上限,而 Skills 最值錢嘅係記錄「踩坑經驗」而唔係流程。
- 將重要上下文寫入外部文件(TODO.md 等),唔好依賴會話壓縮,咁先可以跨 session 保持一致性。
Jason Liu: Getting the most out of Codex
Codex 基本用法入門文章
Codex 功能文檔
官方功能說明
Codex Skills 文檔
官方 Skills 開發文檔
常用 Skills 安裝命令
npx -y skills add mattpocock/skills -g -s handoff npx -y skills add feiskyer/codex-settings -g -s claude-skill npx -y skills add feiskyer/codex-settings -g -s deep-research npx -y skills add feiskyer/codex-settings -g -s youtube-transcribe-skill
內容結構
npx -y skills add mattpocock/skills -g -s handoffnpx -y skills add feiskyer/codex-settings -g -s claude-skillnpx -y skills add feiskyer/codex-settings -g -s deep-researchnpx -y skills add feiskyer/codex-settings -g -s youtube-transcribe-skill
先餵飽背景,先開始任務
AI Agent 最大嘅問題唔係唔識做嘢,而係太好自信亂幹。你唔畀佢 project 背景同規則,佢就按自己想像嚟,容易走錯方向。解決方法好簡單:喺 project 根目錄放一份 AGENTS.md。Codex 每次打開會自動讀呢個檔案,入面可以寫項目背景、技術棧、代碼規範、常見坑、測試方式,等佢好似新入職員工有本手冊跟住。
如果任務涉及特定模組,仲可以喺 prompt 直接話「先讀 docs/xxx.md 再動手」,令佢從文檔開始,唔使靠估。Codex 桌面端有個 置頂會話功能,可以將最常用嘅 thread 固定喺上面,唔好當佢臨時 session,而係當一個持續嘅工作現場。佢會自動壓縮上下文,加上記憶功能,長時任務唔駛開新 thread,慳返好多交接工夫。
驗證先係重中之重
講真,叫 Codex 寫 code,隨便一個 coding agent 都做到七八成。真正拉開距離嘅係驗證,要攞真實結果說話。驗證可以係測試、benchmark、Web 截圖、發佈前 checklist,總之以前你手動做嘅檢查,全部要清楚寫出嚟交畀 Codex 負責。
特別係用Goal跑長任務嗰陣,冇驗證嘅 Goal 只係願望。例如「幫我實現呢個計劃」係唔夠嘅,應該加上:「完成後必須通過 xx 測試、瀏覽器檢查同變更摘要;如果驗證失敗,先修問題,唔好直接話做完。」咁樣 Codex 先會真正為結果負責。
批量操作前一定要審查
從使用經驗睇,審查同清理類任務最容易出事。Codex 預設傾向係搜到就改、揾到就刪,你要主動喺 prompt 或 AGENTS.md 加條例攔住佢。例如:「批量修改前先列出所有命中,按類型分組(需要改/可能需要改/唔應該鬱),等我確認先好執行。」清理舊分支都係:「先輸出 merged 同 unmerged 對比,標註邊啲舊實現已被 main 覆蓋,唔好直接刪。」
舉個例:代碼庫搜到一堆舊 token 引用,唔係全部都要刪,有啲係測試隔離用,有啲係運行時繼承,真正有問題可能得幾個。如果唔加審查,Codex 可能機械式清曬,然後測試死一片。靠驗證可以執返,但嘥時間同 token。呢種技巧唔係乜嘢高深 AI 能力,而係你要將自己見過嘅坑寫低,等 AI 主動避開。
先配好工具,再講模型智能
模型固然重要,但真正決定 AI 做到啲乜嘅,係配置嘅工具、權限、上下文同驗證方式。插件決定 Codex 掂到邊啲外部世界,Skills 決定佢掂到呢啲世界時點做。作者常用插件同 Skills 列喺附錄,但特別強調一個好易忽略嘅位:大多數人寫 Skill 當係說明文,話畀 Codex 做咩步驟。
一開始寫十幾行骨架就夠,用耐咗自然變成成熟 Skill。另外,Side Panel 係另一個好重要嘅工具配搭:將產物放喺側邊欄,邊睇邊改,唔使截圖唔使切窗口。特別適合前端/ui 同文檔報告類任務。
留返控制權喺自己手,唔好追求完全自動
Codex 可以自動化好多嘢,但唔代表你要完全放手。越將佢接入真實工作,越會見到邊緣問題:權限、登入態、數據源缺口、工具失敗、上下文壓縮等等。所以更合理嘅用法係:Codex 做收集、執行、驗證同初步整理,人保留判斷、授權同最終責任。
真實工作係邊睇邊改、邊發現邊調整,唔係「人畀完美需求,AI 一次性完成」。《Steering(中途糾偏)》同《Queuing(排隊追加下一步)》就係為呢個設計。人應該企喺系統入面,負責糾偏、驗收同更新規則。
- 用 AGENTS.md 同外部文件記錄重要決策,唔好依賴記憶。
- 遠程接入(SSH/手機)令你可以隨時隨地介入。
- 定時自動化(Thread Automation)可以讓會話自己醒,但一定要避免假裝全知。