可能是一份最詳細的保姆級Codex教程,看完你就知道它為什麼最近這麼火
整理版優先睇
Codex 保姆級指南:平價自主 AI 智能體,從安裝到進階功能一次搞掂
最近 Codex 嘅討論聲量好大,隱隱蓋過咗 ClaudeCode。原因係「窮+怕」,即係 ClaudeCode 貴又怕封號。Codex 就平好多,生態又完整,內置 Chrome 插件同出圖功能。作者本身用過之後,發現好多細位冇人講,所以決定寫一篇真正新手用得著嘅上手指南。
Codex 係 OpenAI 推出嘅 AI 編程智能體,唔係普通助手,可以自主完成寫 code、測試、除錯、提交成個流程。前身係 2021 年驅動 GitHub Copilot 嘅模型,2025 年升級。安裝方面最推薦桌面客戶端,透過 ChatGPT 賬號或者 API Key 登入。界面主要分左邊欄同主對話區,重點要記住係 Project 模式先會自動保存文件。
文章從安裝開始,逐步講解界面各部分功能,包括 Chat 同 Project 嘅分別、插件市場、Skills 技能區、自動化設定、額度管理、模型選擇、權限同計劃模式。仲有自訂指令、MCP、Hook、Git 等進階功能,最後用 HyperFrame 案例展示 Codex 可以自主規劃同執行。整體結論係 Codex 上手門檻唔高,但搞清楚細節就事半功倍。
- 結論:Codex 係個平價自主 AI 智能體,唔單止寫 code,仲可以自主完成開發流程。
- 方法:最推薦用桌面客戶端嘅 Project 模式,自動保存文件,方便管理。
- 差異:同 ClaudeCode 相比,Codex 價格實惠、生態完善,內置 Chrome 插件同出圖功能。
- 啟發:善用 Skills 同自訂指令,可以大幅提升效率,例如叫佢用人話彙報同自行驗證。
- 可行動點:新手先由 Chat 模式試手感,再轉 Project;記得用斜槓命令提速;快啲試玩 HyperFrame 呢類插件。
Codex 自訂指令:用人話彙報同自行驗證
來自 @Matt Shumer 嘅指令,令 Codex 用簡潔中文解釋,避免術語,自行測試後先回報。
HyperFrame 動畫插件
用 HTML 寫動畫再轉成影片,唔需要剪輯知識,直接喺 Codex 插件市場安裝使用。
點解 Codex 突然咁火?
最近 Codex 嘅討論聲量已經蓋過 ClaudeCode,原因好簡單:平價加 唔怕封號。用 ClaudeCode 嘅人都知費用貴,加上封號越來越嚴,搞到人心惶惶。反觀 Codex,價格 量大管飽,生態仲越嚟越完整,Chrome 插件同內置 GPT Image 2 都係殺手功能。
作者本來覺得呢類教程好多人寫,但真正用起嚟先發現 系統快速上手指南 好重要,免得卡喺啲傻位冇人講。所以佢結合自身經驗,由頭到尾寫一份真正小白用得着嘅指南。
- 平價:比 ClaudeCode 平好多,土區 Plus 低至 70-80 元一個月。
- 生態:內置 Chrome 插件、GPT Image 2,唔使切來切去。
- 安全:用賬號登錄,減少封號風險。
安裝登入同界面逐個睇
Codex 目前有三種用法:桌面客戶端、VS Code 插件同 CI 命令行工具。最推薦桌面客戶端,直接去 OpenAI 官網下載安裝,Windows 就經微軟商店。
- 1 去 OpenAI 官網下載安裝包,跟提示裝完。
- 2 打開之後用 ChatGPT 賬號登錄,或者用 API Key。
- 3 建議用賬號登錄,先可以體驗完整功能,例如 Chrome 插件。
登入之後嘅界面由左到右:左邊欄上半係 Chat 聊天 同 Project 項目。Chat 適合零碎任務,Project 先會自動保存文件到本地文件夾,係真正好用嘅地方。左邊欄中間有 搜尋對話、插件市場、自動化設定。插件內置 Chrome 瀏覽器插件,可以控制瀏覽器自動操作。
- Skills 技能區:預置常用操作,可以直接調用。
- 自動化:設定執行頻率,定時跑報表、週報等。
- 左下角餘額:分 5 小時同周額度,用完要等刷新。
- 右下角模型選擇:日常用 GPT-5.5,大項目用 GPT-5.4,小修改用 GPT-5.3-Codex。
- 計劃模式:開咗之後先規劃再執行,適合大功能。
進階功能:多任務、自訂指令同 Git
Codex 嘅 多任務管理 係佢嘅大優勢,支援 順序執行、插隊執行 同 並行執行。你可以同時派多個任務,唔使等。
- 1 順序執行:任務 A 跑緊時繼續發 B 指令,會自動排隊。
- 2 插隊執行:點引導按鈕,即刻改做新指令。
- 3 並行執行:開新對話同時跑兩個任務,注意唔同對話唔共享內容。
自訂指令係好實用嘅功能,可以俾 Codex 一段說明,叫佢 用人話彙報 同 自行驗證。作者推介 @Matt Shumer 嘅指令,效果好好。
其他進階功能包括 MCP(連接外部工具)、Hook(自動觸發腳本)、Git 管理。Git 係版本記錄系統,Codex 將 Git 操作集成喺側邊欄,唔使打命令,適合開發項目。
- 環境同工作樹:普通用戶保持默認就得,複雜開發先需要調整。
- 斜槓命令:打 / 彈出所有插件同技能,好順手。
- 直接出圖:內置 GPT Image 2,唔使切去 ChatGPT。
實戰:用 HyperFrame 整數學動畫
作者用 HyperFrame 插件 執行一個實際任務:用數形結合推導 a²-b² 公式。HyperFrame 可以用 HTML 寫動畫再轉成影片,唔需要剪輯知識。
作者先叫 Codex 規劃方案,佢列出 1080p 科技風推導視頻、Keynote 式平滑鏡頭等。方案確認後開始執行,初版 TTS 語音生硬,後來接入 MiniMax API 調音,效果好好。
最後作者提醒:上手門檻唔高,但搞清楚 Chat 同 Project 嘅區別、多任務點用呢啲細節,用起嚟就順好多。

唔知大家有冇 feel 到,最近 Codex 嘅討論聲量,已經隱隱然蓋過咗 ClaudeCode。
原因嘛,講穿咗就兩個字:窮 + 怕。
用 ClaudeCode 嘅都知道,費用貴呢樣嘢,已經係老生常談喇,再加上封號呢排越嚟越嚴,搞到好多人提心吊膽。
反觀 Codex,價格主打一個量大管飽,最近生態亦越嚟越完整,Chrome 插件開咗,仲順便內置咗 GPT Image 2,想出圖就直接出,唔使切來切去。
於是,就有好多人開始轉投 Codex 喇。
老實講,我本來覺得呢啲 tutorial 冇必要再寫,網上一大堆。但係真正用起上嚟之後,發現如果有一篇系統快速上手指南系統,就唔會卡喺一啲特別低能、但又冇人話你知嘅位。
所以呢篇文章,我就結合自己嘅使用經驗,由頭同大家串一次,寫一個真正新手用得着嘅上手指南。
Codex 到底係乜嘢?
好多人聽到 Codex,第一反應就係:呢個唔係寫 code 嘅 AI 咩?
冇錯,但係唔止咁簡單。
Codex 係 OpenAI 推出嘅 AI 編程智能體。話係智能體而唔係助手,意思係佢唔單止幫你寫 code,仲可以自主完成由寫 code、測試、調試、到最後提交 code 嘅成個流程。
你同佢講幫我做一個可以記錄每日待辦嘅網頁,佢自己就會去做,唔使你一步一步手把手咁餵,千祈唔好當佢係 ChatGPT 嘅桌面版。
佢嘅前身,係 2021 年嗰個曾經驅動過 GitHub Copilot 嘅 code 大模型,2025 年升級成咗而家呢個版本。
好,呢啲背景資料知道嚇就夠,唔使記太多,我哋直接入正題。
安裝同登入 Codex
Codex 目前主要有三種用法:
第一種係桌面客戶端,界面完整,同普通 AI 傾偈工具差唔多,唔使你識任何 terminal 知識,最親民。
第二種係 VS Code 等插件,適合本身喺 VS Code 寫 code 嘅人。
第三種係 CI 命令行工具,呢個係畀高級用戶玩嘅,普通人暫時唔使理。

呢度優先推薦桌面客戶端,亦係今日重點講嘅。
安裝就直接去 OpenAI 官網下載頁面,將安裝包下載落嚟,跟住提示裝完就得,Windows 係經 Microsoft Store 下載嘅,今日我就以呢個版本做例子。

裝好之後,打開會要求你登入。佢會直接跳去瀏覽器用 ChatGPT 賬號登入。

如果你冇 ChatGPT 賬號,仲有另一種方式,就係直接輸入 API Key。
如果你有 OpenAI 嘅開發者賬號,可以喺 OpenAI 官網嘅後台揾到呢個 Key。
如果用 Codex,建議最好都係經賬號登入,咁先可以體驗到曬全部完整功能,就例如 Chrome 插件就只可以用喺登入賬號嘅情況下。

Anyway,無論邊種方式,登入咗之後,你就去到主界面喇。
Codex 界面各部分功能
入咗嚟唔好慌,我同你由左到右、由上到下,講清楚每個區域係做乜。
左邊欄上半部分你可以喺呢度開新對話。左邊欄入面分兩個目錄,Chat 聊天同 Project 項目。

呢兩個有咩分別?
Chat 聊天,就係普通對話,適合處理一啲零碎嘅小任務,問問題、傾方案、寫個短文案都得。但文件唔會自動儲存到本地,講穿咗,就係相當於 ChatGPT 嘅網頁版。
Project 項目,先係 Codex 真正好用嘅地方。當你叫佢生成文件、寫 code、做 PPT 或 Excel 嘅時候,強烈建議用 Project 模式。
開一個新 Project,佢會喺你電腦上對應創建一個文件夾,所有生成嘅文件都會自動儲入去,唔會唔見,方便你之後管理。
左邊欄中間部分呢度有搜尋對話、插件市場、自動化設定。

講講插件,因為呢樣嘢最近先出,呢度有好多插件。

其中就內置咗 Google Chrome 插件,開咗之後,佢可以直接控制你嘅 Chrome 瀏覽器去執行任務。
即係點解?就係你可以叫佢自己去瀏覽網頁、填表、操作頁面,唔使你親手做。
發起一個小任務,佢就會喺你 Chrome 背景開一個新 tab 去做,重點係用你嘅賬號登入狀態,呢下真係好爽,比以前又進步咗一大截。

插件隔籬係 Skills 技能區。Codex 自帶一啲預設技能,呢個功能好正,相當於佢已經學識咗一批常用操作,你直接 call 就得,唔使每次重新描述。
Skill 呢方面,前排已經陸陸續續寫咗好多。喺呢度,你可以將你之前喺其他平台,例如 OpenClaw 或者 ClaudeCode 常用嘅技能,都可以喺呢度安裝使用。

再隔籬係自動化。你可以揀一個項目、設定執行頻率,叫某個對話線程按計劃自動行。講穿咗就係畀佢定時任務,你唔喺度嘅時候佢自己開工。
呢個係好重要嘅功能,你可以叫佢定時處理報表、跑週報,或者畀你 AI 資訊早報,或者監控某一個網站,睇網站有冇更新等等好多玩法。

左下角睇到你嘅剩餘額度。一般分 5 小時額度同周額度。
呢度有個要注意嘅地方:如果喺一個週期入面用曬額度,只能等週期完咗自動 refresh,冇其他辦法。所以唔好一開頭就大手大腳跑任務,先感受嚇消耗速度先。
所以呢度都建議大家去充一個 Plus,其實已經差唔多夠用,而且最近喺土區 App Store 充一個 Plus,大概就係 70-80 蚊,爽爽用一個月,呢個羊毛應該大家都知道喇,唔使我多講啦?

中間區域係主對話區,對話框嘅右下角可以切換模型同調校推理等級。

關於揀邊個模型,畀你一個最簡單嘅參考:
平時日常使用,直接用 GPT-5.5 就得。日常嘅重構、調試、寫測試、查資料,佢都搞得掂,而且 token 消耗相對慳。
如果你要睇一個好大嘅 code base,檔案太多太長,5.5 裝唔曬,呢個時候轉 GPT-5.4,佢支援更長嘅上下文。
額度就快用完,或者係一啲小改動、子任務,轉 GPT-5.4-mini,平快。
需要幾乎即時回饋嘅小修改,例如改個 style、調個參數,用 GPT-5.3-Codex,秒回,唔使等。
對話框左下角有三個權限可以切換。
默認權限:最保守,Codex 只可以喺限定範圍內操作,適合日常使用。

自動審查:佢會喺沙盒入面跑命令,沙盒即係一個隔離嘅虛擬空間,相當於畀咗佢一個獨立地盤,喺入面點搞都唔影響你真實嘅電腦。

完全訪問權限:放開曬所有限制,佢可以直接操控你嘅電腦,風險升高,官方都標註咗呢點,唔熟嘅話唔好隨便開。

對話框左下角有個計劃模式開關,理解好簡單:開咗就係諗清楚先做,關咗就直接做。

開咗之後,Codex 會先幫你拆任務、列步驟,必要時問你幾個選擇題確認方向,然後先執行。適合改大功能、遷移 code、整理方案呢啲容易做錯嘅嘢。
關咗嘅時候佢更直接,要求明確就廢話少講,直接揾文件、改 code、畀結果。
Project 模式下嘅界面
從普通對話切換到 Project 項目之後。

右上角會出現三個額外嘅掣,分別係:
第一個,終端工具。撳開可以直接輸入指令執行,畀識技術嘅人用,普通用戶暫時唔理。

第二個,文件管理。呢個一定要識!佢可以令你直接喺 Codex 入面睇到項目文件夾有咩檔案,唔使打開文件夾逐個揾。
第三個,側邊欄。佢會即時總結當前任務嘅進度、生成咗咩文件、執行咗邊啲步驟。

如果你睇唔明佢做緊乜,打開呢個側邊欄睇一眼,基本上就清楚曬。
設定裏面嘅好嘢
桌面寵物:呢個純粹好玩,但真係幾得意。
設定入面可以開一隻像素風小寵物,浮喺你桌面度,

即時反映 Codex 嘅工作狀態:佢跑緊任務嘅時候,寵物會鬱。
即係佢做緊嘢嘅時候,你走去做其他嘢,可以快速知道佢做完未,都算有啲實用功能。

開啟方式:設定 → 外觀 → 寵物 → 揀寵物 → 喚醒寵物。

官方內置咗 8 隻,你仲可以自己創建。
個人化設定,呢度仲可以揀 Codex 嘅回覆語氣,親和定務實。跟住自己喜好揀就得。

自定義指令呢個真係有用。你可以預先寫一段說明畀 Codex,話畀佢聽同你溝通嘅時候要注意啲乜。
我揾咗一段 Twitter 上 @Matt Shumer 嘅指令,效果唔錯,直接貼畀大家用:
喺同我溝通你嘅成果時,用簡潔清楚嘅中文解釋你做咗乜同發生咗咩事。避免用術語、技術實作細節同 code 行話。寫嘅時候,就好似你向一個唔識 code 嘅聰明人解釋。你實際嘅工作(點樣思考、計劃、寫 code、調試同解決問題)應該保持完全嘅技術性同嚴謹性。呢樣只係適用於你同我溝通嘅方式。喺向我報告之前,如果可能嘅話,請先檢查自己嘅工作。唔好淨係寫 code 就當做完。實際用可用嘅工具測試佢。如果可能,執行佢,檢查輸出,確認佢係咪按要求運作。目標係令唔使我參與迭代過程。我希望收到最終可用嘅結果,而唔係需要我檢查嘅初稿。只有當你確認一切正常,或者你真係遇到需要我幫手嘅難題嘅時候,先返嚟揾我。

呢段指令嘅核心意思係:叫佢用人話同你報告,同時要求佢自己先驗證,唔好成日揾你確認。
好省心。
繼續,關於 MCP 舊年已經介紹過,係畀 Codex 連接外部工具嘅協議,例如 GitHub、飛書、Notion 等等。Codex 呢度行圖形化配置,唔使你手寫 JSON,㩒㩒揀揀就駁到。呢個等你用熟咗之後可以再研究。

Hook(鈎子),呢個功能個名聽落玄妙,其實講穿咗就一句話:喺 Codex 做嘢前後,自動觸發你預先設好嘅 script。
例如 Codex 每次改完 code,你可以設一個鈎子,叫佢改完之後自動行一次格式化,保證 code 格式永遠整齊;或者喺佢執行某個操作之前,先行一個安全檢查,確認冇問題先放行。日誌記錄、自動測試,都可以掛喺呢度。
講得更直接啲:Hook 就相當於畀 AI 嘅操作流程加咗套自動化嘅監控同審計機制。佢做過啲乜、有冇越界、有冇達標,鈎子幫你睇實,唔使你一步步去確認。

呢樣嘢對普通用戶嚟講,用到嘅場景唔多。但如果你用 Codex 跑比較認真嘅開發項目,怕佢改出咩亂子,或者需要每次改動都自動留記錄,Hook 就係你嘅安全繩。
Git 管理,好,Git 呢個詞,終於都要正面面對。

好多人一見到 Git 就繞路走,覺得係 programmer 嘅嘢,同自己冇關係。但如果你用 Codex 嚟做任何同 code、網站、項目檔案有關嘅嘢,遲早要同佢打交道,所以呢度直接講清楚。
Git 係 code 世界裏面嘅版本記錄系統。
用最白話嘅方式理解:佢就係一部時光機。你個項目每次改嘢,Git 就幫你影一張 snapshot,記錄低呢個時間點檔案係點樣。改出問題?返去上一張 snapshot,一鍵還原,乜都冇唔見。
佢可以話畀你知:呢個項目改過邊啲檔案,邊啲係新加,邊啲係刪咗,每次改動係邊個做,可唔可以撤銷。
以前用 Git,要自己打命令行,咩 git commit、git push,一堆黑框框,普通人睇到頭都大。
但 Codex 直接將 Git 嘅核心操作集成咗落側邊欄,唔使打命令行,睇得到摸得到,㩒一下就 commit、回退、查記錄。
對唔熟命令行嘅人嚟講,呢點確實比 ClaudeCode 省心好多,少咗來回切 terminal 嘅麻煩。
幾時需要理 Git?如果你淨係用 Codex 寫文章、整理表格、做個 PPT,Git 呢頁保持默認就得,完全唔使掂。
但如果你叫 Codex 幫你改網站 code、跑項目、做開發類嘅工作,Git 就係你嘅安全網,改壞咗可以救你。
環境同工作樹:呢兩個詞,單睇個名都夠令人頭大。
不過對於新手其實默認唔使理就得,有興趣嘅話,我就簡單介紹嚇。
先講環境。

呢度嘅環境,係指 code 嘅執行環境。
同一段程式,喺唔同環境入面執行,結果可能完全唔同。環境設定,就係話畀 Codex 知:你要喺咩條件下執行呢段 code。
呢頁設定,對大多數普通用戶嚟講,保持默認就得,唔使改。只有當你喺搭建比較複雜嘅開發環境,遇到執行錯誤嘅時候,先需要嚟呢度睇嚇。
再講工作樹(Worktree)。
呢個概念有啲得意,而且對多任務嚟講好重要。

正常情況下,你所有操作都喺同一個工作目錄入面進行。但如果 Codex 同時跑兩個任務,都喺改同一個項目嘅檔案,就可能撞車。
A 任務改咗某個檔案,B 任務同時亦改緊,兩個改動疊埋一齊,會亂曬龍。
工作樹就係為瞭解決呢個問題。Codex 可以同時 call 多個智能體,每個智能體都喺自己獨立嘅工作樹入面做嘢,互相隔離,各改各嘅,唔會互相干擾,改完之後再合併。
簡單理解:工作樹就係畀每個並行任務各分咗一個獨立嘅工作間,防止大家逼埋一齊亂改檔案。
同樣,呢個設定普通用戶保持默認就得。除非你喺跑好複雜嘅多線程開發任務,唔係嘅話感受唔到佢嘅存在。等你真係遇到多任務衝突嘅問題嗰陣,先嚟呢度調整都未遲。
多任務管理
呢個係 Codex 比好多 AI 工具強嘅地方之一,一定要知。
無論係傾偈對話定 Project 項目,佢都支援多任務管理,具體有三種,呢度以對話為例:
第一種,順序執行:
你叫佢做任務 A,佢跑緊 A 嘅時候,你可以繼續發 B 嘅指令。佢唔會停,會先跑完 A,然後自動接住做 B。唔使你望實等,發完指令去做自己嘢就得。


第二種,插隊執行:
如果你新加嘅指令中途比之前嘅指令更 urgent,要佢即刻轉方向,㩒引導掣將新指令插隊。

佢當前任務會即刻按照要求繼續執行,唔係等原指令完,係即刻改。

第三種,並行執行:
喺當前項目入面撳新對話,開一個新對話,直接再佈置一個新任務。兩個任務同時跑,互不影響。

提提你:唔同對話之間唔 share 對話內容。但係佢哋都睇到同一個項目文件夾入面嘅所有檔案。所以如果你叫兩個 thread 都改同一個檔案,要注意衝突嘅問題。
幾個小知識點
斜槓指令:
喺對話框入面直接打 /,會彈出曬所有可用嘅插件、技能同功能開關,唔使去菜單入面揾。想 call 瀏覽器插件、開某個功能,/ 一打就出,用熟咗好順手。


直接出圖:
Codex 集成咗 OpenAI 嘅 Image 2 模型,對話入面直接叫佢出圖就得,唔使轉去 ChatGPT 網頁。

電腦操控:
Codex 仲可以直接控制電腦,但目前只支援 macOS,Windows 用戶暫時要等。
寫到呢度,呢個 Codex 嘅入門地圖算係同大家畫完。
玩嚇 HyperFrame
剩係講功能太抽象,畀大家睇一個我自己跑過嘅實際案例。
最近有個插件叫 HyperFrame,熱度比較高。
佢嘅玩法係:用 HTML 語言嚟寫動畫,最後轉成一段影片。聽落有啲轉折,但實際上好好理解,你寫一段 HTML,佢幫你渲染成動態影片,成個流程唔使你識剪片,亦唔需要 After Effects。
直接在 Codex 插件入面就可以下載使用。

我喺 Codex 裏面 @hyperframe call 佢,然後直接安排任務。
我第一時間諗到嘅方向,係抖音成日見到嘅嗰種,用數形結合嘅方式推導數學公式。例如用圖形展示 a²-b² 呢個公式,令人一眼就明。
呢類內容好直觀,容易幫細路理解,而且本來就有好多帳號用呢種動畫帶貨教輔,每次我見到都會忍唔住睇曬。
所以我畀咗佢一個指令:用數形結合嘅方式,做一個推導 a²-b² 公式嘅影片。

一開始,我冇叫佢即刻做,而係叫佢規劃方案,話畀我知打算點做。
佢畀咗我一個完整方案:1080p 嘅科技風數學推導影片,Keynote 式平滑滾動鏡頭等等。

方案確認之後,叫佢開始跑。
最初跑出嚟嘅影片,自帶嘅 TTS 語音比較機械,唔係幾得。之後我幫佢駁咗個 MiniMax 嘅 API,調試咗一輪之後,語音效果好咗好多,整體出嚟嘅效果我覺得唔錯。
呢個案例想講嘅係:Codex 唔淨係幫你寫 code 嘅工具,佢更加似一個可以自己規劃、自己執行、自己調試嘅數碼員工。你畀方向,佢做嘢,中間你只需要喺關鍵位睇一眼就得。
方向啱咗,剩下嘅就等佢跑。
結語
老實講,Codex 呢樣嘢,上手門檻其實唔高,但知同唔知之間嘅差距,往往就喺呢啲細節,例如 Chat 同 Project 嘅分別、多任務點樣插隊。
呢啲搞清楚咗,用起嚟就順好多。
剩下嘅,就靠你自己去玩喇。
呢個係一個面向新手嘅入門教學,亦係足足用咗一個週末去寫嘅。寫嘅時候盡量想得仔細啲,想鉅細無遺多講啲。但又怕考慮到讀者嘅接受程度唔同,所以先保證我哋個個都上到手玩得到,呢樣先係最重要。
最後,如果覺得呢篇仲有用,記得 like、收藏、多多 share,上次有朋友話結尾有咁一句都幾有效,咁希望今次依然有效啦。


不知道大家有沒有感覺,最近 Codex 的討論聲量,已經隱隱蓋過了 ClaudeCode。
原因嘛,說白了就兩個字:窮 + 怕。
用 ClaudeCode 的都知道,費用貴這件事,已經是老生常談了,再加上封號這陣子越來越嚴,搞得很多人提心吊膽。
反觀 Codex,價格主打一個量大管飽,最近生態也越來越完整,Chrome 插件開了,還順帶內置了 GPT Image 2,想出圖直接出,不用切來切去。
於是,就有不少人開始轉投 Codex 了。
說實話,我本來覺得這種教程沒必要再寫了,網上一堆。但是真正用起來之後,發現如果有一篇系統快速上手指南系統,就不會卡在一些特別傻、但又沒人告訴你的地方。
所以這篇文章,我就結合自己的使用經驗,從頭給大家串一遍,寫一個真正小白能用得上的上手指南。
Codex 到底是什麼?
不少人聽到 Codex,第一反應是:這不就是個寫代碼的 AI 嗎?
沒錯,但不止於此。
Codex 是 OpenAI 推出的 AI 編程智能體。說智能體而不是助手,意思是它不只是幫你寫代碼,它能自主完成從寫代碼、測試、調試、到最後提交代碼的整個流程。
你跟它說幫我做一個能記錄每日待辦的網頁,它自己就會去幹,不用你一步一步手把手喂,你可千萬別把它當成是 ChatGPT 的桌面版。
它的前身,是 2021 年那個曾經驅動過 GitHub Copilot 的代碼大模型,2025 年升級成了現在這個版本。
好,這個背景知識瞭解了就夠了,不需要記太多,咱們直接進正題。
安裝和登錄 Codex
Codex 目前主要有三種用法:
第一種是桌面客戶端,界面完整,跟普通 AI 聊天工具差不多,不需要你懂什麼終端知識,最友好。
第二種是 VS Code 等插件,適合本身就在 VS Code 裏寫代碼的人。
第三種是 CI 命令行工具,這個是給高級用戶玩的,普通人先不用管。

這裏優先推薦桌面客戶端,也是今天重點講的。
安裝的話直接去 OpenAI 官網下載頁面,把安裝包下下來,按提示裝完就行,Windows 是通過微軟商店去下載的,今天我就以這個版本為例。

裝好之後,打開會要求你登錄。它會直接跳轉瀏覽器使用 ChatGPT 賬號登錄。

如果你沒有 ChatGPT 賬號,還有另一種方式,就是直接輸入 API Key。
如果你有 OpenAI 的開發者賬號,可以在 OpenAI 官網的後台找到這個 Key。
如果使用 Codex,建議最好還是通過賬號來登錄,這樣才能體驗到全部的完整功能,就比如 Chrome 插件就只能在登錄賬號下使用。

Anyway,不管哪種方式,登進去,你就到主界面了。
Codex 界面各部分功能
進來之後別慌,我給你從左到右、從上到下,把每個區域是幹什麼的說清楚。
左邊欄上半部分你能在這裏新建對話。左邊欄裏分兩個目錄,Chat 聊天和 Project 項目。

這兩個有什麼區別?
Chat 聊天,就是普通對話,適合處理一些零碎的小任務,問問題、聊聊方案、寫個短文案都行。但文件不會自動保存到本地,說白了,就是相當於 ChatGPT 的網頁版。
Project 項目,才是 Codex 真正好用的地方。當你讓它生成文件、寫代碼、做 PPT 或 Excel 的時候,強烈建議用 Project 模式。
新建一個 Project,它會在你電腦上對應創建一個文件夾,所有生成的文件都會自動存進去,不會丟,方便你後續管理。
左邊欄,中間部分這裏有搜索對話、插件市場、自動化設置。

說一下插件,因為這玩意最近剛出,這裏有很多插件。

其中就內置了谷歌瀏覽器插件,開啓之後,它可以直接控制你的 Chrome 瀏覽器去執行任務。
什麼意思?就是你可以讓它自己去瀏覽網頁、填表、操作頁面,不需要你動手。
發起一個小任務,它就會在你 Chrome 後台新開一個標籤去操作,關鍵是使用你的賬號登錄態,這就太舒服了,比之前又進了一大步。

插件旁邊是 Skills 技能區。Codex 自帶了一些預置技能,這個功能很贊,相當於它已經學會了一批常用操作,你直接調用就行,不需要每次重新描述。
Skill 這方面,前陣子已經陸陸續續寫了很多。在這裏,你也可以把你之前在其他平台,比如 OpenClaw 或者 ClaudeCode 上常用的技能,也可以在這裏安裝使用。

再旁邊是自動化。你可以選一個項目、設置執行頻率,讓某個對話線程按計劃自動跑起來。說白了就是給它下定時任務,你不在的時候它自己幹活。
這是一個很重要的功能,你可以讓它定時處理報表、跑週報,或者給你 AI 資訊早報,或者是監控某一個網站,看網站是否更新等等很多玩法。

左下角能看到你當前的剩餘額度。一般分 5 小時額度和周額度。
這裏有個要注意的地方:如果在一個週期內把額度用完了,只能等週期結束自動刷新,沒有其他辦法。所以別一上來就大手大腳地跑任務,先感受一下消耗速度再說。
所以這裏還是建議大家去充一個 Plus,其實就已經差不多夠用,而且最近在土區 App Store 充一個 Plus,差不多就是 70-80 元,爽爽用一個月,這個羊毛估計都知道了吧,就不用我多說了吧?

中間區域是主對話區,對話框的右下角可以切換模型和調節推理等級。

關於模型選哪個,給你一個最簡單的參考:
平時日常使用,直接用 GPT-5.5 就好。日常的重構、調試、寫測試、查資料,它都能搞定,而且 token 消耗相對省。
如果你要讀一個特別大的代碼庫,文件太多太長,5.5 裝不下,這時候切 GPT-5.4,它支持更長的上下文。
額度快用完了,或者是一些小改動、子任務,切 GPT-5.4-mini,便宜快。
需要幾乎實時反饋的小修改,比如改個樣式、調個參數,用 GPT-5.3-Codex,秒回,不用等。
對話框左下角有三檔權限可以切換。
默認權限:最保守,Codex 只能在限定範圍內操作,適合日常使用。

自動審查:它會在沙盒裏跑命令,沙盒就是一個隔離的虛擬空間,相當於給它劃了一塊單獨的地盤,在裏面怎麼折騰都不影響你的真實電腦。

完全訪問權限:放開所有限制,它能直接操控你的電腦,風險升高,官方也標註了這點,不熟悉的話別輕易開。

對話框左下角有個計劃模式開關,理解起來很簡單:開啓就是先想清楚再動手,關閉就是直接幹。

開啓之後,Codex 會先幫你拆任務、列步驟,必要時問你幾個選擇題確認方向,然後再執行。適合改大功能、遷移代碼、整理方案這種容易做錯的事。
關閉的時候它更直接,要求明確就不廢話,直接查文件、改代碼、給結果。
Project 模式下的界面
從普通對話切換到 Project 項目後。

右上角會出現三個額外的按鈕,分別是:
第一個,終端工具。點開可以直接輸入命令執行,給懂技術的人用的,普通用戶先不管。

第二個,文件管理。這個必須要認識!它能讓你直接在 Codex 裏看到項目文件夾裏有哪些文件,不用去打開文件夾一個個找。
第三個,側邊欄。它會實時總結當前任務的進度、生成了什麼文件、執行了哪些步驟。

如果你看不懂它在幹什麼,打開這個側邊欄瞄一眼,基本就清楚了。
設置裏的好東西
桌面寵物:這個純屬好玩,但真的蠻有意思。
設置裏可以開一隻像素風小寵物,浮在你桌面上,

實時反映 Codex 的工作狀態它在跑任務的時候,寵物會動。
就是它在幹活的時候,你跑去幹其他事情,能夠快速知道它這個活幹完了沒有,還是有一定實用功能的。

開啓方式:設置 → 外觀 → 寵物 → 選擇寵物 → 喚醒寵物。

官方內置了 8 只,你還可以自己創建。
個性化設置,這裏還能選擇 Codex 的回覆語氣,親和還是務實。根據自己的喜好選就行。

自定義指令這個是真的有用。你可以給 Codex 提前寫一段說明,告訴它在跟你溝通的時候要注意什麼。
我找了一段推上來自@Matt Shumer 的指令,效果不錯,直接貼給大家用:
在與我溝通你的成果時,用簡潔明瞭的中文解釋你做了什麼以及發生了什麼。避免使用術語、技術實現細節和代碼行話。寫的時候,就好像你在向一個不懂代碼的聰明人解釋。你實際的工作(如何思考、計劃、寫代碼、調試和解決問題)應該保持完全的技術性和嚴謹性。這僅適用於你與我溝通的方式。在向我彙報之前,如果有可能的話,請先檢查自己的工作。不要只是寫代碼就認為完成了。實際使用可用工具測試它。如果可能,運行它,檢查輸出,確認它是否按要求工作。目標是讓我不參與迭代過程。我希望收到最終可用的結果,而不是需要我檢查的初稿。只有當你確認一切正常,或者你確實遇到了需要我幫助的難題時,才回來找我。

這段指令的核心意思是:讓它用人話跟你彙報,同時要求它自己先驗證,別動不動就來找你確認。
非常省心。
繼續,關於 MCP 去年就介紹過了,是讓 Codex 連接外部工具的協議,比如 GitHub、飛書、Notion 等等。Codex 這裏走的是圖形化配置,不需要你手寫 JSON,點點選選就能接上。這個等你用熟了之後可以再研究。

Hook(鈎子),這個功能名字聽起來玄乎,其實說白了就一句話:在 Codex 幹活的前後,自動觸發你預先設好的腳本。
比如 Codex 每次改完代碼,你可以設一個鈎子,讓它改完之後自動跑一遍格式化,保證代碼格式永遠整齊;或者在它執行某個操作之前,先跑一個安全檢查,確認沒問題再放行。日誌記錄、自動測試,也都能掛在這裏。
說得更直接一點:Hook 相當於給 AI 的操作流程加了一套自動化的監控和審計機制。它幹了什麼、有沒有出格、有沒有達標,鈎子幫你盯着,不用你自己一步步去確認。

這玩意對普通用戶來說,用到的場景不多。但如果你在用 Codex 跑比較嚴肅的開發項目,怕它改出什麼幺蛾子,或者需要每次改動都自動留記錄,Hook 就是你的保險繩。
Git 管理,好,Git 這個詞,終於還是要正面對上了。

很多人一看到 Git 就繞着走,覺得這是程序員的東西,跟自己沒關係。但如果你用 Codex 來做任何跟代碼、網站、項目文件相關的事,遲早要跟它打交道,所以這裏直接說清楚。
Git 是代碼世界裏的版本記錄系統。
用最直白的話來理解:它就是一台時間機器。你的項目每改一次,Git 就幫你拍一張快照,記錄下這個時間點文件長什麼樣。改出問題了?回退到上一張快照,一鍵還原,什麼都沒丟。
它能告訴你:這個項目改過哪些文件,哪些是新加的,哪些被刪了,每次改動是誰幹的,能不能撤銷。
以前用 Git,得自己打命令行,什麼 git commit、git push,一堆黑框框,普通人看了頭皮發麻。
但 Codex 直接把 Git 的核心操作集成進了側邊欄,不用打命令行,看得見摸得着,點一下就能提交、回退、查記錄。
對不熟命令行的人來說,這一點確實比 ClaudeCode 省心很多,少了來回切終端的麻煩。
什麼時候需要管 Git?如果你只是用 Codex 寫文章、整理表格、做個 PPT,Git 這頁保持默認就行,完全不需要碰。
但如果你讓 Codex 幫你改網站代碼、跑項目、做開發類的工作,Git 就是你的安全網,改壞了能救你。
環境和工作樹:這兩個詞,光看名字就夠讓人頭大的了。
不過對於新手其實默認不用管就行,感興趣的話,我就簡單介紹一下。
先說環境。

這裏的環境,指的是代碼的運行環境。
同一段程序,在不同的環境裏跑,結果可能完全不同。環境設置,就是告訴 Codex:你要在什麼條件下運行這段代碼。
這頁設置,對大多數普通用戶來說,保持默認就行,不用動。只有當你在搭一些比較複雜的開發環境,遇到運行報錯的時候,才需要來這裏看看。
再說工作樹(Worktree)。
這個概念稍微有意思一點,而且對多任務來說很重要。

正常情況下,你所有的操作都在同一個工作目錄裏進行。但如果 Codex 同時在跑兩個任務,都在改同一個項目的文件,就可能撞車。
A 任務改了某個文件,B 任務同時也在改,兩個改動疊在一起,直接亂掉。
工作樹就是為了解決這個問題的。Codex 能同時調用多個智能體,每個智能體都在自己獨立的工作樹裏幹活,互相隔離,誰改誰的,互不干擾,改完之後再合併。
簡單理解:工作樹就是給每個並行任務各分了一間獨立的工作間,防止大家擠在一起亂改文件。
同樣的,這個設置普通用戶保持默認就行。除非你在跑很複雜的多線程開發任務,不然感知不到它的存在。等你真的遇到多任務衝突的問題了,再來這裏調整也不晚。
多任務管理
這是 Codex 比很多 AI 工具強的地方之一,一定要知道。
不管是在聊天對話還在 Project 項目,它都支持多任務管理,具體有三種,這裏以對話為例:
第一種,順序執行:
你讓它幹任務 A,它在跑 A 的時候,你可以繼續發 B 的指令。它不會停,會先把 A 跑完,然後自動接着幹 B。不需要你盯着等,發完指令去幹自己的事就好。


第二種,插隊執行:
如果你新加入的指令中途比之前的指令更緊急,需要它馬上改變方向,點引導按鈕把新的指令插隊。

它當前任務會立刻按照要求繼續執行,不是等原指令結束,是現在就改。

第三種,並行執行:
在當前項目裏點新對話,新建一個對話,直接再佈置一個新任務。兩個任務同時跑,互不影響。

需要提醒一下:不同對話之間不共享對話內容。但它們都能看到同一個項目文件夾裏的所有文件。所以如果你讓兩個線程都在改同一個文件,要注意一下衝突的問題。
幾個小知識點
斜槓命令:
在對話框裏直接打/,會彈出所有可用的插件、技能和功能開關,不用去菜單裏翻。想調用瀏覽器插件、開某個功能,/一戳就出來,用熟了極其順手。


直接出圖:
Codex 集成了 OpenAI 的 Image 2 模型,對話裏直接讓它出圖就行,不用切 ChatGPT 網頁。

電腦操控:
Codex 還能直接控制電腦,但目前只支持 macOS,Windows 用戶暫時還得等。
寫到這裏,這個 Codex 的入門地圖算是給大家畫完了。
玩一下 HyperFrame
光講功能太抽象,給大家看一個我自己跑過的實際案例。
最近有個插件叫 HyperFrame,熱度比較高。
它的玩法是:用 HTML 語言來寫動畫,然後最後轉成一個視頻。乍一聽有點繞,但實際上很好理解,你寫一段 HTML,它幫你渲染成動態視頻,整個流程不需要你會剪輯,也不需要會 After Effects。
直接在 Codex 插件裏就能下載使用。

我在 Codex 裏@hyperframe 調用它,然後直接安排任務。
我第一時間想到的方向,是抖音上經常刷到的那種,用數形結合的方式來推導數學公式。比如用圖形演示 a²-b² 這個公式,讓人一眼就看懂。
這類內容很直觀,容易幫小孩理解,而且本來就有很多賬號在用這種動畫帶貨教輔,每次我刷到都會忍不住看完。
所以我給它下了一個指令:用數形結合的方式,做一個推導 a²-b² 公式的視頻。

一開始,我沒讓它馬上動手,而是先讓它規劃方案,告訴我打算怎麼做。
它給我列了一個完整的方案:1080p 的科技風數學推導視頻,Keynote 式平滑滾動鏡頭等等。

方案確認之後,讓它開跑。
一開始跑出來的視頻,自帶的 TTS 語音比較機械,不太行。後來我給它接入了一個 MiniMax 的 API,調試了一輪之後,語音效果好了很多,整體出來的效果我覺得還不錯。
這個案例想說明的是:Codex 不只是幫你寫代碼的工具,它更像是一個能自己規劃、自己執行、自己調試的數字員工。你給方向,它幹活,中間你只需要在關鍵節點過一眼就行。
方向對了,剩下的讓它跑就是。
結語
說實話,Codex 這個東西,上手門檻其實不高,但知道和不知道之間的差距,往往就在這些細節上,比如 Chat 和 Project 的區別、多任務怎麼插隊。
這些搞清楚了,用起來就順多了。
剩下的,就靠你自己去玩了。
這是一個面向新手的入門教程,也是足足花了一個週末去寫的。寫的時候也儘可能想得儘量詳細,想事無鉅細多展開一些。但是又怕考慮到讀者的接受程度不同,所以先保證咱們每個人都能上手玩起來,這才是最重要的。
最後,如果覺得這篇還有用,記得點贊、收藏、多多轉發,上次有小夥伴說結尾有這麼一句還是管用的,那就希望這次依然還管用吧。
