Oh-My-Codex:把 OpenAI Codex 武裝成工業級智能體

作者:AI作弊碼
日期:2026年4月28日 上午6:10
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Oh-My-Codex:為Codex加裝智能體外骨骼,解決工作流協調問題

整理版摘要

OpenAI Codex CLI本身係一個純粹嘅執行器,只能單輪對話,冇工作流記憶,亦無法並行分工。呢個瓶頸唔係模型能力,而係點樣組織大型任務。Oh-My-CodexOMX)就係針對呢個問題,為Codex套上一層完整嘅智能體外骨骼,包括30個專家Agent、40個可複用Skill、4個MCP狀態服務器、tmux原生多進程隔離,同埋完整嘅任務生命週期狀態機。

OMX嘅核心係一套四步黃金工作流:deep-interview幫你澄清需求,ralplan產出PRD,team拉起並行Agent,ralph進行持續執行。配合持久化記憶同任務隊列狀態機,OMX將原本聰明但混亂嘅AI程式員,改造成咗一個有SOP、有記憶、有分工、有監控嘅工程團隊。結論係:AI協作嘅天花板在於多智能體之間嘅協調質量。

  • OMX通過工作流協調提升Codex實戰效率,證實瓶頸在於組織而非模型。
  • 四步SOP(deep-interview、ralplan、team、ralph)將任務從混沌變為可執行。
  • 原生Codex缺乏記憶與並行,OMX補齊四層MCP引擎同tmux多進程隔離。
  • OMX嘅任務隊列用Claim-Safe生命週期防止race condition,類似真實分佈式系統。
  • 部署只需npm install加一鍵初始化,即可獲得30 Agent + 40 Skill團隊。
值得記低
連結 github.com

Oh-My-Codex GitHub

開源項目地址

整理重點

核心洞察:工作流先於模型

OMX嘅設計哲學建基於一個清醒嘅判斷:AI編程嘅核心瓶頸已經唔係「模型有幾聰明」,而係「點樣組織一個大型任務令模型持續推進而唔迷失」。原生Codex嘅問題在於缺乏澄清任務邊界嘅機制、規劃與執行解耦嘅流程、並行協調嘅基礎設施,同埋跨會話保存上下文嘅持久層。

澄清任務邊界

規劃與執行解耦

整理重點

四步黃金工作流:從混沌到可執行

OMX核心係一套經實戰驗證嘅四步標準SOP,每一步對應一個專用命令。呢個流程確保任務由混沌逐步變為可執行。

  1. 1 $deep-interview:喺你未諗清需求時反向拷問,v0.14.0引入結構化問題義務,未回答嘅關鍵問題會鎖住Stop操作。
  2. 2 $ralplan:強制輸出帶架構圖同實施步驟嘅PRD,暴露可觀測嘅運行時狀態,供人類審核後放行。
  3. 3 $team N:executor:一鍵喺tmux拉起N個並行Agent,每個Worker獨佔git worktree,通過版本化Claim Token競爭領取任務。
  4. 4 $ralph:單一Owner持續死磕模式,自動發送continue steer心跳,進度停滯時擴展max_iterations。

$deep-interview

$ralplan

Claim Token

整理重點

四層MCP狀態引擎:跨會話記憶

OMX內置4個MCP服務器,賦予Agent一套可持久化、可查詢嘅外腦。呢啲服務器記錄喺.omx/目錄下,令記憶跨越會話邊界。

  • omx_state:會話級模式狀態(ralplan/ralph/team是否激活)
  • omx_memory:跨會話嘅項目長期記憶(project-memory.json)
  • omx_code_intel:代碼庫結構索引同符號檢索
  • omx_trace:完整執行軌跡追溯,可事後審計

持久化外腦

AGENTS.md係整個系統嘅編排大腦,由omx setup自動生成,包含30個Agent角色描述、40個Skill觸發模式、模型路由策略。Codex每次啟動自動加載,相當於畀AI團隊發放崗位說明書。

AGENTS.md

整理重點

工業級任務隊列:Claim-Safe生命週期

OMX嘅團隊運行時實現咗一套完整嘅分佈式任務狀態機,防止race condition,呢點係大多數多Agent框架冇嘅。

  • create-task → claim-task (versioned token) → in_progress
  • transition-task-status → completed / failed
  • release-task-claim(失敗時歸還任務)

Worker之間通過Mailbox收發結構化消息,Leader通過HUD監控全局進度,omx hud --watch提供獨立監控視窗,唔打擾工作pane。

Mailbox

HUD

整理重點

兩分鐘部署:實戰開始

部署好簡單,前提係Node.js 20+、OpenAI API Key、macOS/Linux需安裝tmux。跟住步驟就可以獲得全套戰隊。

  1. 1 全局安裝:npm install -g @openai/codex oh-my-codex
  2. 2 一鍵初始化:omx setup && omx doctor(安裝30 Agent + 40 Skill + 4 MCP服務器 + AGENTS.md
  3. 3 以強力模式啟動,拉起3個並行執行者:omx --madmax --high,然後輸入$ralplan同$team 3:executor

omx setup && omx doctor

--madmax

核心問題

OpenAI Codex CLI 本體係一個純粹嘅執行器:佢只能夠單輪對話、冇工作流記憶、冇辦法並行分工。Oh-My-Codex (OMX) 喺唔替換 Codex 嘅前提下,為佢套上一層完整嘅「智能體外骨骼」:30 個專家 Agent、40 個可重用 Skill、4 個 MCP 狀態服務器、tmux 原生多進程隔離,以及完整嘅任務生命週期狀態機。

• • •

01 核心洞察:Codex 本體唔係瓶頸,工作流先係

OMX 嘅設計哲學建立喺一個極其清醒嘅判斷上:當下 AI 編程嘅核心瓶頸,已經唔係「模型有幾聰明」,而係「點樣組織一個大型任務令模型持續推進而唔迷失」

原生 Codex 嘅問題唔在於能力,而在於缺乏:澄清任務邊界嘅機制、將規劃同執行解耦嘅流程、喺多個並行方向上協調工作嘅基礎設施,以及跨會話保存上下文同狀態嘅持久層。OMX 逐一補齊咗呢四塊短板。

工作流對比

• • •

02 四步黃金工作流:由混沌到可執行

OMX 嘅核心係一套經過大量實戰驗證嘅四步標準 SOP,每一步對應一個專用命令關鍵字:

OMX 黃金執行路徑

$deep-interview
喺你仲未諗清楚需求嘅時候,OMX 化身蘇格拉底反向拷問用戶。v0.14.0 引入結構化問題義務(pending-question obligations),未回答嘅關鍵問題會鎖住 Stop 操作,阻止 AI 倉皇開工。
$ralplan
澄清邊界之後,強制輸出帶架構圖同實施步驟嘅 PRD。佢會暴露可觀測嘅運行時狀態(Live ralplan state visibility),令 HUD 同 Pipeline 都可以跟蹤規劃進度,供人類審核之後再放行。
$team N:executor
一鍵喺 tmux 裏面拉起 N 個並行 Agent(支援 Codex + Claude 混合編隊)。每個 Worker 獨佔一個 git worktree,彼此隔離,通過版本化 Claim Token 競爭領取任務隊列入面嘅子任務,防止 race condition。
$ralph
當某個任務需要單一 Owner 持續死磕嘅時候,Ralph 模式會持續發送「continue steer」心跳信號,並喺進度停滯時自動擴展 max_iterations,直到任務完成為止。

• • •

03 四層 MCP 狀態引擎:令記憶跨越會話邊界

OMX 內置 4 個 MCP(Model Context Protocol)服務器,賦予 Agent 一套可持久化、可查詢嘅外腦:

持久化外腦:.omx/ 目錄結構

omx_state — 會話級模式狀態(ralplan/ralph/team 係咪激活)
omx_memory — 跨會話嘅項目長期記憶(project-memory.json)
omx_code_intel — 代碼庫結構索引同符號檢索
omx_trace — 完整嘅執行軌跡追溯(可事後審計)

AGENTS.md 係整個系統嘅編排大腦,由 omx setup 自動生成:裏麪包含 30 個 Agent 嘅角色描述、委派規則、40 個 Skill 嘅觸發模式、模型路由策略(按複雜度分配 gpt-5.5 / gpt-5.4-mini / gpt-5.3-codex-spark 三檔)。Codex 喺每次會話啟動時自動加載佢,相當於俾 AI 團隊發放咗崗位說明書同組織架構圖。

• • •

04 任務隊列嘅工業級保障:Claim-Safe 生命週期

OMX 嘅團隊運行時實現咗一套完整嘅分佈式任務狀態機,呢個係大多數「多 Agent」框架根本冇嘅嘢:

Claim-Safe 任務生命週期(防 race condition)

create-task → claim-task (versioned token) → in_progress
→ transition-task-status → completed / failed
→ release-task-claim(失敗時歸還任務)

Worker 必須持有版本化嘅 Claim Token 先至可以修改任務狀態。某個 Worker 崩潰之後,Token 自動失效,任務被重新放返隊列供其他 Worker 接管——同真實嘅分佈式系統如出一轍。

Worker 之間通過 Mailbox 收發結構化消息(send-message / broadcast / mailbox-mark-delivered),Leader 通過 HUD(實時 status line)監控全局進度,同時 omx hud --watch 提供獨立嘅監控視窗,唔打擾工作 pane。

• • •

05 Rust 原生引擎:omx explore 同 sparkshell

v0.9.0 起,OMX 引入咗 Rust 編寫嘅原生探索引擎,以 omx-explore-harness 和 omx-sparkshell 兩個二進制形式分發,喺 npm install 之後自動解壓到本地緩存。

點解要用 Rust 做呢件事?

omx explore 需要喺大型 repo 裏面做高速文件樹遍歷同符號搜索(佢底層集成咗 ripgrep);sparkshell 係唯讀嘅 Shell 原生檢視工具,需要喺沙箱中以極低延遲執行 git status / ps / tail 等命令並匯總結果。TypeScript 冇辦法喺呢個場景下達到足夠低嘅啟動時間,Rust 原生二進制先至係正確答案。

• • •

06 兩分鐘部署全套戰隊

前提:Node.js 20+,OpenAI API Key 已經配置好,macOS/Linux 需要安裝 tmux。

💻 Step 1:全局安裝

npm install -g @openai/codex oh-my-codex

💻 Step 2:一鍵初始化(安裝 30 Agent + 40 Skill + 4 MCP 服務器 + AGENTS.md)

omx setup && omx doctor

💻 Step 3:以強力模式啟動,並拉起 3 個並行執行者

omx --madmax --high
# 喺會話內輸入:
$ralplan 「重構認證模塊,引入 JWT 並添加單元測試」
$team 3:executor 「按上面嘅計劃並行執行」

寫喺最後

OMX 最令人印象深刻嘅地方,係佢將一個原本「聰明但混亂」嘅 AI 程序員,改造成咗一個有 SOP、有記憶、有分工、有監控嘅工程團隊。佢證明咗一件事:AI 協作嘅天花板唔在於單個模型嘅參數量,而在於多智能體之間嘅協調質量。

📌 項目開源地址(Star 26.4k+):
https://github.com/Yeachan-Heo/oh-my-codex


核心問題

OpenAI Codex CLI 本體是一個純粹的執行器:它只能單輪對話、沒有工作流記憶、無法並行分工。Oh-My-Codex (OMX) 在不替換 Codex 的前提下,為它套上了一層完整的"智能體外骨骼":30 個專家 Agent、40 個可複用 Skill、4 個 MCP 狀態服務器、tmux 原生多進程隔離,以及完整的任務生命週期狀態機。

• • •

01 核心洞察:Codex 本體不是瓶頸,工作流才是

OMX 的設計哲學建立在一個極其清醒的判斷上:當下 AI 編程的核心瓶頸,已經不是"模型有多聰明",而是"如何組織一個大型任務讓模型持續推進而不迷失"

原生 Codex 的問題不在於能力,而在於缺乏:澄清任務邊界的機制、把規劃和執行解耦的流程、在多個並行方向上協調工作的基礎設施,以及跨會話保存上下文和狀態的持久層。OMX 逐一補齊了這四塊短板。

工作流對比

• • •

02 四步黃金工作流:從混沌到可執行

OMX 的核心是一套經過大量實戰驗證的四步標準 SOP,每一步對應一個專用命令關鍵字:

OMX 黃金執行路徑

$deep-interview
在你還沒想清楚需求時,OMX 化身蘇格拉底反向拷問用戶。v0.14.0 引入結構化問題義務(pending-question obligations),未回答的關鍵問題會鎖住 Stop 操作,阻止 AI 倉皇開幹。
$ralplan
澄清邊界後,強制輸出帶架構圖和實施步驟的 PRD。它會暴露可觀測的運行時狀態(Live ralplan state visibility),讓 HUD 和 Pipeline 都能跟蹤規劃進度,供人類審核後再放行。
$team N:executor
一鍵在 tmux 里拉起 N 個並行 Agent(支持 Codex + Claude 混合編隊)。每個 Worker 獨佔一個 git worktree,彼此隔離,通過版本化 Claim Token 競爭領取任務隊列中的子任務,防止 race condition。
$ralph
當某個任務需要單一 Owner 持續死磕時,Ralph 模式會持續發送"continue steer"心跳信號,並在進度停滯時自動擴展 max_iterations,直到任務完成為止。

• • •

03 四層 MCP 狀態引擎:讓記憶跨越會話邊界

OMX 內置 4 個 MCP(Model Context Protocol)服務器,賦予 Agent 一套可持久化、可查詢的外腦:

持久化外腦:.omx/ 目錄結構

omx_state — 會話級模式狀態(ralplan/ralph/team 是否激活)
omx_memory — 跨會話的項目長期記憶(project-memory.json)
omx_code_intel — 代碼庫結構索引和符號檢索
omx_trace — 完整的執行軌跡追溯(可事後審計)

AGENTS.md 是整個系統的編排大腦,由 omx setup 自動生成:裏面包含 30 個 Agent 的角色描述、委派規則、40 個 Skill 的觸發模式、模型路由策略(按複雜度分配 gpt-5.5 / gpt-5.4-mini / gpt-5.3-codex-spark 三檔)。Codex 在每次會話啓動時自動加載它,相當於給 AI 團隊發放了崗位說明書和組織架構圖。

• • •

04 任務隊列的工業級保障:Claim-Safe 生命週期

OMX 的團隊運行時實現了一套完整的分佈式任務狀態機,這是大多數"多 Agent"框架根本沒有的東西:

Claim-Safe 任務生命週期(防 race condition)

create-task → claim-task (versioned token) → in_progress
→ transition-task-status → completed / failed
→ release-task-claim(失敗時歸還任務)

Worker 必須持有版本化的 Claim Token 才能修改任務狀態。某個 Worker 崩潰後,Token 自動失效,任務被重新放回隊列供其他 Worker 接管——和真實的分佈式系統如出一轍。

Worker 之間通過 Mailbox 收發結構化消息(send-message / broadcast / mailbox-mark-delivered),Leader 通過 HUD(實時 status line)監控全局進度,同時 omx hud --watch 提供獨立的監控視窗,不打擾工作 pane。

• • •

05 Rust 原生引擎:omx explore 與 sparkshell

v0.9.0 起,OMX 引入了 Rust 編寫的原生探索引擎,以 omx-explore-harness 和 omx-sparkshell 兩個二進制形式分發,在 npm install 後自動解壓到本地緩存。

為什麼要用 Rust 做這件事?

omx explore 需要在大型 repo 裏做高速文件樹遍歷和符號搜索(它底層集成了 ripgrep);sparkshell 是隻讀的 Shell 原生檢視工具,需要在沙箱中以極低延遲執行 git status / ps / tail 等命令並彙總結果。TypeScript 無法在這個場景下達到足夠低的啓動時間,Rust 原生二進制才是正確答案。

• • •

06 兩分鐘部署全套戰隊

前提:Node.js 20+,OpenAI API Key 已配置,macOS/Linux 需安裝 tmux。

💻 Step 1:全局安裝

npm install -g @openai/codex oh-my-codex

💻 Step 2:一鍵初始化(安裝 30 Agent + 40 Skill + 4 MCP 服務器 + AGENTS.md)

omx setup && omx doctor

💻 Step 3:以強力模式啓動,並拉起 3 個並行執行者

omx --madmax --high
# 在會話內輸入:
$ralplan "重構認證模塊,引入 JWT 並添加單測"
$team 3:executor "按上面的計劃並行執行"

寫在最後

OMX 最令人印象深刻的地方,是它把一個原本"聰明但混亂"的 AI 程序員,改造成了一個有 SOP、有記憶、有分工、有監控的工程團隊。它證明了一件事:AI 協作的天花板不在於單個模型的參數量,而在於多智能體之間的協調質量。

📌 項目開源地址(Star 26.4k+):
https://github.com/Yeachan-Heo/oh-my-codex