最新最全的 codex 指南，是時候切換你的主力 Agent 了。

作者：空格的鍵盤

日期：2026年5月7日上午5:28

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Codex桌面端憑藉GPT-5.5同完善生態，成為目前最值得切換嘅Coding Agent。

整理版摘要

作者係一個由Claude Code轉用Codex桌面端一個禮拜嘅開發者，佢發現OpenAI最近發展得好快，5.5模型推出後Codex一日推好幾個版本，App端功能一個接一個。而Anthropic就限速、封號，體驗差啲。整體嚟講，桌面端Codex比Claude Code操作更簡單，體驗更順暢，GPT 5.5真係靠譜，token又多唔少。

文章詳細介紹咗Codex嘅13個功能，包括全終端支援、模型選擇、Git管理、MCP配置、Skills、插件市場、Computer Use、內置瀏覽器、自動化、圖片生成同桌面寵物。作者認為Codex已經從一個簡單嘅AI助手邁向超級應用，插件市場同Skills令佢可以整合各種外部服務，唔再需要為唔同任務切換工具。

最後作者比較咗OpenAI同Anthropic嘅產品策略：雖然Claude模型本體代碼能力仍然頂尖，但OpenAI更注重產品體驗同生態建設，呢個優勢會越嚟越明顯。如果模型能力冇大提升，作者會繼續用Codex做主力。

Codex桌面端操作直觀，內置Git管理、MCP配置等功能，大幅降低開發門檻。
GPT-5.5模型效能突出，token消耗比Opus 4.6更省，配額管理人性化。
一鍵遷移工具可從Claude Code導入所有配置，半小時內完成切換。
插件市場同Skills系統令Codex邁向超級應用，整合多種外部服務。
Computer Use同內置瀏覽器實現前端開發閉環，自動化功能可定時執行任務。

整理重點

點解我要由Claude Code轉去Codex？

我將主力Agent由Claude Code轉咗去Codex桌面端一個禮拜，發現OpenAI最近發展得好快。

5.5模型推出後，Codex一日推好幾個版本

Anthropic就限速、封號，體驗差啲。總括而言，桌面端Codex比Claude Code操作更簡單，體驗更順暢，GPT-5.5真係靠譜，token多唔少。

整理重點

Codex嘅13個必用功能

GPT-5.5：日常默認，token消耗比Opus 4.6仲省

Git管理整合入側邊欄，一鍵提交推送

MCP配置圖形化，裝完插件可以直接對話調用

Skills面板比Claude Code嘅.md文件更清晰

插件市場似手機App Store，搜裝權限一體化

Git管理整合入側邊欄，一鍵提交推送，唔使再開終端。
MCP配置圖形化，裝完插件可以直接對話調用外部服務。
Skills面板比Claude Code嘅.md文件更清晰易用。
插件市場似手機App Store，搜裝權限一體化。

整理重點

高階功能：Computer Use、瀏覽器同自動化

Computer Use功能讓Codex可以控制你嘅電腦，內置瀏覽器邊寫邊睇效果，自動化定時執行任務。

Computer Use目前Codex獨佔，操作電腦直接完成任務

內置瀏覽器邊寫邊睇效果，前端開發閉環

自動化定時喚醒線程，例如每日檢查GitHub通知

1 內置瀏覽器可以預覽dev server，改完代碼自動熱更新。
2 自動化設定定時線程，例如每日檢查GitHub通知發去飛書。
3 image2模型對話出圖，適合技術文檔配圖。

整理重點

OpenAI vs Anthropic：產品策略嘅啟示

Claude模型本體代碼能力仍然頂尖，但OpenAI更注重產品體驗同生態建設。下一階段若模型冇大提升，我會繼續用Codex。

模型領先唔等於產品領先

OpenAI不停堆功能，Anthropic就剋制安全

奧特曼之前出post話「Codex 正在經歷佢嘅 ChatGPT 時刻」，最近好多人都有呢個感覺。

我將主力 Agent 由 Claude Code 轉咗去 Codex 桌面端大概一個禮拜。

發現 OpenAI 最近發展得好快。5.5模型推出之後，Codex 一日可以推好幾個版本，App 端功能一個接一個出：computer use、內置瀏覽器、桌面寵物、image2 圖片生成Anthropic 呢邊就限速、封號，一套連招將用戶按在地上摩擦。

呢篇係我轉完之後嘅真實使用體驗，分享 13 個你用得到嘅功能。

順便講下我對呢兩間公司、對 Coding Agent 呢條賽道嘅一啲睇法。

總括嚟講，桌面端 Codex 比 Claude Code 操作更簡單，體驗更輸出，GPT 5.5 都真係靠譜，token 仲多唔少。

1、 Codex 全終端

Codex 產品家族，總共有 5 個客戶端：

Codex CLI：喺終端度行，Rust 寫嘅，啟動快，開發者最鍾意。
Codex APP：macOS / Windows 桌面端，所見即所得，呢篇文詳細講佢嘅使用方法。
Codex Web / Cloud：chatgpt.com/codex，雲端行長任務，掛個 PR review 可以行成晚。
IDE 插件：VS Code / Cursor / Windsurf，寫代碼時直接叫用，唔使切窗口。
Codex SDK：TypeScript 套件，自己寫代碼編排 Agent。

Codex App 係將所有能力收埋喺一個圖形界面入面，冇學習成本，一上手就用得。

入到主界面首頁，喺對話框度打 / 斜槓，就可以叫用所有插件、skill，或者開其他功能開關

其他幾個端，CLI 需要命令行操作有啲門檻，Web 適合臨時救火，IDE 插件適合開發，SDK 係俾搞二次開發嘅人。

Anthropic 一直喺 CLI 呢個點度死磨，桌面端嘅 cowork 設計體驗真係唔及 codex，周圍都有限制，而且 cowork 太嘥 token 喇，反而網頁端嘅 claude design 整體設計唔錯，但係 plus 俾嘅 token 額度根本唔夠用。

2、安裝與登入

Windows / macOS 喺官網下載並安裝：chatgpt.com/codex

安裝之後登入揀 Sign in with ChatGPT，瀏覽器授權完就登入成功。

最近 codex 加大咗風控力度，如果觸發咗風控規則，需要手機號碼驗證，可以揾個接碼方式解決，喺鹹魚度有。

關於配額，ChatGPT Plus / Pro / Business / Enterprise 自帶 Codex 配額，唔洗額外畀錢。

Plus 5 小時一輪，整體感覺比 claude 嘅額度多少少。重度使用就上 Pro，或者行國內中轉配置 API 都得。

CLI 已經登過嘅話，App 直接重用同一套登入狀態，唔使再登入。

呢點比 Claude Code 多端各自登入順手好多

產品設計上 openai 好似係產品經理主導，而 claude 就好似係工程師主導，帶嚟唔同嘅用戶體驗。

3、從 Claude Code 一鍵遷移

呢個功能，OpenAI 就係嚟搶 Claude Code 嘅用戶，遷移工具內置喺 APP 裏面。

操作路徑：設定 → General → Import other agent setup → Import

遷移覆蓋範圍：

指令檔案 CLAUDE.md 自動轉成 AGENTS.md
設定檔 settings.json 自動轉成 config.toml
Skills 、MCP 伺服器設定
過去 30 日嘅會話記錄
Hooks
子 Agent 設定

遷完重點睇 4 項：

Skill 同 Agent 裏嘅工具權限設定。
自訂認證 / 環境變數嘅 MCP 設定（密鑰唔會自動遷，要重新填）。
行為可能變嘅 Hooks。
依賴參數 / 檔案路徑嘅 Prompt 模板。

主要係密鑰同路徑需要手動填，業務邏輯已經幫轉好咗，半個鐘就可以完成全套切換。

4、模型選擇

主界面右下角係模型選擇器，拉落嚟切換。我嘅日常配比：

GPT-5.5：日常預設。重構、除錯、寫測試、知識檢索，token 消耗比 Opus 4.6 仲要慳。
GPT-5.4：要 1M 上下文 / 行 computer use 時可以切佢。例如叫佢讀曬成個代碼架構總結，5.5 嘅 400K 裝唔曬，要用 5.4 先得。
GPT-5.4-mini：額度緊張時 Codex 會主動問要唔要降，子任務、掃代碼庫、做長上下文壓縮就用佢，平又快。
GPT-5.3-Codex：要「幾乎即時回應」嘅細改動場景。例如改 Tailwind 類名、調整 prop 類型呢啲工作，秒回。

有樣嘢比較好，APP 喺額度就嚟爆嘅時候會主動彈「要唔要降一級」，同手機省電模式一樣。

Claude Code 係直接彈「5 個鐘後再嚟」，體驗差咗一截。

用 CC switch 都可以自訂模型 API 喺 codex 使用。

5、Git 管理

APP 將 git 工作流程整咗入側邊欄，唔使再開終端打指令推代碼。

常用流程：

項目 → 揀本地資料夾，自動識別 git 倉庫
改完代碼 APP 頂部「提交」掣着燈，寫 commit message 直接提交
設定好 GitHub 遠端倉庫之後「推送」掣可以撳，一鍵 push
拉 PR 到側邊欄，review 評論、diff、行內回覆都可以睇
叫 Codex 針對 review 評論改代碼、再自我檢查、再推

具體用得着嘅場景：

寫完一個 feature，叫 Codex 將 commit 拆成幾個細嘅，每個寫好 message。
review 人哋嘅 PR，叫 Codex 先用口語總結改咗啲乜、有冇風險點。
合併衝突嘅時候叫佢自己解，比手動 vimdiff 快十倍。

成個過程唔使離開 APP 一次。Claude Code 呢邊永遠要切返終端，麻煩咗唔止一星半點。

6、MCP：將外部軟件駁入嚟

MCP 喺 Codex APP 裏面行圖形化設定，唔使手寫 JSON。

設定 → Plugins / MCP → 加伺服器 → 填指令、參數、env。

常見嘅 MCP ：GitHub、Linear、Postgres、飛書、Notion、Slack、Sentry。

裝完喺對話度直接@github拉 issue、@linear查 ticket、@postgres查 SQL 結果，Codex 自動叫用對應工具。

MCP 呢個協議係 Anthropic 提出嘅，但係將佢做到普通用戶都用得嘅形態，反而係 OpenAI 先咁做。

7、Skills：工作流程

Codex 裏面 Skills 有自己嘅設定面板，比 Claude Code 嘅 .md 檔案清爽。

安裝方式：插件 → 技能/Skills → 管理/建立。

或者喺對話度/skill 名直接叫用。

亦都可以直接喺項目根目錄複製貼上你嘅 skill 到.codex/skills/your-skill/，結構同 Claude Code 幾乎一致。

8、插件市場：APP 走向超級應用嘅關鍵

插件市場係 APP 端最近改動最大嘅模組。Plugins → Marketplace，分類裏面有：

編程類：GitHub、CircleCI、CodeRabbit、Atlassian Rovo、GitLab Issues。
設計類：Figma 集成，將設計稿直接搬入對話。
生活方式類：任務、日程、筆記。
自訂遠端插件：自己公司嘅內部 Agent 都可以掛上去。

實際場景舉兩個：

裝 CodeRabbit 插件之後，PR 自動出第一輪 AI review，我淨係睇佢標紅嘅幾條，慳一半時間。
裝 Figma 插件之後，對話框掉一個 Figma 連結，Codex 自己讀節點結構、出 React 組件代碼，比拷貝截圖準好多。

裝插件嘅體驗同手機 App Store 一樣，搜、裝、開權限。

呢個係 Codex 走向「超級 APP」最關鍵嘅一步，奧特曼一直心心念念嘅第二個超級 App，應該就係 Codex 無疑。唔使再為咗唔同任務切換唔同工具，呢件事本身就係巨大嘅護城河。

9、Computer Use：叫 Codex 接管電腦

GPT-5.4 起嘅原生能力，目前 Codex 獨佔。

設定 → Features → Computer Use 打開。

喺對話框度揀插件——電腦，輸入你想做嘅嘢，例如幫我喺備忘錄記低我今日用 codex 做咗啲乜

第一次用會請求屏幕錄製同輔助功能權限，授權之後叫 Codex 就可以按你嘅要求操作電腦。

10、內置瀏覽器：邊寫代碼邊睇效果

APP 裏面直接開瀏覽器標籤頁。

具體用法：

叫 Codex 直接預覽本地啟動嘅 dev server（localhost:3000），改完代碼熱更新，佢自己睇截圖判斷。
重現視覺 bug 時截圖掉返對話叫佢改 CSS，成個迴路喺 APP 裏面閉環。
叫 Codex 打開真實網站做數據擷取，例如「打開呢個小紅書頁，將所有筆記內容抓落嚟存 csv」。

改前端代碼最爽就係：一邊對話框叫 Codex 改組件，一邊內置瀏覽器開 dev server，肉眼對比，效率翻倍。

11、自動化：定時喚醒線程

設定 → Automations，輸入自動化要求，揀項目、執行頻率，就可以叫某個對話線程按計劃自動行。

舉例：

每日早上 9 點叫某個線程「檢查我嘅 GitHub 通知，將 review 請求列出嚟發去飛書」。
每星期五自動行一次「掃描呢個星期嘅 commit，寫個研發週報」。
每日 8 點行一次「睇嚇昨日嘅播客更新，揀三條總結到 obsidian」。

配合/goal持久化目標，相當於將「半自動任務編排器」內置咗入 Codex。

12、image2 圖片生成

Codex APP 集成咗 OpenAI 嘅 image2 模型，對話度直接出圖，唔使切 ChatGPT 網頁版。

直接講「畫個 XXX」或者「按呢個截圖風格生成一張 banner」，幾秒出圖。

我用得最多嘅場景：

寫技術文檔時順手出配圖
批量出小紅書封面 / 公眾號頭圖。

就好似呢篇文章嘅配圖都係 codex 用嘅批量出圖 skill 製作嘅。

13、桌面寵物：花哩花碌但真係上癮

5 月 2 日上嘅功能。Anthropic 之前嘅 Buddy 就係寵物功能，OpenAI 改良咗呢個寵物功能。

桌面浮現一隻像素風小寵物，即時反映 Codex 工作狀態。

捽頭表示忙、揮手錶示做完、待機表示等緊輸入。

相當於一個跨應用嘅「靈動島」，睇一眼就知任務跑到邊。

開啟方式：設定 → 外觀 → 寵物→ 揀寵物 → 顯示頭像。

揀咗之後，喺對話框打斜槓，撳寵物，桌面就會顯示寵物。

官方內置 8 隻（Codex 吉祥物、整理鴨 Dewey、火焰精靈 Fireball 等）。

社區寵物去 petdex.crafter.run，幾百隻玩家自製按鍾意數排序。一行指令安裝：

npx petdex install ikun

需要自己整一隻寵物，可以裝 hatch-pet skill，輸入/hatch-pet，文字描述或者上載相片叫 AI 出 9 格動畫精靈圖。

寵物功能用咗一個禮拜真係離唔開。對住代碼兩個鐘已經夠攰，呢個時候見到桌面角落有隻小寵物向你揮手，都幾欣慰。

最後

Claude 模型本身嘅代碼能力到今日仍然係最頂尖水準。

但模型領先 ≠ 產品領先，過去半年佢將太多精力擺喺「剋制」同「安全」上面，

而 OpenAI 就不停咁堆桌面端、堆插件、堆生態、堆細節。

如果模型能力發展到頂嘅時候，產品體驗嘅優勢就會凸顯出嚟。

喺呢方面，openai 比 authoripic 做得好太多。

下一階段，如果模型冇極大嘅提升，我都會繼續將主力擺喺 codex。

如果大家想更系統咁掌握 coding Agent、Obsidian、Skill、Vibecoding 嘅技能，歡迎訂閲我嘅 AI 生產力專欄 + 社羣。跟住就會更新 Obsidian 更詳細系統嘅使用方法，仲有 vibecoding 基礎同 Coding Agent 嘅使用等住更新。

奧特曼之前發文說"Codex 正在經歷它的 ChatGPT 時刻"，最近有不少人都感受到這個時刻了。

我把主力 Agent 從 Claude Code 切到了 Codex 桌面端有一週時間了。

發現 OpenAI 最近發展得像開了掛。5.5模型推出後， Codex 一天能推好幾個版本，App 端功能一個接一個上：computer use、內置瀏覽器、桌面寵物、image2 圖片生成。Anthropic 這邊呢，限速、封號一套連招把用戶按在地上摩擦。

這篇是我切完之後的真實使用體驗，分享 13 個你用得到的功能。

順便聊聊我對這兩家公司、對 Coding Agent 這條賽道的一些看法。

總的來說，桌面端 Codex 比 Claude Code 操作更簡單，體驗更輸出，GPT 5.5 也確實靠譜，token 還多不少。

1、 Codex 全終端

Codex 產品家族，共有 5 個客戶端：

Codex CLI：終端裏跑，Rust 寫的，啓動快，開發者最愛。
Codex APP：macOS / Windows 桌面端，所見即所得，本文詳解它的使用。
Codex Web / Cloud：chatgpt.com/codex，雲端跑長任務，掛個 PR review 可以跑一晚上。
IDE 插件：VS Code / Cursor / Windsurf，寫代碼現場調用，不用切窗口。
Codex SDK：TypeScript 包，自己寫代碼編排 Agent。

Codex App 是把所有能力收在一個圖形界面裏，沒有學習成本，上手就能用。

進入主界面首頁，在對話框裏打/斜槓，就能調用所有插件、skill，或開啓其他功能開關

其他幾個端，CLI 需要命令行操作有點門檻，Web 適合臨時救火，IDE 插件適合開發，SDK 是給搞二次開發的人。

Anthropic 一直在 CLI 這一個點上死磕，桌面端的 cowork 設計體驗真不如 codex，處處都有限制，而且 cowork 太費 token 了，倒是網頁端的 claude design 整體設計不錯，但是 plus 給的 token 額度根本不夠用。

2、安裝與登錄

Windows /macOS 在官網下載並安裝：chatgpt.com/codex

安裝後登錄選 Sign in with ChatGPT，瀏覽器授權完就登錄成功了。

最近 codex 加大了風控力度，如果觸發了風控規則，需要手機號碼驗證，可以找個接碼方式解決，在鹹魚上有。

關於配額，ChatGPT Plus / Pro / Business / Enterprise 自帶 Codex 配額，不用額外付費。

Plus 5 小時一輪，總體感覺比 claude 的額度要多一些。。重度使用上 Pro，或者走國內中轉配置 API 也行。

CLI 已經登過的話，App 直接複用同一套登錄態，免登錄。

這點比 Claude Code 多端各自登錄順手太多

產品設計上 openai 像是產品經理在主導，而 claude 像是工程師在主導，帶來了不一樣的用戶體驗。

3、從 Claude Code 一鍵遷移

這個功能，OpenAI 就是來搶 Claude Code 的用戶的，遷移工具內嵌在 APP 裏。

操作路徑：設置 → General → Import other agent setup → Import

遷移覆蓋範圍：

指令文件 CLAUDE.md 自動轉成 AGENTS.md
配置文件 settings.json 自動轉成 config.toml
Skills 、MCP 服務器配置
過去 30 天的會話歷史
Hooks
子 Agent 設定

遷完重點查 4 項：

Skill 和 Agent 裏的工具權限設置。
自定義認證 / 環境變量的 MCP 配置（密鑰不會自動遷，得重填）。
行為可能變的 Hooks。
依賴參數 / 文件路徑的 Prompt 模板。

主要是密鑰和路徑需要手填，業務邏輯都幫轉好了，半個小時就能完成全套切換。

4、模型選擇

主界面右下角是模型選擇器，下拉切換。我的日常配比：

GPT-5.5：日常默認。重構、調試、寫測試、知識檢索，token 消耗比 Opus 4.6 還省。
GPT-5.4：要 1M 上下文 / 跑 computer use 時可以切它。比如讓它讀完整個代碼架構總結，5.5 的 400K 裝不下，5.4 才行。
GPT-5.4-mini：額度緊張時 Codex 會主動問要不要降，子任務、掃代碼庫、做長上下文壓縮用它，便宜快。
GPT-5.3-Codex：要"幾乎實時反饋"的小改動場景。比如改 Tailwind 類名、調 prop 類型這種活，秒回。

有一點比較好，APP 在額度快炸的時候會主動彈"要不要降一檔"，跟手機省電模式一樣。

Claude Code 是直接彈"5 小時後再來"，體驗差了一截。

使用CC switch 也可以自定義模型 API 在 codex 使用。

5、Git 管理

APP 把 git 工作流做進了側邊欄，不用再開終端敲命令行推送代碼了。

常用流程：

項目 → 選擇本地文件夾，自動識別 git 倉庫
改完代碼 APP 頂部"提交"按鈕亮起，寫 commit message 直接提
配好 GitHub 遠程倉庫後"推送"按鈕可點，一鍵 push
拉 PR 到側邊欄，review 評論、diff、行內回覆都能看
讓 Codex 針對 review 評論改代碼、再自我檢查、再推

具體能用上的場景：

寫完一個 feature，讓 Codex 把 commit 拆成幾個小的，每個寫好 message。
review 別人的 PR，讓 Codex 先用人話總結改了啥、有沒有風險點。
合併衝突的時候讓它自己解，比手動 vimdiff 快十倍。

整個過程不離開 APP 一次。Claude Code 這邊永遠要切回終端，繁瑣了不止一星半點。

6、MCP：把外部軟件接進來

MCP 在 Codex APP 裏走圖形化配置，不用手寫 JSON。

設置 → Plugins / MCP → 添加服務器 → 填命令、參數、env。

常見的 MCP ：GitHub、Linear、Postgres、飛書、Notion、Slack、Sentry。

裝完在對話裏直接@github拉 issue、@linear查 ticket、@postgres查 SQL 結果，Codex 自動調用對應工具。

MCP 這個協議是 Anthropic 提的，但把它做成普通用戶也能用的形態，反倒是 OpenAI 先這麼做了。

7、Skills：工作流

Codex 裏 Skills 有自己的設置面板，比 Claude Code 的 .md 文件清爽。

安裝方式：插件 → 技能/Skills → 管理/創建。

或者在對話裏/skill 名直接調。

也可以直接在項目根目錄複製粘貼你的 skill 到.codex/skills/your-skill/，結構和 Claude Code 幾乎一致。

8、插件市場：APP 走向超級應用的關鍵

插件市場是 APP 端最近改動最大的模塊。Plugins → Marketplace，分類裏有：

編程類：GitHub、CircleCI、CodeRabbit、Atlassian Rovo、GitLab Issues。
設計類：Figma 集成，把設計稿直接搬進對話。
生活方式類：任務、日程、筆記。
自定義遠程插件：自家公司的內部 Agent 也能掛上去。

實際場景舉兩個：

裝 CodeRabbit 插件後，PR 自動出第一輪 AI review，我只看它標紅的幾條，省一半時間。
裝 Figma 插件後，對話框扔一個 Figma 連結，Codex 自己讀節點結構、出 React 組件代碼，比拷截圖準多了。

裝插件的體驗跟手機 App Store 一樣，搜、裝、開權限。

這是 Codex 走向"超級 APP"最關鍵的一步，奧特曼一直心心念唸的第二個超級 App，應該就是 Codex 無疑了。不再需要為不同任務切不同工具，這件事本身就是巨大的護城河。

9、Computer Use：讓 Codex 接管電腦

GPT-5.4 起的原生能力，目前 Codex 獨佔。

設置 → Features → Computer Use 打開。

在對話框裏選擇插件——電腦，輸入你想做的事情，比如幫我在備忘錄記下我今天用 codex 做了什麼

第一次用會請求屏幕錄製和輔助功能權限，授權後讓 Codex 就能按你的要求操作電腦了。

10、內置瀏覽器：邊寫代碼邊看效果

APP 裏直接開瀏覽器標籤頁。

具體用法：

讓 Codex 直接預覽本地啓動的 dev server（localhost:3000），改完代碼熱更新，它自己看截圖判斷。
復現視覺 bug 時截圖丟回對話讓它改 CSS，整個迴路在 APP 裏閉環。
讓 Codex 打開真實網站做數據抓取，比如"打開這個小紅書頁，把所有筆記內容抓下來存 csv"。

改前端代碼最爽的就是：一邊對話框讓 Codex 改組件，一邊內置瀏覽器開 dev server，肉眼對比，效率翻倍。

11、自動化：定時喚醒線程

設置 → Automations，輸入自動化要求，選擇項目、執行頻率，就能讓某個對話線程按計劃自動跑。

舉例：

每天早上 9 點讓某個線程"檢查我的 GitHub 通知，把 review 請求列出來發到飛書"。
每週五自動跑一次"掃描這周的 commit，寫個研發週報"。
每天 8 點跑一次"看看昨天的播客更新，挑三條總結到 obsidian"。

配合/goal持久化目標，相當於把"半自動任務編排器"內置進了 Codex。

12、image2 圖片生成

Codex APP 集成了 OpenAI 的 image2 模型，對話裏直接出圖，不用切 ChatGPT 網頁版。

直接說"畫個 XXX"或者"按這個截圖風格生成一張 banner"，幾秒出圖。

我用得最多的場景：

寫技術文檔時順手出配圖
批量出小紅書封面 / 公眾號頭圖。

就像這篇文章的配圖都是 codex 用的批量出圖 skill 製作的。

13、桌面寵物：花裏胡哨但真上頭

5 月 2 日上的功能。Anthropic 之前的 Buddy 就是寵物的功能，OpenAI 改進這個寵物功能。

桌面懸浮一隻像素風小寵物，實時反映 Codex 工作狀態。

撓頭表示忙、揮手錶示幹完了、待機表示在等輸入。

相當於一個跨應用的"靈動島"，瞥一眼就知道任務跑到哪。

開啓方式：設置 → 外觀 → 寵物→ 選擇寵物 → 顯示頭像。

選擇後，在對話框打斜槓，點擊寵物，桌面就顯示寵物了。

官方內置 8 只（Codex 吉祥物、整理鴨 Dewey、火焰精靈 Fireball 等）。

社區寵物去 petdex.crafter.run，幾百只玩家自制按喜歡數排序。一行命令安裝：

npx petdex install ikun

需要自己造一隻寵物，可以裝 hatch-pet skill，輸入/hatch-pet，文字描述或者上傳照片讓 AI 出 9 幀動畫精靈圖。

寵物功能用了一週真離不開。盯着代碼兩小時已經夠累了，這個時候看到桌面角落有隻小寵物衝你揮手，還是挺欣慰的。

最後

Claude 模型本體的代碼能力到今天仍然是最頂尖水準。

但模型領先 ≠ 產品領先，過去半年它把太多精力花在了"剋制"和"安全"上，

而 OpenAI 在不停地堆桌面端、堆插件、堆生態、堆細節。

如果模型能力發展到頂的時候，產品體驗的優勢就凸顯出來了。

在這方面，openai 的是比 authoripic 做的要好的多。

下一階段，模型沒有極大的提升的話，我還是會把主力放 codex 。

如果大家想要更系統的掌握 coding Agent、Obsidian、Skill、Vibecoding 的技能，歡迎訂閲我的 AI 生產力專欄+社羣。接下來就要更新 Obsidian 更詳細系統的使用、還有 vibecoding 基礎和 Coding Agent 的使用待更新。