最新最全的 codex 指南,是時候切換你的主力 Agent 了。

作者:空格的鍵盤
日期:2026年5月7日 上午5:28
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Codex桌面端憑藉GPT-5.5同完善生態,成為目前最值得切換嘅Coding Agent

整理版摘要

作者係一個由Claude Code轉用Codex桌面端一個禮拜嘅開發者,佢發現OpenAI最近發展得好快,5.5模型推出後Codex一日推好幾個版本,App端功能一個接一個。而Anthropic就限速、封號,體驗差啲。整體嚟講,桌面端Codex比Claude Code操作更簡單,體驗更順暢,GPT 5.5真係靠譜,token又多唔少。

文章詳細介紹咗Codex嘅13個功能,包括全終端支援、模型選擇、Git管理、MCP配置、Skills、插件市場、Computer Use、內置瀏覽器、自動化、圖片生成同桌面寵物。作者認為Codex已經從一個簡單嘅AI助手邁向超級應用,插件市場同Skills令佢可以整合各種外部服務,唔再需要為唔同任務切換工具。

最後作者比較咗OpenAIAnthropic嘅產品策略:雖然Claude模型本體代碼能力仍然頂尖,但OpenAI更注重產品體驗同生態建設,呢個優勢會越嚟越明顯。如果模型能力冇大提升,作者會繼續用Codex做主力。

  • Codex桌面端操作直觀,內置Git管理、MCP配置等功能,大幅降低開發門檻。
  • GPT-5.5模型效能突出,token消耗比Opus 4.6更省,配額管理人性化。
  • 一鍵遷移工具可從Claude Code導入所有配置,半小時內完成切換。
  • 插件市場同Skills系統令Codex邁向超級應用,整合多種外部服務。
  • Computer Use同內置瀏覽器實現前端開發閉環,自動化功能可定時執行任務。
整理重點

點解我要由Claude Code轉去Codex?

我將主力Agent由Claude Code轉咗去Codex桌面端一個禮拜,發現OpenAI最近發展得好快。

5.5模型推出後,Codex一日推好幾個版本

Anthropic就限速、封號,體驗差啲。總括而言,桌面端CodexClaude Code操作更簡單,體驗更順暢,GPT-5.5真係靠譜,token多唔少。

整理重點

Codex嘅13個必用功能

GPT-5.5:日常默認,token消耗比Opus 4.6仲省

Git管理整合入側邊欄,一鍵提交推送

MCP配置圖形化,裝完插件可以直接對話調用

Skills面板比Claude Code嘅.md文件更清晰

插件市場似手機App Store,搜裝權限一體化

  • Git管理整合入側邊欄,一鍵提交推送,唔使再開終端。
  • MCP配置圖形化,裝完插件可以直接對話調用外部服務。
  • Skills面板比Claude Code嘅.md文件更清晰易用。
  • 插件市場似手機App Store,搜裝權限一體化。
整理重點

高階功能:Computer Use、瀏覽器同自動化

Computer Use功能讓Codex可以控制你嘅電腦,內置瀏覽器邊寫邊睇效果,自動化定時執行任務。

Computer Use目前Codex獨佔,操作電腦直接完成任務

內置瀏覽器邊寫邊睇效果,前端開發閉環

自動化定時喚醒線程,例如每日檢查GitHub通知

  1. 1 內置瀏覽器可以預覽dev server,改完代碼自動熱更新。
  2. 2 自動化設定定時線程,例如每日檢查GitHub通知發去飛書。
  3. 3 image2模型對話出圖,適合技術文檔配圖。
整理重點

OpenAI vs Anthropic:產品策略嘅啟示

Claude模型本體代碼能力仍然頂尖,但OpenAI更注重產品體驗同生態建設。下一階段若模型冇大提升,我會繼續用Codex

模型領先唔等於產品領先

OpenAI不停堆功能,Anthropic就剋制安全

奧特曼之前出post話「Codex 正在經歷佢嘅 ChatGPT 時刻」,最近好多人都有呢個感覺。

飛書文檔 - 圖片

我將主力 Agent 由 Claude Code 轉咗去 Codex 桌面端大概一個禮拜。

發現 OpenAI 最近發展得好快。5.5模型推出之後,Codex 一日可以推好幾個版本,App 端功能一個接一個出:computer use、內置瀏覽器、桌面寵物、image2 圖片生成Anthropic 呢邊就限速、封號,一套連招將用戶按在地上摩擦。

呢篇係我轉完之後嘅真實使用體驗,分享 13 個你用得到嘅功能。

順便講下我對呢兩間公司、對 Coding Agent 呢條賽道嘅一啲睇法。

總括嚟講,桌面端 Codex 比 Claude Code 操作更簡單,體驗更輸出,GPT 5.5 都真係靠譜,token 仲多唔少。

1、 Codex 全終端

Codex 產品家族,總共有 5 個客戶端:

飛書文檔 - 圖片
  • Codex CLI:喺終端度行,Rust 寫嘅,啟動快,開發者最鍾意。

  • Codex APP:macOS / Windows 桌面端,所見即所得,呢篇文詳細講佢嘅使用方法。

  • Codex Web / Cloud:chatgpt.com/codex,雲端行長任務,掛個 PR review 可以行成晚。

  • IDE 插件:VS Code / Cursor / Windsurf,寫代碼時直接叫用,唔使切窗口。

  • Codex SDK:TypeScript 套件,自己寫代碼編排 Agent。

Codex App 係將所有能力收埋喺一個圖形界面入面,冇學習成本,一上手就用得。

入到主界面首頁,喺對話框度打 / 斜槓,就可以叫用所有插件、skill,或者開其他功能開關

飛書文檔 - 圖片

其他幾個端,CLI 需要命令行操作有啲門檻,Web 適合臨時救火,IDE 插件適合開發,SDK 係俾搞二次開發嘅人。

Anthropic 一直喺 CLI 呢個點度死磨,桌面端嘅 cowork 設計體驗真係唔及 codex,周圍都有限制,而且 cowork 太嘥 token 喇,反而網頁端嘅 claude design 整體設計唔錯,但係 plus 俾嘅 token 額度根本唔夠用。

2、安裝與登入

Windows / macOS 喺官網下載並安裝:chatgpt.com/codex

安裝之後登入揀 Sign in with ChatGPT,瀏覽器授權完就登入成功。

最近 codex 加大咗風控力度,如果觸發咗風控規則,需要手機號碼驗證,可以揾個接碼方式解決,喺鹹魚度有。

飛書文檔 - 圖片

關於配額,ChatGPT Plus / Pro / Business / Enterprise 自帶 Codex 配額,唔洗額外畀錢。

Plus 5 小時一輪,整體感覺比 claude 嘅額度多少少。重度使用就上 Pro,或者行國內中轉配置 API 都得。

CLI 已經登過嘅話,App 直接重用同一套登入狀態,唔使再登入。

呢點比 Claude Code 多端各自登入順手好多

產品設計上 openai 好似係產品經理主導,而 claude 就好似係工程師主導,帶嚟唔同嘅用戶體驗。

3、從 Claude Code 一鍵遷移
飛書文檔 - 圖片

呢個功能,OpenAI 就係嚟搶 Claude Code 嘅用戶,遷移工具內置喺 APP 裏面。

操作路徑:設定 → General → Import other agent setup → Import

飛書文檔 - 圖片

遷移覆蓋範圍:

  • 指令檔案 CLAUDE.md 自動轉成 AGENTS.md
  • 設定檔 settings.json 自動轉成 config.toml
  • Skills 、MCP 伺服器設定
  • 過去 30 日嘅會話記錄
  • Hooks
  • 子 Agent 設定

遷完重點睇 4 項:

  • Skill 同 Agent 裏嘅工具權限設定。
  • 自訂認證 / 環境變數嘅 MCP 設定(密鑰唔會自動遷,要重新填)。
  • 行為可能變嘅 Hooks。
  • 依賴參數 / 檔案路徑嘅 Prompt 模板。

主要係密鑰同路徑需要手動填,業務邏輯已經幫轉好咗,半個鐘就可以完成全套切換。

4、模型選擇

主界面右下角係模型選擇器,拉落嚟切換。我嘅日常配比:

飛書文檔 - 圖片
  • GPT-5.5:日常預設。重構、除錯、寫測試、知識檢索,token 消耗比 Opus 4.6 仲要慳。
  • GPT-5.4:要 1M 上下文 / 行 computer use 時可以切佢。例如叫佢讀曬成個代碼架構總結,5.5 嘅 400K 裝唔曬,要用 5.4 先得。
  • GPT-5.4-mini:額度緊張時 Codex 會主動問要唔要降,子任務、掃代碼庫、做長上下文壓縮就用佢,平又快。
  • GPT-5.3-Codex:要「幾乎即時回應」嘅細改動場景。例如改 Tailwind 類名、調整 prop 類型呢啲工作,秒回。

有樣嘢比較好,APP 喺額度就嚟爆嘅時候會主動彈「要唔要降一級」,同手機省電模式一樣。

Claude Code 係直接彈「5 個鐘後再嚟」,體驗差咗一截。

用 CC switch 都可以自訂模型 API 喺 codex 使用。

5、Git 管理

APP 將 git 工作流程整咗入側邊欄,唔使再開終端打指令推代碼。

飛書文檔 - 圖片

常用流程:

  • 項目 → 揀本地資料夾,自動識別 git 倉庫
  • 改完代碼 APP 頂部「提交」掣着燈,寫 commit message 直接提交
  • 設定好 GitHub 遠端倉庫之後「推送」掣可以撳,一鍵 push
  • 拉 PR 到側邊欄,review 評論、diff、行內回覆都可以睇
  • 叫 Codex 針對 review 評論改代碼、再自我檢查、再推

具體用得着嘅場景:

  • 寫完一個 feature,叫 Codex 將 commit 拆成幾個細嘅,每個寫好 message。
  • review 人哋嘅 PR,叫 Codex 先用口語總結改咗啲乜、有冇風險點。
  • 合併衝突嘅時候叫佢自己解,比手動 vimdiff 快十倍。

成個過程唔使離開 APP 一次。Claude Code 呢邊永遠要切返終端,麻煩咗唔止一星半點。

6、MCP:將外部軟件駁入嚟

MCP 喺 Codex APP 裏面行圖形化設定,唔使手寫 JSON。

設定 → Plugins / MCP → 加伺服器 → 填指令、參數、env。

飛書文檔 - 圖片

常見嘅 MCP :GitHub、Linear、Postgres、飛書、Notion、Slack、Sentry。

裝完喺對話度直接@github拉 issue、@linear查 ticket、@postgres查 SQL 結果,Codex 自動叫用對應工具。

MCP 呢個協議係 Anthropic 提出嘅,但係將佢做到普通用戶都用得嘅形態,反而係 OpenAI 先咁做。

7、Skills:工作流程

Codex 裏面 Skills 有自己嘅設定面板,比 Claude Code 嘅 .md 檔案清爽。

飛書文檔 - 圖片

安裝方式:插件 → 技能/Skills → 管理/建立。

或者喺對話度/skill 名直接叫用。

亦都可以直接喺項目根目錄複製貼上你嘅 skill 到.codex/skills/your-skill/,結構同 Claude Code 幾乎一致。

8、插件市場:APP 走向超級應用嘅關鍵
飛書文檔 - 圖片

插件市場係 APP 端最近改動最大嘅模組。Plugins → Marketplace,分類裏面有:

  • 編程類:GitHub、CircleCI、CodeRabbit、Atlassian Rovo、GitLab Issues。
  • 設計類:Figma 集成,將設計稿直接搬入對話。
  • 生活方式類:任務、日程、筆記。
  • 自訂遠端插件:自己公司嘅內部 Agent 都可以掛上去。

實際場景舉兩個:

  • 裝 CodeRabbit 插件之後,PR 自動出第一輪 AI review,我淨係睇佢標紅嘅幾條,慳一半時間。

  • 裝 Figma 插件之後,對話框掉一個 Figma 連結,Codex 自己讀節點結構、出 React 組件代碼,比拷貝截圖準好多。

裝插件嘅體驗同手機 App Store 一樣,搜、裝、開權限。

呢個係 Codex 走向「超級 APP」最關鍵嘅一步,奧特曼一直心心念念嘅第二個超級 App,應該就係 Codex 無疑。唔使再為咗唔同任務切換唔同工具,呢件事本身就係巨大嘅護城河。

9、Computer Use:叫 Codex 接管電腦

GPT-5.4 起嘅原生能力,目前 Codex 獨佔。

設定 → Features → Computer Use 打開。

喺對話框度揀插件——電腦,輸入你想做嘅嘢,例如幫我喺備忘錄記低我今日用 codex 做咗啲乜

飛書文檔 - 圖片

第一次用會請求屏幕錄製同輔助功能權限,授權之後叫 Codex 就可以按你嘅要求操作電腦。

10、內置瀏覽器:邊寫代碼邊睇效果

APP 裏面直接開瀏覽器標籤頁。

具體用法:

  • 叫 Codex 直接預覽本地啟動嘅 dev server(localhost:3000),改完代碼熱更新,佢自己睇截圖判斷。
  • 重現視覺 bug 時截圖掉返對話叫佢改 CSS,成個迴路喺 APP 裏面閉環。
  • 叫 Codex 打開真實網站做數據擷取,例如「打開呢個小紅書頁,將所有筆記內容抓落嚟存 csv」。

改前端代碼最爽就係:一邊對話框叫 Codex 改組件,一邊內置瀏覽器開 dev server,肉眼對比,效率翻倍。

11、自動化:定時喚醒線程

設定 → Automations,輸入自動化要求,揀項目、執行頻率,就可以叫某個對話線程按計劃自動行。

飛書文檔 - 圖片

舉例:

  • 每日早上 9 點叫某個線程「檢查我嘅 GitHub 通知,將 review 請求列出嚟發去飛書」。
  • 每星期五自動行一次「掃描呢個星期嘅 commit,寫個研發週報」。
  • 每日 8 點行一次「睇嚇昨日嘅播客更新,揀三條總結到 obsidian」。

配合/goal持久化目標,相當於將「半自動任務編排器」內置咗入 Codex。

12、image2 圖片生成

Codex APP 集成咗 OpenAI 嘅 image2 模型,對話度直接出圖,唔使切 ChatGPT 網頁版。

直接講「畫個 XXX」或者「按呢個截圖風格生成一張 banner」,幾秒出圖。

我用得最多嘅場景:

  • 寫技術文檔時順手出配圖
  • 批量出小紅書封面 / 公眾號頭圖。

就好似呢篇文章嘅配圖都係 codex 用嘅批量出圖 skill 製作嘅。

飛書文檔 - 圖片
13、桌面寵物:花哩花碌但真係上癮

5 月 2 日上嘅功能。Anthropic 之前嘅 Buddy 就係寵物功能,OpenAI 改良咗呢個寵物功能。

桌面浮現一隻像素風小寵物,即時反映 Codex 工作狀態。

飛書文檔 - 圖片

捽頭表示忙、揮手錶示做完、待機表示等緊輸入。

相當於一個跨應用嘅「靈動島」,睇一眼就知任務跑到邊。

開啟方式:設定 → 外觀 → 寵物→ 揀寵物 → 顯示頭像。

揀咗之後,喺對話框打斜槓,撳寵物,桌面就會顯示寵物。

官方內置 8 隻(Codex 吉祥物、整理鴨 Dewey、火焰精靈 Fireball 等)。

社區寵物去 petdex.crafter.run,幾百隻玩家自製按鍾意數排序。一行指令安裝:

npx petdex install ikun

需要自己整一隻寵物,可以裝 hatch-pet skill,輸入/hatch-pet,文字描述或者上載相片叫 AI 出 9 格動畫精靈圖。

寵物功能用咗一個禮拜真係離唔開。對住代碼兩個鐘已經夠攰,呢個時候見到桌面角落有隻小寵物向你揮手,都幾欣慰。

最後

Claude 模型本身嘅代碼能力到今日仍然係最頂尖水準。

但模型領先 ≠ 產品領先,過去半年佢將太多精力擺喺「剋制」同「安全」上面,

而 OpenAI 就不停咁堆桌面端、堆插件、堆生態、堆細節。

如果模型能力發展到頂嘅時候,產品體驗嘅優勢就會凸顯出嚟。

喺呢方面,openai 比 authoripic 做得好太多。

下一階段,如果模型冇極大嘅提升,我都會繼續將主力擺喺 codex。

如果大家想更系統咁掌握 coding Agent、Obsidian、Skill、Vibecoding 嘅技能,歡迎訂閲我嘅 AI 生產力專欄 + 社羣。跟住就會更新 Obsidian 更詳細系統嘅使用方法,仲有 vibecoding 基礎同 Coding Agent 嘅使用等住更新。

Image

奧特曼之前發文說"Codex 正在經歷它的 ChatGPT 時刻",最近有不少人都感受到這個時刻了。

飛書文檔 - 圖片

我把主力 Agent 從 Claude Code 切到了 Codex 桌面端有一週時間了。

發現 OpenAI 最近發展得像開了掛。5.5模型推出後,  Codex 一天能推好幾個版本,App 端功能一個接一個上:computer use、內置瀏覽器、桌面寵物、image2 圖片生成。Anthropic 這邊呢,限速、封號一套連招把用戶按在地上摩擦。

這篇是我切完之後的真實使用體驗,分享 13 個你用得到的功能。

順便聊聊我對這兩家公司、對 Coding Agent 這條賽道的一些看法。

總的來說,桌面端 Codex 比 Claude Code 操作更簡單,體驗更輸出,GPT 5.5 也確實靠譜,token 還多不少。

1、 Codex 全終端

Codex 產品家族,共有 5 個客戶端:

飛書文檔 - 圖片
  • Codex CLI:終端裏跑,Rust 寫的,啓動快,開發者最愛。

  • Codex APP:macOS / Windows 桌面端,所見即所得,本文詳解它的使用。

  • Codex Web / Cloud:chatgpt.com/codex,雲端跑長任務,掛個 PR review 可以跑一晚上。

  • IDE 插件:VS Code / Cursor / Windsurf,寫代碼現場調用,不用切窗口。

  • Codex SDK:TypeScript 包,自己寫代碼編排 Agent。

Codex App 是把所有能力收在一個圖形界面裏,沒有學習成本,上手就能用。

進入主界面首頁,在對話框裏打/斜槓,就能調用所有插件、skill,或開啓其他功能開關

飛書文檔 - 圖片

其他幾個端,CLI 需要命令行操作有點門檻,Web 適合臨時救火,IDE 插件適合開發,SDK 是給搞二次開發的人。

Anthropic 一直在 CLI 這一個點上死磕,桌面端的 cowork 設計體驗真不如 codex, 處處都有限制,而且  cowork 太費 token 了,倒是網頁端的 claude design 整體設計不錯,但是 plus 給的 token 額度根本不夠用。

2、安裝與登錄

Windows /macOS 在官網下載並安裝:chatgpt.com/codex

安裝後登錄選 Sign in with ChatGPT,瀏覽器授權完就登錄成功了。

最近 codex 加大了風控力度,如果觸發了風控規則,需要手機號碼驗證,可以找個接碼方式解決,在鹹魚上有。

飛書文檔 - 圖片

關於配額,ChatGPT Plus / Pro / Business / Enterprise 自帶 Codex 配額,不用額外付費。

Plus  5 小時一輪,總體感覺比 claude 的額度要多一些。。重度使用上 Pro,或者走國內中轉配置 API 也行。

CLI 已經登過的話,App 直接複用同一套登錄態,免登錄。

這點比 Claude Code 多端各自登錄順手太多

產品設計上 openai 像是產品經理在主導,而 claude 像是工程師在主導,帶來了不一樣的用戶體驗。

3、從 Claude Code 一鍵遷移
飛書文檔 - 圖片

這個功能,OpenAI 就是來搶 Claude Code 的用戶的,遷移工具內嵌在 APP 裏。

操作路徑:設置 → General → Import other agent setup → Import

飛書文檔 - 圖片

遷移覆蓋範圍:

  • 指令文件 CLAUDE.md 自動轉成 AGENTS.md
  • 配置文件 settings.json 自動轉成 config.toml
  • Skills 、MCP 服務器配置
  • 過去 30 天的會話歷史
  • Hooks
  • 子 Agent 設定

遷完重點查 4 項:

  • Skill 和 Agent 裏的工具權限設置。
  • 自定義認證 / 環境變量的 MCP 配置(密鑰不會自動遷,得重填)。
  • 行為可能變的 Hooks。
  • 依賴參數 / 文件路徑的 Prompt 模板。

主要是密鑰和路徑需要手填,業務邏輯都幫轉好了,半個小時就能完成全套切換。

4、模型選擇

主界面右下角是模型選擇器,下拉切換。我的日常配比:

飛書文檔 - 圖片
  • GPT-5.5:日常默認。重構、調試、寫測試、知識檢索,token 消耗比 Opus 4.6 還省。
  • GPT-5.4:要 1M 上下文 / 跑 computer use 時可以切它。比如讓它讀完整個代碼架構總結,5.5 的 400K 裝不下,5.4 才行。
  • GPT-5.4-mini:額度緊張時 Codex 會主動問要不要降,子任務、掃代碼庫、做長上下文壓縮用它,便宜快。
  • GPT-5.3-Codex:要"幾乎實時反饋"的小改動場景。比如改 Tailwind 類名、調 prop 類型這種活,秒回。

有一點比較好,APP 在額度快炸的時候會主動彈"要不要降一檔",跟手機省電模式一樣。

Claude Code 是直接彈"5 小時後再來",體驗差了一截。

使用CC switch 也可以自定義模型 API 在 codex 使用。

5、Git 管理

APP 把 git 工作流做進了側邊欄,不用再開終端敲命令行推送代碼了。

飛書文檔 - 圖片

常用流程:

  • 項目 → 選擇本地文件夾,自動識別 git 倉庫
  • 改完代碼 APP 頂部"提交"按鈕亮起,寫 commit message 直接提
  • 配好 GitHub 遠程倉庫後"推送"按鈕可點,一鍵 push
  • 拉 PR 到側邊欄,review 評論、diff、行內回覆都能看
  • 讓 Codex 針對 review 評論改代碼、再自我檢查、再推

具體能用上的場景:

  • 寫完一個 feature,讓 Codex 把 commit 拆成幾個小的,每個寫好 message。
  • review 別人的 PR,讓 Codex 先用人話總結改了啥、有沒有風險點。
  • 合併衝突的時候讓它自己解,比手動 vimdiff 快十倍。

整個過程不離開 APP 一次。Claude Code 這邊永遠要切回終端,繁瑣了不止一星半點。

6、MCP:把外部軟件接進來

MCP 在 Codex APP 裏走圖形化配置,不用手寫 JSON。

設置 → Plugins / MCP → 添加服務器 → 填命令、參數、env。

飛書文檔 - 圖片

常見的 MCP :GitHub、Linear、Postgres、飛書、Notion、Slack、Sentry。

裝完在對話裏直接@github拉 issue、@linear查 ticket、@postgres查 SQL 結果,Codex 自動調用對應工具。

MCP 這個協議是 Anthropic 提的,但把它做成普通用戶也能用的形態,反倒是 OpenAI 先這麼做了。

7、Skills:工作流

Codex 裏 Skills 有自己的設置面板,比 Claude Code 的 .md 文件清爽。

飛書文檔 - 圖片

安裝方式:插件 → 技能/Skills → 管理/創建。

或者在對話裏/skill 名直接調。

也可以直接在項目根目錄複製粘貼你的 skill 到.codex/skills/your-skill/,結構和 Claude Code 幾乎一致。

8、插件市場:APP 走向超級應用的關鍵
飛書文檔 - 圖片

插件市場是 APP 端最近改動最大的模塊。Plugins → Marketplace,分類裏有:

  • 編程類:GitHub、CircleCI、CodeRabbit、Atlassian Rovo、GitLab Issues。
  • 設計類:Figma 集成,把設計稿直接搬進對話。
  • 生活方式類:任務、日程、筆記。
  • 自定義遠程插件:自家公司的內部 Agent 也能掛上去。

實際場景舉兩個:

  • 裝 CodeRabbit 插件後,PR 自動出第一輪 AI review,我只看它標紅的幾條,省一半時間。

  • 裝 Figma 插件後,對話框扔一個 Figma 連結,Codex 自己讀節點結構、出 React 組件代碼,比拷截圖準多了。

裝插件的體驗跟手機 App Store 一樣,搜、裝、開權限。

這是 Codex 走向"超級 APP"最關鍵的一步,奧特曼一直心心念唸的第二個超級 App,應該就是 Codex 無疑了。不再需要為不同任務切不同工具,這件事本身就是巨大的護城河。

9、Computer Use:讓 Codex 接管電腦

GPT-5.4 起的原生能力,目前 Codex 獨佔。

設置 → Features → Computer Use 打開。

在對話框裏選擇插件——電腦,輸入你想做的事情,比如幫我在備忘錄記下我今天用 codex 做了什麼

飛書文檔 - 圖片

第一次用會請求屏幕錄製和輔助功能權限,授權後讓 Codex 就能按你的要求操作電腦了。

10、內置瀏覽器:邊寫代碼邊看效果

APP 裏直接開瀏覽器標籤頁。

具體用法:

  • 讓 Codex 直接預覽本地啓動的 dev server(localhost:3000),改完代碼熱更新,它自己看截圖判斷。
  • 復現視覺 bug 時截圖丟回對話讓它改 CSS,整個迴路在 APP 裏閉環。
  • 讓 Codex 打開真實網站做數據抓取,比如"打開這個小紅書頁,把所有筆記內容抓下來存 csv"。

改前端代碼最爽的就是:一邊對話框讓 Codex 改組件,一邊內置瀏覽器開 dev server,肉眼對比,效率翻倍。

11、自動化:定時喚醒線程

設置 → Automations,輸入自動化要求,選擇項目、執行頻率,就能讓某個對話線程按計劃自動跑。

飛書文檔 - 圖片

舉例:

  • 每天早上 9 點讓某個線程"檢查我的 GitHub 通知,把 review 請求列出來發到飛書"。
  • 每週五自動跑一次"掃描這周的 commit,寫個研發週報"。
  • 每天 8 點跑一次"看看昨天的播客更新,挑三條總結到 obsidian"。

配合/goal持久化目標,相當於把"半自動任務編排器"內置進了 Codex。

12、image2 圖片生成

Codex APP 集成了 OpenAI 的 image2 模型,對話裏直接出圖,不用切 ChatGPT 網頁版。

直接說"畫個 XXX"或者"按這個截圖風格生成一張 banner",幾秒出圖。

我用得最多的場景:

  • 寫技術文檔時順手出配圖
  • 批量出小紅書封面 / 公眾號頭圖。

就像這篇文章的配圖都是 codex 用的批量出圖 skill 製作的。

飛書文檔 - 圖片
13、桌面寵物:花裏胡哨但真上頭

5 月 2 日上的功能。Anthropic 之前的 Buddy 就是寵物的 功能,OpenAI 改進這個寵物功能。

桌面懸浮一隻像素風小寵物,實時反映 Codex 工作狀態。

飛書文檔 - 圖片

撓頭表示忙、揮手錶示幹完了、待機表示在等輸入。

相當於一個跨應用的"靈動島",瞥一眼就知道任務跑到哪。

開啓方式:設置 → 外觀 → 寵物→ 選擇寵物 → 顯示頭像。

選擇後,在對話框打斜槓,點擊寵物,桌面就顯示寵物了。

官方內置 8 只(Codex 吉祥物、整理鴨 Dewey、火焰精靈 Fireball 等)。

社區寵物去 petdex.crafter.run,幾百只玩家自制按喜歡數排序。一行命令安裝:

npx petdex install ikun

需要自己造一隻寵物,可以裝 hatch-pet skill,輸入/hatch-pet,文字描述或者上傳照片讓 AI 出 9 幀動畫精靈圖。

寵物功能用了一週真離不開。盯着代碼兩小時已經夠累了,這個時候看到桌面角落有隻小寵物衝你揮手,還是挺欣慰的。

最後

Claude 模型本體的代碼能力到今天仍然是最頂尖水準。

但模型領先 ≠ 產品領先,過去半年它把太多精力花在了"剋制"和"安全"上,

而 OpenAI 在不停地堆桌面端、堆插件、堆生態、堆細節。

如果模型能力發展到頂的時候,產品體驗的優勢就凸顯出來了。

在這方面,openai 的是比 authoripic 做的要好的多。

下一階段,模型沒有極大的提升的話,我還是會把主力放 codex 。

如果大家想要更系統的掌握 coding Agent、Obsidian、Skill、Vibecoding 的技能,歡迎訂閲我的 AI 生產力專欄+社羣。接下來就要更新 Obsidian 更詳細系統的使用、還有 vibecoding 基礎和 Coding Agent 的使用待更新。

Image