來自 Codex 官方團隊的分享:如何把 Codex 用到極致

作者:寶玉AI
日期:2026年5月21日 上午7:47
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Codex唔再只係寫Code工具,透過持久對話、語音、自動化等功能,進化成全能AI助手,能夠完成從指令到審查嘅完整工作流

整理版摘要

呢篇文章係由Codex官方團隊嘅成員jason(@jxnlco)所寫,原文分享點樣將Codex用到最盡。佢指出大多數開發者只係用Codex嚟寫程式碼,但其實Codex可以做好多其他嘢,例如執行終端命令、瀏覽網頁、調用API、導出文檔等。隨住Codex新特性嘅推出,佢已經唔再係一個單純嘅編程助手,而係進化成一個可以幫你處理各種電腦工作嘅全能打工人。

作者詳細介紹咗幾個關鍵功能:持久對話流可以長期記住工作上下文,置頂對話流令你可以快速切換;語音輸入方便捕捉模糊想法;任務幹預同任務排隊令你可以喺任務執行中途打斷或安排下一步;工具擴展包括browser、chrome、computer同MCP服務器,令Codex可以接觸到代碼庫以外嘅地方;自動化功能可以定時或者喺對話流中自動推進工作;目標設定需要一個可量化嘅成功標準,否則只係許願。

側邊欄令你可以原地審查生成嘅文件,唔使切換軟件;共享記憶透過Obsidian知識庫或者AGENTS.md文件,將重要上下文持久化,打破單次聊天限制。總括而言,Codex已經可以承擔一個完整工作流:從聽取指令、執行任務到最終審查,而且唔侷限於代碼庫。呢啲功能組合起嚟,令Codex變成一個真正嘅全能助手。

  • 持久對話流可以長期保存工作上下文,置頂對話流(Command-1至9)快速切換,適合反覆推進嘅任務。
  • 語音輸入捕捉原始想法,配合任務幹預(中途糾正)同任務排隊(安排後續),實現流暢嘅人機協作。
  • 工具觸角擴展:$browser審查網頁、@chrome用登錄狀態、@computer操控桌面GUIMCP服務器連接外部工具。
  • 對話流自動化可以定時查崗並自動推進工作直到條件滿足;目標設定需要可量化驗證器(如測試用例)先有意義。
  • 側邊欄原地審查文件,共享記憶透過Obsidian知識庫或AGENTS.md文件持久化上下文,確保重要資訊唔會流失。
值得記低
連結 developers.openai.com

Codex新特性(持久對話流等功能)

官方文檔介紹Codex嘅新功能

連結 developers.openai.com

MCP工具連接器

讓Codex安全連接本地數據同工具

連結 developers.openai.com

自動化功能

設定定時或對話流自動化

連結 developers.openai.com

記憶功能

Codex嘅內置記憶系統,記住個人偏好同工作流

整理重點

持久對話流與語音輸入

持久對話流

Codex嘅核心功能,可以喺多次使用之間保留工作上下文,唔使每次從頭開始。

置頂對話流可以透過 Command-1Command-9 快速切換,瞬間回到保存好嘅專屬對話流。

語音輸入方面,Codex內置咗語音功能,特別適合捕捉模糊嘅想法。

語音輸入可以捕捉未經修飾嘅原始念頭,保留猶豫語氣同強調重點。

錄音轉寫亦都一樣有用,一份未經修飾嘅會議記錄比簡短總結更有價值。

整理重點

任務幹預、排隊與工具擴展

Codex執行任務時,你可以中途打斷佢(任務幹預)嚟糾正方向,或者將新任務排隊等佢做完再處理(任務排隊)。

任務幹預喺發現AI跑偏時特別有用,例如即時糾正「呢個元素間距唔啱」。

任務排隊可以安排後續步驟,例如「做完之後將預覽連結發去Slack」。

工具擴展方面,Codex嘅觸角可以延伸至多個領域。

$browser、@chrome、@computer同MCP服務器分別對應唔同場景。

  • $browser:喺側邊欄內運行瀏覽器,審查網頁同做標記
  • @chrome:獲取Chrome登錄狀態,處理需要賬號嘅工作流
  • @computer:專治只能透過桌面GUI完成嘅任務
  • MCP服務器:將能力延伸到Slack、電郵等外部工具
整理重點

自動化與目標設定

自動化功能分兩種:定時自動化適合每日從零開始嘅任務;對話流自動化則係一種心跳機制,會定期返去同一個對話流繼續工作,直到滿足條件為止。

對話流自動化可以設為每30分鐘檢查一次SlackGmail,幫你排優先級,等你返到電腦前時背景資料已經收集好。

目標設定需要

驗證器

嚟判斷進度。常用驗證器有

  1. 1 完整的測試用例
  2. 2 基準性能測試
  3. 3 能穩定復現的Bug
  4. 4 驗證矩陣
  5. 5 端到端工作流必須始終跑通
整理重點

側邊欄與共享記憶

側邊欄令你可以喺對話框旁邊直接審查生成嘅文件,包括代碼、幻燈片、PDF、表格等。

側邊欄支援四種操作:檢查生成文件、標註修改點、操作網頁界面、審查代碼變更。

共享記憶方面,你可以透過

Obsidian知識庫

AGENTS.md

嚟管理長期上下文。

  • AGENTS.md可以教Codex:將~vault當作長期工作記憶
  • 唔好亂改知識庫文件,除非有實質進展
  • 記錄做過嘅決定、卡點、負責人、日期同有用連結

作者:jason (@jxnlco)
原文:Getting the most out of Codex[1]

大部分開發者啱啱接觸代碼編輯類嘅AI智能體 (AI Agent) 嗰陣,通常都淨係叫佢做一件事:寫代碼。例如叫佢檢查下個代碼庫,生成一個差異對比 (diff),跑下測試,然後再提一個合併請求 (pull request)。

寫代碼的確仲係 Codex 嘅核心強項。但係諗真啲,我哋喺電腦上面做嘅大部分工作,本質上其實都同代碼有關:執行終端命令、瀏覽網頁、調用應用程式接口、導出文檔、響應各種事件,或者係觸發自動化流程。當 Codex 開始延伸到呢啲領域嗰陣,佢俾人嘅感覺就唔再淨係一個狹義上嘅「編程助手」咁簡單,而係進化成一個可以幫你搞掂各種電腦工作嘅「全能打工人」。

Codex 嘅新特性[2] 令到呢種轉變變得觸手可及。而家嘅對話流 (thread) 可以記低你哋嘅上下文、調用各種工具、展示生成嘅文件 (artifacts),仲可以喺唔同嘅提示詞之間無縫銜接,唔使再每次傾完都「重新認識」一次。

想徹底榨乾 Codex 嘅潛能,你要將下面呢啲絕招組合埋一齊用:

  • • 能夠長期保存記憶嘅「持久對話流 (durable threads)」
  • • 喺你掌控全局嘅時候,靈活使用語音輸入、任務幹預 (steering) 同任務排隊 (queuing)
  • • 藉助瀏覽器、電腦操控 (computer-use)、模型上下文協議伺服器 (MCP servers, 一種令 AI 安全連接本地數據同工具嘅通用標準) 以及各類連接器,令 Codex 嘅手伸到代碼庫以外嘅地方
  • • 當你離開電腦嘅時候,利用對話流自動化 (thread automations) 同目標驅動 (Goals) 等佢繼續搬磚
  • • 熟練使用側邊欄 (side panel),隨時審查佢生成嘅代碼、文檔、幻燈片同其他文件

持久對話流 (Durable threads)

持久對話流:可以長時間運行嘅 Codex 對話流,可以喺你多次使用嘅過程中,始終為你保留工作上下文。

將對話流「置頂 (Pinned threads)」係令呢啲持久對話隨叫隨到嘅好方法。呢個對於嗰啲需要反覆推進嘅工作流嚟講簡直係神器,例如:

  • • 一個專屬嘅「幕僚長」對話流(幫你處理日常雜務)
  • • 一個專門負責產品發佈嘅對話流
  • • 一個負責審查文檔嘅對話流
  • • 一個專門睇住外部數據嘅監控對話流

佢哋唔係嗰種傾完即焚嘅閒聊框,而係持久嘅工作空間。隨住時間過去,Codex 可以隨時返到呢啲對話入面,佢會記得你之前做過嘅決定、你嘅個人偏好同埋當前嘅進度。如果冇呢個功能,你每次都要從零開始將呢啲背景資料重新餵俾佢。

置頂快捷鍵令到呢個操作變得極為實用。只要㩒 Command-1 到 Command-9,你就可以瞬間穿越返去呢啲保存好嘅專屬對話流入面繼續工作。

語音輸入 (Voice input)

語音輸入之所以好用,係因為佢能夠喺你將想法斟酌字句打曬做文字之前,先將你腦入面最原始、最粗糙嘅念頭捕捉落嚟。

Codex 內置咗語音輸入功能。呢個對於嗰啲「把口講得清楚,打字嫌麻煩」嘅模糊想法特別有用。例如:

「我記得有個叫 Ben 嘅人喺 Slack 度提過呢件事。
細節我唔記得咗。
你去幫我揾下。」

對於一個會自己搜索、收集上下文並向你匯報嘅AI智能體嚟講,呢幾句說話就足夠佢開工。

當你腦入面有一個大概嘅想法,但係仲未完全成形嗰陣,花兩三分鐘對住佢「碎碎念」,將思緒一嘢倒曬出嚟,效果都出奇咁好。

錄音轉寫都係同一道理。一份未經修飾嘅會議記錄,或者一段口述嘅計劃草案,好多時比一份簡短嘅總結更有價值。因為嗰啲粗糙嘅記錄入面,保留咗你猶豫嘅語氣、強調嘅重點,以及嗰啲仲未講完嘅靈光一現。

任務幹預與排隊 (Steering and queuing)

當你將語音輸入同對運行中任務嘅直接控制結合埋一齊嗰陣,佢嘅威力先至真正顯現出嚟。

當一個任務正在執行嘅時候,如果你想

任務幹預 (Steering):喺當前任務仲未完成嘅時候,中途打斷 Codex 並俾佢指引新嘅方向。

當你發現 AI 走錯路,需要喺佢撞牆之前糾正佢嘅話,呢個功能就派上用場。例如,喺叫佢審查網站嗰陣,你可以一邊喺側邊欄度指指點點,一邊直接開口打斷佢嘅工作:

  • • 「將呢個整細啲」
  • • 「呢兩個元素之間嘅間距睇落唔多妥」
  • • 「呢句文案寫錯咗」

任務排隊 (Queuing):喺 Codex 完成當前步驟之後,俾佢安排接下來嘅工作。

任務排隊就唔同啲。佢唔會打斷緊進行嘅任務,而係將新任務排喺隊尾。你可以咁樣同佢講:

「等呢單嘢搞掂之後,將預覽連結 send 去 Slack 俾審核人睇下。」

簡單講,「幹預」係改變 Codex 而家做緊嘅事,而「排隊」係安排佢之後要做嘅事。呢兩個功能都可以令你喺任務執行嘅過程中,始終保持一種「人機合一」嘅掌控感。

工具與觸達範圍 (Tools and reach)

當一個對話流有咗連續嘅記憶之後,下一個問題就係:佢可以掂到啲咩?Codex 嘅觸角可以向外一層層延伸:

  • • $browser[3] 喺側邊欄入面運行嘅應用內瀏覽器,Codex 可以喺呢度審查網頁並喺上面做標記。
  • • @chrome[4] 可以攞到你瀏覽器嘅登入狀態,用嚟處理嗰啲基於 Chrome 嘅工作流。
  • • @computer[5] 專治嗰啲淨係可以透過桌面圖形界面 (GUI) 嚟完成嘅任務。

$browser 適合喺側邊欄做網頁審查;@chrome 適合嗰啲需要你帳號登入狀態嘅瀏覽器內工作;而 @computer 就用嚟搞掂嗰啲淨係可以喺電腦桌面度㩒嚟㩒去做嘅任務。

MCP 伺服器同各類連接器將呢種能力進一步延伸到你嘅整個工作流入面。Slack 集成[6]、以及各種 MCP 工具連接器[7] 同 MCP 指南[7] 之所以重要,係因為好多關鍵任務喺變成代碼之前,最初好多時只係一條聊天訊息、一封 inbox 裏面嘅電郵,或者一個日程安排問題。

技能 (Skills) 令到嗰啲重複嘅工作流可以反覆利用。一旦某個工作流被證明好用,你可以將佢固化做技能[8],咁樣 Codex 下次就可以直接行通,而唔使從頭開始重新學習呢個流程。

隨時隨地工作 (Work from anywhere)

隨時隨地與 Codex 協同工作[9] 嘅理念,徹底打破咗我哋「一定要坐喺電腦前面先做到嘢」嘅傳統限制。一個任務可以喺你裝滿文件、權限同本地環境嘅 Mac 電腦上啟動,然後當你離開位用手機睇嗰陣,佢依然喺度默默推進。

呢個喺好多碎片時間入面好有用。你可以叫 Codex 喺電腦度行一個好耐嘅任務,然後自己離開位去飲杯咖啡。如果喺出面嘅時候佢有問題問你,你可以直接用手機回覆、批准佢嘅下一步行動,或者喺返位之前就俾佢指派新嘅方向。你嘅本地環境安安靜靜噉喺度做嘢,而你個人就可以自由走動。

自動化 (Automations)

自動化功能[10] 可以令 Codex 按照你設定嘅時間表自動做嘢。如果係需要每日從零開始嘅任務,例如生成日報或者例行檢查代碼庫,就用「定時自動化 (scheduled automation)」。但如果需要喺一個帶有歷史記憶嘅對話入面繼續推進工作,就用「對話流自動化 (thread automation)」。

對話流自動化:就好似一種定時喚醒嘅「心跳」機制,佢會按照設定嘅時間表,定期返去同一個 Codex 對話流入面繼續工作。

將對話流置頂固然好用,但佢畢竟仲要等你主動返去揾佢。而「對話流自動化」就可以每隔幾分鐘或幾小時自己去睇下,一直跑到滿足某個條件為止,甚至仲可以根據情況自己調整檢查嘅頻率。

例如,你嘅「幕僚長」對話流可以每 30 分鐘行一次:

每 30 分鐘,去睇下我嘅 Slack 同 Gmail 裏面有冇需要處理但係未覆嘅訊息。
幫我排個優先級。
如果有人向我提問,盡可能深入咁去揾資料,然後幫我起草一份回覆,但唔好直接 send 出去。

當你返到電腦前面嗰陣,嗰啲最花時間嘅「收集背景資料」工作好多時已經做完咗。作為人類,你淨係需要做最後拍板 send 出去嘅決定。

對話流自動化都好啱用嚟處理「反饋循環」。佢可以默默噉睇住你喺代碼合併請求、Google 文檔或者 Slack 裏面嘅評論,趁你唔喺度嘅時候自動推進後續嘅修改工作。

想像一個製作動畫嘅場景:審核人喺 Slack 度 send 咗一個影片。對話流自動化可以定時檢查討論進度,一旦有修改意見入嚟,佢就自動渲染一個新版本,然後喺原 post 度 @ 審核人並回覆新影片。如果某個軟件嘅集成接口冇辦法自動完成最終嘅 upload,佢甚至可以調動「電腦桌面自動化」透過圖形界面將最後一步搞掂。

呢個完整嘅閉環跨越咗接收反饋嘅 Slack、負責渲染嘅代碼庫,以及負責最終 upload 嘅桌面自動化工具。

目標設定 (Goals)

當一個任務有一條清晰嘅終點線,並且 AI 智能體可以不斷向住嗰個終點努力嘅時候,目標 (Goals) 嘅威力就徹底爆發。

目標:運行時間更長嘅 Codex 任務,有一條明確嘅終點線,AI 會喺一段時間內持續向佢衝刺。

一個差嘅目標係咁樣定嘅:

將呢個 Markdown 文件裏面嘅計劃實現出嚟。

一個好嘅目標必須有一個可以被衡量嘅成功標準。

例如,一位工程師想將一個內部工具由 Python 語言搬去 Rust 語言,佢可以起好新目錄,設定好目標,並畫一條明確嘅終點線:

直到所有單元測試全部通過,呢個新版本嘅開發先算完成。

目標設定,其實就係將「持續執行」同「驗證器 (verifier)」結合埋一齊。你作為人類嚟定義想要嘅結果、幾時停嘅條件,以及用嚟判斷 Codex 有冇離終點更近嘅信號。

好用嘅驗證器包括:

  • • 一套完整嘅測試用例
  • • 一項基準性能測試
  • • 一個可以穩定重現嘅 Bug
  • • 一個驗證矩陣
  • • 一個必須始終行得通嘅端到端工作流

有野心固然重要,但冇驗證機制嘅野心,就只係喺度許願咋。

側邊欄 (The side panel)

側邊欄功能[11] 令你生成嘅工作成果始終同你哋嘅聊天窗口並排喺一齊。你再唔使將文件導出嚟,然後痛苦咁喺唔同軟件之間切來切去,直接喺原位就可以審查。生成嘅成果可能係代碼,但都可能係幻燈片、PDF 文件、網頁、表格,或者任何其他生成嘅嘢。

佢特別擅長處理四種工作:

  1. 1. 檢查生成文件 (artifacts)
  2. 2. 標註需要修改嘅地方
  3. 3. 操作網頁界面
  4. 4. 審查代碼或文件嘅變更

側邊欄容許用戶直接喺原地睇 Markdown 文檔、電子表格、數據表、普通文檔同幻燈片。你可以唔打斷現有嘅工作流,直接檢查、做標記、修改文件。

圖片

你嘅幻燈片或 PDF 就乖乖噉打開喺對話框旁邊,隨時等你檢閲同修改。

圖片

應用內瀏覽器[3] 令 Codex 可以直接檢查渲染好嘅網頁,控制佢,甚至直接回應你喺網頁上做嘅標註。對網頁或文件嘅評論全部留喺呢個工作閉環入面,唔使再好似以前噉將佢拆開做一個個單獨嘅交接任務。

網頁既變成咗佢嘅輸出結果,亦變成咗你可以操控嘅控制面板。Codex 可以起好一個頁面,喺側邊欄打開佢,自己檢查佢,修 Bug,然後原地不斷迭代優化同一個嘢。

圖片

下面呢啲場景配合側邊欄尤其好用:

  • • 用單個 index.html 嚟做輕量級嘅靜態展示
  • • 行 Storybook 嚟審查用戶界面 (UI) 組件
  • • 用 Remotion Studio 搞代碼生成嘅動畫
  • • 喺瀏覽器裏面放映嘅幻燈片演示
  • • 用於數據分析流嘅數據應用 (data apps)

一個簡簡單單嘅 index.html 文件就可以變成一個好玩嘅交互式小應用,連伺服器都唔使搭。而且,對話流自動化仲可以隨住時間悄悄噉更新呢啲靜態文件,咁等你返嚟嗰陣,總會見到最新嘅進展喺度等你。

共享記憶 (Shared memory)

當嗰啲長時間運行嘅對話流可以打破單次聊天嘅界限,將記憶共享出去嗰陣,佢哋嘅作用將會發生質嘅飛躍。

共享記憶 (Shared memory):存儲喺單一對話之外嘅持久上下文,佢可以令未來嘅工作可以基於一啲明確嘅、可追溯嘅信息繼續推進。

一個相對穩妥嘅做法係,將呢啲持久嘅對話流「錨定」喺一個 Obsidian 知識庫 (vault) 入面。講白啲,就係起一個存放純文本文件嘅文件夾。佢簡單直白,方便你隨時睇、修改、移動,而且可以保存好耐。團隊可以將呢個文件夾放喺任何你哋鍾意嘅雲盤入面,例如 Git、Dropbox、Google Drive 或者其他同步工具。

你嘅知識庫可能會係噉樣:

vault/
├── TODO.md
├── people/
├── projects/
├── agent/
└── notes/

喺最外層目錄下,你可以放一個 AGENTS.md 文件。喺呢度,你可以同 Codex 定規矩:當佢瞭解到關於人員、項目、決策以及待辦事項嘅新情況嗰陣,應該點樣更新呢個知識庫。

唔好死板咁抄某一種知識庫結構。你需要做嘅係「教」你嘅 AI 智能體:嗰啲持久嘅上下文應該放喺邊,邊啲上下文需要保留,以及幾時唔好亂咁改文件。

一份實用嘅 AGENTS.md 指南入面可以咁寫:

  • • 把 ~/vault 當你長期嘅工作記憶區。
  • • 盡量將筆記整理得有條理,唔好搞到成日都碎片記錄。
  • • 準確咁將待辦事項、人員、項目、每日總結同草稿分類放好。
  • • 將做過嘅決定、遇到嘅卡點、負責人、日期同有用嘅連結好好保存落嚟。
  • • 如果冇咩實質性嘅新進展,唔好隨便修改知識庫裏面嘅文件。

代碼庫係用嚟存代碼嘅。而呢個知識庫,係用嚟存不斷滾動嘅上下文嘅:牽涉到邊啲人、改咗啲咩、卡喺邊度、接下來邊個跟進,以及嗰啲如果喺兩次聊天中間斷咗就會徹底消失嘅細節。

重要嘅上下文絕對唔應該淨係鎖死喺某一次聊天嘅文字記錄入面。將佢哋寫落嚟,放喺下一個對話流可以即刻接手嘅地方。

Codex 自己都喺 設置 > 個性化 > 記憶 度提供官方嘅 記憶功能[12]。佢哋就好似系統自帶嘅本地記事本,用嚟記低你嘅個人偏好、常用嘅工作流同埋一啲成日踩嘅坑。不過,呢個功能係用嚟輔助你清晰寫落嚟嘅上下文嘅,而唔係取代佢。Chronicle 記憶組件[13] 都係同一道理,佢可以幫 Codex 由你最近屏幕上發生嘅嘢入面提取並構建記憶。

從代碼向外延伸 (From code outward)

Codex 雖然仲係以寫代碼為本行起家,但係而家,圍繞代碼嘅諸多周邊工作,都可以喺呢個同一套系統入面搞掂:無論係 MCP 伺服器、網頁界面、電腦桌面控制、對話流自動化,定係嗰啲可以喺側邊欄直接審查嘅文件。

咁徹底改變咗我哋控制佢嘅方式。「任務幹預」可以喺中途打斷佢嘅動作;「任務排隊」可以幫佢安排好下一步;「對話流自動化」可以令你人唔喺場嗰陣系統依然運轉;而「目標設定」就俾佢畫咗一條清晰嘅終點線,令 Codex 知道要一直向邊度衝。

而家嘅 Codex 已經可以孭起一個完整嘅工作流:由聽取指令、執行任務,一直到最終文件嘅審查。就算呢啲工作一早已經超出咗代碼庫嘅範圍,佢依然遊刃有餘。

引用連結

[1] Getting the most out of Codex: https://x.com/jxnlco/status/2057153744630890620
[2] Codex 嘅新特性: https://developers.openai.com/codex/app/features/
[3] $browser: https://developers.openai.com/codex/app/browser
[4] @chrome: https://developers.openai.com/codex/app/chrome-extension
[5] @computer: https://developers.openai.com/codex/app/computer-use
[6] Slack 集成: https://developers.openai.com/codex/integrations/slack
[7] MCP 工具連接器: https://developers.openai.com/api/docs/guides/tools-connectors-mcp
[8] 固化為技能: https://developers.openai.com/codex/skills
[9] 隨時隨地與 Codex 協同工作: https://openai.com/index/work-with-codex-from-anywhere/
[10] 自動化功能: https://developers.openai.com/codex/app/automations
[11] 側邊欄功能: https://developers.openai.com/codex/app/features
[12] 記憶功能: https://developers.openai.com/codex/memories
[13] Chronicle 記憶組件: https://developers.openai.com/codex/memories/chronicle

作者:jason (@jxnlco)
原文:Getting the most out of Codex[1]

大多數開發者剛接觸代碼編輯類的 AI 智能體 (AI Agent) 時,通常只讓它們幹一件事:寫代碼。比如讓它檢查一下代碼庫,生成個差異對比 (diff),跑跑測試,然後再提個合併請求 (pull request)。

寫代碼確實依然是 Codex 的核心強項。但仔細想想,我們在電腦上做的大部分工作,本質上其實都和代碼息息相關:執行終端命令、瀏覽網頁、調用應用程序接口、導出文檔、響應各種事件,或者是觸發自動化流程。當 Codex 開始延伸到這些領域時,它給人的感覺就不再只是一個狹義上的“編程助手”了,而是進化成了一個能幫你搞定各種電腦工作的“全能打工人”。

Codex 的新特性[2] 讓這種轉變變得觸手可及。現在的對話流 (thread) 可以記住你們的上下文、調用各種工具、展示生成的文件 (artifacts),還能在不同的提示詞之間無縫銜接,再也不用每次聊完都“重新認識”一遍了。

想要徹底榨乾 Codex 的潛能,你需要把下面這些絕招組合起來用:

  • • 能夠長期保存記憶的“持久對話流 (durable threads)”
  • • 在你掌控全局時,靈活使用語音輸入、任務干預 (steering) 和任務排隊 (queuing)
  • • 藉助瀏覽器、電腦操控 (computer-use)、模型上下文協議服務器 (MCP servers, 一種讓 AI 安全連接本地數據和工具的通用標準) 以及各類連接器,讓 Codex 的手伸向代碼庫之外的地方
  • • 當你離開電腦時,利用對話流自動化 (thread automations) 和目標驅動 (Goals) 讓它繼續搬磚
  • • 熟練使用側邊欄 (side panel),隨時審查它生成的代碼、文檔、幻燈片和其他文件

持久對話流 (Durable threads)

持久對話流:可以長時間運行的 Codex 對話流,能在你多次使用的過程中,始終為你保留工作上下文。

把對話流“置頂 (Pinned threads)”是讓這些持久對話隨叫隨到的好辦法。這對於那些需要反覆推進的工作流來說簡直是神器,比如:

  • • 一個專屬的“幕僚長”對話流(幫你處理日常雜務)
  • • 一個專門負責產品發佈的對話流
  • • 一個負責審查文檔的對話流
  • • 一個專門盯着外部數據的監控對話流

它們不是那種聊完即焚的閒聊框,而是持久的工作空間。隨着時間的推移,Codex 可以隨時回到這些對話中,它會記得你之前做過的決定、你的個人偏好以及當前的進度。如果沒有這個功能,你每次都得從零開始把這些背景信息重新餵給它。

置頂快捷鍵讓這個操作變得極為實用。只要按下 Command-1 到 Command-9,你就能瞬間穿越回這些保存好的專屬對話流裏繼續工作。

語音輸入 (Voice input)

語音輸入之所以好用,是因為它能在你把想法字斟句酌地敲成文字之前,先把你腦子裏最原始、最粗糙的念頭捕捉下來。

Codex 內置了語音輸入功能。這對於那些“嘴上說得清,打字嫌麻煩”的模糊想法特別管用。比如:

“我記得有個叫 Ben 的人在 Slack 上提過這事兒。
細節我忘了。
你去幫我找找看。”

對於一個會自己搜索、收集上下文並向你彙報的 AI 智能體來說,這幾句話就足夠它幹活了。

當你腦子裏有一個大概的想法,但還沒完全成型時,花兩三分鐘對着它“碎碎念”,把思緒一股腦倒出來,效果也出奇的好。

錄音轉寫也是同樣的道理。一份未經修飾的會議記錄,或者一段口述的計劃草案,往往比一份簡短的總結更有價值。因為那些粗糙的記錄裏,保留了你猶豫的語氣、強調的重點,以及那些還沒講完的靈光一現。

任務干預與排隊 (Steering and queuing)

當你把語音輸入和對運行中任務的直接控制結合起來時,它的威力才真正顯現出來。

當一個任務正在執行時,如果你想

任務干預 (Steering):在當前任務還沒完成時,中途打斷 Codex 並給它指引新的方向。

當你發現 AI 跑偏了,需要在它撞南牆之前糾正它時,這個功能就派上用場了。比如,在讓它審查網站時,你可以一邊在側邊欄上指指點點,一邊直接開口打斷它的工作:

  • • “把這個調小一點”
  • • “這兩個元素之間的間距看着不太對勁”
  • • “這句文案寫錯了”

任務排隊 (Queuing):在 Codex 完成當前步驟後,給它安排接下來的活兒。

任務排隊就不太一樣了。它不會打斷正在進行的任務,而是把新任務排在隊伍後面。你可以這麼跟它說:

“等這活兒幹完之後,把預覽連結發到 Slack 給審核人看看。”

簡單來說,“干預”是改變 Codex 眼下正在做的事,而“排隊”是安排它接下來要做的事。這兩個功能都能讓你在任務執行的過程中,始終保持一種“人機合一”的掌控感。

工具與觸達範圍 (Tools and reach)

當一個對話流有了連續的記憶後,下一個問題就是:它能觸碰到什麼?Codex 的觸角可以向外一層層延伸:

  • • $browser[3] 在側邊欄中運行的應用內瀏覽器,Codex 可以在這裏審查網頁並在上面做標記。
  • • @chrome[4] 可以獲取你瀏覽器的登錄狀態,用來處理那些基於 Chrome 的工作流。
  • • @computer[5] 專治那些只能通過桌面圖形界面 (GUI) 來完成的任務。

$browser 適合在側邊欄做網頁審查;@chrome 適合那些需要你賬號登錄狀態的瀏覽器內工作;而 @computer 則用來搞定那些只能在電腦桌面上點來點去的任務。

MCP 服務器和各類連接器把這種能力進一步延伸到了你的整個工作流中。Slack 集成[6]、以及各種 MCP 工具連接器[7] 和 MCP 指南[7] 之所以重要,是因為很多關鍵任務在變成代碼之前,最初往往只是一條聊天消息、一封收件箱裏的郵件,或者一個日程安排問題。

技能 (Skills) 讓那些重複的工作流可以被反覆利用。一旦某個工作流被證明好用,你可以將它固化為技能[8],這樣 Codex 下次就能直接跑通,而不需要從頭開始重新學習這個流程。

隨時隨地工作 (Work from anywhere)

隨時隨地與 Codex 協同工作[9] 的理念,徹底打破了我們“必須坐在電腦前才能幹活”的傳統限制。一個任務可以在你裝滿文件、權限和本地環境的 Mac 電腦上啓動,然後當你離開工位用手機查看時,它依然在默默推進。

這在很多碎片時間裏非常有用。你可以讓 Codex 在電腦上跑一個耗時很長的任務,然後自己離開工位去喝杯咖啡。如果在外面時它有問題問你,你可以直接用手機回覆、批准它的下一步行動,或者在回座位前就給它指派新的方向。你的本地環境安安靜靜地待在那裏幹活,而你的人卻可以自由移動。

自動化 (Automations)

自動化功能[10] 能讓 Codex 按照你設定的時間表自動幹活。如果是需要每天從零開始的任務,比如生成日報或者例行檢查代碼庫,那就用“定時自動化 (scheduled automation)”。但如果需要在一個帶有歷史記憶的對話中繼續推進工作,那就用“對話流自動化 (thread automation)”。

對話流自動化:就像一種定時喚醒的“心跳”機制,它會按照設定的時間表,定期回到同一個 Codex 對話流中繼續工作。

把對話流置頂固然好用,但它畢竟還得等你主動回去找它。而“對話流自動化”則可以每隔幾分鐘或幾小時自己去查崗,一直跑到滿足某個條件為止,甚至還能根據情況自己調整查崗的頻率。

比如,你的“幕僚長”對話流可以每 30 分鐘跑一次:

每 30 分鐘,去查一下我的 Slack 和 Gmail 裏有沒有需要處理但還沒回的消息。
幫我排個優先級。
如果有人向我提問,儘可能深入地去查資料,然後幫我起草一份回覆,但不要直接發送。

當你回到電腦前時,那些最耗時耗力的“收集背景資料”的工作往往已經做完了。作為人類,你只需要做最後拍板發出去的決定。

對話流自動化也非常適合用來處理“反饋循環”。它可以默默盯着你在代碼合併請求、Google 文檔或是 Slack 裏的評論,趁你不在的時候自動推進後續的修改工作。

想象一個製作動畫的場景:審核人在 Slack 裏發了一個視頻。對話流自動化可以定時檢查討論進度,一旦有修改意見進來,它就自動渲染一版新的,然後在原貼裏艾特審核人並回復新視頻。如果某個軟件的集成接口沒法自動完成最終的上傳,它甚至能調動“電腦桌面自動化”通過圖形界面把最後一步走完。

這個完整的閉環跨越了接收反饋的 Slack、負責渲染的代碼庫,以及負責最終上傳的桌面自動化工具。

目標設定 (Goals)

當一個任務有一個清晰的終點線,並且 AI 智能體可以不斷朝着那個終點努力時,目標 (Goals) 的威力就徹底爆發了。

目標:運行時間更長的 Codex 任務,有一個明確的終點線,AI 會在一段時間內持續向它衝刺。

一個糟糕的目標是這樣定的:

把這個 Markdown 文件裏的計劃實現一下。

一個優秀的目標必須有一個可以被衡量的成功標準。

比如,一位工程師想把一個內部工具從 Python 語言遷移到 Rust 語言,他可以建好新目錄,設定好目標,並畫一條明確的終點線:

直到所有單元測試全部通過,這個新版本的開發才算完成。

目標設定,其實就是把“持續執行”和“驗證器 (verifier)”結合在了一起。你作為人類來定義想要的結果、何時停止的條件,以及用來判斷 Codex 有沒有離終點更近的信號。

好用的驗證器包括:

  • • 一套完整的測試用例
  • • 一項基準性能測試
  • • 一個能穩定復現的 Bug
  • • 一個驗證矩陣
  • • 一個必須始終跑通的端到端工作流

有野心固然重要,但沒有驗證機制的野心,就只是在許願而已。

側邊欄 (The side panel)

側邊欄功能[11] 讓你生成的工作成果始終和你們的聊天窗口並排在一起。你再也不用把文件導出來,然後痛苦地在不同軟件之間切來切去了,直接在原位就能審查。生成的成果可能是代碼,但也可能是幻燈片、PDF 文件、網頁、表格,或者任何其他生成的東西。

它特別擅長處理四種工作:

  1. 1. 檢查生成文件 (artifacts)
  2. 2. 標註需要修改的地方
  3. 3. 操作網頁界面
  4. 4. 審查代碼或文件的變更

側邊欄允許用戶直接原地查看 Markdown 文檔、電子表格、數據表、普通文檔和幻燈片。你可以不打斷現有的工作流,直接檢查、做標記、修改文件。

圖片

你的幻燈片或 PDF 就乖乖敞開在對話框旁邊,隨時等你檢閲和修改。

圖片

應用內瀏覽器[3] 讓 Codex 能夠直接檢查渲染好的網頁,控制它,甚至直接響應你在網頁上做的標註。對網頁或文件的評論全部留在這個工作閉環裏,再也不用像以前那樣把它拆分成一個個單獨的交接任務了。

網頁既變成了它的輸出結果,也變成了你可以操控的控制面板。Codex 可以建好一個頁面,在側邊欄打開它,自己檢查它,修 Bug,然後原地不斷迭代優化同一個東西。

圖片

下面這些場景配合側邊欄尤其好用:

  • • 用單個 index.html 來做輕量級的靜態展示
  • • 跑 Storybook 來審查用戶界面 (UI) 組件
  • • 用 Remotion Studio 搞代碼生成的動畫
  • • 在瀏覽器裏放映的幻燈片演示
  • • 用於數據分析流的數據應用 (data apps)

一個簡簡單單的 index.html 文件就能變成一個好玩的交互式小應用,連服務器都不用搭。而且,對話流自動化還能隨着時間推移悄悄更新這些靜態文件,這樣等你回來時,總能看到最新的進展等着你。

共享記憶 (Shared memory)

當那些長時間運行的對話流能夠打破單次聊天的界限,把記憶共享出去時,它們的作用將發生質的飛躍。

共享記憶 (Shared memory):存儲在單一對話之外的持久上下文,它可以讓未來的工作能夠基於一些明確的、可追溯的信息繼續推進。

一個相對穩妥的做法是,把這些持久的對話流“錨定”在一個 Obsidian 知識庫 (vault) 裏。說白了,就是建一個存放純文本文件的文件夾。它簡單直白,方便你隨時查看、修改、移動,而且能保存很久。團隊可以把這個文件夾放在任何你們喜歡的雲盤裏,比如 Git、Dropbox、Google Drive 或是其他的同步工具中。

你的知識庫可能長這樣:

vault/
├── TODO.md
├── people/
├── projects/
├── agent/
└── notes/

在最外層目錄下,你可以放一個 AGENTS.md 文件。在這裏,你可以給 Codex 定規矩:當它瞭解到關於人員、項目、決策以及待辦事項的新情況時,應該如何更新這個知識庫。

別死板地照抄某一種知識庫結構。你需要做的是“教”你的 AI 智能體:那些持久的上下文該放在哪,哪些上下文需要保留,以及什麼時候不要瞎折騰去改文件。

一份實用的 AGENTS.md 指南里可以這麼寫:

  • • 把 ~/vault 當作你長期的工作記憶區。
  • • 儘量把筆記整理得有條理,別搞得到處都是碎片記錄。
  • • 準確地把待辦事項、人員、項目、每日總結和草稿分類放好。
  • • 把做過的決定、遇到的卡點、負責人、日期和有用的連結好好保存下來。
  • • 如果沒有什麼實質性的新進展,不要隨意修改知識庫裏的文件。

代碼庫是用來存代碼的。而這個知識庫,是用來存不斷滾動的上下文的:牽涉到哪些人、改了什麼、卡在哪裏、接下來誰跟進,以及那些如果在兩次聊天中間斷掉就會徹底消失的細節。

重要的上下文絕不應該僅僅鎖死在某一次聊天的文字記錄裏。把它們寫下來,放在下一個對話流能夠立刻接手的地方。

Codex 自己也在 設置 > 個性化 > 記憶 中提供官方的 記憶功能[12]。它們就像是系統自帶的本地記事本,用來記住你的個人偏好、常用的工作流以及一些經常踩的坑。不過,這個功能是用來輔助你清晰寫下來的上下文的,而不是取代它。Chronicle 記憶組件[13] 也是同樣的思路,它能幫 Codex 從你最近屏幕上發生的事情中提取並構建記憶。

從代碼向外延伸 (From code outward)

Codex 雖然還是以寫代碼為本行起家,但現在,圍繞代碼的諸多周邊工作,都能在這個同一套系統裏搞定了:無論是 MCP 服務器、網頁界面、電腦桌面控制、對話流自動化,還是那些可以在側邊欄直接審查的文件。

這徹底改變了我們控制它的方式。“任務干預”可以在中途打斷它的動作;“任務排隊”可以幫它安排好下一步;“對話流自動化”能讓你人不在場時系統依然運轉;而“目標設定”則給它畫了一條清晰的終點線,讓 Codex 知道要一直往哪裏衝。

如今的 Codex 已經可以扛起一個完整的工作流:從聽取指令、執行任務,一直到最終文件的審查。哪怕這些工作早已經超出了代碼庫的範疇,它也依然遊刃有餘。

引用連結

[1] Getting the most out of Codex: https://x.com/jxnlco/status/2057153744630890620
[2] Codex 的新特性: https://developers.openai.com/codex/app/features/
[3] $browser: https://developers.openai.com/codex/app/browser
[4] @chrome: https://developers.openai.com/codex/app/chrome-extension
[5] @computer: https://developers.openai.com/codex/app/computer-use
[6] Slack 集成: https://developers.openai.com/codex/integrations/slack
[7] MCP 工具連接器: https://developers.openai.com/api/docs/guides/tools-connectors-mcp
[8] 固化為技能: https://developers.openai.com/codex/skills
[9] 隨時隨地與 Codex 協同工作: https://openai.com/index/work-with-codex-from-anywhere/
[10] 自動化功能: https://developers.openai.com/codex/app/automations
[11] 側邊欄功能: https://developers.openai.com/codex/app/features
[12] 記憶功能: https://developers.openai.com/codex/memories
[13] Chronicle 記憶組件: https://developers.openai.com/codex/memories/chronicle