OpenAI工程師親授:8條技巧把codex用到極致!
整理版優先睇
Codex唔止寫Code,係電腦全能Agent:8個技巧用盡佢
呢篇文章係由「噪點」整理自OpenAI工程師Jason嘅官方指南《Getting the most out of Codex》,目標係教用戶點樣將Codex用到極致。作者想解決嘅問題係:大多數人只將Codex當成寫代碼工具,但其實佢已經演化成一個可以處理所有電腦任務嘅全能Agent。整體結論係:透過組合使用8個技巧,你可以將Codex從一個編碼助手變成真正嘅數位工作夥伴,幫你自動化執行命令、瀏覽網頁、管理文件、回覆訊息等各種任務。呢啲技巧涵蓋對話管理、語音輸入、任務糾偏、擴充能力範圍、自動化排程、目標設定、側邊欄即時協作,同埋長期記憶維護。
文章首先指出Codex嘅核心轉變:佢已經唔單止係一個Coding Agent,而係一個能「動手」做任何電腦操作嘅Agent。Jason建議用戶改變使用習慣,將對話窗口由臨時變成永久工作台,用語音代替打字嚟捕捉模糊想法,仲要學會喺任務中途即時糾偏(Steering同Queuing)。另外,Codex嘅能力可以一層層向外延伸:由瀏覽器、Chrome、桌面控制,到MCP伺服器同Skills,令佢可以處理代碼以外嘅工作,例如回覆Email、檢查Slack訊息、生成報告等。
文章進一步強調自動化同目標驗證嘅重要性。你可以設定定時任務或線程自動化(心跳喚醒),等Codex自動幫你監控訊息同排優先級。更重要嘅係,畀Codex一個「強目標」——即係要有可量化嘅驗證標準,例如測試通過、分數達標、B…
- Codex已從純編碼工具升級為全能Agent,可以處理瀏覽器、桌面、電郵等任務。
- 用持久線程對話代替一次性對話,將常用對話置頂做固定工作台,保持上下文一致性。
- 語音輸入係捕捉模糊想法嘅利器,適合未清晰組織嘅指令,保留原始語境更有價值。
- 任務中途可用Steering即時改道,或用Queuing排隊下個任務,確保Codex唔走偏。
- 強目標=持續執行 + 可量化驗證器(測試、評分、清單),先定義點樣算完成,再開工。
Codex角色大轉變
呢篇文章嘅核心判斷好直接:Codex已經唔再係一個單純嘅寫Code工具,而係變成一個可以幫你搞掂電腦上所有任務嘅全能Agent。作者Jason指出,大多數人第一次用Coding Agent都係衝住寫Code去,但電腦上好多嘢背後都係由Code驅動,例如執行命令、刷網頁、調接口、自動化任務等。當Codex連呢啲都做到,佢嘅定位就唔同咗。
Codex已變成一個能幫我哋做電腦上所有嘢嘅Agent
呢個轉變唔係口號,而係透過以下8個技巧組合實現。以下我會詳細拆解每個技巧嘅用法同適合場景。
技巧1-4:對話、語音、糾偏、擴展能力
- 1 持續線程對話:將常用對話置頂,當成固定工作台,例如發版專用、文檔審查專用。上下文唔會清零,決定同偏好一直保留。
- 2 用語音代替打字:語音適合表達模糊念頭,例如『我記得有個叫Ben嘅人喺羣組提過呢件事,細節我唔記得,你去查下』。原始嘅含糊語氣反而更有價值。
- 3 任務中途糾偏:分兩種——Steering(打斷進行中任務改方向)同Queuing(排隊等下次做)。配合使用可以確保Codex唔走偏。
- 4 伸出代碼庫:利用$browser睇網頁標註、@chrome用已登錄狀態、@computer做桌面鼠標操作,再透過MCP同Skills處理訊息、電郵等非Code入口。
將一個對話長期留着,反覆派任務,就變成一個記得住前因後果嘅工作台
Steering係改Codex而家做緊咩,Queuing係改Codex接下來做咩
技巧5-8:自動化、目標驗證、側邊欄、長期記憶
- 1 任務自動化:定時自動化(每日收集資訊、出報告)同線程自動化(心跳喚醒,每隔幾分鐘自動檢查Slack同Gmail,排優先級並草擬回覆)。
- 2 畀佢一把驗收尺:強目標要有可量化標準,例如『新代碼單元測試必須全過』,而唔係『實現呢個文檔嘅計劃』。目標=持續幹活 + 驗證器(測試、評分、驗證清單)。
- 3 側邊欄邊睇邊改:Codex嘅產物(PPT、PDF、網頁、數據表)可以直接喺右側欄預覽,唔使匯出,即時修改,保持節奏。
- 4 長期記憶:用Obsidian呢類純文字文件夾做Agent嘅長期工作記憶,頂層放AGENTS.md,定義咩要記(決策、卡點、負責人)、幾時唔好亂改。記住:代碼放Code倉庫,上下文放記憶庫。
Codex嘅長期記憶庫:用Obsidian文件夾,頂層AGENTS.md話畀佢知點樣維護
結語:由代碼出發,超越代碼
總括而言,Codex仍然以代碼為核心,但透過MCP Servers、瀏覽器自動化、桌面控制等,佢可以處理完整流程:由你落指令、佢執行,到你審查成品,成條鏈路一氣呵成。Codex已經唔再只係一個Coding Agent,而係一個幫你搞掂所有電腦任務嘅全能Agent。
Codex已經唔再只係一個Coding Agent,而係一個幫你搞掂所有電腦任務嘅全能Agent
如果你對AI工具、Vibe Coding呢類話題有興趣,可以留意『噪點』嘅後續分享。
大家好,我係噪點
上個禮拜,openai 官方團隊分享咗一篇 codex 使用指南,主題係《Getting the most out of Codex》,即係點樣將 codex 用到最盡,短短幾日就有幾十萬閲讀,我呢幾日睇咗好幾次,覺得好有用,整理咗啲關鍵資訊出嚟好值得用緊 codex 嘅朋友睇多幾次

佢講嘅一個核心意思係:codex 已經唔只係一個寫 code 嘅工具,佢逐步變成一個「可以幫我哋搞掂電腦上所有嘢」嘅 agent。
jason 開頭就畀咗個判斷:大部分人第一次用 coding agent,都係為咗寫 code,例如開 repo、改 diff、跑測試、開 PR 等等,呢啲的確仲係 codex 嘅重點。
但要留意,電腦上嘅工作好多本身係「由 code 喺背後做」嘅,例如執行指令、瀏覽網頁、call API、導出文檔、自動化任務等。當呢啲嘢 codex 都做到之後,佢就唔似一個狹義嘅「coding agent」,反而更似一個乜都做得嘅全能 agent。
codex app 令呢個轉變更加具體要最有效率咁用 codex,關鍵就係將下面呢 8 種能力組合埋一齊用。
jason 建議轉嚇對話方式,唔好將每次對話都當成傾完就散嘅臨時視窗。
以前我哋習慣每次都開新對話,但問題係每次開新對話,上下文就會清零,之前傾過嘅偏好、決定全部要重新嚟過。
而用 codex,更建議用持久線程對話,我哋將一個對話長期留低,然後喺呢個對話入面不斷派任務畀 codex,咁佢就變成一個記得前因後果嘅工作枱,包括之前嘅決定、偏好同上文下理等都喺曬度。
一個具體做法,就係將常用對話置頂,當成一個個固定工作枱,例如一個專門管發版、一個做文檔審查、一個專門睇外部數據等等。
codex 內置語音輸入功能,語音嘅價值,係可以喺你將一個想法用語言組織好之前,先用粗糙嘅方式講出原始意思。
佢適合嗰啲把口好易表達,但打字要好小心斟酌或者覺得彆扭嘅模糊諗法:
例如,「我記得有個叫 ben 嘅人喺 group 入面提過呢件事,細節我唔記得了,你幫我查嚇」
對於一個可以自己搜尋、收集資訊再匯報嘅 agent 嚟講,就咁一句就夠了。
佢亦好適合啲任務仲未諗清楚嘅時候先用兩三分鐘將自己模糊嘅想法講出嚟。
呢種原始嘅想法表達,反而成日比你整理過嘅簡短摘要更好用,因為佢保留咗嗰啲含糊、強調、未講完嘅地方,更加有價值。
要學識對緊進行嘅任務作出明顯控制,主要有 2 種方式:
第一係 steering:
即係未做完,用新指令打斷緊進行嘅任務,適合 agent 任務偏離咗方向,需要糾正。
例如做網站評審嗰陣,一邊喺側邊欄標註一邊打斷:
「呢個整細啲;呢兩個元素之間嘅距離唔啱;呢句文案錯咗」
第二係 queuing:
即係唔打斷當前任務,將下一個任務排入隊列。
比如:
「做完之後,將預覽連結 send 俾 Slack 上面嘅評審人。」
steering 係改 codex 而家做緊嘅嘢,queuing 係改 codex 接下來做嘅嘢。
兩個配合用,就可以最大限度引導 codex 唔好走歪。
codex 除咗 code 任務之外,仲可以「動手」做好多其他任務。
佢嘅動手能力係一層層向外延伸嘅:
$browser:app 側邊欄嘅內置瀏覽器,可以令 codex 直接睇網頁,喺上面做標註;
@chrome:用你已經登入咗嘅 chrome,做啲要靠 chrome 登入狀態先做到嘅嘢;
@computer:處理嗰啲只能夠透過桌面界面操作嘅任務,例如要靠滑鼠點擊先完成到嘅任務等。
再向外就係 mcp server 同埋各種 connector,因為好多任務一開始根本唔係 code,而係一個訊息、一封 email、一個日程,呢啲都可以透過 connector 成為 codex 嘅工作入口。
仲有 skills,如果一個流程行得通而且有用,就打包成 skill,下次可以直接 call 嚟用。
一種係定時自動化:每次由乾淨嘅工作區重新開始,適合每日收集資訊、出報告、定期 check repo 呢類任務。
另一種係線程自動化:即係「心跳喚醒」,佢會按計劃定時返去上下文對話,每隔幾分鐘或幾小時自己醒一醒睇嚇,自動按你 set 好嘅任務執行。
比如:
每 30 分鐘,check 一次 slack 同 gmail 入面需要我留意、仲未回覆嘅訊息,幫我排個優先次序。如果有人問我問題,盡量深入幫我查好答案、寫好回覆草稿。
簡單嚟講就係畀 codex 一個目標,佢會一直向住嗰個目標持續推進。
但目標都有強弱之分。
例如「將呢份文檔入面嘅計劃實現出嚟」,呢啲就係弱目標,太模糊,codex 根本唔知點先算做完。
強目標就要有可量化標準。例如一個工程師想將內部工具由 python 轉去 rust,佢會先開好新目錄、定義目標,再將標準明確化:
新 code 嘅 unit test 一定要全部 pass,先算完成,否則失敗。
所以一個 goal,係「持續做嘢」加上「一個驗證器」:要確定結果、定幾時停、用咩信號判斷佢有冇接近任務結果。
呢個驗證器可以係:一套 test、跑分、一個可唔可以復現嘅 bug、一張驗證清單,或者一條一定要行得通嘅 end-to-end 流程。
codex 側邊欄嘅核心價值係:你叫 codex 整出嚟嘅嘢,唔使匯出嚟再開第二個軟件睇。
而且呢啲產物唔一定係 code,都可以係一份 ppt、pdf、網頁、數據表等。
叫佢整樣嘢,我哋直接喺右邊側邊欄邊睇邊叫佢改,省卻咗來回匯出、切換視窗嘅麻煩,從而唔會打斷成個節奏。
最後一塊,共享記憶,我個人最有共鳴。
意思係唔好將重要嘅上下文只係放喺某次對話入面,因為對話一關就冇咗。要將佢寫喺對話以外,可以下次再用嘅地方。
jason 畀咗一個實用做法,就係用 obsidian 呢類「一堆純文字檔案嘅 folder」,當做 agent 嘅長期工作記憶。好處係隨便睇、隨便改、隨便搬,仲可以長期儲存,放 git、放雲端都得。
然後再喺最頂層放一個 AGENTS.md,專門話畀 codex 知應該點樣維護呢個記憶庫:
咩嘢應該記低:決定、卡住嘅位、邊個負責、日期、有用嘅連結。
幾時唔好亂改:冇實質變化就唔好鬱,免得越改越亂。
一句講曬:code 放 code repo,而嗰啲滾動嘅上下文,放喺呢個記憶庫。
codex 仍然由 code 出發,但 code 以外嘅更多工作同樣可以做到,例如用 mcp server、瀏覽器接自動化、桌面控制等。
佢能夠將一個完整流程,由落指令、到佢執行、再到你審查成品,成條鏈全部執行曬。
codex 已經唔只係一個 coding agent,而係一個可以幫你搞掂全部電腦任務嘅全能 agent。
如果你覺得呢篇分享對你有幫助,歡迎一鍵三連,方便更多朋友睇到~
對 AI 工具、AI 乾貨技巧、vibe coding 有興趣,可以畀『噪點』加個星標 ⭐️第一時間收到推送!亦都歡迎交個朋友~
大家好,我是噪點
上週,openai 官方團隊分享了一篇codex使用指南,主題是《Getting the most out of Codex》,也就是如何把codex用到極致,短短几天就幾十萬閲讀,我這幾天看了好幾遍,覺得非常受用,把關鍵信息整理了下,非常值得使用codex的朋友多讀幾遍。

他講的一個核心意思是:codex 已經不只是個寫代碼的工具了,它正在變成一個"能幫我們乾電腦上所有活"的agent。
jason 開篇就給了個判斷:大多數人第一次用 coding agent,都是衝着寫代碼去的,比如建倉庫、改 diff、跑測試、開 pr等,這確實還是 codex的重心。
但是要知道,電腦上的活,本來很多就是"由代碼在背後幹"的,比如執行命令、刷網頁、調接口、導文檔、自動化任務等。當這些事codex 都能幹後,它就不太像一個狹義的"coding agent",而是更像一個能幹所有活的全能agent。
codex app 讓這個轉變更加落地,要最高效的使用 codex,關鍵就是把下面這8種能力組合起來使用。
jason 建議換種方式進行對話,不要把每次對話都當成聊完即棄的臨時窗口。
以前我們習慣是每次都新開一個對話,但問題是每開一個對話,上下文就會清零,之前聊的偏好、決定全得重來。
而codex使用,更建議持久線程對話,我們把一個對話長期留着,然後在這個對話裏反覆給codex派任務,它就成了一個記得住前因後果的工作台,包括之前的決定、偏好和上下文等都在裏面。
落地的一個辦法,就是把常用對話置頂,當成一個個固定工作台,比如一個專門管發版的、一個做文檔審查的、一個專門盯外部數據的等等。
codex 自帶語音輸入功能,語音的價值,就是能在你把一個想法用語言組織好之前,先可以把用粗糙的方式把原始意思說出來。
它適合那種嘴上很容易表達,但打字要仔細斟酌或彆扭的模糊念頭:
比如,"我記得有個叫 ben的人在羣裏提過這事,細節我忘了,你去查一下"
對一個能自己搜索、收集信息再彙報的 agent來說,這麼一句就夠了。
它也很適合任務還沒想清楚時,先花兩三分鐘把自己的模糊想法表達出來。
這種原始的想法表達,反而常常比你整理過的簡短摘要更好用,因為它保留了那些含糊、強調、沒說完的地方,會更有價值。
要學會對正在運行的任務進行顯性控制,主要有2種方式:
一是 steering:
也就是活兒還沒幹完,用新指令打斷進行中的任務,適合 agent任務走偏了,進行糾偏。
比如做網站評審時,一邊在側邊欄標註一邊打斷:
"這個做小一點;這兩個元素間距感覺不對;這句文案錯了"
二是 queuing:
也就是不打斷當前任務,把下一個任務排進隊列。
比如:
"活幹完後,把預覽連結發給 Slack 上的評審人。"
steering是改codex現在在幹嘛,queuing是改codex接下來幹嘛。
兩個配合起來,就能最大程度引導着codex不跑偏。
codex除了代碼任務外,還能"動手"操作很多任務。
它動手能力是一層層往外伸的:
$browser:app 側邊欄裏的內置瀏覽器,可以讓codex 直接看網頁,在上面做標註;
@chrome:用自己已經登錄的 chrome,幹那些依賴chrome 登錄狀態、得登錄才能做的事;
@computer:處理那些只能通過桌面界面操作的任務,比如要靠鼠標點擊才能完成的任務等。
再往外就是 mcp 服務器和各種連接器(connectors),因為很多任務一開始根本不是代碼,而是一條消息、一封郵件、一個日程,這些都可以通過連結器成為codex的工作入口。
還有 skills,如果一個流程跑通了並且有用,就打包成 skill,下次可以直接調用。
一種是定時自動化:每次從乾淨的工作區重新跑,適合每天收集信息、出報告、定期查倉庫這種任務。
另一種是線程自動化:也就是"心跳喚醒",它會按計劃定時回到上下文對話,每隔幾分鐘或幾小時自己喚醒看一眼,自動按你設置的任務進行執行。
比如:
每 30 分鐘,查一遍 slack 和 gmail 裏需要我注意的,還沒回的消息,幫我排個優先級。如果有人問我問題,儘量深入幫我查好答案、把回覆草稿寫好。
簡單理解就是給 codex 目標,它會一直朝着那個目標持續推進。
但目標也有強弱之分。
比如"把這個文檔裏的計劃實現一下",這種就是弱目標,太模糊了,codex根本不知道怎麼算幹完。
強目標是要有可量化標準。比如一個工程師想把內部工具從 python 遷到 rust,他會先建好新目錄、定義目標,再把標準明確化:
新代碼的單元測試必須全過,才算完成,否則失敗。
所以一個goal,是"持續幹活"加上"一個驗證器":要確定結果、定什麼時候停止、定用什麼信號判斷它有沒有接近任務結果。
這個驗證器可以是:一套測試、跑分、一個能不能復現的 bug、一張驗證清單,或者一條必須一直跑通的端到端流程。
codex側邊欄的核心價值就是:你讓 codex做出來的東西,不用導出來切到別的軟件去看。
而且這些產物不一定是代碼,也可以是一份 ppt、pdf、網頁、數據表等。
讓它做個東西,我們直接在右側側邊欄邊看邊讓它改,省去來回導出、切窗口的麻煩,從而不打斷整個節奏。
最後一塊,共享記憶,我個人最有共鳴。
意思是別讓重要的上下文只存在某次對話裏,因為對話一關就沒了。要把它寫到一個對話之外,能下次接着用的地方。
jason 給的一個實用做法,就是用obsidian 這種"一堆純文本文件的文件夾",當做agent的長期工作記憶。好處是隨便看、隨便改、隨便搬,還能長期存,放 git、網盤都行。
然後再在頂層放一個 AGENTS.md,專門告訴 codex 該怎麼維護這個記憶庫:
什麼該記下來:決策、卡點、誰負責、日期、有用的連結。
什麼時候別瞎改:沒實質變化就別動,免得越改越亂。
一句話總結:代碼放代碼倉庫,而那些滾動的上下文,放這個記憶庫。
codex 仍從代碼出發,但代碼外的更多工作同樣可以實現,比如用mcp servers、瀏覽器接自動化、桌面控制等。
它能把一個完整流程,從下指令、到它執行、再到你審查成品,整條鏈路全部執行。
codex也早已不再只是一個coding agent,而是一個能幫你幹全部電腦任務的全能agent。
如果覺得本篇分享對你有幫助,歡迎一鍵三連,方便更多朋友看到~
對AI工具、AI乾貨技巧、vibe coding感興趣,可以給『噪點』加個星標 ⭐️,第一時間獲取推送!也歡迎交個朋友~