OpenAI 官方指南:掌握 /goal 的 7 個關鍵點,讓 Codex 自動工作到目標達成
整理版優先睇
掌握/goal嘅7個關鍵點,讓Codex自動完成目標
呢篇文章係OpenAI官方出嘅指南,專門講解Codex入面嘅/goal模式。呢個模式可以令Codex不斷朝着具體目標努力,直到完成為止。作者想解決嘅問題係點樣令/goal發揮最大效用,避免浪費時間或者走錯方向。整體結論係,只要跟住以下7個關鍵點,就可以有效管理/goal任務,令Codex自動完成複雜工作。
首先,目標要明確同可驗證,例如「將構建時間減少30%」,咁樣Codex就可以判斷幾時完成。其次,盡量提供引導,話畀Codex用邊啲工具或者避開邊啲陷阱。另外,要畀Codex衡量進度嘅工具,例如截圖比對或者評估套件。仲有,要喺真實環境入面運行,令Codex可以接觸到模擬生產環境。
處理視覺目標嗰陣要小心,最好用功能清單取代像素級還原。追蹤進度都好重要,可以叫Codex自動commit、更新artifact或者發佈更新。最後,目標達成之後,要叫Codex做反思同審查,清理唔需要嘅嘗試。呢啲技巧可以幫你更高效咁用/goal完成任務。
- 目標要有明確可驗證嘅標準,例如百分比或具體數字,咁Codex先知道幾時完成。
- 提供引導可以減少Codex走彎路,例如指定可用工具或先做計劃再行動。
- 宏大目標需要衡量進度嘅工具,例如截圖比對或評估套件,避免Codex誤以為完成。
- 視覺目標容易令Codex鑽牛角尖,建議用功能清單代替像素級還原。
- 目標完成後一定要做代碼審查同清理,移除無效嘗試,保持代碼整潔。
明確目標同引導
用/goal嗰陣,要將prompt設定為目標嘅退出標準,專注於明確可驗證嘅數據。例如「將構建和部署時間減少30%」就係一個好例子。
退出標準
明確嘅數據
如果你唔確定目標,可以先普通對話,決定好之後叫Codex自己設定目標。
提供引導可以令Codex少走彎路,例如畀佢一個入手起點,或者指明可用工具。
少走彎路
入手嘅起點
進度衡量同環境搭建
對於宏大目標,要提供衡量進度嘅工具,例如截圖比對或評估套件。
截圖比對
評估套件
搭建真實運行環境好重要,令Codex可以訪問模擬生產環境,用相同技術棧同數據庫。
真實嘅運行環境
仲可以叫Codex用computer use測試實際應用。
視覺目標同進度追蹤
視覺目標容易令Codex鑽牛角尖,最好用功能清單取代像素級還原。
鑽牛角尖
功能清單
追蹤進度有幾個實用方法:
- 叫Codex喺關鍵步驟commit並推送到草稿PR。
- 叫Codex更新artifact,例如HTML文件或進度圖表。
- 叫Codex發佈更新到Slack或其他平台。
- 開新對話查詢狀態,可以用/side或者普通對話讀取/goal紀錄。
commit
artifact
發佈更新
最終審查同清理
目標達成後,叫Codex做反思同審查,清理無效嘗試。
反思同審查
代碼審查
呢個步驟特別適用於優化任務,確保最終成果乾淨利落。
Codex 推出嘅 /goal 模式,提供咗一種引導 Codex 向住具體嘅方向無限努力嘅方法。
一旦設定咗目標,Codex 就會持續工作,直到目標達成,無論呢個需要花費幾個鐘定係幾日。
/goal 模式非常強大。為咗令你能夠充分利用佢,OpenAI 官方發佈文章,詳細說明咗使用時嘅幾個關鍵點。
以下就係使用 /goal 時需要記住嘅 7 件事。
01明確「可驗證」標準
在使用 /goal 時,應該將你嘅 prompt 作為呢個目標嘅退出標準去進行描述。
Codex 會喺每個回合結束之後檢查目標係咪已經達成,所以你嘅目標 prompt 唔適宜太長,而且應該專注於目標達成嘅明確標準。
通常情況下,一個好嘅目標需要包含一個明確嘅數據供模型判斷。例如:
如果你唔肯定點樣更好咁定義目標,或者想先同 Codex 一齊頭腦風暴構思項目,咁就唔好先用 /goal 開始對話。
你可以先嘗試進行普通對話,決定好目標之後,再令 Codex 基於之前嘅對話內容嚟自己設定目標。
02盡可能提供引導
發送類似“將構建同部署時間減少 30%”嘅 prompt 確實可以令 Codex 揾出啲有創意嘅解決方案,但如果你已經對問題有咗頭緒,可以直接話畀 Codex 聽,咁可以令 Codex 少走好多冤枉路。
如果可能嘅話,畀 Codex 提供一個入手嘅起點,話畀佢聽達成目標可以用嘅工具,或者指出邊啲方向可能會令佢誤入歧途。
例如,Codex 團隊嘅 @reach_vb,當佢令 Codex 訓練一個模型嗰陣,佢話畀 Codex 聽可以用 Chrome 瀏覽器入 Google Colab,並允許佢自己生成數據集。

同樣,如果你嘅目標係縮短構建時間,而且知道大部分時間花咗喺邊度,最好喺 prompt 入面先話畀 Codex 聽。
或者,你甚至可以令 Codex 先喺 plan 模式下進行初步研究,令佢創建一個計劃嚟記錄潛在嘅方案,然後令你嘅目標參考呢個計劃。
03令進度可以衡量
如果你嘅目標非常宏大,或者 Codex 有多種途徑可以達成呢個目標,咁為 Codex 提供衡量進度嘅工具就至關重要。
對於某啲可以量化數據嘅任務嚟講,呢個好簡單(例如縮短構建時間或提高測試覆蓋率)。但對於某啲目標,就值得同 Codex 一齊頭腦風暴,探討邊啲工具可以幫助,或者引導佢去揾可以體現進度嘅方法。
例如,用工具嚟計算兩個截圖之間嘅視覺差異,或者為你正在調整嘅 agent 創建一個評估套件。
有一次,我通過 Codex 重新製作影片入面嘅某啲內容嗰陣,我令 Codex 自己開發咗一個工具嚟比對截圖同埋查看差異。隨住時間嘅推移,佢仲可以對呢個工具進行迭代,以支持唔同嘅比對模式。

根據任務嘅唔同,你可能仲需要考慮係咪有其他需要衡量/檢查嘅條件,以防 Codex 誤以為任務已經完成咗。
04搭建真實嘅運行環境
要令 Codex 真正向住目標取得進展,就要令佢喺真實嘅運行環境入面運行。
如果你想要改進部署時間或延遲問題,咁佢就應該可以訪問模擬生產環境嘅部署同測試環境,而且盡量用相同嘅技術棧、相同嘅 flags,同埋相似嘅數據庫。
舉個例,OpenAI 團隊正在為 developers.openai.com 網站調試構建同部署時間嘅優化。因為當時已經在用 deploy,所以 Codex 可以用預覽版本進行部署同埋查看相關日誌。
但同完整嘅生產環境運行相比,預覽部署禁用咗一啲構建路徑,因此,Codex 唔得唔手動部署到相同嘅環境,用生產相似嘅配置進行檢查。
同樣,你仲可以令 Codex 用 computer use 測試實際嘅應用。
05謹慎對待視覺目標
畀 Codex 設定一個好似 “根據呢張圖片,100% 像素級還原呢個 UI 設計” 噉樣嘅視覺目標好吸引人,但實際情況係可能會比較麻煩。
如果你冇畀佢正確嘅引導同約束,佢可能會喺某啲細節問題上鑽牛角尖,從而忽略咗整體目標。
例如,如果參考圖入麪包含需要 Codex 生成嘅圖形(無論係 SVG 圖標定係圖片),佢可能會迷失喺追求呢啲圖形嘅精確度上,從而忽略核心問題。
此外,Codex 需要工具輔助嚟進行正確嘅視覺對比,呢個就意味住更多嘅圖片輸入同更高嘅 token 消耗,同時仲唔一定可以令 Codex 更好達成預期目標。
所以,最好淨係將圖片作為推動目標實現嘅上下文,你應該揾其他方法令 Codex 確認目標達成,例如功能清單、待實現嘅規格說明、對設計系統嘅跟從情況等。
06追蹤進度
如果 Codex 最後喺後台(甚至喺另一部機器上)工作咗幾個鐘或幾日,我哋好容易漏咗佢嘅最新進度或已完成嘅工作。
根據目標嘅唔同,以下幾點有助於跟進進度:
- 令 Codex 喺關鍵步驟進行 commit 同埋推送到草稿 PR。呢個喺開發支持預覽部署嘅網站嗰陣特別有用。
- 令 Codex 更新一個面向決策者嘅 artifact。呢個可以係一個你可以喺瀏覽器入面打開嘅 HTML 文件,甚至係用
@Sites部署畀團隊嘅網頁、一張追蹤進度嘅渲染圖表,或者只係一個普通嘅 markdown 文件。 - 令 Codex 發佈更新。你可以喺目標入面要求 Codex 將重大進展同步到 Slack 或你希望記錄進度嘅其他地方。
- 創建其他對話詢問狀態更新。如果你淨係想快啲瞭解當前狀態,可以用
/side嚟開一個新嘅側邊對話,並喺嗰度提問。佢擁有截至目前嘅所有上下文,又係臨時性嘅。你仲可以喺 Codex 入面創建一個普通嘅新對話,令 Codex 讀取另一個/goal對話並回答你嘅問題。呢種方式可以同定時任務配合使用,非常強大。
07確定最終結果
目標達成咗,直接提交代碼然後收工就完咗喇?
事實上我發現,特別係喺進行優化任務嗰陣,令 Codex 對已完成嘅工作進行反思同審查好重要。
你可以通過 /review 啟動代碼審查,令 Codex 更深層次咁反思,佢為解決目標所嘗試嘅唔同方案並進行清理。
因為 Codex 喺達成目標嘅過程中,可能嘗試咗多種效果唔好或根本冇效嘅方法,而呢啲嘗試可能會殘留喺代碼改動入面。
08係時候用 goal 開始你嘅下一個任務啦
Codex 入面嘅 goal 功能係解決你所面臨挑戰嗰陣嘅好強大嘅工具。
提供合適嘅運行環境同指令,可以令你更高效咁達成目標。
你想好用 /goal 做咩嘢未呀?
09推薦閲讀
Codex 推出的 /goal 模式,提供了一種引導 Codex 朝着具體的方向無限努力的方法。
一旦設定了目標,Codex 就會持續工作,直到目標達成,無論這需要花費幾個小時還是幾天。
/goal 模式非常強大。為了讓你能夠充分利用它,OpenAI 官方發佈文章,詳細說明了使用時的幾個關鍵點。
以下就是使用 /goal 時需要牢記的 7 件事。
01明確「可驗證」標準
在使用 /goal 時,應該將你的 prompt 作為該目標的退出標準去進行描述。
Codex 會在每個回合結束後檢查目標是否已經達成,所以你的目標 prompt 不宜過長,而且應專注於目標達成的明確標準。
通常情況下,一個好的目標需要包含一個明確的數據供模型判斷。例如:
如果你不確定如何更好地定義目標,或者想先和 Codex 一起頭腦風暴構思項目,那就不要先使用 /goal 開始對話。
你可以先嚐試進行普通對話,決定好目標時,再讓 Codex 基於之前的對話內容來自己設定目標。
02儘可能提供引導
發送類似“將構建和部署時間減少 30%”的 prompt 確實能讓 Codex 找出一些有創意的解決方案,但如果你已經對問題有了頭緒,可以直接告訴 Codex,這能讓 Codex 少走不少彎路。
如果可能的話,給 Codex 提供一個入手的起點,告訴它達成目標可使用的工具,或者指出哪些方向可能讓它誤入歧途。
例如,Codex 團隊的 @reach_vb,當他讓 Codex 訓練一個模型時,他告訴 Codex 可以使用 Chrome 瀏覽器進入 Google Colab,並允許它自己生成數據集。

同樣地,如果你的目標是縮短構建時間,並且知道大部分時間花在了哪裏,最好在 prompt 中首先告訴 Codex。
或者,你甚至可以讓 Codex 先在 plan 模式下進行初步研究,讓它創建一個計劃來記錄潛在的方案,然後讓你的目標參考該計劃。
03讓進度可衡量
如果你的目標非常宏大,或者 Codex 有多種途徑可以達成該目標,那麼為 Codex 提供衡量進度的工具就至關重要。
對於某些可量化數據的任務來說,這很簡單(比如縮短構建時間或提高測試覆蓋率)。但對於某些目標,則值得與 Codex 一起頭腦風暴,探討哪些工具有所幫助,或者引導它去尋找能夠體現進度的方法。
例如,使用工具來計算兩個截圖之間的視覺差異,或者為你正在調整的 agent 創建一個評估套件。
有一次,我通過 Codex 重新制作視頻中的某些內容時,我讓 Codex 自己開發了一個工具來比對截圖並查看差異。隨着時間的推移,它還能對該工具進行迭代,以支持不同的比對模式。

根據任務的不同,你可能還需要考慮是否有其他需要衡量/檢查的條件,以防 Codex 誤以為任務已完成。
04搭建真實的運行環境
要讓 Codex 真正朝着目標取得進展,就要讓它在真實的運行環境中運行。
如果你想要改進部署時間或延遲問題,那它就應該能夠訪問模擬生產環境的部署和測試環境,且儘量使用相同的技術棧、相同的 flags,以及相似的數據庫。
舉個例子,OpenAI 團隊正在為 developers.openai.com 網站調試構建和部署時間的優化。因為當時已經在使用 deploy,所以 Codex 可以用預覽版本進行部署並查看相關日誌。
但與完整的生產環境運行相比,預覽部署禁用了一些構建路徑,因此,Codex 不得不手動部署到相同的環境,使用生產相似的配置進行檢查。
同樣,你還可以讓 Codex 使用 computer use 測試實際的應用。
05謹慎對待視覺目標
給 Codex 設定一個像 “根據這張圖片,100% 像素級還原這個 UI 設計” 這樣的視覺目標很誘人,但實際情況是可能會比較麻煩。
如果你沒有給予它正確的引導和約束,它可能會在某些細節問題上鑽牛角尖,從而忽略了整體目標。
例如,如果參考圖中包含需要 Codex 生成的圖形(無論是 SVG 圖標還是圖片),它可能會迷失在追求這些圖形的精確度上,從而忽略核心問題。
此外,Codex 需要工具輔助來進行正確的視覺對比,這就意味着更多的圖片輸入和更高的 token 消耗,同時還不一定能讓 Codex 更好達成預期目標。
所以,最好只將圖片作為推動目標實現的上下文,你應該尋找其他方法讓 Codex 確認目標達成,例如功能清單、待實現的規格說明、對設計系統的遵循情況等。
06追蹤進度
如果 Codex 最終在後台(甚至在另一台機器上)工作了數小時或數天,我們很容易遺漏它的最新進度或已完成的工作。
根據目標的不同,以下幾點有助於跟進進度:
- 讓 Codex 在關鍵步驟進行 commit 並推送到草稿 PR。這在開發支持預覽部署的網站時特別有用。
- 讓 Codex 更新一個面向決策者的 artifact。這可以是一個你能在瀏覽器中打開的 HTML 文件,甚至是使用
@Sites部署給團隊的網頁、一張追蹤進度的渲染圖表,或者僅僅是一個普通的 markdown 文件。 - 讓 Codex 發佈更新。你可以在目標中要求 Codex 將重大進展同步到 Slack 或你希望記錄進度的其他地方。
- 創建其它對話詢問狀態更新。如果你只想快速瞭解當前狀態,可以使用
/side來開啓一個新的側邊對話,並在那裏提問。它擁有截至目前的所有上下文,又是臨時性的。你還可以在 Codex 中創建一個普通的新對話,讓 Codex 讀取另一個/goal對話並回答你的問題。這種方式可以與定時任務配合使用,非常強大。
07確定最終結果
目標達成了,直接提交代碼然後收工就完了嗎?
事實上我發現,特別是在進行優化任務時,讓 Codex 對已完成的工作進行反思和審查非常重要。
你可以通過 /review 啓動代碼審查,讓 Codex 更深層次地反思,它為解決目標所嘗試的不同方案並進行清理。
因為 Codex 在達成目標的過程中,可能嘗試了多種效果不佳或根本無效的方法,而這些嘗試可能會殘留在代碼改動中。
08是時候用 goal 開啓你的下一個任務了
Codex 中的 goal 功能是解決你所面臨挑戰時的極其強大的工具。
提供合適的運行環境 and 指令,能讓你更高效地達成目標。
你想好用 /goal 做什麼了嗎?