如何讓 Codex 幫你做效率審計,實現自我進化

作者:土著哥聊AI
日期:2026年5月27日 上午6:30
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

用一份提示詞令AI代理自我審計,自動將重複工作封裝成可複用工具

整理版摘要

呢篇文章係關於OpenAI聯合創辦人Greg Brockman轉發嘅一份提示詞,原作者係Vaibhav SrivastavGreg只係加咗一句「self improvement prompt for codex」,但背後解決嘅係一個好多重度Agent用戶都遇到嘅真實痛點:每次開新對話都要重新交代背景同重複性工作,浪費時間仲容易出錯。

呢份提示詞嘅核心思路係叫AI代理回顧過去30日嘅工作記錄,按順序睇會話、記憶、Chronicle同現有技能,找出至少出現過兩次、流程穩定、值得標準化嘅重複工作流。然後用「最小封裝形式」原則,將佢哋打包成Skill(可複用操作手冊)、Custom subagent(專屬角色)或Automation(定時任務),如果證據唔夠就Skip。成個過程分成回顧歷史、識別重複、評估價值同選擇封裝四個步驟。

整體結論係呢份提示詞提供咗一個具體可行嘅解法,令AI可以系統性學習你嘅工作習慣,將重複勞動自動化。但佢唔適合長駐背景,而係應該每個月或每兩週主動跑一次。效果取決於你過去記錄嘅豐富程度,Agent夠唔夠聰明,同埋你最終要親自審核清單。

  • 核心結論:呢份提示詞令AI代理自我審計,識別重複工作並自動建立技能或自動化,大幅提升效率。
  • 方法:提示詞按固定順序——會話記錄、記憶摘要、Chronicle、現有技能——去揾值得封裝嘅重複模式。
  • 差異關鍵:強調「最小封裝形式」,根據工作性質揀Skill、SubagentAutomation或Skip,避免大而全嘅浪費。
  • 啟發:提示詞唔應該放入全局規則,而係適合定期(每週或每月)執行一次,唔好開機就觸發。
  • 可行動點Codex用戶可直接複製提示詞使用;Claude Code用戶要刪除Chronicle部分,改為參考CLAUDE.md;其他平台要按實際功能調整。
值得記低
Prompt

Codex 自我提升提示詞(英文原版)

回顧過去30天工作,識別重複性手動工作流,按優先級使用證據,並根據判斷封裝為技能、子代理或自動化。

Prompt

Codex 自我提升提示詞(中文版)

同上,但係繁體中文版,適合直接複製畀Codex或經過調整後畀其他Agent使用。

連結 openai.com

Codex 官方網址

OpenAI Codex 產品頁面,可以瞭解更多關於呢個AI代理嘅功能。

結構示例

內容結構

內容結構 python
Look back over my recent work from the last 30 days, or all available history if shorter, and identify repeated manual workflows worth packaging.

Use available evidence in this order:
- Recent Codex sessions and task summaries.
- Codex Memories and rollout summaries to find patterns repeated across sessions.
- Chronicle, if enabled, to spot repeated work outside Codex. Use Chronicle for discovery only; confirm important details in the relevant source system when possible.
- Existing skills, custom agents, and automations, so you reuse or extend what already exists instead of duplicating it.

Look broadly for work that is repeated, time-consuming, error-prone, context-heavy, or benefits from a consistent process. Include workflows across coding, research, writing, planning, communication, operations, analysis, and personal administration.

Only act on a candidate when it:
- occurred at least twice, or is clearly likely to recur and costly to repeat;
- has stable inputs, a repeatable procedure, and a clear output or stopping condition;
- would materially improve speed, quality, consistency, or reliability;
- is not already adequately covered.

Choose the smallest appropriate form:
- Skill: a reusable workflow or playbook.
- Custom subagent: a bounded specialist role or investigation task suitable for delegation.
- Automation: a scheduled or recurring check, report, reminder, or monitor.
- Skip: work that is too one-off, ambiguous, sensitive, or poorly evidenced to package.

First produce a compact shortlist with:
- repeated workflow
- supporting evidence and dates
- frequency/confidence
- recommended form: skill, subagent, automation, extend existing, or skip
- why it is or is not worth creating

Then create only the high-confidence missing items. Keep them narrow, practical, source-aware, and easy to validate. Do not create speculative, overlapping, or overly broad assets.

Finish with:
- what you created or extended
- what you deliberately skipped
- what needs more evidence before packaging
整理重點

一個轉發引發嘅痛點:AI代理點樣先可以真正「記得」你嘅工作習慣

OpenAI聯合創辦人Greg Brockman平時好少出post,但佢轉發咗一份提示詞,話係「self improvement prompt for codex」,即係畀Codex自我提升用嘅。呢個動作引起咗好多重度AI用戶嘅關注。

CodexOpenAI嘅AI編程助手,但已經進化到通用型Agent,可以自主執行任務

作者Vaibhav Srivastav(網名reach_vb)提出咗一個好實際嘅問題:每次重新打開AI助手,你都要將項目背景、技術架構、代碼結構重複交代一次。特別係啲例行工作,例如每週檢查進度、提交代碼前跑測試、整理文檔格式,冇標準流程真係好嘥時間。

整理重點

提示詞點樣運作?四個步驟拆解自我審計邏輯

呢份提示詞唔係簡單叫AI「揾重複任務」,而係畀咗一套好嚴謹嘅流程。第一個動作係「回顧歷史」,Agent要按特定優先級去揾證據。

  1. 1 首先睇最近嘅Codex會話記錄同任務摘要——呢啲係最直接嘅證據。
  2. 2 然後睇Codex記憶庫(Memories)同部署摘要,揾跨會話重複模式。
  3. 3 如果開咗Chronicle(一個跨平台大事記功能),就用佢嚟發現Codex以外嘅重複工作。Chronicle只用嚟發現,重要細節要去返源系統確認。
  4. 4 最後檢查現有嘅技能、自定義代理同自動化工具,確保唔會重複發明。

第二個動作係「識別重複」,唔係所有做過嘅事都要打包,要符合四個條件:至少發生兩次/輸入穩定流程可重複/能提升速度質量或可靠性/未被現有工具覆蓋。

四條缺一不可,滿足先算候選項,唔會亂封裝

第三個動作係「評估值唔值得封裝」,Agent要為每個候選項寫一份「簡歷」,包括重複工作描述、證據同日期、頻率置信度、建議封裝形式、值唔值得建立嘅理由。呢步係畀你睇清單確認方向,唔好盲信。

第四個動作係「選擇最小封裝形式」,提示詞定義咗三種形式,仲有個兜底選項跳過。

  • 技能(Skill):一個可以反覆調用嘅操作手冊,適合固定流程。
  • 自定義子代理(Custom subagent):一個邊界清晰、可以委派任務嘅專屬角色,適合特定範疇。
  • 自動化(Automation):定時運作嘅檢查、報告或提醒,適合週期性任務。
  • 跳過(Skip):一次性、模糊、敏感或證據唔夠嘅工作,直接放棄,唔好夾硬封裝。

「選最小原則」唔好做大而全,要做剛好夠用嘅最小單元

整理重點

點樣用?唔同平台嘅調整方法同最佳實踐

如果你用緊Codex,最直接嘅用法就係將上面份完整提示詞(英文或中文版)複製到對話框,當一次任務發出。Codex本身有SessionsMemories同Chronicle,證據鏈齊全,提示詞可以原樣運行。

Codex用戶可直接複製,唔使修改

如果係Claude Code,因為冇Chronicle,要將相關部分換成「查閲CLAUDE.md中記錄嘅項目信息同個人偏好」。Claude Code主要靠CLAUDE.md同對話歷史,邏輯上對應到。

至於其他Agent產品,例如OpenClawHermes Agent,遷移難度大啲,要睇佢哋有冇會話記錄同跨會話記憶功能。基本原則係借鑑思路,但具體功能名同證據來源要換成平台實際支援嘅嘢,唔可以照抄。

定期執行先係最佳用法:你可以設定每週或每月做一次自我審計,確保Agent幫你整理好最新嘅重複工作流。

整理重點

注意事項:效果取決於記錄質素,跑完記得親手覆檢

首先,呢份提示詞對Agent能力有要求。如果你用嘅Agent歷史記錄好短,或者唔支援跨會話記憶,回顧唔到有效內容,結果會好空洞甚至亂估。

Agent歷史記錄短嘅話,畀嘅結果唔可信,可能係亂編

其次,Agent喺識別重複模式方面仲未算精準。明顯嘅重複(例如每次手動整理格式)一定揾到,但隱性重複(例如成日繞同一條彎路)就弱啲。所以跑完之後最好親手過一次清單,唔好全信。

最後,呢份提示詞係一個框架,真正有冇用取決於你過去嘅工作記錄有幾豐富。你記錄得越多,Agent揾到嘅有效模式就越多;記錄得一團糟,佢畀嘅建議自然有限。

記錄質素決定回報:平時用Agent時保持清晰記憶,審計效果先會好

總括而言,Greg Brockman轉發呢條內容絕對唔係冇意義,因為佢戳中咗痛點。呢份提示詞提供咗具體解法,值得所有重度Agent用戶收藏。下次覺得「最近總係重複做同一樣嘢」嘅時候,就拎出嚟跑一次啦。


昨天,OpenAI 的總裁兼聯合創始人Greg Brockman,在自己的 X 上轉發了一條推文。

可能你對 Greg Brockman 這個人還沒那麼熟,但如果你知道 OpenAI,那這個名字的分量就不言而喻了。

之前 Sam Altman 還專門寫過一篇小作文來抒發 Greg Brockman 對於 OpenAI 公司以及他個人的重要性。

圖片

原文連結(有興趣的可以去讀讀):
https://blog.samaltman.com/greg

Greg Brockman 是 ChatGPT 背後那家公司的核心創始人之一,圈內公認的技術老炮。他平時發帖不多,但每次出手還都挺有料兒。

他轉發的這條內容來自一位叫 Vaibhav Srivastav(網名reach_vb)的博主,主題是一份專門寫給 Codex 用的提示詞。

圖片

格雷格只加了一句話:"self improvement prompt for codex"。即:給 Codex 用的自我提升提示詞

那這份提示詞到底是什麼意思,普通用戶用得上嗎?今天我們來拆開說清楚。

先說 Codex 是什麼,免得有人真不知道。

Codex 是 OpenAI 推出的一款 AI 編程助手,你可以理解成一個專門幫你寫代碼、跑任務的 AI 代理(Agent)。

網址:
https://openai.com/codex/

它跟 ChatGPT 網頁端那種一問一答式是完全不一樣的,Codex 更像是你在家裏僱了個能自主幹活兒的程序員助手,你給它分配任務,它去執行,執行完了再彙報結果給你。

而它不僅僅能幹編程的事情,它和 Claude Code 一樣已經演進為一款通用型 Agent。

好,背景交代完了。現在來說說這份提示詞到底在幹什麼。

每次當你在本地重新打開你的 AI 助手,不管是 Codex 也好,還是 Claude Code 也罷,還是其他什麼 Agent 產品,你可能都會遇到同樣的問題「記憶問題」。

就是你得把上次關於你們之間聊過的項目或者任務的背景或進展重新交代一遍。

比如"我們之前在做什麼項目或者任務"、"我們處理到什麼程度或進展了"、"我們上次確定的技術架構是這樣的,代碼結構是這樣的"等等...

這些話你每次都要一遍又一遍的重複說,有的時候你的 AI 助手還是一臉茫然地等你重新介紹。

更煩的是,有些事情你天天都在做,比如每週檢查一次項目的進度、每次提交代碼前跑一遍測試流程、每次整理文檔的時候都要按同一個格式來。

這些重複的事情,你沒有形成任何標準流程,每次都靠臨時交代,效率低,還容易出錯。

所以,這份提示詞就是來解決這個問題的。

我給你提供兩版:一版是英文提示詞,另一版是經過校驗過的中文提示詞。你自己選擇。

英文原版提示詞

Look back over my recent work from the last 30 days, or all available history if shorter, and identify repeated manual workflows worth packaging.

Use available evidence in this order:
- Recent Codex sessions and task summaries.
- Codex Memories and rollout summaries to find patterns repeated across sessions.
- Chronicle, if enabled, to spot repeated work outside Codex. Use Chronicle for discovery only; confirm important details in the relevant source system when possible.
- Existing skills, custom agents, and automations, so you reuse or extend what already exists instead of duplicating it.

Look broadly for work that is repeated, time-consuming, error-prone, context-heavy, or benefits from a consistent process. Include workflows across coding, research, writing, planning, communication, operations, analysis, and personal administration.

Only act on a candidate when it:
- occurred at least twice, or is clearly likely to recur and costly to repeat;
- has stable inputs, a repeatable procedure, and a clear output or stopping condition;
- would materially improve speed, quality, consistency, or reliability;
- is not already adequately covered.

Choose the smallest appropriate form:
- Skill: a reusable workflow or playbook.
- Custom subagent: a bounded specialist role or investigation task suitable for delegation.
- Automation: a scheduled or recurring check, report, reminder, or monitor.
- Skip: work that is too one-off, ambiguous, sensitive, or poorly evidenced to package.

First produce a compact shortlist with:
- repeated workflow
- supporting evidence and dates
- frequency/confidence
- recommended form: skill, subagent, automation, extend existing, or skip
- why it is or is not worth creating

Then create only the high-confidence missing items. Keep them narrow, practical, source-aware, and easy to validate. Do not create speculative, overlapping, or overly broad assets.

Finish with:
- what you created or extended
- what you deliberately skipped
- what needs more evidence before packaging

中文版提示詞

回顧我過去 30 天的近期工作記錄(若可用歷史不足 30 天則回顧全部),識別出值得封裝的重複性手動工作流。

按以下優先級使用可用證據:
· 近期的 Codex 會話記錄與任務摘要。
· Codex 記憶庫與部署摘要,用於發現跨會話重複出現的模式。
· 若已啓用 Chronicle,用於發現 Codex 之外的重複性工作。Chronicle 僅用於發現階段;如有可能,請在相關源系統中確認重要細節。
· 現有的技能、自定義代理與自動化工具,優先複用或擴展已有資源,避免重複開發。

廣泛排查以下類型的工作:重複性高、耗時、易出錯、上下文依賴強,或能從標準化流程中獲益的工作。涵蓋編碼、研究、寫作、規劃、溝通、運營、分析及個人事務管理等領域的工作流。

僅當候選工作流滿足以下全部條件時,才對其進行處理:
· 已至少發生兩次,或明確可能再次發生且重複執行成本較高;
· 輸入穩定、流程可重複,且有明確的輸出或終止條件;
· 能顯著提升工作速度、質量、一致性或可靠性;
· 尚未被現有資源充分覆蓋。

選擇最小粒度的合適封裝形式:
· 技能(Skill):可複用的工作流或操作手冊。
· 自定義子代理(Custom subagent):邊界清晰的專業角色或適合委派的調查任務。
· 自動化(Automation):定時或週期性執行的檢查、報告、提醒或監控任務。
· 跳過(Skip):過於一次性、模糊不清、涉及敏感信息或證據不足,不適合封裝的工作。

首先生成一份精簡候選清單,包含以下內容:
· 重複性工作流描述
· 支持證據及對應日期
· 發生頻率 / 置信度
· 推薦封裝形式:技能、子代理、自動化、擴展現有資源或跳過
· 值得 / 不值得創建的理由

隨後僅創建高置信度的缺失項。保持其範圍聚焦、實用、適配源系統且易於驗證。請勿創建推測性、重疊或過於寬泛的資產。

最後總結以下內容:
· 你創建或擴展的內容
· 你刻意跳過的內容
· 需要更多證據才能進行封裝的內容

這份提示詞的核心思路簡單說一下:讓你的 Agent 自己回頭看看,你過去 30 天都在做什麼,哪些事情你做了不止一次,把這些事情整理出來,打包成可以下次直接複用的標準流程

換句話說,就是讓 AI 幫你做一次工作效率審計,然後自己給自己建工具。

原作者 Vaibhav 在這份提示詞發出來之前其實還有一個更早的版本,更簡單,只有幾句話,大意是:"看看我最近的 Codex 會話,找出重複的工作流,給我建個技能或者子代理,保持簡單"。

後來他根據大家的反饋對這版簡單的提示詞做了迭代升級,變成了上面現在我提供給你的這個版本,功能更完整,邏輯也更嚴謹。

我們來把這份提示詞的工作邏輯拆一拆,它大致包括了四個動作。

第一個動作:回顧歷史

提示詞讓 Agent 按照一個固定的順序去找證據:先看最近的會話記錄,再看跨會話的記憶摘要,再看 Chronicle(這是 Codex 專有的一個功能,你可以理解它是個大事記或者記錄),最後再看現有已經建好的技能和自動化工具。

這個順序設計得其實很有講究,為的是讓 Agent 從最可靠的證據入手,而不是腦補出一堆你根本沒做過的「重複工作」。

第二個動作:識別重複

Agent 不是把你做過的所有事情都列出來,而是專門找那些「值得打包」的。

提示詞給了四個判斷標準:

◆ 這件事兒至少發生過兩次,或者明確還會再發生;
◆ 這件事兒的輸入比較穩定,流程可以重複,有明確的完成標準;
◆ 打包之後能實實在在地提升速度、質量或者可靠性;
◆ 你現有的工具裏還沒有已經覆蓋到這件事兒的。

這四條缺一不可,都滿足才算候選項。

第三個動作:評估值不值得封裝

通過了第二步篩選之後,Agent 還要給每個候選項寫一份「簡歷」:

這件事是什麼,有什麼證據證明它重複發生了,發生頻率是多少,置信度怎麼樣,建議用哪種形式打包,以及為什麼值得建或者為什麼不值得建。

這一步的目的就是讓你在 Agent 開始動手之前先看一眼清單,自己確認一下方向到底有沒有跑偏。

第四個動作:選擇最小的封裝形式

我認為這是整份提示詞裏我覺得最值得單獨說的一點。

它定義了三種封裝形式:

◆ 技能(Skill)—— 就是一個可以反覆調用的操作手冊;
◆ 自定義子代理(Custom subagent)—— 就是一個邊界清晰、可以委派任務的專屬角色;
◆ 自動化(Automation)—— 就是定時運行的檢查、報告或者提醒。

另外,還有一個兜底選項叫跳過(Skip)。如果某件事太一次性、太模糊、涉及敏感信息,或者證據不夠,就直接跳過,不強行封裝。

這個「選最小的」原則背後其實是一個很樸素的工程思維:你不需要建一個大而全的系統,你只需要建一個剛好夠用的最小單元。

建太大,維護起來麻煩,用起來笨重;

建太小,不夠用,以後還得重建。

最小夠用,才是最實用的

OK,理解了這份提示詞的邏輯,接下來咱們再說說最實際的問題:怎麼用,在哪裏用。

如果你用的是 Codex,那最方便也最直接,把上面那份完整的提示詞(英文原版或者中文版都行)直接複製到你的 Agent 聊天框裏,作為一次對話任務發出去就行。

Codex 本身有 Sessions 記錄、Memories 記憶和 Chronicle 跨平台追蹤這三層功能,對應的證據鏈是完整的,提示詞可以原樣運行。

如果你常用的是 Claude Code,就得需要稍微調整一下。

Claude Code 可沒有 Chronicle 這個功能,所以跟 Chronicle 相關的部分你可以刪掉或者替換成「回顧最近的對話記憶」。

因為 Claude Code 有自己的記憶機制,主要依賴「CLAUDE.md 文件和對話歷史」。

你在使用的時候可以把提示詞裏涉及 Chronicle 的那段換成「查看 CLAUDE.md 中記錄的項目信息和個人偏好」,邏輯上是能對上的。

但如果你經常用的是 OpenClaw、Hermes Agent 或者其他 Agent 產品,遷移的難度我覺得會更大一些,這取決於那個產品有沒有「會話記錄」和「跨會話記憶」的功能。

基本原則是:提示詞的思路是完全可以借鑑的,但具體的功能名稱和證據來源需要換成你那個平台實際支持的東西,不能直接照抄

還有一點我需要額外說清楚,因為我自己也想過這個問題:有沒有可能把這份提示詞直接放進全局規則裏,讓它每次對話都自動跑?

後來我的判斷是不建議這麼做。

原因很簡單:這份提示詞要做的事情其實還是蠻重的,它需要回顧 30 天的歷史、識別模式、生成資產,這是一個即耗時又耗資源的任務,不適合每次開口就觸發一遍。

它更適合一個「月度」或「周度」的定期自檢任務。

你主動喊它跑一次,看看結果,確認沒問題,而不是開機就「掛在後台跑的常駐程序」。

最合適的用法,是你每隔兩三週,或者感覺最近重複性工作明顯變多的時候,專門在項目下開一個新會話,把這個提示詞發出去,讓 Agent 做一次系統性的梳理。

寫在最後

最後再說幾個需要注意的地方。

首先,這份提示詞對 Agent 的能力是有一定要求的。

如果你用的 Agent 歷史記錄很短,或者根本不支持跨會話記憶,它是回顧不到什麼有效內容的,給出的結果也會很空洞甚至亂猜。這種情況下你會看到 Agent 給你列出一堆「可能重複」的工作,但其實只是根據你這次對話隨手編的,沒有實際價值。

其次,Agent 在識別重複模式這件事兒上,目前還不夠精準。

它肯定能找到明顯的重複,比如你每次都要手動整理某個格式的文檔。但對於隱性的重複,比如你每次遇到某類問題時都在繞同一個彎路,感知能力要弱一些。所以跑完之後別嫌麻煩,最好親自再過一遍清單,別閉眼全信。

還有就是,這份提示詞本身只是一個模板,它給了你一個做事兒的框架和結構,但真正有沒有用,還是得取決於你過去的工作記錄有多豐富、多清晰。你記錄得越多,Agent 能找到的有效模式就越多;你記錄得一團糟,甚至沒執行過什麼任務,那它能提供給你的建議信息自然也就很有限了。

但總的來說吧,Greg Brockman 轉發這條內容我覺得並非他沒事兒閒的(畢竟他平時確實很少發帖)。它確實戳中了一個很多重度 Agent 用戶都在默默忍受的真實痛點:

我們每天在用 AI 幹活,但從來沒有系統性地讓 AI 學會我們的工作習慣

這份提示詞給了一個具體的、可操作的解法,哪怕你現在只是偶爾用用 Codex 或者 Claude Code,我覺得也非常值得收藏起來。

等你覺得「最近怎麼總在重複同樣的事兒」的時候,就可以拿出來跑一次試試。

看看能得到什麼樣的結果或者建議。


既然看到這兒了,如果覺得還不錯,幫忙隨手點個「贊」、「在看」、「轉發」三連;如果想第一時間收到推送,也可給我加個星標★,非常感謝!