OpenAI大神教你如何榨乾Codex

作者:量子位
日期:2026年5月23日 下午2:06
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Codex使用心法:長期線程+Heartbeats+本地記憶,令AI真正上崗

整理版摘要

Jason LiuInstructor開源庫作者,啱啱加入OpenAI Codex團隊冇耐,就喺社交平台公開佢嘅Codex玩法。呢篇文章係佢嘅實戰心得,核心係想解決點樣令Codex唔只係一次性問答工具,而係一個可以長期運行、持續接管任務嘅工作系統。整體結論係:Codex已經從工具變成員工,比拼嘅係邊個可以令佢持續工作更耐。

Jason嘅做法係開一堆跨月存活嘅巨型線程,每個對應一個工作流,例如日程、開源項目、社交監控等,透過Command-1Command-9一鍵跳轉。佢主要靠口述落指令,保持原始思路,配合Codex嘅Steering功能可以插隊追加指令。最關鍵嘅係Heartbeats定時機制,畀Agent可以自動掃Slack、Gmail,甚至幫手等亞馬遜退款,洗完澡出嚟已經搞掂。

記憶方面,Jason幾乎放棄Codex內置記憶,改用Obsidian vault存放核心知識,目錄分TODO、people、projects等板塊,頂層AGENTS.md寫明規則。咁樣數據完全屬於自己,方便搬遷同版本控制。任務一定要有驗證機制(例如通過測試),先算完成,否則只係願望。最新嘅Goal模式已經轉正,但前提係有清晰可驗證嘅反饋閉環。

  • Codex應該被改造成長期運行嘅系統,而唔係一次過對話。Jason開咗多個跨月線程,令Agent有連續性。
  • 口述命令配合Steering功能,可以保留模糊思路,同時喺執行途中插隊追加指令。
  • Heartbeats定時任務係核心:每30分鐘掃一次Slack/Gmail,自動起草回覆;仲可以監控動畫渲染反饋,自動重新渲染。
  • 個人記憶應該放喺本地文件(Obsidian vault),唔好依賴平台內置記憶,因為文件更容易控制、備份同搬遷。
  • 每個任務都要有驗證機制(例如通過測試),否則只係願望;Goal模式正式轉正,但前提係有清晰可驗證嘅反饋閉環。
整理重點

將Codex變成24小時員工

Jason認為多數人用Codex嘅方式係單次問答,關閉會話就冇咗。佢嘅做法係開一堆跨月存活嘅巨型線程,每個對應一個工作流,例如Command-1Command-9一鍵跳轉。線程裡面累積幾個月嘅歷史,Agent自然有連續性。

單次問答

長期線程

口述命令

整理重點

Heartbeats定時任務:幫你打工24小時

Heartbeats本質上係畀Agent加咗一層定時任務調度。Jason有個Chief of Staff線程,每30分鐘跑一次——掃一遍Slack同Gmail,判斷優先級,起草回覆草稿,最終由人決定發唔發。

Heartbeats

每30分鐘

  1. 1 Chief of Staff線程每30分鐘掃SlackGmail,判斷優先級,起草回覆草稿,最終由人決定發唔發。
  2. 2 動畫項目:每15分鐘檢查Slack審閲線程,有反饋就重新渲染並上傳。

驗證機制

整理重點

記憶掌握喺自己手裡

Jason幾乎放棄Codex嘅內置記憶系統,將核心記憶數據存放喺本地Obsidian vault入面。目錄劃分為TODO、people、projects、agent、notes等板塊,頂層AGENTS.md寫明規則:任何變動都要同步更新知識庫。

Obsidian vault

AGENTS.md

  • 數據完全屬於自己,可隨時查閲手動修改
  • 可用版本對比查看變動
  • 出現問題可以一鍵roll back
  • 換工具或遷平台時拎住知識庫就走

文件系統

整理重點

Codex最新功能:鎖屏都開工

最新Codex更新包括Goal模式正式轉正、Appshots截圖直餵、鎖屏後遠程工作。Jason最鍾意嘅交付形式係一個帶JS同CSS嘅單文件index.html,唔使部署。

Goal模式

鎖屏繼續工作

可複用工作流模板

佢仲將Connectors同Skills打包成可複用工作流模板,成功做完一件事就將流程打包,下次直接調用。

聞樂 報導 來自 凹非寺
量子位 | 微信公眾號 QbitAI

新入職嘅員工真係毫無保留。

Jason Liu,係13k星開源庫Instructor嘅作者,啱啱俾OpenAI招入Codex團隊冇幾耐,唔單止喺社交平台大方派API額度;

圖片

仲寫咗篇Codex-maxxing,將自己嘅Codex玩法全部爆曬出嚟。

圖片

仲係要Codex自動跟進亞馬遜退款、定時掃Slack接需求、開住Heartbeats喺你沖涼嘅時候幫你做嘢嗰種。

Codex每週活躍用戶4月底已經突破400萬,終於嚟咗份「官方使用指南」。

圖片

啱啱好,呢兩日Codex又更新咗一輪:Appshots截圖直接餵、Goal模式正式轉正、鎖屏後都可以遠程做嘢

圖片

夾埋Jason嘅使用心法一齊睇會發現,而家大家比拼嘅,係邊個可以持續做嘢更耐,邊個可以真正上崗喇……

等佢自己行起嚟

Jason成個玩法嘅核心,係將Codex改造咗一個可以長期運行、持續接管任務嘅工作系統。

多數人習慣單次問答結束就關閉對話,但Jason係開住一大堆跨月仍然存活嘅巨型線程,唔會隨便終止。

佢俾每個工作流一個置頂線程:管日程嘅一個、管開源項目嘅一個、監控社交平台嘅一個……經由Command-1到Command-9一鍵跳轉。

圖片

線程入面積累咗幾個月嘅對話歷史、偏好同決策,再次使用時唔使重新交代背景,Agent就可以自動承接進度。

當線程生命週期被拉長之後,項目背景、溝通習慣同歷史決策都會自然沉澱入去,Agent開始具備連續性。

而且Jason落任務唔打字,主要靠講。

喺佢睇嚟,口述可以完整保留原始思路,唔需要刻意優化Prompt,可以直接將模糊、跳躍、帶溯源需求嘅想法原樣掟俾Agent。

再配合Codex嘅Steering功能,仲可以喺Agent執行任務時插隊追加指令,講完就走,唔使乾等。

不過,真正令Codex由工具變成員工嘅,係Heartbeats+@computer呢套組合拳。

圖片

Heartbeats本質上相當於俾Agent加咗一層定時任務調度。

Jason有個Chief of Staff線程,每30分鐘行一次——

掃一次Slack同Gmail,睇下有冇需要回覆嘅訊息,判斷優先級,需要回覆嘅先起草一份草稿,但唔發送,最後由人決定係咪發出。

佢仲舉咗一個更複雜嘅例子,做動畫項目時,佢會先將影片發去Slack審閲線程,然後叫Codex每15分鐘檢查一次線程。

如果同事畀咗反饋,Codex就會重新渲染一個新版本並回覆到線程入面。

因為Slack MCP伺服器仲未支援文件上傳,Agent甚至會自己調用@computer去㩒「Add file」掣,將渲染好嘅文件傳上去。

仲有一次,Jason喺沖涼前叫Codex睇住亞馬遜客服排隊狀態,結果等佢沖完涼出嚟,退款已經到帳了。

類似嘅流程,而家已經可以擴展到Google Docs評論、GitHub PR Review等場景,只要有反饋就自動推進下一步。

圖片

Jason最強調嘅一點,係驗證機制,可以判斷任務幾時終止。

佢試過叫Codex將Python嘅Rich庫完整遷移到Rust,硬性要求係必須通過原Python庫嘅所有單元測試。

測試過唔過到,決定咗任務係咪完成;失敗咗,Agent就繼續改。

用佢嘅話講:

冇驗證機制嘅野心,最多算係個願望咋。

圖片

而喺最新嘅呢次更新中,OpenAI已經將Goal模式由實驗版本變做正式版喇

你只要明確一個最終目標同驗收標準,Codex就會自主持續推進,短則幾小時長則數天,中途可以查進度、調方向,亦可以直接暫停。

但前提係任務本身必須有清晰、可驗證嘅反饋閉環。

記憶放喺自己手度

Jason呢套用法嘅另一大核心思路,係個人工作記憶唔應該託管喺平台內部

佢所有嘅長期線程都係由一個Obsidian vault開始,目錄劃分為TODO、people、projects、agent、notes等板塊。

圖片

喺頂層AGENTS.md入面寫明規則:人員資訊更新、項目推進、待辦辦結等變動,都要同步更新知識庫對應內容。

即係話,佢幾乎放棄咗Codex嘅內置記憶系統,將核心記憶數據存放喺本地可控文件入面,既可以隨時查閲手動修改,都可以經由版本對比睇變動,出現問題仲可以一鍵roll back。

原因係AI承載嘅記憶體量越大,就越唔應該將數據鎖死喺單一平台。

而文件係完全屬於用戶自己嘅,後續想換工具、轉平台,拎住知識庫就可以走,毫無顧慮。

佢都有提Codex自帶嘅記憶功能Chronicle,經由截取屏幕內容嚟構建上下文。

但呢個係需要手動開啓嘅實驗預覽功能,喺權限、速率同隱私方面依然有短板,整體方向可行但仲未夠成熟。

所以,喺佢睇嚟,文件系統依然係最可靠嘅記憶基礎設施。

而且Codex工作枱本身都在升級。

Codex嘅側邊欄唔再侷限聊天交互,可以直接渲染Markdown、篩選表格、閲覽PDF同PPT。

圖片

Agent仲可以經由內置瀏覽器用JavaScript控制網頁,用戶可以邊睇邊標註,唔使來回切窗口。

Jason話佢成日喺側邊面板入面同時打開Storybook審閲UI組件、用Remotion Studio做動畫、用Slidev做演示文稿。

而佢最鍾意嘅交付形式,就係一個帶JS同CSS嘅單文件index.html,唔使部署,唔用伺服器,打開就可以行。

另外,佢仲將Connectors同Skills當做可複用工作流模版。

只要成功做完一件有用嘅事,就將流程打包起嚟,下次Codex唔使重新學,直接調用就得。

最近Codex仲補咗一手遠程能力,電腦鎖屏後Codex可以繼續工作,手機端都可以實時查看、審批甚至接管任務。

而家好啦,你收工佢加班,你鎖屏佢做嘢,超額KPI呢唔就嚟咗……

不過,當AI可以持續接管工作,人自己反而越來越輕鬆咗(doge)。

參考連結:https://x.com/jxnlco/status/2057153744630890620


一鍵三連「讚好」「轉發」「心心」

歡迎喺留言區留低你嘅想法!

—  —


專屬AI產品從業者嘅實名社羣,只傾AI產品最貼地嘅真問題 圖片 掃碼添加小助手,發送「姓名+公司+職位」申請入羣~
圖片
入羣後,你將直接獲得:
 👉 最新最專業嘅AI產品資訊同分析 🔍 
 👉 不定期發放嘅熱門產品內測碼 🔥
 👉 內部專屬內容同專業討論 👂


🌟 點亮星標 🌟

科技前沿進展每日見

聞樂 發自 凹非寺
量子位 | 公眾號 QbitAI

新晉員工確實毫無保留。

Jason Liu,13k星開源庫Instructor的作者,剛被OpenAI招進Codex團隊沒多久,不僅在社交平台大方發API額度;

圖片

還寫了篇Codex-maxxing,把自己的Codex玩法全抖出來了。

圖片

而且是讓Codex自動跟進亞馬遜退款、定時掃Slack接需求、開着Heartbeats在你洗澡的時候幫你幹活的那種。

Codex周活用戶4月底已經破了400萬,終於來了份“官方使用指南”。

圖片

正好,這兩天Codex又更新了一波:Appshots截圖直喂、Goal模式正式轉正、鎖屏後也能遠程幹活

圖片

跟Jason的使用心法疊在一起看會發現,現在大家比拼的,是誰能持續工作更久,誰能真正上崗了……

讓它自己跑起來

Jason整套玩法的核心,是把Codex改造成了一個能長期運行、持續接管任務的工作系統。

多數人習慣單次問答結束就關閉會話,但Jason是開着一堆跨月存活的巨型線程,不會隨意終止。

他給每個工作流一個置頂線程:管日程的一個、管開源項目的一個、監控社交平台的一個……通過Command-1到Command-9一鍵跳轉。

圖片

線程裏積累了幾個月的對話歷史、偏好和決策,再次使用時不用重新交代背景,Agent就能自動承接進度。

當線程生命週期被拉長後,項目背景、溝通習慣和歷史決策都會自然沉澱進去,Agent開始具備連續性。

而且Jason下任務不打字,主要靠說。

在他看來,口述能完整保留原始思路,不需要刻意優化Prompt,可以直接把模糊、跳躍、帶溯源需求的想法原樣丟給Agent。

再配合Codex的Steering功能,還能在Agent執行任務時插隊追加指令,說完就走,不用幹等。

不過,真正讓Codex從工具變員工的,是Heartbeats+@computer這套組合拳。

圖片

Heartbeats本質上相當於給Agent加了一層定時任務調度。

Jason有個Chief of Staff線程,每30分鐘跑一次——

掃一遍Slack和Gmail,看看有沒有需要回復的消息,判斷優先級,需要回復的先起草一份草稿,但不發送,最終由人來決定是否發出。

他還舉了一個更復雜的例子是,做動畫項目時,他會先把視頻發到Slack審閲線程,然後讓Codex每15分鐘檢查一次線程。

如果同事提了反饋,Codex就重新渲染一個新版本並回復到線程裏。

因為Slack MCP服務器還不支持文件上傳,Agent甚至會自己調用@computer去點“Add file”按鈕,把渲染好的文件傳上去。

還有一次,Jason在洗澡前讓Codex盯着亞馬遜客服排隊狀態,結果等他洗完澡出來,退款已經到賬了。

類似的流程,現在已經能擴展到Google Docs評論、GitHub PR Review等場景,只要有反饋就自動推進下一步。

圖片

Jason最強調的一點,是驗證機制,可以判斷任務什麼時候終止。

他試過讓Codex把Python的Rich庫完整遷移到Rust,硬性要求是必須通過原Python庫的所有單元測試。

測試能不能通過,決定了任務是否完成;失敗了,Agent就繼續修。

用他的話說:

沒有驗證機制的野心,頂多算個願望而已。

圖片

而在最新的這次更新中,OpenAI已經把Goal模式從實驗版本轉正了

你只要明確一個最終目標和驗收標準,Codex會自主持續推進,短則幾小時長則數天,中途可以查進度、調方向,也可以直接暫停。

但前提是任務本身必須存在清晰、可驗證的反饋閉環。

記憶放在自己手裏

Jason這套用法的另一大核心思路,是個人工作記憶不應該託管在平台內部

他所有的長期線程都從一個Obsidian vault起步,目錄劃分為TODO、people、projects、agent、notes等板塊。

圖片

在頂層AGENTS.md裏寫明規則:人員信息更新、項目推進、待辦辦結等變動,都要同步更新知識庫對應內容。

也就是說,他幾乎放棄了Codex的內置記憶系統,把核心記憶數據存放在本地可控文件中,既能隨時查閲手動修改,也能通過版本對比查看變動,出現問題還能一鍵roll back。

原因是AI承載的記憶體量越大,就越不該把數據鎖死在單一平台。

而文件是完全屬於用戶自己的,後續想換工具、遷平台,拎着知識庫就能走,毫無顧慮。

他也提到了Codex自帶的記憶功能Chronicle,通過截取屏幕內容來構建上下文。

但這是需要手動開啓的實驗預覽功能,在權限、速率和隱私方面存仍在短板,整體方向可行但還不夠成熟。

所以,在他看來,文件系統仍然是最可靠的記憶基礎設施。

而且Codex工作台本身也在升級。

Codex的側邊欄不再侷限聊天交互,可直接渲染Markdown、篩選表格、閲覽PDF與PPT。

圖片

Agent還能通過內置瀏覽器用JavaScript控制網頁,用戶可以邊看邊標註,不用來回切窗口。

Jason說他經常在側邊面板裏同時打開Storybook審閲UI組件、用Remotion Studio做動畫、用Slidev做演示文稿。

而他最喜歡的交付形式,就是一個帶JS和CSS的單文件index.html,不用部署,不用服務器,打開就能跑。

另外,他還把Connectors和Skills作為可複用工作流模版。

只要成功做完一件有用的事,就把流程打包起來,下次Codex不用重新學,直接調用就行。

最近Codex還補了一手遠程能力,電腦鎖屏後Codex可以繼續工作,手機端也能實時查看、審批甚至接管任務。

現在好了,你下班它加班,你鎖屏它幹活,超額KPI這不就來了……

不過,當AI可以持續接管工作,人自己倒是越來越輕鬆了(doge)。

參考連結:https://x.com/jxnlco/status/2057153744630890620


一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

—  —


專屬AI產品從業者的實名社羣,只聊AI產品最落地的真問題 圖片 掃碼添加小助手,發送「姓名+公司+職位」申請入羣~
圖片
進羣后,你將直接獲得:
 👉 最新最專業的AI產品信息及分析 🔍 
 👉 不定期發放的熱門產品內測碼 🔥
 👉 內部專屬內容與專業討論 👂


🌟 點亮星標 🌟

科技前沿進展每日見