30 分鐘掌握 Codex 95% 的能力?!不相信?一起學習:七大核心能力 + 一個彩蛋功能!
整理版優先睇
30分鐘掌握 Codex 95% 嘅能力?拆解七大核心能力同一個彩蛋功能
呢篇文章係根據知名 AI 開發者 Riley Brown 嘅 YouTube 影片《Learn 95% of Codex in 30 minutes》整理。佢係 VibeCode.dev 嘅聯合創始人,認為 OpenAI Codex 已經唔係一個單純寫程式嘅工具,而係一個可以完成「任何知識工作+編碼工作」嘅桌面級 AI 智能體超級應用。影片以七大核心能力加一個彩蛋功能做主線,系統咁拆解 Codex 同 ChatGPT、Claude、Claude Code 等工具嘅本質差異,同埋佢喺真實業務流程中嘅落點。
作者反覆強調,Codex 同 ChatGPT/Claude 最根本嘅分別在於檔案系統存取權限。ChatGPT 同 Claude 將你上傳同生成嘅檔案儲存喺雲端,形成一個「對話沙盒」;而 Codex 所有輸入同產出都直接落喺你本地電腦嘅真實檔案系統,Agent 擁有對本機檔案嘅完整讀寫權限,仲可以進一步控制瀏覽器同操作系統。呢個分別令 Codex 更接近 Claude Code/Cursor Agent 呢一類面向真實工作流程嘅本地代理,但配上一個對非開發者都友善嘅圖形界面。影片繼而詳細介紹七大能力:完整檔案存取、持久化記憶、插件連接、可重用技能、內置圖像生成、瀏覽器與操作系統級控制,同埋定時自動化,最後仲有一個彩蛋功能 Chronicle 環境感知記憶。
整體嚟講,呢套能力結構同業界已經成型嘅 Agent 設計範式高…
- Codex 同 ChatGPT/Claude 最核心嘅分別係本地檔案存取權限:Codex 直接讀寫你電腦上嘅真實檔案,唔係雲端沙盒。
- 七大核心能力包括 Full File Access、Persistent Memory、Plugins、Skills、GPT Image Access、Browser & Computer Use 同 Automations,涵蓋從連接、流程到排程嘅完整工作流。
- Skills 係可重用 SOP,最佳做法係喺使用中迭代演化:每次滿意嘅結果都可以話「請記住」,Agent 就會更新 SKILL.md 檔案。
- Automations 可以將單次任務變成定時或觸發式自動化,例如每週五早上自動跑銷售線索分析,等於 AI 員工。
- 彩蛋 Chronicle 環境感知令 Agent 擁有「見到你喺做乜」嘅能力,但因為持續截圖,要留意私隱同合規問題。
Learn 95% of Codex in 30 minutes
Riley Brown 嘅 YouTube 影片,詳細講解 Codex 七大核心能力同彩蛋功能。
內容結構
[Chronicle 環境感知] ←— 視覺上下文輸入 ↓[File System 全訪問] + [Persistent Memory] ←— 持久狀態層 ↓[Plugins 外部連接] ←— 工具層(與 SaaS / 系統對接) ↓[Skills 可複用流程] ←— 程序化知識層(SOP) ↓[Browser / Computer Use] ←— 執行層(GUI 級動作) ↓[Automations 調度] ←— 時間維度的觸發器
Codex 根本唔係更強嘅 ChatGPT,而係本地 Agent
作者 Riley Brown 喺影片開頭就點出:Codex 同 ChatGPT/Claude 最大分別係檔案系統存取權限。
ChatGPT/Claude 係雲端沙盒,而 Codex 直接操作本地電腦嘅真實檔案
呢個分別決定咗 Codex 唔係「更強嘅 ChatGPT」,而係面向真實工作流程嘅本地代理。Agent 擁有對本機檔案嘅完整讀寫權限。
以項目=文件夾組織工作,天然解決 Agent 失憶同產出散落問題
作者建議,用家應該以呢個方式組織工作。
善用 AGENTS.md 將個人偏好固化為 Agent 行為規範
七大核心能力解構
影片逐一介紹七大能力,每個都有實戰演示。以下係精華一覽:
- 1 Full File Access:可直接讀取 Downloads 入面 60 張收據圖片,進行 OCR、分類、彙總,最終生成 Excel。輸出物保留喺本地,可以一按「Open in Folder」打開。
- 2 Persistent Memory:分手動(AGENTS.md)同自動(~/.codex/memories/)兩種。直接同 Agent 講「請記住」即可寫入偏好,由 Agent 自己維護自動記憶文件,定期閲讀可瞭解 Agent 對你嘅畫像。
- 3 Plugins:連接超過 100 個外部 SaaS,例如 Gmail、Notion。用 @ 呼叫,示範咗從 Gmail 揾品牌方做推廣調研,同埋模仿 Notion 內容寫作語氣。
- 4 Skills:可重用 SOP,存放喺 plugins/skills/,用 /skill_name 呼叫。最佳做法係先同 Agent 來回打磨到滿意,再請佢沉澱為 skill,之後每次使用都可以迭代更新。
- 5 GPT Image Access:內置 GPT-image-2 圖像模型,可以根據示意圖生成產品圖,例如唔同人種模特穿着同一件毛衣嘅相。
- 6 Browser & Computer Use:Agent 可以接管你嘅鼠標鍵盤操作 Canva,或者打開瀏覽器測試自己生成嘅應用,實現開發者兼測試者嘅自動化 QA 閉環。
- 7 Automations:一句話將單次會話變成定時任務:「每週五早 9 點跑一次呢個流程」,自動創建記錄,包含觸發時間、所用 Skill、狀態同上次運行時間。
Plugin vs Skill 嘅邊界:Plugin = 連接+工具,Skill = 流程指令
Skill 係「活文檔」,每次使用都係迭代機會
Browser & Computer Use 實現自動化 QA 閉環:Agent 同時係開發者同測試者
彩蛋:Chronicle 環境感知記憶
Chronicle 係 Codex 嘅隱藏功能,開啟後會持續對你嘅屏幕進行截圖採樣,並將視覺上下文餵俾 Agent。
Agent 第一次擁有「見到你喺做乜」嘅環境感知
示範中,作者冇上傳任何文件,只係話「用 Chronicle 睇下我演示文稿仲應該加啲乜」,Agent 基於近期截圖列出咗具體建議,例如「Codex 超級應用地圖」等。
Always-on 屏幕錄製有私隱考量
工程啟示:點樣用好 Codex
作者總結咗幾個實用建議,係從影片中提煉出嚟嘅 actionable insights:
- 以項目文件夾為單位組織 Agent 工作,天然解決 Agent 失憶同產出散落問題。
- 善用 AGENTS.md 將個人品味同規範固化,係將偏好「編譯」成 Agent 行為嘅最低成本路徑。
- Skill 唔好一次寫好,要喺使用中演化。每次滿意嘅結果都係一次免費嘅 SOP 升級。
- 真正放大槓桿係 Automations:定時跑銷售線索分析、郵件彙總、內容選題等高頻低價值工作。
- 對 Chronicle 持謹慎態度:涉及客戶數據或機密文件時,先確認截圖記錄嘅合規邊界。
真正放大槓桿係 Automations:定時跑高頻低價值工作
Codex 定位係通用知識工作 Agent 嘅桌面 OS
一句話總結:呢期影片嘅真正價值唔止係「教你 7 個功能」,而係傳遞咗一個判斷——OpenAI 將 Codex 打造成一個完整嘅工作台。
30分鐘學識Codex嘅95%能力
一位知名AI開發者、VibeCode.dev嘅聯合創始人Riley Brown最新發布嘅YouTube影片 30分鐘學識Codex嘅95%能力佢話:OpenAI Codex已經唔單止係一個寫程式嘅工具,而係一個可以完成「任何知識工作+編碼工作」嘅桌面級AI智能體超級應用。
30分鐘學識Codex嘅95%能力
https://www.youtube.com/watch?v=474wZZHoWN4[1]
條片以「七大核心能力+一個彩蛋功能」做主線,系統咁拆解咗Codex同ChatGPT、Claude、Claude Code呢啲工具嘅本質差異,仲有佢喺真實業務流程入面嘅落點。
半個鐘,真係可以令我哋學識Codex嘅95%能力?唔信?一齊睇下,睇完再嚟評論!
Codex同ChatGPT/Claude嘅根本分別
呢個係成條片嘅隱含前提,作者不停強調:
- ChatGPT / Claude你上載嘅檔案、生成嘅檔案都儲存喺雲端,係一個「對話沙盒」。
- Codex所有輸入同產出都直接落喺你本地電腦嘅真實檔案系統上面,而且Agent擁有對本機檔案嘅完整讀寫權限,仲可以進一步控制瀏覽器同操作系統。
呢個差別決定咗Codex唔係「更強嘅ChatGPT」,而係更加接近Claude Code / Cursor Agent嗰一類——面向真實工作流程嘅本地代理——但係配咗一個對非開發者都友好嘅圖形界面。
七大核心能力解讀
能力1:Full File Access(完整檔案存取)
示範場景將60幾張收據圖片擺喺 Downloads/receipts to process 下面,叫Agent做OCR、分類、滙總,最後生成帶dashboard、分類滙總、付款方式分析嘅Excel。
關鍵點:
- Agent經本機路徑直接讀取原始檔案(而唔係用戶手動逐個上載)。
- 輸出物(xlsx)都保留喺本地,可以一撳「Open in Folder」定位。
- 作者建議:以「項目(Project)= 資料夾」嚟組織工作每個Project就係磁盤上一個真實目錄,所有嗰個Project入面嘅對話都默認喺嗰個目錄讀寫檔案,仲可以用
@文件名跨對話引用前面產生嘅文檔。
工程意義呢樣將Agent嘅「工作記憶」明確映射到咗檔案系統。呢個係Claude Code嘅設計哲學,但Codex就將佢包裝成普通用戶都理解到嘅「項目+聊天」模型。
能力2:Persistent Memory(持久記憶)
Codex分開兩種記憶:
| 類型 | 文件 | 誰來寫 | 用途 |
|---|---|---|---|
| 手動記憶 | AGENTS.md | 你(或者你叫Agent寫) | 你明確想Agent長期遵守嘅偏好、規範 |
| 自動記憶 | ~/.codex/memories/ 下面嘅檔案 | Agent自己維護 | Agent對你工作模式嘅觀察 |
作者嘅實際建議好務實:
- 如果想固定一個偏好(例如「以後整landing page都用左邊目錄佈局」),直接同Agent講「請記住」,佢會將呢條寫入
AGENTS.md。 - 唔好手動改自動記憶檔案叫Agent自己維護就得,定期睇佢可以反過來瞭解Agent對你嘅畫像。
呢個本質上係Cursor / Claude Code早已經採用咗嘅 AGENTS.md / CLAUDE.md 規範,OpenAI喺Codex入面做咗產品化。
能力3:Plugins(插件 / 外部連接)
Plugins係Codex同外部SaaS(Slack、Gmail、Notion等,作者話而家已經超過100個)打通嘅連接層,相當於MCP / Connectors嘅產品化封裝。
示範場景:
- 裝好Gmail插件之後,叫Agent「翻查過去兩個星期嘅電郵,揾出所有想揾我做付費推廣嘅品牌方,做咗調研之後輸出表格」——大約5分鐘就出一份帶研究備註嘅品牌方清單。
- 裝好Notion插件之後,叫Agent由用戶嘅Notion入面讀取以前嘅高質素長影片腳本,學習作者嘅寫作語氣再為新主題生成一份「聽起嚟就係作者本人寫嘅」草稿。
調用方式方面,輸入 @ 就會彈出插件菜單,體驗對標Cursor嘅 @ 選擇器。
能力4:Skills(技能 / 可重用SOP)
作者將Skills形容為「reusable workflow recipes / SOP」——一份叫Agent每次跟從嘅指令檔案。佢哋存放喺 plugins/skills/ 下面,調用方式係 /skill_name。
兩種創建方式:
- Prompt-to-Skill(直接生成)一句說話「創建一個叫X嘅skill,做Y」。簡單,但作者覺得效果一般。
- 手動迭代之後反向萃取(推薦)先同Agent來回打磨,直到產出真係令你滿意,再講「我對呢個結果滿意,請將佢沉澱成一個skill」。Agent會回顧成個對話,將你認可嘅工作流程寫成
SKILL.md。
進一步嘅關鍵洞察(作者明確提到):
每一次用舊skill,都係迭代佢嘅機會——發現新亮點直接講「以後都係咁做」,叫Agent更新skill檔案。
呢個將skill當成「活文檔」,而唔係一次性prompt。呢個思路同Anthropic嘅Skills規範完全一致:Skills = 可演化嘅過程性知識。
Plugin同Skill嘅邊界:
- Plugin = 同外部系統嘅「連接+工具」。
- Skill = 用呢啲工具做某件事嘅「流程指令」。
- 一個Skill可以調用多個Plugin(例如 brand-deal-researcher 內部調用Gmail插件)。
能力5:GPT Image Access(原生圖像生成)
Codex內置咗圖像生成能力(GPT-image-2,目前OpenAI最強嘅圖像模型)。
演示上載一張毛衣樣板圖,叫Agent生成5張唔同種族模特兒、唔同人數(1/1/1/3/5人)着住件毛衣嘅產品圖。
工程上值得注意:圖像生成喺Codex入面以一個內置skill(image-gen) 嘅形式存在,同第三方skill平起平坐。呢個意味住所有「內置能力」都用Skills呢套抽象統一描述——呢個係一個乾淨嘅設計選擇。
能力6:Browser & Computer Use(瀏覽器同操作系統級控制)
兩個能力以 Plugin 形式提供:@computer use 與 @browser use。
Computer Use示範叫Agent打開本機Canva客戶端,新建簡報,將啱啱生成嘅5張產品圖一圖一頁放埋入去。Agent真係接管咗滑鼠、操作Canva。
Browser Use示範將生成嘅HTML檔案轉成一個測驗類小應用,然後叫Agent 自己打開瀏覽器測試呢個應用——撳Start、答題、驗證答案啱唔啱、檢查側邊欄同滾動行為。呢個本質上係一個自動化QA閉環Agent同時係開發者又係測試者。
呢個係Codex最具顛覆性嘅能力:人機互動嘅三件套(鍵盤、滑鼠、屏幕)正式俾Agent接管令任何喺GUI入面完成到嘅工作都進入Agent可以做到嘅範圍。
能力7:Automations(定時同觸發式自動化)
任何已經行得通嘅對話都可以「一句說話變定時任務」:
「請逢星期五朝早9點行一次呢個流程,並更新呢張表。」
Agent會喺Automations面板度創建一條記錄,包含觸發時間、所用Skill、活動狀態、上次運行時間等。
呢個將前面六項能力閉合成一個完整嘅工作流程系統:
Plugins(連接) → Skills(流程) → Automations(調度)
效果上相當於一個為個人度身訂造、由自然語言配置嘅Zapier / n8n。
彩蛋:Chronicle(環境感知記憶)
開咗之後,Codex會持續對你嘅屏幕進行截圖採樣並將呢啲視覺上下文餵俾Agent。
演示作者冇上載任何檔案,只係講「用Chronicle睇下我份簡報入面仲應該加啲乜」,Agent直接根據近期截圖,列出咗「Codex超級應用地圖」、「全控制環路圖」、「prompt檔案示意」等具體補充建議。
作者老實指出:呢個功能有啲侵入性(長期開着屏幕錄製→截圖)。但佢嘅價值都好明確——Agent第一次擁有咗「睇到你正在做乜嘢」嘅環境感知呢個係由「被動回應prompt」走向「主動協作」嘅關鍵技術原語。
整體框架嘅工程評價
將七大能力抽象一下,可以畫出Codex嘅能力棧:
[Chronicle 環境感知] ←— 視覺上下文輸入
↓
[File System 全訪問] + [Persistent Memory] ←— 持久狀態層
↓
[Plugins 外部連接] ←— 工具層(與 SaaS / 系統對接)
↓
[Skills 可複用流程] ←— 程序化知識層(SOP)
↓
[Browser / Computer Use] ←— 執行層(GUI 級動作)
↓
[Automations 調度] ←— 時間維度的觸發器
呢套結構同行業已經成熟嘅Agent設計範式高度吻合(Claude Code、Cursor、Anthropic Skills、MCP等),但Codex嘅差異在於:
- 統一嘅產品形態將「開發者工具+知識工作工具」合併成一個GUI App,非工程背景嘅用戶都用得到。
- 以本地檔案系統為真實狀態避免咗雲端沙盒帶來嘅遷移成本同不可見性。
- Skills + Plugins雙軸清楚區分「做乜嘢嘅流程」同「用乜嘢去做」,呢個係ChatGPT早期Custom GPT體系所欠缺嘅。
- Automations將單次任務變成持續服務由「AI助手」過渡到「AI員工」。
對個人/團隊工作流程嘅實際啓示
- 以項目資料夾為單位組織Agent工作自然解決咗「Agent失憶」同「產出散落」兩大痛點。
- 善用AGENTS.md將品味同規範固定呢個係將個人偏好「編譯」成Agent行為嘅最低成本路徑。
- Skill唔好一次過寫好,要喺使用入面演化每一次「我希望以後都係咁做」都係一次免費嘅SOP升級。
- 真正可以放大槓桿嘅係Automations定時行銷售線索分析、電郵滙總、內容選題、對賬呢啲高頻低價值工作,係個人ROI最高嘅切入點。
- 對Chronicle保持謹慎態度喺涉及客戶數據、機密文檔嘅環境入面啓用之前,先諗清楚截圖記錄嘅合規邊界。
一句講曬總結
呢期影片嘅真正價值唔止在於「教你7個功能」,而係傳遞咗一個判斷:
OpenAI將Codex定位為「通用知識工作Agent嘅桌面OS」——本地檔案係狀態,AGENTS.md係偏好,Plugins係外設,Skills係程序,Browser/Computer Use係執行器,Automations係cron,Chronicle係感知層。當呢套抽象俾普通用戶接受嘅時候,AI先真正由「對話框」走入咗「工作台」。
相關資源推薦
由Claude Code忠實用戶到被說服轉用Codex:一場64分鐘嘅OpenAI Codex大師課
OpenAI Codex核心成員訪問:Codex團隊點樣用Codex做研發工作,對AI Native團隊又有邊啲重要啓發?
Learn 95% of Codex in 30 minutes
一位知名 AI 開發者、VibeCode.dev 聯合創始人 Riley Brown 最新發布的 Youtube 視頻 Learn 95% of Codex in 30 minutes,他表示:OpenAI Codex 已不只是一個寫代碼的工具,而是一個能完成"任何知識工作 + 編碼工作"的桌面級 AI 智能體超級應用。
Learn 95% of Codex in 30 minutes
https://www.youtube.com/watch?v=474wZZHoWN4[1]
視頻以"七大核心能力 + 一個彩蛋功能"為主線,系統拆解了 Codex 與 ChatGPT、Claude、Claude Code 等工具的本質差異,以及它在真實業務流中的落點。
半個小時,真的能讓我們學習到 Codex 95% 的能力?不信?一起看看,看完再來評論!
Codex 與 ChatGPT/Claude 的根本區別
這是整段視頻的隱含前提,作者反覆強調:
- ChatGPT / Claude:你上傳的文件、生成的文件都存儲在雲端,是一個"對話沙盒"。
- Codex:所有輸入與產出都直接落在你本地電腦的真實文件系統上,並且 Agent 擁有對本機文件的完整讀寫權限,還能進一步控制瀏覽器與操作系統。
這一差別決定了 Codex 不是"更強的 ChatGPT",而是更接近 Claude Code / Cursor Agent 那一類——面向真實工作流的本地代理——但配了一個對非開發者也友好的圖形界面。
七大核心能力解讀
能力 1:Full File Access(完整文件訪問)
演示場景:把 60 多張收據圖片放在 Downloads/receipts to process 下,讓 Agent 進行 OCR、分類、彙總,最終生成帶 dashboard、分類彙總、付款方式分析的 Excel。
關鍵點:
- Agent 通過本機路徑直接讀取原始文件(而非用戶手動逐個上傳)。
- 輸出物(xlsx)也保留在本地,可一鍵 "Open in Folder" 定位。
- 作者建議:以"項目(Project)= 文件夾"組織工作。每個 Project 就是磁盤上一個真實目錄,所有該 Project 內的會話都默認在該目錄讀寫文件,並能用
@文件名跨會話引用前面產出的文檔。
工程含義:這把 Agent 的"工作記憶"顯式映射到了文件系統。這是 Claude Code 的設計哲學,但 Codex 把它包裝成普通用戶也能理解的"項目+聊天"模型。
能力 2:Persistent Memory(持久化記憶)
Codex 區分兩類記憶:
| 類型 | 文件 | 誰來寫 | 用途 |
|---|---|---|---|
| 手動記憶 | AGENTS.md | 你(或你讓 Agent 寫) | 你顯式希望 Agent 長期遵守的偏好、規範 |
| 自動記憶 | ~/.codex/memories/ 下的文件 | Agent 自己維護 | Agent 對你工作模式的觀察 |
作者的實操建議很務實:
- 想固化一個偏好(如"以後做 landing page 都用左側目錄佈局"),直接對 Agent 說"請記住",它會把這條寫進
AGENTS.md。 - 不要手動改自動記憶文件,讓 Agent 自己維護即可,定期閲讀它能反向瞭解 Agent 對你的畫像。
這本質上是 Cursor / Claude Code 早已採用的 AGENTS.md / CLAUDE.md 規範,OpenAI 在 Codex 中做了產品化。
能力 3:Plugins(插件 / 外部連接)
Plugins 是 Codex 與外部 SaaS(Slack、Gmail、Notion 等,作者說當前已超過 100 個)打通的連接層,相當於 MCP / Connectors 的產品化封裝。
演示場景:
- 裝好 Gmail 插件後,讓 Agent "翻過去兩週郵件,找出所有想找我做付費推廣的品牌方,做調研後輸出表格"——5 分鐘左右產出一份帶研究備註的品牌方清單。
- 裝好 Notion 插件後,讓 Agent 從用戶的 Notion 中讀取以往的高質量長視頻腳本,學習作者的寫作語氣,再為新主題生成一份"聽起來就是作者本人寫的"草稿。
調用方式上,輸入 @ 即可彈出插件菜單,體驗對標 Cursor 的 @ 選擇器。
能力 4:Skills(技能 / 可複用 SOP)
作者把 Skills 描述為"reusable workflow recipes / SOP"——一份讓 Agent 每次遵循的指令文件。它們存放在 plugins/skills/ 下,調用方式是 /skill_name。
兩種創建方式:
- Prompt-to-Skill(直接生成):一句話"創建一個叫 X 的 skill,做 Y"。簡單,但作者認為效果一般。
- 手工迭代後反向萃取(推薦):先和 Agent 來回打磨,直到產出真的讓你滿意,再說"我對這個結果滿意,請把它沉澱為一個 skill"。Agent 會回看完整對話,把你認可的工作流寫成
SKILL.md。
進一步的關鍵洞察(作者明確提到):
每一次使用舊 skill,都是迭代它的機會——發現新亮點直接說"以後都這樣做",讓 Agent 更新 skill 文件。
這把 skill 當作"活文檔",而不是一次性 prompt。這一思路與 Anthropic 的 Skills 規範完全一致:Skills = 可演化的過程性知識。
Plugin vs Skill 的邊界:
- Plugin = 與外部系統的"連接 + 工具"。
- Skill = 用這些工具做某件事的"流程指令"。
- 一個 Skill 可以調用多個 Plugin(例如 brand-deal-researcher 內部調用 Gmail 插件)。
能力 5:GPT Image Access(原生圖像生成)
Codex 內置了圖像生成能力(GPT-image-2,當前 OpenAI 最強圖像模型)。
演示:上傳一張毛衣樣圖,讓 Agent 生成 5 張不同人種模特、不同人數(1/1/1/3/5 人)穿着該毛衣的產品圖。
工程上值得注意:圖像生成在 Codex 中以一個內置 skill (image-gen) 的形式存在,與第三方 skill 平起平坐。這意味着所有"內置能力"也用 Skills 這套抽象統一描述——這是一個乾淨的設計選擇。
能力 6:Browser & Computer Use(瀏覽器與操作系統級控制)
兩個能力以 Plugin 形式提供:@computer use 與 @browser use。
Computer Use 演示:讓 Agent 打開本機 Canva 客戶端,新建演示文稿,把剛生成的 5 張產品圖一圖一頁放進去。Agent 真實地接管鼠標、操作 Canva。
Browser Use 演示:把生成的 HTML 文件轉成一個測驗類小應用,然後讓 Agent 自己打開瀏覽器測試這個應用——點擊 Start、答題、驗證答案對錯、檢查側邊欄與滾動行為。這本質上是一個自動化 QA 閉環:Agent 既是開發者也是測試者。
這是 Codex 最具顛覆性的能力:人機交互的三件套(鍵盤、鼠標、屏幕)正式被 Agent 接管,使任何能在 GUI 內完成的工作都進入 Agent 可達範圍。
能力 7:Automations(定時與觸發式自動化)
任何已經跑通的會話都可以"一句話變定時任務":
"請每週五早 9 點跑一次這個流程,並更新這張表。"
Agent 會在 Automations 面板中創建一條記錄,包含觸發時間、所用 Skill、活動狀態、上次運行時間等。
這把前面六項能力閉合成一個完整的工作流系統:
Plugins(連接) → Skills(流程) → Automations(調度)
效果上等價於一個為個人量身定製的、由自然語言配置的 Zapier / n8n。
彩蛋:Chronicle(環境感知記憶)
開啓後,Codex 會持續對你的屏幕進行截圖採樣,並把這些視覺上下文餵給 Agent。
演示:作者沒有上傳任何文件,只說"用 Chronicle 看看我演示文稿裏還該加些什麼",Agent 直接基於近期截圖,列出了"Codex 超級應用地圖"、"全控制環路圖"、"prompt 文件示意"等具體補充建議。
作者誠實指出:這功能略有侵入性(always-on 屏幕錄製 → 截圖)。但其價值也很明確——Agent 第一次擁有了"看到你正在做什麼"的環境感知,這是從"被動響應 prompt"走向"主動協作"的關鍵技術原語。
整體框架的工程評價
把七大能力抽象一下,可以畫出 Codex 的能力棧:
[Chronicle 環境感知] ←— 視覺上下文輸入
↓
[File System 全訪問] + [Persistent Memory] ←— 持久狀態層
↓
[Plugins 外部連接] ←— 工具層(與 SaaS / 系統對接)
↓
[Skills 可複用流程] ←— 程序化知識層(SOP)
↓
[Browser / Computer Use] ←— 執行層(GUI 級動作)
↓
[Automations 調度] ←— 時間維度的觸發器
這套結構與業內已經成型的 Agent 設計範式高度吻合(Claude Code、Cursor、Anthropic Skills、MCP 等),但 Codex 的差異在於:
- 統一的產品形態:把"開發者工具 + 知識工作工具"合併成一個 GUI App,非工程背景用戶也能用。
- 以本地文件系統為真實狀態:避免了雲端沙盒帶來的遷移成本和不可見性。
- Skills + Plugins 雙軸:清晰區分"做什麼的流程"和"用什麼去做",這是 ChatGPT 早期 Custom GPT 體系所欠缺的。
- Automations 把單次任務變成持續服務:從"AI 助手"過渡到"AI 員工"。
對個人/團隊工作流的實際啓示
- 以項目文件夾為單位組織 Agent 工作:天然解決了"Agent 失憶"和"產出散落"兩大痛點。
- 善用 AGENTS.md 把品味和規範固化:這是把個人偏好"編譯"為 Agent 行為的最低成本路徑。
- Skill 不要一次寫好,要在使用中演化:每一次"我希望以後都這樣做"都是一次免費的 SOP 升級。
- 真正能放大槓桿的是 Automations:定時跑銷售線索分析、郵件彙總、內容選題、對賬等高頻低價值工作,是個人 ROI 最高的切入點。
- 對 Chronicle 持謹慎態度:在涉及客戶數據、機密文檔的環境裏啓用前,先想清楚截圖記錄的合規邊界。
一句話總結
這期視頻的真正價值不止在於"教你 7 個功能",是傳遞了一個判斷:
OpenAI 把 Codex 定位為"通用知識工作 Agent 的桌面 OS"——本地文件是狀態,AGENTS.md 是偏好,Plugins 是外設,Skills 是程序,Browser/Computer Use 是執行器,Automations 是 cron,Chronicle 是感知層。當這套抽象被普通用戶接受時,AI 才真正從"對話框"走進了"工作台"。
相關資源推薦
從 Claude Code 忠實用戶到被說服切換到 Codex:一場 64 分鐘的 OpenAI Codex 大師課
OpenAI Codex 官方最佳實踐和最新六大關鍵能力升級
OpenAI Codex 核心成員訪談:Codex 團隊如何用 Codex 做研發工作,對 AI Native 團隊又有哪些重要啓發?