OpenAI Codex 完整教程 2026:100 分鐘,四個關鍵概念 + 六個實戰項目
整理版優先睇
OpenAI Codex 已經進化成統一AI Agent操作平台;掌握四個核心概念同並行工作流,可幾小時完成從App到市場推廣全流程。
呢篇文係基於Riley Brown(VibeCode Dev聯合創始人)嘅100分鐘Codex完整教程。佢想帶出嘅核心論點係:OpenAI Codex已經唔再係一個單純嘅AI編程助手,而係進化成為一個統一嘅通用型AI Agent操作平台。佢認為Codex同Claude Code處於同一代次,但因為整合度更高、UI更友好、同OpenAI模型深度耦合,所以更適合作為日常生產力嘅「超級應用」。整體結論係Codex有能力將編程、文件讀寫、瀏覽器操控、計算機使用等場景收斂到一個聊天界面,成為下一代生產力工具。
教程第一部分介紹咗四個核心概念:Project(對應真實文件夾)、Chats/Steering/Queueing(異步糾偏機制)、Skills/Plugins/MCP(擴展能力邊界)、Automations(定時任務)。Riley特別強調,用戶可以用自然語言為Agent擴展能力,例如用Supadata API自建「YouTube Researcher」Skill。第二部分示範咗一個真實產品Chorus嘅六條並行產線,包括iOS App開發、落地頁、投資人Deck、營銷視頻、社交媒體自動發帖等。佢展示咗「序列化prompt」工作法——一次性畀足上下文,信任Agent獨立完成5-15分鐘任務,期間繼續發起新任務。
呢個示範揭示咗幾個重要信號:模型分工已經開始(Codex做編排,Claude做設計);多任務本質係序列化prom…
- Codex 係一個統一嘅AI Agent操作平台,整合咗編程、瀏覽器操控、計算機使用等功能,唔係一般IDE。
- 核心概念包括Project(文件夾映射)、Chats/Steering/Queueing(異步糾偏)、Skills/Plugins/MCP(可擴展能力)、Automations(定時任務)。
- 實戰示範六個並行項目,展示「序列化prompt」工作流:一次過畀足上下文,然後放手畀Agent獨立完成。
- Codex擅長工程編排,但視覺設計要用Claude Opus呢類模型補充,跨模型協作係現階段必須。
- 單人創業者可以靠「白嫖+拼裝」快速建產品,人的核心能力變成「提出值得做嘅事」同「判斷結果好唔好」。
Riley Brown Codex 完整教程影片
YouTube: Codex Full Course 2026: The NEW Best AI Coding Tool
產品定位:Codex 係一個「AI 操作系統」,唔係IDE
Riley Brown 反覆強調一個判斷:
Codex 係唯一一個統一的通用型 AI Agent 工具
,將編碼、協作、瀏覽器、電腦操作全部放喺一個界面。呢個定位挑戰咗我哋以往將 AI 工具按場景分開使用嘅習慣——而家 Codex 試圖將一切
收斂到一個聊天界面加一個文件夾
。
過去我哋將 AI 工具按場景分成幾類:編程(Cursor、Claude Code)、文檔(ChatGPT)、設計(Figma)、自動化(Zapier)、瀏覽器(Browser Use)。Codex 桌面應用試圖將呢啲收斂到一個界面,你同佢講嘢,佢喺你電腦度讀寫文件、調外部 API、操控瀏覽器、生成圖片、構建視頻、發佈社交媒體。Riley 將佢視為
「下一代生產力 super app」
。
核心機制:四個必須理解嘅概念
教程 Part 1 本質上係教你掌握 Codex 嘅
「心智模型」
。我將佢壓縮成四個支柱:
- 1 Project = 文件夾:每個項目對應電腦一個真實目錄。Agent 喺呢個目錄讀寫文件,生成嘅 xlsx、md、png、Swift 工程等都落到呢度。項目唔係 Codex 私有數據庫,而係文件系統嘅視圖。你可以用 Finder、Git 照常操作,跨 chat 透過 @文件名 互相引用。
- 2 Chats vs. Steering vs. Queueing:每個 chat 係獨立任務。支援 steering(即時插入指令):當 Agent 跑緊長任務,你唔使等佢結束再追加。普通輸入會被排隊(queue),點「steer」則會喺下一個工具調用結束時立即插入。呢個將人與 Agent 嘅交互從同步對話改為異步糾偏。
- 3 Skills vs. Plugins vs. MCP:Plugin 係官方預裝能力擴展(Figma、Gmail等);Skill 係用戶自訂可複用工作流配方(一組 prompt + API + 文件模板);MCP 係底層協議層。當一個工具冇官方 plugin 時,你可以讓 Codex 讀取 API 文檔,生成 Skill 來包裝。Riley 現場示範用 Supadata API 創建「YouTube Researcher」skill 全過程,不寫一行代碼。
- 4 Automations:任何 chat 都可以一句話變成定時任務。佢實際上係將 prompt + skill 組合保存為 cron。影片示範咗每週五 4 點嘅日曆總結、每月最後一日嘅 YouTube 頻道分析報告、每日早晨自動起草 3 條 X 推文。呢意味著
Skill + Automation = 個人級 RPA
,唔再需要 Zapier。
實戰工作流:六個項目並行嘅序列化 prompt
Part 2 係整個視頻嘅靈魂。Riley 用一個虛構但已真實部署嘅產品 Chorus(一個學習 AI Agent 嘅 iOS 應用),同時跑 6 條產線:
- iOS App 設計稿(自建 Mobile Design skill,從 Claude.ai/design 反向工程)
- iOS App 本體(Swift + Xcode + 真機調試 + TestFlight 上架)
- 落地頁(React + Tally 表單 + Vercel 部署)
- 投資人 Deck(Codex 生成 → Claude Opus 4.7 精修 → 導出 Canva)
- 發佈視頻(Remotion plugin,時間線編輯 + 加配樂)
- X 自動發帖(Typefully API + 自建 skill + Automation)
呢套演示傳遞咗幾個重要信號。
模型分工已經開始
:Codex 適合工程編排,Claude(Opus 4.7)喺設計審美上更強。Riley 喺 Codex 內置終端直接 claude --dangerously-skip-permissions 跑 Claude Code,將 Codex 當 orchestrator,Claude Code 當 subagent。
多任務本質係「序列化 prompt」
:佢糾正咗「multitask」呢個詞,更準確係「serializing」。人類嘅工作係將高質量 prompt 一個個發出去,信任 Agent 獨立完成 5–15 分鐘,期間轉去發起下一個任務。呢種節奏要求寫 prompt 密度要高,同埋學會「放手」。
Figma plugin 示範中,Agent 唔係調 API 操作 Figma,而係
真實操控你打開嘅 Figma 應用
。呢個係 OpenAI 將 computer use 默默嵌入日常工具鏈嘅方式。
方法論與啟示:Agent 時代嘅新工作哲學
剝開具體操作,呢個視頻背後有
幾個值得長期記住嘅判斷
:
- 1 Agent 工作時長係新摩爾定律。單任務時長可達 1–2 小時,協作模式必須從「對話」變成「委派 + 異步」。多窗口、命名 chat、pin 重要 chat、用 plan.md 做 checklist 呢啲組織技巧會變成核心競爭力。
- 2 通用模型 + 自定義 skill 勝過專用工具。你能讓 Agent 喺 5 分鐘內包裝出一個 Typefully、Supadata、Paper 嘅 skill,「是否有現成 SaaS」就唔係關鍵。呢個係對輕量 SaaS 嘅降維打擊。
- 3 設計 vs 工程嘅能力差距仲喺度。Codex 喺工程上紮實,但視覺設計平庸,所以要用 Claude Opus 4.7 補刀。跨模型協作唔係奢侈,係必須。
- 4 「白嫖 + 拼裝」係新嘅開發哲學。整個 Chorus 應用嘅棧:Supabase + Tally + Vercel + Typefully + Remotion + Canva + Xcode,冇一行真正「原創」嘅基礎設施,但透過 Agent 拼起來,幾小時內攞到一個能上 TestFlight 嘅產品 + 投資人 Deck + 推廣視頻。呢個係單人創業者能力上限嘅一次躍遷。
- 5 「學唔識」已經唔係藉口。Riley 多次話「我都未用過 Supabase / Remotion / Typefully API」,然後讓 Agent 邊教邊做。
學習曲線被抹平後核心能力變成判斷力
Agent 工作時長係新摩爾定律
白嫖 + 拼裝係新開發哲學
呢個係 AI 開發者、VibeCode Dev 聯合創始人 Riley Brown 嘅 100 分鐘視頻教學,唔單止係一個單純嘅「工具教學」。Riley Brown 真正想表達嘅核心論點係:Codex 已經由一個「AI 編程助手」演化成一個統一、通用型 AI Agent 操作平台。喺佢睇嚟,佢同 Claude Code 處於同一世代,但因為整合度更高、UI 更友善、同 OpenAI 模型(GPT-5.5、電腦使用 computer-use 等)深度耦合,所以更適合作為日常生產力嘅「超級應用」。
Codex Full Course 2026: The NEW Best AI Coding Tool
https://www.youtube.com/watch?v=KXIdYEdOPys[1]
下面我哋將條視頻拆解成四個層次:產品定位 → 核心機制 → 實戰工作流程 → 方法論同啟示。
產品定位:Codex 係一個「AI 操作系統」,唔係 IDE
Riley 反覆強調一個判斷:
「Codex is the only unified all-purpose AI agent tool — coding, co-work, browser, computer use, all in one interface.」
呢句話嘅潛台詞係:以前我哋將 AI 工具按場景分成幾類——
- 編程類:Cursor、Claude Code
- 文檔類:ChatGPT、Notion AI
- 設計類:Figma、Paper
- 自動化類:Zapier、Make
- 瀏覽器類:Browser Use、Computer Use
而 Codex 桌面應用企圖將呢啲收斂到一個聊天界面 + 一個文件夾(項目根目錄):你同佢講嘢,佢喺你電腦裏便讀寫文件、調用外部 API、操控瀏覽器、生成圖片、製作視頻、發佈社交媒體。Riley 將佢視為「下一代生產力 super app」。
呢個判斷嘅爭議性在於:佢依賴嘅係模型能力曲線持續急劇上升(GPT-5.5 已經可以穩定運行 1–2 小時嘅長任務),以及生態裏便 plugin/MCP 數量嘅快速累積。如果呢兩個變數有任何一個停滯,「超級應用」嘅敍事就會倒退到「高級 IDE」。但視頻裏便 Riley 用一個晚上 6 個並行項目嘅演示,說明今日呢個敍事喺工程上已經站得住。
核心機制:四個一定要理解嘅概念
視頻嘅 Part 1 本質上係教你掌握 Codex 嘅「心智模型」。我將佢壓縮成四個支柱:
1. Project = 文件夾
每個項目對應你電腦裏便嘅一個真實目錄。Agent 喺呢個目錄裏便讀寫文件,生成嘅產物(xlsx、md、png、Swift 工程……)都落到呢度。項目唔係 Codex 私有嘅數據庫,而係文件系統嘅視圖。呢個意味住:
- 你可以用 Finder、Git、其他編輯器照常操作;
- 跨 chat 通過
@文件名互相引用; - 刪除項目只係從側邊欄移除,文件本身唔會唔見。
呢個係 Codex 比傳統 SaaS 更加「可信」嘅地方——所有產物都喺你硬碟裏便。
2. Chats vs. Steering vs. Queueing
每個 chat 係一次獨立任務。Codex 嘅差異化在於支援 steering(即時插入指令):當 Agent 正在跑一個長任務,你唔使等佢結束先至追加;普通輸入會被排隊(queue),撳「steer」就會喺佢下一個工具調用結束時即刻插入。
呢一點對多任務場景好關鍵——佢將「人類同 Agent 嘅互動」從同步對話改咗做異步糾偏。
3. Skills vs. Plugins vs. MCP
呢個係大多數新用戶混淆嘅概念,Riley 嘅拆法好清晰:
| 概念 | 本質 | 例子 |
|---|---|---|
| Plugin | 官方/第三方預裝嘅能力擴展 | Figma、Google Calendar、Gmail、Remotion、Vercel |
| Skill | 用戶可以定義嘅可重用工作流程配方(一組 prompt + API + 文件模板) | 自己整嘅 YouTube Researcher、Mobile Design、Excalidraw |
| MCP | 底層協定層,外部服務用 MCP 接入 | Supabase MCP、Paper MCP |
關鍵洞察:當一個工具冇官方 plugin 時,你可以叫 Codex 自己讀取佢嘅 API 文檔,生成一個 Skill 嚟包裝佢。Riley 現場演示咗用 Supadata API 創建「YouTube Researcher」skill 嘅全過程——從查 API 到生成 skill 到調用,全部喺 chat 裏便完成,唔使寫一行代碼。呢個係 Codex 真正「超級」嘅地方:用戶可以靠自然語言擴展 Agent 嘅能力邊界。
4. Automations
任何 chat 都可以一句話變成定時任務(「Make this a weekly automation, every Friday at 4pm」)。佢實際上係將 prompt + skill 組合保存做 cron。視頻裏便佢設置咗:
- 每星期五 4 點嘅日曆總結;
- 每月最後一日嘅 YouTube 頻道分析報告;
- 每日朝早自動起草 3 條 X 推文(經 Typefully API)。
呢個意味住 Skill + Automation 係個人級嘅 RPA——你唔再需要 Zapier。
Part 2 實戰:六個項目並行嘅工作流程
Part 2 係成條視頻嘅靈魂。Riley 用一個虛構(但已真實部署)嘅產品 Chorus(一個學習 AI Agent 嘅 iOS 應用),同時跑 6 條生產線:
- iOS App 設計稿(自己整嘅 Mobile Design skill,從 Claude.ai/design 反向工程得嚟)
- iOS App 本體(Swift + Xcode + 真機調試 + TestFlight 上架)
- 落地頁(React + Tally 表單 + Vercel 部署)
- 投資人 Deck(Codex 生成 → Claude Opus 4.7 精修 → 匯出 Canva)
- 發佈視頻(Remotion plugin,時間線編輯 + 加配樂)
- X 自動發帖(Typefully API + 自己整 skill + Automation)
呢套演示傳遞嘅信號比單一功能更加重要——
信號 1:模型分工已經開始
Riley 明確話:Codex 適合工程編排,Claude(Opus 4.7)喺「設計審美」上更加強。所以佢喺 Codex 內置終端裏便直接 claude --dangerously-skip-permissions 跑 Claude Code,處理 landing page 同 Deck 嘅視覺細化。呢個係一個值得記住嘅實踐模式:
將 Codex 當 orchestrator,將 Claude Code 當 subagent,按任務性質分配模型。
信號 2:多任務嘅本質係「序列化 prompt」
佢自己糾正咗「multitask」呢個詞,話更加準確嘅描述係 "serializing":
"Each prompt that you type in is the task. Once you press enter, check out of that task and move to a new one."
人類嘅工作唔係同時睇住 6 個屏幕,而係將高質量 prompt 一個一個發出去,然後信任 Agent 獨立完成 5–15 分鐘嘅工作,期間轉去發起下一個任務。呢種工作節奏要求兩樣嘢:
- 寫 prompt 嘅密度要高——一次過俾夠上下文,避免來回打補丁;
- 學識「放手」——唔好焦慮咁睇住進度條,而係按藍點提示返嚟 review。
信號 3:fork chat = 分支思維
佢喺 mobile app chat 完成之後右鍵「fork into local」,新分支繼承咗所有上下文,直接開始做 investor deck(「參考 app 嘅視覺風格」)。呢個等於 Git 嘅 branch 應用喺對話狀態——上下文唔浪費,分叉唔污染主線。
信號 4:Computer Use + Plugin = 真實世界嘅手腳
Figma plugin 演示:佢叫 Agent 創建 hello world 文字,然後畫出新波鞋公司 NoSho 嘅 landing page 設計稿(包括用內置圖像生成產出冇背景嘅鞋圖)。Agent 唔係喺度調 API 操作 Figma,而係真實咁操控你打開嘅 Figma 應用。呢個係 OpenAI 將「computer use」靜靜雞嵌入日常工具鏈嘅方式——你以為係 plugin,其實係電腦使用。
方法論同啟示
剝開具體操作,呢條視頻背後有幾個值得長期記住嘅判斷:
1. Agent 工作時長係新摩爾定律。Riley 反覆話:「agents are working for longer and longer——up to 1 or 2 hours per task.」一旦單任務時長超過 30 分鐘,協作模式一定要從「對話」變成「委派 + 異步」。多視窗、命名 chat、pin 重要 chat、用 plan.md 做 checklist——呢啲組織技巧會變成核心競爭力。
2. 通用模型 + 自定義 skill > 專用工具。當你可以叫 Agent 喺 5 分鐘內為你包裝出一個 Typefully、Supadata、Paper 嘅 skill,咁「是否有現成 SaaS」就唔再係關鍵。API 可達 + Agent 能寫 = 你想要嘅工具就存在。 呢個係對所有「輕量 SaaS」嘅降維打擊,亦係 Riley 話「未來公司會爭住入 plugin 列表」嘅原因。
3. 設計 vs. 工程嘅能力差距仲喺度。Codex 喺工程上好紮實(Swift、Supabase、Vercel 部署、TestFlight 一條龍),但視覺設計仍然平庸——所以佢用 Claude Opus 4.7 補刀。現階段,跨模型協作唔係奢侈,係必須。
4. 「白嫖 + 拼裝」係新嘅開發哲學。成個 Chorus 應用嘅棧:Supabase(數據庫)+ Tally(表單)+ Vercel(部署)+ Typefully(社媒)+ Remotion(視頻)+ Canva(演示)+ Xcode(iOS)。冇一行真正「原創」嘅基礎設施,但途經 Agent 將佢哋拼埋一齊,幾小時內得到一個可以上 TestFlight 嘅產品 + 投資人 Deck + 推廣視頻。呢個係單人創業者(solopreneur)能力上限嘅一次躍遷示範。
5. 「學唔識」已經唔係藉口。佢多次現場話「我都冇用過 Supabase / Remotion / Typefully API」——然後叫 Agent 邊教邊做。學習曲線俾 Agent 抹平之後,人嘅核心能力變咗做「提出值得做嘅事」+「判斷結果係咪夠好」,而唔係「識唔識用某個工具」。
相關視頻推薦
30 分鐘掌握 Codex 95% 嘅能力?!唔信?一齊學:七大核心能力 + 一個彩蛋功能!
由 Claude Code 忠實用戶到俾人說服轉用 Codex:一場 64 分鐘嘅 OpenAI Codex 大師課
Claude Code 架構深度解讀:Agent 系統嘅真正護城河唔係喺模型,而係喺 Harness
點樣寫好 Skill ?OpenAI、Anthropic 同 Sentry 嘅 Skill-Creator 對比結合:由快速原型到工程化工作流程持續迭代
來自 AI 開發者、VibeCode Dev 聯合創始人 Riley Brown 100 分鐘的視頻教程,不僅僅是一支單純的"工具教程"。Riley Brown 真正想傳遞的核心論點是:Codex 已經從一個"AI 編程助手"演化成了一個統一的、通用型 AI Agent 操作平台。在他看來,它和 Claude Code 處於同一代次,但因為整合度更高、UI 更友好、與 OpenAI 模型(GPT-5.5、計算機使用 computer-use 等)深度耦合,所以更適合作為日常生產力的"超級應用"。
Codex Full Course 2026: The NEW Best AI Coding Tool
https://www.youtube.com/watch?v=KXIdYEdOPys[1]
下面咱們把視頻拆解為四個層次:產品定位 → 核心機制 → 實戰工作流 → 方法論與啓示。
產品定位:Codex 是一個"AI 操作系統",不是 IDE
Riley 反覆強調一個判斷:
"Codex is the only unified all-purpose AI agent tool — coding, co-work, browser, computer use, all in one interface."
這句話的潛台詞是:過去我們把 AI 工具按場景切成幾類——
- 編程類:Cursor、Claude Code
- 文檔類:ChatGPT、Notion AI
- 設計類:Figma、Paper
- 自動化類:Zapier、Make
- 瀏覽器類:Browser Use、Computer Use
而 Codex 桌面應用試圖把這些收斂到一個聊天界面 + 一個文件夾(項目根目錄):你跟它說話,它在你電腦裏讀寫文件、調外部 API、操控瀏覽器、生成圖片、構建視頻、發佈社交媒體。Riley 把它視為「下一代生產力 super app」。
這個判斷的爭議性在於:它依賴的是模型能力曲線持續陡峭上升(GPT-5.5 已經能穩定跑 1–2 小時長任務),以及生態側 plugin/MCP 數量的快速堆積。如果這兩個變量任一停滯,"超級應用"敍事就會回退到"高級 IDE"。但視頻裏 Riley 用一個晚上 6 個並行項目的演示,說明今天這個敍事在工程上已經站得住。
核心機制:四個必須理解的概念
視頻的 Part 1 本質上是在教你掌握 Codex 的"心智模型"。我把它壓縮成四個支柱:
1. Project = 文件夾
每個項目對應你電腦裏的一個真實目錄。Agent 在這個目錄裏讀寫文件,生成的產物(xlsx、md、png、Swift 工程……)都落到這裏。項目不是 Codex 私有的數據庫,而是文件系統的視圖。這意味着:
- 你可以用 Finder、Git、其他編輯器照常操作;
- 跨 chat 通過
@文件名互相引用; - 刪除項目只是從側邊欄移除,文件本身不會丟。
這是 Codex 比傳統 SaaS 更"可信"的地方——所有產物都在你硬盤裏。
2. Chats vs. Steering vs. Queueing
每個 chat 是一次獨立任務。Codex 的差異化在於支持 steering(即時插入指令):當 Agent 正在跑一個長任務,你不必等它結束再追加;普通輸入會被排隊(queue),點 "steer" 則會在它下一個工具調用結束時立刻插入。
這一點對多任務場景很關鍵——它把"人類與 Agent 的交互"從同步對話改成了異步糾偏。
3. Skills vs. Plugins vs. MCP
這是大多數新用戶混淆的概念,Riley 的拆法清晰:
| 概念 | 本質 | 例子 |
|---|---|---|
| Plugin | 官方/第三方預裝的能力擴展 | Figma、Google Calendar、Gmail、Remotion、Vercel |
| Skill | 用戶可定義的可複用工作流配方(一組 prompt + API + 文件模板) | 自建的 YouTube Researcher、Mobile Design、Excalidraw |
| MCP | 底層協議層,外部服務以 MCP 接入 | Supabase MCP、Paper MCP |
關鍵洞察:當一個工具沒有官方 plugin 時,你可以讓 Codex 自己讀取它的 API 文檔,生成一個 Skill 來包裝它。Riley 現場演示了用 Supadata API 創建 "YouTube Researcher" skill 的全過程——從查 API 到生成 skill 到調用,全在 chat 裏完成,不寫一行代碼。這是 Codex 真正"超級"的地方:用戶可以靠自然語言擴展 Agent 的能力邊界。
4. Automations
任何 chat 都可以一句話變成定時任務("Make this a weekly automation, every Friday at 4pm")。它實際上是把 prompt + skill 組合保存為 cron。視頻裏他設置了:
- 每週五 4 點的日曆總結;
- 每月最後一天的 YouTube 頻道分析報告;
- 每天早晨自動起草 3 條 X 推文(通過 Typefully API)。
這意味着 Skill + Automation 是個人級的 RPA——你不再需要 Zapier。
Part 2 實戰:六個項目並行的工作流
Part 2 是整個視頻的靈魂。Riley 用一個虛構(但已真實部署)的產品 Chorus(一個學習 AI Agent 的 iOS 應用),同時跑 6 條產線:
- iOS App 設計稿(自建 Mobile Design skill,從 Claude.ai/design 反向工程而來)
- iOS App 本體(Swift + Xcode + 真機調試 + TestFlight 上架)
- 落地頁(React + Tally 表單 + Vercel 部署)
- 投資人 Deck(Codex 生成 → Claude Opus 4.7 精修 → 導出 Canva)
- 發佈視頻(Remotion plugin,時間線編輯 + 加配樂)
- X 自動發帖(Typefully API + 自建 skill + Automation)
這套演示傳遞的信號比單個功能更重要——
信號 1:模型分工已經開始
Riley 明確說:Codex 適合工程編排,Claude(Opus 4.7)在"設計審美"上更強。所以他在 Codex 內置終端裏直接 claude --dangerously-skip-permissions 跑 Claude Code,處理落地頁和 Deck 的視覺細化。這是一個值得記住的實踐模式:
把 Codex 當 orchestrator,把 Claude Code 當 subagent,按任務氣質分配模型。
信號 2:多任務的本質是"序列化 prompt"
他自己糾正了"multitask"這個詞,說更準確的描述是 "serializing":
"Each prompt that you type in is the task. Once you press enter, check out of that task and move to a new one."
人類的工作不是同時盯 6 個屏幕,而是把高質量 prompt 一個個發出去,然後信任 Agent 獨立完成 5–15 分鐘的工作,期間轉去發起下一個任務。這種工作節奏要求兩件事:
- 寫 prompt 的密度要高——一次性給足上下文,避免來回打補丁;
- 學會"放手"——不要焦慮地盯進度條,而是按藍點提示回來 review。
信號 3:fork chat = 分支思維
他在 mobile app chat 完成後右鍵 "fork into local",新分支繼承了所有上下文,直接開始做 investor deck("參考 app 的視覺風格")。這等價於 Git 的 branch 應用到對話狀態——上下文不浪費,分叉不污染主線。
信號 4:Computer Use + Plugin = 真實世界的手腳
Figma plugin 演示:他讓 Agent 創建 hello world 文本,然後畫出新球鞋公司 NoSho 的落地頁設計稿(包括用內置圖像生成產出無背景的鞋子圖)。Agent 不是在調 API 操作 Figma,而是在真實操控你打開的 Figma 應用。這是 OpenAI 把 "computer use" 默默嵌入日常工具鏈的方式——你以為是 plugin,其實是計算機使用。
方法論與啓示
剝開具體操作,這個視頻背後有幾個值得長期記住的判斷:
1. Agent 工作時長是新摩爾定律。Riley 反覆說:"agents are working for longer and longer——up to 1 or 2 hours per task." 一旦單任務時長超過 30 分鐘,協作模式必須從"對話"變成"委派 + 異步"。多窗口、命名 chat、pin 重要 chat、用 plan.md 做 checklist——這些組織技巧會變成核心競爭力。
2. 通用模型 + 自定義 skill > 專用工具。當你能讓 Agent 在 5 分鐘內為你包裝出一個 Typefully、Supadata、Paper 的 skill,那麼"是否有現成 SaaS"就不再是關鍵。API 可達 + Agent 能寫 = 你想要的工具就存在。 這是對所有"輕量 SaaS"的降維打擊,也是 Riley 說"未來公司會搶着進 plugin 列表"的原因。
3. 設計 vs. 工程的能力差距還在。Codex 在工程上紮實(Swift、Supabase、Vercel 部署、TestFlight 一條龍),但視覺設計仍然平庸——所以他用 Claude Opus 4.7 補刀。當前階段,跨模型協作不是奢侈,是必須。
4. "白嫖 + 拼裝"是新的開發哲學。整個 Chorus 應用的棧:Supabase(數據庫)+ Tally(表單)+ Vercel(部署)+ Typefully(社媒)+ Remotion(視頻)+ Canva(演示)+ Xcode(iOS)。沒有一行真正"原創"的基礎設施,但通過 Agent 把它們拼起來,幾小時內拿到了一個能上 TestFlight 的產品 + 投資人 Deck + 推廣視頻。這是單人創業者(solopreneur)能力上限的一次躍遷示範。
5. "學不會"已經不是藉口。他多次現場說"我也沒用過 Supabase / Remotion / Typefully API"——然後讓 Agent 邊教邊做。學習曲線被 Agent 抹平後,人的核心能力變成了"提出值得做的事"+ "判斷結果是否夠好",而不是"會不會用某個工具"。
相關視頻推薦
30 分鐘掌握 Codex 95% 的能力?!不相信?一起學習:七大核心能力 + 一個彩蛋功能!
從 Claude Code 忠實用戶到被說服切換到 Codex:一場 64 分鐘的 OpenAI Codex 大師課
Claude Code 架構深度解讀:Agent 系統的真正護城河不在模型,而在 Harness
怎麼寫好 Skill ?OpenAI、Anthropic 與 Sentry 的 Skill-Creator 對比結合:從快速原型到工程化工作流持續迭代