Codex 5 月讓我做的 3 件事,我 5 月前根本做不了

作者:縱所周知101
日期:2026年5月26日 上午7:02
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Codex 5月升級解鎖三個新能力,改變你對AI工具的認知:從提升效率轉向創造能力

整理版摘要

呢篇文章係一位國內OPC創業者嘅親身經驗。佢喺5月之前用AI工具仲係停留喺「邊個寫code快啲」嘅productivity思維,但Codex 5月升級之後,佢做咗三件5月前根本做唔到嘅事,徹底改變咗佢對工具嘅理解。佢想講嘅核心係:而家AI已經從「做快啲」變咗做「做新事」,如果仲用productivity角度去睇新工具,你會錯過真正有價值嘅capability。

產品嘅升級可以分兩種:一種係幫你做得更快(productivity),另一種係幫你做你以前做唔到嘅事(capability)。絕大多數人仲卡喺前者,淨係比benchmark、比生成速度,但呢啲嘢冇稀缺性。真正嘅稀缺性係capability——做你以前根本做唔到嘅嘢。Codex 5月嘅三大升級:AppshotsGoal mode、Codex Mobile,每一項都係capability解鎖,唔係productivity提升。

作者嘅結論係:工具畀你嘅係capability入口,但行唔行入去係你嘅事。你需要重設工作流,每週問自己「今個禮拜用AI做嘅嘢有邊啲係上個月唔會做嘅」。如果連續3週答案係0,說明你裝咗新工具但冇換工作流。真正嘅差距唔係工具本身,而係你肯唔肯重新定義自己做得到嘅事。

  • Codex 5月升級嘅核心係解鎖新能力(capability),唔係單純提升效率(productivity);後者冇稀缺性,前者先係真正嘅差異。
  • 三大新能力Appshots令屏幕變成prompt,唔使再翻譯畫面;Goal mode將互動式coding變成委託式coding,可以放低電腦;Codex Mobile令手機可以審批agent任務,唔使坐喺枱前。
  • Productivity思維睇feature list問「邊個快啲」;Capability思維問「有邊幾件事係以前根本唔會做嘅」——呢個反問係關鍵判據。
  • 啟發:工具嘅價值在於幫你做到以前做唔到嘅嘢,而唔係幫你用更短時間做同一件事;唔好用舊框架衡量新工具。
  • 行動:每週記錄新動作、跳過提速feature專揾capability feature、新capability強迫7日內用3次,先可以重設工作流邊界。
整理重點

工具觀嘅分水嶺:Productivity vs Capability

國內好多OPC創業者5月仲喺度比Codex同Claude Code邊個快,但呢個問題背後嘅假設係——AI工具嘅價值係將「我已經做緊嘅事」做得更快。作者話佢自己以前都係咁,成日用「快幾多」去衡量工具好唔好用。

Productivity工具嘅死穴係永遠停留喺「幫你做你已經識嘅事,但快啲」,呢個冇稀缺性。

真正有稀缺性嘅係Capability工具——幫你做你以前根本做唔到嘅事。

OpenAI喺5月發佈Codex升級時嘅標題係「Codex for almost everything」,almost everything唔係「做得更快嘅事」,係「以前做唔到嘅事」。但大多數用戶用productivity角度去買,呢個差距唔係20%,係5倍。

整理重點

三個以前做唔到嘅新動作

作者親身試咗三個Codex 5月嘅新功能,每一個都改變咗佢同AI合作嘅方式。

  • Appshots:按下雙Cmd,當前app窗口連同截圖同可讀文本一齊send畀Codex,唔使再描述「右上角紅色按鈕」,屏幕直接變prompt。
  • Goal mode:交一個長目標(例如改曬所有測試用例),合埋電腦去散步、開會、瞓覺,Codex自己跑幾小時甚至一日,由互動式變委託式。
  • Codex Mobile:手機可以睇Codex所有線程、review輸出、approve命令、切模型、起新任務,AI agent脱離枱機跟你走。

呢三個動作以前做唔到,唔係因為「冇時間做」,而係根本冇呢個動作喺工作流入面。

整理重點

點樣判斷自己係咪真係轉咗彎?

作者提出一個好簡單嘅反問:我而家用Codex做嘅N件事裏面,有幾件係5月之前根本唔會去做嘅?唔係「做得慢啲」,係「根本唔會做」。

如果你答案係0,你仲喺productivity嗰邊;如果係1-2,你喺過渡期;如果≥3,你已經過咗capability條線,正在拉開5倍差距。

作者自己嘅答案係3:每日Appshots至少20次、每週交2-3個24h長goal、手機批咗至少50次。呢啲動作5月之前根本唔會出現喺工作流入面。

整理重點

落地行動:重設工作流三步法

  1. 1 每週記一次「呢個禮拜用AI做嘅嘢有邊幾件係上個月唔會做嘅」;如果連續3週答案係0,即係裝咗新工具但冇換工作流。
  2. 2 睇更新日誌時跳過「提速X%」嘅feature,專揾「而家你可以做Y」嗰啲——只有呢啲係capability升級。
  3. 3 遇到新capability,強迫自己7日內至少用3次;唔用3次,大腦唔會重設「我能做啲咩」嘅邊界。

三週落嚟,作者對「一人公司能做啲咩」嘅認知同4月底完全唔同。

國內好多 OPC 創業者,5 月仲喺度比較 Codex 同 Claude Code 邊個快啲。

我 5 月之後用 Codex 做嘅 3 件事,係我 5 月之前根本做唔到嘅。

呢兩件事聽落差唔多,但背後係兩種完全唔同嘅工具觀。前者將工具當做 Productivity(提升效率)—— 做一樣嘅嘢,快啲。後者將工具當做 Capability(能力)—— 做以前根本做唔到嘅事。絕大多數 OPC 用 AI 工具,卡喺前者,一路卡住。


01行業誤解

我之前都卡過呢個陷阱。

5 月之前,我評估一個 AI 工具好唔好用,睇嘅係佢可以令我「快幾多」。Codex 幫我寫一段代碼 5 分鐘 vs Claude Code 幫我寫 3 分鐘,咁就 Claude Code 好啲。呢個評估方式冇問題——只要你將工具當 productivity 咁用。

國內大多數 OPC 而家仲喺呢個評估維度上。Codex 5 月升級咗,佢哋打開知乎、X、即刻,睇嘅係評測 benchmark、睇嘅係某段代碼生成速度對比、睇嘅係「喺 SWE-bench 上 Codex 升咗幾多個百分點」。呢套邏輯背後有個隱含假設——AI 工具嘅價值係將「我已經喺度做嘅事」做得更快。

OpenAI 自己喺 5 月發佈 Codex 升級嘅時候,標題係 "Codex for (almost) everything"。呢樣就好有意思喇,almost everything 唔係「做得更快嘅事」,係「以前做唔到嘅事」。OpenAI 想賣嘅係 capability,但大多數用戶買嘅係 productivity。

兩類人都在用 Codex,但 5 月之後,佢哋之間嘅差距唔係 20%,係 5 倍。


圖片

02拆解原因

我哋對「AI 工具」嘅隱含假設係咁嘅:工具係手嘅延伸,令我隻手伸得更遠更快。呢套思維喺 2024 年冇錯,但喺 2026 年嘅 OPC 場景下,佢係一個陷阱。

因為而家 AI 已經由「手嘅延伸」變成「動作嘅替換」。Codex 喺 5 月做嘅幾個升級,本質上唔係令你「手伸得更遠」,係令你「根本唔使伸手」。

Productivity 工具嘅死穴,係佢永遠停留喺「幫你做你已經識做嘅事,但快啲」。呢件事有價值,但冇稀缺性——AI 而家每間都喺度做「更快」,邊個都快唔出真正嘅差異。

真正有稀缺性嘅,係 Capability 工具——幫你做你以前根本做唔到嘅事。

呢個就係點解 Codex 5 月升級係一個分水嶺。佢嘅三個核心升級,每一個都唔係「productivity 升級」,係「capability 解鎖」。

Anthropic 嘅 Claude Code 當然都好強,我自己仍然每日用。但喺我 5 月重新審視工作流程嘅時候,我發現 Codex 5 月解鎖嘅幾個 capability,我用 Claude Code 係做唔到嘅。

唔係 Claude Code 唔好,係 OpenAI 喺 capability 呢個維度,5 月跑得更激進。


033 個新動作:我 5 月之前根本做唔到嘅事

具體講三個我親身做過嘅新動作。

第一個動作 · 屏幕即上下文

知識卡片 A

5 月之前,我令 AI 幫我睇一個我正在用嘅桌面 app(例如某個 SaaS 儀錶板),流程係咁嘅:cap圖、貼上去、描述「呢個圖你睇到嗎」、AI 話「係嘅我睇到一啲圖表」、我話「唔係圖表,係右上角嗰個紅色掣」、AI 話「哦嗰個掣」……

5 月之後,我喺 macOS 上㩒雙 Cmd 鍵,當前 app 視窗連同佢嘅 cap圖同可讀取嘅文本一齊發畀 Codex。Codex 唔需要我描述。佢直接知道我喺度睇緊乜。

呢個動作叫 Appshots,係 Codex macOS 應用程式 5 月加嘅功能。表面上係「cap圖工具升級」,本質上係將「屏幕本身變成 prompt」。

我以前冇呢個動作。我只能將屏幕翻譯畀 AI。而家我唔翻譯喇,屏幕直接係輸入。

第二個動作 · 交一個 24 小時嘅長 goal

知識卡片 B

5 月之前,我用 Codex 或者 Claude Code 寫代碼,係 5-10 分鐘一輪嘅交互式會話。我講一句、agent 寫一段、我 review、我話下一步、agent 再寫一段。我必須坐喺電腦前面。

5 月之後,Codex 嘅 Goal mode 由 experimental 變正式版。我交畀 Codex 一個目標,例如「將呢個項目嘅所有測試用例改造成新嘅測試框架,跑通,提 PR」。然後我閂埋電腦,去散步、去開會、去瞓覺。Codex 自己跑幾個鐘甚至一日。

呢個動作叫 Goal mode。表面上係「長會話支援」,本質上係將「交互式 coding」變成「委託式 coding」。

我以前冇呢個動作。我只能睇實 agent 一步一步做。而家我交付一個完整嘅 goal,我自己去做其他事。

第三個動作 · 散步途中手機審批

知識卡片 C

5 月之前,如果 Codex 喺遠端跑長任務,我必須返到電腦前面先至可以審批佢嘅下一步。

5 月 14 號 OpenAI 將 Codex 整合入 ChatGPT 流動端。從手機上我可以睇 Codex 嘅所有線程、review 輸出、approve 命令、切模型、起新任務。

呢個動作叫 Codex Mobile。表面上係「多端同步」,本質上係將「AI agent 解鎖喺枱面前」變成「AI agent 跟我走」。

我以前冇呢個動作。我必須喺電腦前面。而家我喺地鐵上、喺咖啡館排隊、喺同客戶開會嘅空隙,畀 Codex 一個 yes 或者 no。

04畀方法論

如果你認同「將 Capability 工具咁用」呢個方向,咁下一個問題係,點判斷你自己係咪真係切換咗?

先講最常見嘅錯誤,用功能升級清單衡量好唔好用

好多 OPC 評估 Codex 5 月升級,列咗 10 條新 feature,然後問「邊個對我有用」。呢種係 productivity 思維嘅延伸——你喺度揾「邊個令我做得更快」。但 capability 升級,你喺 feature list 上面係睇唔出嘅。capability 係「你以前根本冇意識到自己做唔到」嘅事。

真正嘅判斷標準,係問自己一個反問:

我而家用 Codex 做嘅 N 件事裏面,有幾件係 5 月之前根本唔會去做嘅?

唔係「做得慢啲嘅」——係「根本唔會做嘅」。

我自己回答呢個問題,答案係 3 件:

  • 我以前唔會俾 AI 睇屏幕,因為翻譯太攰。而家我每日 Appshots 至少 20 次。
  • 我以前唔會交長 goal,因為唔放心。而家我每週交 2-3 個 24h 長 goal。
  • 我以前唔會喺出門嘅時候俾 agent 繼續跑,因為冇辦法審批。而家我手機批咗至少 50 次。

如果你回答呢個問題,答案係 0,咁你裝咗 Codex 5 月版本但你嘅行為冇換——你仲喺 productivity 嗰邊。

如果你回答係 1-2,你喺過渡期,已經摸到 capability 嘅邊喇。

如果你回答 ≥3,你已經喺 capability 嗰邊喇。呢部分人,正在同 productivity 嗰邊嘅人拉開 5 倍嘅差距。

05落地工具

具體行動公式係咁嘅。

第一步,每週記一次「呢個星期我用 AI 做嘅事裏面,有邊幾件係上個月唔會做嘅」。如果連續 3 個星期答案都係 0,即係你裝咗新工具但工作流程冇換。

第二步,睇 OpenAI 同 Anthropic 嘅更新日誌時,跳過「提速 X%」嗰啲 feature。專門揾寫住「而家你可以做 Y 喇」嗰種 feature——得呢種先係 capability 升級。

第三步,遇到一個新 capability,強迫自己喺 7 日內至少用 3 次。唔用夠 3 次,你大腦唔會重設「我能夠做啲乜」嘅界限。

我自己 5 月重設工作流程,靠嘅就係呢套循環。三個星期落嚟,我對「一人公司可以做啲乜」嘅認知,同 4 月底完全唔同咗。

呢個就係我真正想講嘅。Codex 5 月真正畀我嘅唔係速度,係新動作。但令我用得着呢啲新動作嘅,係我自己願意重設工作流程。工具畀你嘅係 capability 入口,但行唔行入去,係你嘅事。

為人唔識 Capability,遲早會被 AI 裁。

我想,所有覺醒中嘅 OPC,5 月之後都應該做同一件事。重新清點你嘅工作流程,揾到嗰啲「以前根本做唔到」嘅新動作,將佢哋放入每星期嘅流程裏面。然後你會發現,唔係工具越來越好用,係你自己越來越識用。

周知 · 我哋一齊同 AI 覺醒超級個體


國內很多 OPC 創業者,5 月還在比 Codex 和 Claude Code 哪個更快。

我5 月之後用 Codex 做的 3 件事,是我 5 月之前根本做不了的。

這兩件事乍聽差不多,但背後是兩種完全不同的工具觀。前者把工具當 Productivity(提效)—— 做一樣的事,更快。後者把工具當 Capability(能力)—— 做以前根本做不了的事。絕大多數 OPC 用 AI 工具,卡在前者,一直卡着。


01行業誤解

我之前也卡過這個陷阱。

5 月之前,我評估一個 AI 工具好不好用,看的是它能讓我"快多少"。Codex 幫我寫一段代碼 5 分鐘 vs Claude Code 幫我寫 3 分鐘,那 Claude Code 更好。這個評估方式沒毛病——只要你把工具當 productivity 用。

國內大多數 OPC 現在還在這個評估維度上。Codex 5 月升級了,他們打開知乎、X、即刻,看的是測評 benchmark、看的是某段代碼生成速度對比、看的是"在 SWE-bench 上 Codex 漲了幾個點"。這套邏輯背後有個隱含假設——AI 工具的價值是把"我已經在做的事"做得更快。

OpenAI 自己在 5 月發佈 Codex 升級時,標題是 "Codex for (almost) everything"。這就很有意思了,almost everything 不是"做得更快的事",是"以前做不了的事"。OpenAI 想賣的是 capability,但大多數用戶買的是 productivity。

兩類人都在用 Codex,但 5 月以後,他們之間的差距不是 20%,是 5 倍。


圖片

02拆解原因

我們對"AI 工具"的隱含假設是這樣的:工具是手的延伸,讓我手伸得更遠更快。這套思維在 2024 年沒錯,但在 2026 年的 OPC 場景下,它是個陷阱。

因為現在 AI 已經從"手的延伸"變成"動作的替換"。Codex 在 5 月做的幾個升級,本質上不是讓你"手伸得更遠",是讓你"根本不用伸手"。

Productivity 工具的死穴,是它永遠停留在"幫你做你已經會做的事,但更快一點"。這件事有價值,但沒有稀缺性——AI 現在每家都在做"更快",誰都快不出真正的差異。

真正有稀缺性的,是 Capability 工具——幫你做你以前根本做不了的事。

這就是為什麼 Codex 5 月升級是一個分水嶺。它的三個核心升級,每一個都不是"productivity 升級",是"capability 解鎖"。

Anthropic 的 Claude Code 當然也很強,我自己仍然每天用。但在我 5 月重新審視工作流的時候,我發現 Codex 5 月解鎖的幾個 capability,我用 Claude Code 是做不到的。

不是 Claude Code 不好,是 OpenAI 在 capability 這個維度,5 月跑得更激進。


033 個新動作:我 5 月之前根本做不了的事

具體講三個我親身做過的新動作。

第一個動作 · 屏幕即上下文

知識卡片 A

5 月之前,我讓 AI 幫我看一個我正在使用的桌面 app(比如某個 SaaS 儀表盤),流程是這樣的:截圖、貼上去、描述"這個圖你看到了嗎"、AI 說"是的我看到了一些圖表"、我說"不是圖表,是右上角那個紅色按鈕"、AI 說"哦那個按鈕"……

5 月之後,我在 macOS 上按下雙 Cmd 鍵,當前 app 窗口連帶它的截圖和可讀取的文本一起發給 Codex。Codex 不需要我描述。它直接知道我在看什麼。

這個動作叫 Appshots,是 Codex macOS 應用 5 月加的功能。表面上是"截圖工具升級",本質上是把"屏幕本身變成 prompt"。

我以前沒有這個動作。我只能把屏幕翻譯給 AI。現在我不翻譯了,屏幕直接是輸入。

第二個動作 · 交一個 24 小時的長 goal

知識卡片 B

5 月之前,我用 Codex 或 Claude Code 寫代碼,是 5-10 分鐘一輪的交互式會話。我說一句、agent 寫一段、我 review、我說下一步、agent 再寫一段。我必須坐在電腦前。

5 月之後,Codex 的 Goal mode 從 experimental 轉正了。我交給 Codex 一個目標,比如"把這個項目的所有測試用例改造成新的測試框架,跑通,提 PR"。然後我合上電腦,去散步、去開會、去睡覺。Codex 自己跑幾小時甚至一天。

這個動作叫 Goal mode。表面上是"長會話支持",本質上是把"交互式 coding"變成"委託式 coding"。

我以前沒有這個動作。我只能盯着 agent 一步一步做。現在我交付一個完整的 goal,我自己去做別的事。

第三個動作 · 散步路上手機審批

知識卡片 C

5 月之前,如果 Codex 在遠端跑長任務,我必須回到電腦前才能審批它的下一步。

5 月 14 號 OpenAI 把 Codex 整合進 ChatGPT 移動端。從手機上我可以看 Codex 的所有線程、review 輸出、approve 命令、切模型、起新任務。

這個動作叫 Codex Mobile。表面上是"多端同步",本質上是把"AI agent 解鎖在桌面前"變成"AI agent 跟着我走"。

我以前沒有這個動作。我必須在電腦前。現在我在地鐵上、在咖啡館排隊、在跟客戶開會的間隙,給 Codex 一個 yes 或 no。

04給方法論

如果你認同"做 Capability 工具用"這個方向,那下一個問題是,怎麼判斷你自己是不是真切換了?

先說最常見的錯誤,用功能升級清單衡量好不好用

很多 OPC 評估 Codex 5 月升級,列了 10 條新 feature,然後問"哪個對我有用"。這種是 productivity 思維的延伸——你在找"哪個讓我做得更快"。但 capability 升級,你在 feature list 上是看不出來的。capability 是"你以前根本沒意識到自己做不了"的事。

真正的判據,是問自己一個反問:。

我現在用 Codex 做的 N 件事裏,有幾件是 5 月之前根本不會去做的?

不是"做得更慢的"——是"根本不會做的"。

我自己回答這個問題,答案是 3 件:。

  • 我以前不會讓 AI 看屏幕,因為翻譯太累。現在我每天 Appshots 至少 20 次。
  • 我以前不會交長 goal,因為不放心。現在我每週交 2-3 個 24h 長 goal。
  • 我以前不會在出門時讓 agent 繼續跑,因為沒法審批。現在我手機批了至少 50 次。

如果你回答這個問題,答案是 0,那你裝了 Codex 5 月版本但你的行為沒換——你還在 productivity 那邊。

如果你回答是 1-2,你在過渡期,已經摸到 capability 的邊了。

如果你回答 ≥3,你已經在 capability 那邊了。這部分人,正在和 productivity 那邊的人拉開 5 倍的差距。

05落地工具

具體行動公式是這樣的。

第一步,每週記一次"這周我用 AI 做的事裏,有哪幾件是上個月不會做的"。如果連續 3 周答案都是 0,說明你裝了新工具但工作流沒換。

第二步,看 OpenAI 和 Anthropic 的更新日誌時,跳過"提速 X%"那些 feature。專門找寫着"現在你可以做 Y 了"那種 feature——只有這種是 capability 升級。

第三步,遇到一個新 capability,強迫自己在 7 天內至少用 3 次。不用 3 次,你大腦不會重設"我能做什麼"的邊界。

我自己 5 月重設工作流,靠的就是這套循環。三週下來,我對"一人公司能做什麼"的認知,跟 4 月底完全不一樣了。

這就是我真正想說的。Codex 5 月真正給我的不是速度,是新動作。但讓我能用上這些新動作的,是我自己願意重設工作流。工具給你的是 capability 入口,但走不走進去,是你的事。

為人不識 Capability,遲早要被 AI 裁。

我想,所有覺醒中的 OPC,5 月以後都該做同一件事。重新清點你的工作流,找到那些"以前根本做不了"的新動作,把它們裝進每週的流程裏。然後你會發現,不是工具越來越好用了,是你自己越來越會用了。

周知 · 我們一起和 AI 覺醒超級個體