Codex 5 月讓我做的 3 件事，我 5 月前根本做不了

作者：縱所周知101

日期：2026年5月26日上午7:02

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Codex 5月升級解鎖三個新能力，改變你對AI工具的認知：從提升效率轉向創造能力

整理版摘要

呢篇文章係一位國內OPC創業者嘅親身經驗。佢喺5月之前用AI工具仲係停留喺「邊個寫code快啲」嘅productivity思維，但Codex 5月升級之後，佢做咗三件5月前根本做唔到嘅事，徹底改變咗佢對工具嘅理解。佢想講嘅核心係：而家AI已經從「做快啲」變咗做「做新事」，如果仲用productivity角度去睇新工具，你會錯過真正有價值嘅capability。

產品嘅升級可以分兩種：一種係幫你做得更快（productivity），另一種係幫你做你以前做唔到嘅事（capability）。絕大多數人仲卡喺前者，淨係比benchmark、比生成速度，但呢啲嘢冇稀缺性。真正嘅稀缺性係capability——做你以前根本做唔到嘅嘢。Codex 5月嘅三大升級：Appshots、Goal mode、Codex Mobile，每一項都係capability解鎖，唔係productivity提升。

作者嘅結論係：工具畀你嘅係capability入口，但行唔行入去係你嘅事。你需要重設工作流，每週問自己「今個禮拜用AI做嘅嘢有邊啲係上個月唔會做嘅」。如果連續3週答案係0，說明你裝咗新工具但冇換工作流。真正嘅差距唔係工具本身，而係你肯唔肯重新定義自己做得到嘅事。

Codex 5月升級嘅核心係解鎖新能力（capability），唔係單純提升效率（productivity）；後者冇稀缺性，前者先係真正嘅差異。
三大新能力：Appshots令屏幕變成prompt，唔使再翻譯畫面；Goal mode將互動式coding變成委託式coding，可以放低電腦；Codex Mobile令手機可以審批agent任務，唔使坐喺枱前。
Productivity思維睇feature list問「邊個快啲」；Capability思維問「有邊幾件事係以前根本唔會做嘅」——呢個反問係關鍵判據。
啟發：工具嘅價值在於幫你做到以前做唔到嘅嘢，而唔係幫你用更短時間做同一件事；唔好用舊框架衡量新工具。
行動：每週記錄新動作、跳過提速feature專揾capability feature、新capability強迫7日內用3次，先可以重設工作流邊界。

整理重點

工具觀嘅分水嶺：Productivity vs Capability

國內好多OPC創業者5月仲喺度比Codex同Claude Code邊個快，但呢個問題背後嘅假設係——AI工具嘅價值係將「我已經做緊嘅事」做得更快。作者話佢自己以前都係咁，成日用「快幾多」去衡量工具好唔好用。

Productivity工具嘅死穴係永遠停留喺「幫你做你已經識嘅事，但快啲」，呢個冇稀缺性。

真正有稀缺性嘅係Capability工具——幫你做你以前根本做唔到嘅事。

OpenAI喺5月發佈Codex升級時嘅標題係「Codex for almost everything」，almost everything唔係「做得更快嘅事」，係「以前做唔到嘅事」。但大多數用戶用productivity角度去買，呢個差距唔係20%，係5倍。

整理重點

三個以前做唔到嘅新動作

作者親身試咗三個Codex 5月嘅新功能，每一個都改變咗佢同AI合作嘅方式。

Appshots：按下雙Cmd，當前app窗口連同截圖同可讀文本一齊send畀Codex，唔使再描述「右上角紅色按鈕」，屏幕直接變prompt。
Goal mode：交一個長目標（例如改曬所有測試用例），合埋電腦去散步、開會、瞓覺，Codex自己跑幾小時甚至一日，由互動式變委託式。
Codex Mobile：手機可以睇Codex所有線程、review輸出、approve命令、切模型、起新任務，AI agent脱離枱機跟你走。

呢三個動作以前做唔到，唔係因為「冇時間做」，而係根本冇呢個動作喺工作流入面。

整理重點

點樣判斷自己係咪真係轉咗彎？

作者提出一個好簡單嘅反問：我而家用Codex做嘅N件事裏面，有幾件係5月之前根本唔會去做嘅？唔係「做得慢啲」，係「根本唔會做」。

如果你答案係0，你仲喺productivity嗰邊；如果係1-2，你喺過渡期；如果≥3，你已經過咗capability條線，正在拉開5倍差距。

作者自己嘅答案係3：每日Appshots至少20次、每週交2-3個24h長goal、手機批咗至少50次。呢啲動作5月之前根本唔會出現喺工作流入面。

整理重點

落地行動：重設工作流三步法

1 每週記一次「呢個禮拜用AI做嘅嘢有邊幾件係上個月唔會做嘅」；如果連續3週答案係0，即係裝咗新工具但冇換工作流。
2 睇更新日誌時跳過「提速X%」嘅feature，專揾「而家你可以做Y」嗰啲——只有呢啲係capability升級。
3 遇到新capability，強迫自己7日內至少用3次；唔用3次，大腦唔會重設「我能做啲咩」嘅邊界。

三週落嚟，作者對「一人公司能做啲咩」嘅認知同4月底完全唔同。

國內好多 OPC 創業者，5 月仲喺度比較 Codex 同 Claude Code 邊個快啲。

我 5 月之後用 Codex 做嘅 3 件事，係我 5 月之前根本做唔到嘅。

呢兩件事聽落差唔多，但背後係兩種完全唔同嘅工具觀。前者將工具當做 Productivity（提升效率）—— 做一樣嘅嘢，快啲。後者將工具當做 Capability（能力）—— 做以前根本做唔到嘅事。絕大多數 OPC 用 AI 工具，卡喺前者，一路卡住。

01行業誤解

我之前都卡過呢個陷阱。

5 月之前，我評估一個 AI 工具好唔好用，睇嘅係佢可以令我「快幾多」。Codex 幫我寫一段代碼 5 分鐘 vs Claude Code 幫我寫 3 分鐘，咁就 Claude Code 好啲。呢個評估方式冇問題——只要你將工具當 productivity 咁用。

國內大多數 OPC 而家仲喺呢個評估維度上。Codex 5 月升級咗，佢哋打開知乎、X、即刻，睇嘅係評測 benchmark、睇嘅係某段代碼生成速度對比、睇嘅係「喺 SWE-bench 上 Codex 升咗幾多個百分點」。呢套邏輯背後有個隱含假設——AI 工具嘅價值係將「我已經喺度做嘅事」做得更快。

OpenAI 自己喺 5 月發佈 Codex 升級嘅時候，標題係 "Codex for (almost) everything"。呢樣就好有意思喇，almost everything 唔係「做得更快嘅事」，係「以前做唔到嘅事」。OpenAI 想賣嘅係 capability，但大多數用戶買嘅係 productivity。

兩類人都在用 Codex，但 5 月之後，佢哋之間嘅差距唔係 20%，係 5 倍。

02拆解原因

我哋對「AI 工具」嘅隱含假設係咁嘅：工具係手嘅延伸，令我隻手伸得更遠更快。呢套思維喺 2024 年冇錯，但喺 2026 年嘅 OPC 場景下，佢係一個陷阱。

因為而家 AI 已經由「手嘅延伸」變成「動作嘅替換」。Codex 喺 5 月做嘅幾個升級，本質上唔係令你「手伸得更遠」，係令你「根本唔使伸手」。

Productivity 工具嘅死穴，係佢永遠停留喺「幫你做你已經識做嘅事，但快啲」。呢件事有價值，但冇稀缺性——AI 而家每間都喺度做「更快」，邊個都快唔出真正嘅差異。

真正有稀缺性嘅，係 Capability 工具——幫你做你以前根本做唔到嘅事。

呢個就係點解 Codex 5 月升級係一個分水嶺。佢嘅三個核心升級，每一個都唔係「productivity 升級」，係「capability 解鎖」。

Anthropic 嘅 Claude Code 當然都好強，我自己仍然每日用。但喺我 5 月重新審視工作流程嘅時候，我發現 Codex 5 月解鎖嘅幾個 capability，我用 Claude Code 係做唔到嘅。

唔係 Claude Code 唔好，係 OpenAI 喺 capability 呢個維度，5 月跑得更激進。

033 個新動作：我 5 月之前根本做唔到嘅事

具體講三個我親身做過嘅新動作。

第一個動作 · 屏幕即上下文

5 月之前，我令 AI 幫我睇一個我正在用嘅桌面 app（例如某個 SaaS 儀錶板），流程係咁嘅：cap圖、貼上去、描述「呢個圖你睇到嗎」、AI 話「係嘅我睇到一啲圖表」、我話「唔係圖表，係右上角嗰個紅色掣」、AI 話「哦嗰個掣」……

5 月之後，我喺 macOS 上㩒雙 Cmd 鍵，當前 app 視窗連同佢嘅 cap圖同可讀取嘅文本一齊發畀 Codex。Codex 唔需要我描述。佢直接知道我喺度睇緊乜。

呢個動作叫 Appshots，係 Codex macOS 應用程式 5 月加嘅功能。表面上係「cap圖工具升級」，本質上係將「屏幕本身變成 prompt」。

我以前冇呢個動作。我只能將屏幕翻譯畀 AI。而家我唔翻譯喇，屏幕直接係輸入。

第二個動作 · 交一個 24 小時嘅長 goal

5 月之前，我用 Codex 或者 Claude Code 寫代碼，係 5-10 分鐘一輪嘅交互式會話。我講一句、agent 寫一段、我 review、我話下一步、agent 再寫一段。我必須坐喺電腦前面。

5 月之後，Codex 嘅 Goal mode 由 experimental 變正式版。我交畀 Codex 一個目標，例如「將呢個項目嘅所有測試用例改造成新嘅測試框架，跑通，提 PR」。然後我閂埋電腦，去散步、去開會、去瞓覺。Codex 自己跑幾個鐘甚至一日。

呢個動作叫 Goal mode。表面上係「長會話支援」，本質上係將「交互式 coding」變成「委託式 coding」。

我以前冇呢個動作。我只能睇實 agent 一步一步做。而家我交付一個完整嘅 goal，我自己去做其他事。

第三個動作 · 散步途中手機審批

5 月之前，如果 Codex 喺遠端跑長任務，我必須返到電腦前面先至可以審批佢嘅下一步。

5 月 14 號 OpenAI 將 Codex 整合入 ChatGPT 流動端。從手機上我可以睇 Codex 嘅所有線程、review 輸出、approve 命令、切模型、起新任務。

呢個動作叫 Codex Mobile。表面上係「多端同步」，本質上係將「AI agent 解鎖喺枱面前」變成「AI agent 跟我走」。

我以前冇呢個動作。我必須喺電腦前面。而家我喺地鐵上、喺咖啡館排隊、喺同客戶開會嘅空隙，畀 Codex 一個 yes 或者 no。

04畀方法論

如果你認同「將 Capability 工具咁用」呢個方向，咁下一個問題係，點判斷你自己係咪真係切換咗？

先講最常見嘅錯誤，用功能升級清單衡量好唔好用。

好多 OPC 評估 Codex 5 月升級，列咗 10 條新 feature，然後問「邊個對我有用」。呢種係 productivity 思維嘅延伸——你喺度揾「邊個令我做得更快」。但 capability 升級，你喺 feature list 上面係睇唔出嘅。capability 係「你以前根本冇意識到自己做唔到」嘅事。

真正嘅判斷標準，係問自己一個反問：

我而家用 Codex 做嘅 N 件事裏面，有幾件係 5 月之前根本唔會去做嘅？

唔係「做得慢啲嘅」——係「根本唔會做嘅」。

我自己回答呢個問題，答案係 3 件：

我以前唔會俾 AI 睇屏幕，因為翻譯太攰。而家我每日 Appshots 至少 20 次。
我以前唔會交長 goal，因為唔放心。而家我每週交 2-3 個 24h 長 goal。
我以前唔會喺出門嘅時候俾 agent 繼續跑，因為冇辦法審批。而家我手機批咗至少 50 次。

如果你回答呢個問題，答案係 0，咁你裝咗 Codex 5 月版本但你嘅行為冇換——你仲喺 productivity 嗰邊。

如果你回答係 1-2，你喺過渡期，已經摸到 capability 嘅邊喇。

如果你回答 ≥3，你已經喺 capability 嗰邊喇。呢部分人，正在同 productivity 嗰邊嘅人拉開 5 倍嘅差距。

05落地工具

具體行動公式係咁嘅。

第一步，每週記一次「呢個星期我用 AI 做嘅事裏面，有邊幾件係上個月唔會做嘅」。如果連續 3 個星期答案都係 0，即係你裝咗新工具但工作流程冇換。

第二步，睇 OpenAI 同 Anthropic 嘅更新日誌時，跳過「提速 X%」嗰啲 feature。專門揾寫住「而家你可以做 Y 喇」嗰種 feature——得呢種先係 capability 升級。

第三步，遇到一個新 capability，強迫自己喺 7 日內至少用 3 次。唔用夠 3 次，你大腦唔會重設「我能夠做啲乜」嘅界限。

我自己 5 月重設工作流程，靠嘅就係呢套循環。三個星期落嚟，我對「一人公司可以做啲乜」嘅認知，同 4 月底完全唔同咗。

呢個就係我真正想講嘅。Codex 5 月真正畀我嘅唔係速度，係新動作。但令我用得着呢啲新動作嘅，係我自己願意重設工作流程。工具畀你嘅係 capability 入口，但行唔行入去，係你嘅事。

為人唔識 Capability，遲早會被 AI 裁。

我想，所有覺醒中嘅 OPC，5 月之後都應該做同一件事。重新清點你嘅工作流程，揾到嗰啲「以前根本做唔到」嘅新動作，將佢哋放入每星期嘅流程裏面。然後你會發現，唔係工具越來越好用，係你自己越來越識用。

周知 · 我哋一齊同 AI 覺醒超級個體

國內很多 OPC 創業者，5 月還在比 Codex 和 Claude Code 哪個更快。

我5 月之後用 Codex 做的 3 件事，是我 5 月之前根本做不了的。

這兩件事乍聽差不多，但背後是兩種完全不同的工具觀。前者把工具當 Productivity（提效）—— 做一樣的事，更快。後者把工具當 Capability（能力）—— 做以前根本做不了的事。絕大多數 OPC 用 AI 工具，卡在前者，一直卡着。

01行業誤解

我之前也卡過這個陷阱。

5 月之前，我評估一個 AI 工具好不好用，看的是它能讓我"快多少"。Codex 幫我寫一段代碼 5 分鐘 vs Claude Code 幫我寫 3 分鐘，那 Claude Code 更好。這個評估方式沒毛病——只要你把工具當 productivity 用。

國內大多數 OPC 現在還在這個評估維度上。Codex 5 月升級了，他們打開知乎、X、即刻，看的是測評 benchmark、看的是某段代碼生成速度對比、看的是"在 SWE-bench 上 Codex 漲了幾個點"。這套邏輯背後有個隱含假設——AI 工具的價值是把"我已經在做的事"做得更快。

OpenAI 自己在 5 月發佈 Codex 升級時，標題是 "Codex for (almost) everything"。這就很有意思了，almost everything 不是"做得更快的事"，是"以前做不了的事"。OpenAI 想賣的是 capability，但大多數用戶買的是 productivity。

兩類人都在用 Codex，但 5 月以後，他們之間的差距不是 20%，是 5 倍。

02拆解原因

我們對"AI 工具"的隱含假設是這樣的：工具是手的延伸，讓我手伸得更遠更快。這套思維在 2024 年沒錯，但在 2026 年的 OPC 場景下，它是個陷阱。

因為現在 AI 已經從"手的延伸"變成"動作的替換"。Codex 在 5 月做的幾個升級，本質上不是讓你"手伸得更遠"，是讓你"根本不用伸手"。

Productivity 工具的死穴，是它永遠停留在"幫你做你已經會做的事，但更快一點"。這件事有價值，但沒有稀缺性——AI 現在每家都在做"更快"，誰都快不出真正的差異。

真正有稀缺性的，是 Capability 工具——幫你做你以前根本做不了的事。

這就是為什麼 Codex 5 月升級是一個分水嶺。它的三個核心升級，每一個都不是"productivity 升級"，是"capability 解鎖"。

Anthropic 的 Claude Code 當然也很強，我自己仍然每天用。但在我 5 月重新審視工作流的時候，我發現 Codex 5 月解鎖的幾個 capability，我用 Claude Code 是做不到的。

不是 Claude Code 不好，是 OpenAI 在 capability 這個維度，5 月跑得更激進。

033 個新動作：我 5 月之前根本做不了的事

具體講三個我親身做過的新動作。

第一個動作 · 屏幕即上下文

5 月之前，我讓 AI 幫我看一個我正在使用的桌面 app（比如某個 SaaS 儀表盤），流程是這樣的：截圖、貼上去、描述"這個圖你看到了嗎"、AI 說"是的我看到了一些圖表"、我說"不是圖表，是右上角那個紅色按鈕"、AI 說"哦那個按鈕"……

5 月之後，我在 macOS 上按下雙 Cmd 鍵，當前 app 窗口連帶它的截圖和可讀取的文本一起發給 Codex。Codex 不需要我描述。它直接知道我在看什麼。

這個動作叫 Appshots，是 Codex macOS 應用 5 月加的功能。表面上是"截圖工具升級"，本質上是把"屏幕本身變成 prompt"。

我以前沒有這個動作。我只能把屏幕翻譯給 AI。現在我不翻譯了，屏幕直接是輸入。

第二個動作 · 交一個 24 小時的長 goal

5 月之前，我用 Codex 或 Claude Code 寫代碼，是 5-10 分鐘一輪的交互式會話。我說一句、agent 寫一段、我 review、我說下一步、agent 再寫一段。我必須坐在電腦前。

5 月之後，Codex 的 Goal mode 從 experimental 轉正了。我交給 Codex 一個目標，比如"把這個項目的所有測試用例改造成新的測試框架，跑通，提 PR"。然後我合上電腦，去散步、去開會、去睡覺。Codex 自己跑幾小時甚至一天。

這個動作叫 Goal mode。表面上是"長會話支持"，本質上是把"交互式 coding"變成"委託式 coding"。

我以前沒有這個動作。我只能盯着 agent 一步一步做。現在我交付一個完整的 goal，我自己去做別的事。

第三個動作 · 散步路上手機審批

5 月之前，如果 Codex 在遠端跑長任務，我必須回到電腦前才能審批它的下一步。

5 月 14 號 OpenAI 把 Codex 整合進 ChatGPT 移動端。從手機上我可以看 Codex 的所有線程、review 輸出、approve 命令、切模型、起新任務。

這個動作叫 Codex Mobile。表面上是"多端同步"，本質上是把"AI agent 解鎖在桌面前"變成"AI agent 跟着我走"。

我以前沒有這個動作。我必須在電腦前。現在我在地鐵上、在咖啡館排隊、在跟客戶開會的間隙，給 Codex 一個 yes 或 no。

04給方法論

如果你認同"做 Capability 工具用"這個方向，那下一個問題是，怎麼判斷你自己是不是真切換了？

先說最常見的錯誤，用功能升級清單衡量好不好用。

很多 OPC 評估 Codex 5 月升級，列了 10 條新 feature，然後問"哪個對我有用"。這種是 productivity 思維的延伸——你在找"哪個讓我做得更快"。但 capability 升級，你在 feature list 上是看不出來的。capability 是"你以前根本沒意識到自己做不了"的事。

真正的判據，是問自己一個反問：。

我現在用 Codex 做的 N 件事裏，有幾件是 5 月之前根本不會去做的？

不是"做得更慢的"——是"根本不會做的"。

我自己回答這個問題，答案是 3 件：。

我以前不會讓 AI 看屏幕，因為翻譯太累。現在我每天 Appshots 至少 20 次。
我以前不會交長 goal，因為不放心。現在我每週交 2-3 個 24h 長 goal。
我以前不會在出門時讓 agent 繼續跑，因為沒法審批。現在我手機批了至少 50 次。

如果你回答這個問題，答案是 0，那你裝了 Codex 5 月版本但你的行為沒換——你還在 productivity 那邊。

如果你回答是 1-2，你在過渡期，已經摸到 capability 的邊了。

如果你回答 ≥3，你已經在 capability 那邊了。這部分人，正在和 productivity 那邊的人拉開 5 倍的差距。

05落地工具

具體行動公式是這樣的。

第一步，每週記一次"這周我用 AI 做的事裏，有哪幾件是上個月不會做的"。如果連續 3 周答案都是 0，說明你裝了新工具但工作流沒換。

第二步，看 OpenAI 和 Anthropic 的更新日誌時，跳過"提速 X%"那些 feature。專門找寫着"現在你可以做 Y 了"那種 feature——只有這種是 capability 升級。

第三步，遇到一個新 capability，強迫自己在 7 天內至少用 3 次。不用 3 次，你大腦不會重設"我能做什麼"的邊界。

我自己 5 月重設工作流，靠的就是這套循環。三週下來，我對"一人公司能做什麼"的認知，跟 4 月底完全不一樣了。

這就是我真正想說的。Codex 5 月真正給我的不是速度，是新動作。但讓我能用上這些新動作的，是我自己願意重設工作流。工具給你的是 capability 入口，但走不走進去，是你的事。

為人不識 Capability，遲早要被 AI 裁。

我想，所有覺醒中的 OPC，5 月以後都該做同一件事。重新清點你的工作流，找到那些"以前根本做不了"的新動作，把它們裝進每週的流程裏。然後你會發現，不是工具越來越好用了，是你自己越來越會用了。

周知 · 我們一起和 AI 覺醒超級個體