太牛逼，Codex 這波更新！可以放棄小龍蝦和愛馬仕了！

作者：彭濤說

日期：2026年5月24日下午10:20

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Codex 5月更新：從聊天框進化為AI工位，關鍵在於任務定義與遠程監督

整理版摘要

呢篇文章係一個前Python程式員、而家做AI編程出海創業嘅作者，針對OpenAI Codex喺5月21日嘅更新做嘅深度分析。作者認為呢次唔係單純加幾個功能掣，而係Codex由「幫你寫code嘅對話框」演變成「能夠理解上下文、帶住目標跑流程、可以被遠程監督嘅AI工位」。佢將官方公佈嘅五個重點——Appshots、Goal mode、瀏覽器批註、鎖屏執行同手機端整合——逐個拆解，指出每個功能點係點樣補齊AI工作所需嘅現場感、任務終局、視覺反饋同長任務監督。

文章嘅整體結論係：未來用AI編程拉開差距嘅關鍵，唔係識唔識開Codex，而係有冇建立一套屬於自己嘅AI工作系統——包括邊啲任務可以交俾AI做、點樣寫驗收標準、邊啲命令可以自動批准、邊啲節點一定要等人睇。作者用「取法乎上，得乎其中」嚟強調心態嘅重要性：你當Codex係聊天框，佢就只係聊天框；你當佢係AI工位，佢先會真正幫你跑嘢。

文章最後附咗幾條OpenAI官方影片連結作為延伸資料，並提返之前講過嘅手機端功能，點樣同呢次更新串連成完整邏輯：手機係方向盤，host（Mac、Mac mini或devbox）先係真正做嘢嘅工位。作者對呢個模式嘅判斷係，AI在電腦上幹活，人類在關鍵節點接管方向，同傳統遠程桌面完全唔同。

Appshots解決現場上下文問題：直接將Mac上當前App窗口（截圖+可讀文字）發俾Codex，令AI唔使靠大量背景描述就能理解工作現場。
Goal mode定義任務終局：唔再係「幫我改嚇」，而係設定outcome同success criteria（例如遷移TypeScript嚴格模式、修復375px寬度佈局），令AI有明確驗收標準。
瀏覽器批註縮短前端反饋流程：直接喺內置瀏覽器圈出有問題嘅區域，唔再用純文字描述，配合browser use improvements令迭代效率提升。
鎖屏執行支援長任務：Mac鎖屏後Codex仍可繼續用Computer Use處理任務，加上手機審批，令AI可以跑更長時間嘅自動化流程。
手機端係監督入口唔係IDE：手機負責審批同糾偏，真正幹活嘅host係Mac或devbox，呢個模式將AI變成可以遠程監督嘅數碼員工。

值得記低

連結 youtube.com

Introducing the Codex app

OpenAI官方Codex介紹影片

連結 youtube.com

Automate tasks with the Codex app

自動化任務示範影片

連結 youtube.com

Multitasking with the Codex app

多工處理示範影片

整理重點

從聊天框到AI工位：五個功能點補齊工作現場

作者指出，呢次5月21日更新最值得留意嘅唔係功能本身，而係Codex正在由「幫你寫code嘅對話框」進化為一個完整嘅AI工位。五個重點分別係：Appshots、Goal mode、瀏覽器批註、鎖屏執行同browser use improvements。

Appshots解決現場感：以前要AI改UI，要寫好多背景描述，而家直接將App窗口截圖連可讀文字送俾佢，AI即刻睇到現場。

1 Appshots：少寫背景，直接睇現場，尤其適合前端、桌面軟件同調試工具。
2 Goal mode：設定驗收標準，例如「遷移到TypeScript嚴格模式，唔準有顯式any」。
3 瀏覽器批註：圈出問題區域，唔使純文字描述，配合browser use improvements令反饋更快。
4 鎖屏執行：Mac鎖屏後仍繼續跑任務，配合手機審批支援長流程。
5 browser use improvements：包括高級批註模式、更快資產提取、只讀JS context等實用增強。

整理重點

手機係方向盤，host先係工位

作者將5月14日嘅手機端預覽同呢次更新串連，指出手機唔係新IDE，而係監督入口。真正做嘢嘅係host——Mac、Mac mini或者devbox，上面有齊項目文件、憑據、權限、插件同本地工具。

呢個模式同傳統遠程桌面完全唔同。遠程桌面係你操作電腦，但Codex呢個模式係AI在電腦上幹活，你在關鍵節點接管方向。手機上做嘅係監督、審批、糾偏。

手機端負責監督、審批、糾偏，唔係寫code。
host（Mac/mini/devbox）負責執行，存曬所有環境同工具。
呢個模式令AI可以由「即時對話」進化為「非同步工作」。

整理重點

建立你嘅AI工作系統，先會拉開差距

作者最後強調，以後用AI編程拉開差距嘅，唔係「識唔識開Codex」，而係有冇一套自己嘅AI工作系統。呢套系統要包括：邊啲任務可以交俾AI、驗收標準點寫、邊啲命令可以自動批准、邊啲節點必須等人睇。

取法乎上，得乎其中：你當Codex係聊天框，佢就係聊天框；你當佢係AI工位，佢先會真正幫你跑事。

Codex 手機端連接呢件事，之前其實已經寫過喇。

我今日再睇多次 OpenAI 官方 release notes，真正值得單獨拎出嚟講嘅，係 5 月 21 日呢一波更新。

呢個唔係單純多咗幾個按鈕。

佢說明 Codex 正喺度由「幫你寫 code 嘅聊天框」，演進到「能夠理解上下文、帶住目標跑流程、可以被遠程監督嘅 AI 工位」。

官方今次列出 5 個點：Appshots、Goal mode、瀏覽器批註、locked computer use、browser use improvements。

1. Appshots：少寫背景，等佢直接睇現場

以前我哋叫 AI 改一個頁面、睇一個報錯、理解一個設定面板，成日要寫一大段背景。

例如「左邊嗰個按鈕有啲歪」「彈窗遮住咗圖表」「呢個窗口入面第二行參數唔啱」。

呢啲嘢寫出嚟都好彆扭。

Appshots 做嘅嘢好簡單：喺 Mac 上面將當前 app 窗口 send 畀 Codex，裏麪包括截圖同可讀取文本。

呢個意味住 Codex 唔單止讀 code，佢開始可以讀到你正在睇嘅工作現場。

呢個能力對前端、桌面軟件、除錯工具尤其有用。

好多時候，AI 缺乏嘅唔係智商，而係現場感。

2. Goal mode：由「幫我改嚇」變成「按目標交付」

今次 Goal mode 亦正式擴展到 Codex app、IDE extension 同 CLI。

我覺得呢個係今次更新入面最重要嘅一點。

以前我哋畀 AI 派任務，常見講法係「幫我優化一下呢個頁面」「將呢個 bug 修一修」。

呢種 prompt 最大嘅問題係冇驗收標準。

Goal mode 嘅核心，係令你定義 outcome 同 success criteria。

例如：遷移到 TypeScript，嚴格模式可以編譯通過，唔允許出現顯式 any；或者修復移動端佈局，喺 375px 寬度下按鈕唔可以溢出。

呢個就唔係閒聊喇。

佢更加似係畀一個人安排任務：目標係咩、完成標準係咩、做到咩程度就算結束。

AI 編程嘅下一階段，比拼嘅唔係邊個識得寫更玄嘅 prompt，而係邊個更識得定義任務終局。

3. 瀏覽器批註：前端反饋開始變短

前端問題最怕淨係文字描述。

你話「呢張卡片唔協調」，AI 可能唔知你指嘅係高度、留白、陰影，定係按鈕位置。

今次 in-app browser annotations 就係為咗呢個場景準備嘅。

你可以喺 Codex 內置瀏覽器入面打開頁面，直接圈出某個按鈕、某個區域，然後叫佢改。

官方今次仲提到 browser use improvements，包括高級批註模式、更快嘅資產提取、唯讀 JavaScript context、標籤頁分組可用性、減少 Chrome 擴展標籤頁幹擾，以及可靠性提升。

呢啲都唔係大詞，但好實用。

因為 AI 寫前端，真正花時間嘅唔係生成第一版，而係來回指出「邊度唔啱」。

4. 鎖屏執行：佢要跑更長嘅任務

簡單講，Mac 鎖屏之後，喺你開咗權限嘅情況下，Codex 仍然可以通過 Computer Use 繼續處理任務。

官方都強調，呢個唔係通用遠程解鎖，而係畀 Codex 當前任務用嘅受限能力。

呢點好關鍵。

AI 以前成日好似一個「你要睇住佢先肯做嘢」嘅實習生。

鎖屏執行、手機遠程審批、host 保持喚醒呢啲能力放埋一齊，就說明 OpenAI 想令 Codex 跑更長嘅任務。

例如重現桌面 App bug、跑瀏覽器測試、睇頁面、執行命令、等你喺手機上面批准下一步。

5. 手機端只係入口，host 先至係工位

手機端我前面唔詳細講喇，因為呢部分之前已經講過。

但如果將 5 月 14 日嘅 mobile preview 同 5 月 21 日呢波更新連埋一齊睇，邏輯就好清楚喇。

手機唔係一個新 IDE，佢更加似方向盤。

真正做嘢嘅係 host：你嘅 Mac、Mac mini，或者 devbox。

項目文件、憑據、權限、插件、瀏覽器環境、本地工具，都喺 host 上面。

你喺手機上面做嘅係監督、審批、糾正偏差。

呢個模式同遠程桌面唔一樣。

遠程桌面係你操作電腦。Codex 呢個模式係 AI 喺電腦上面做嘢，你喺關鍵節點接管方向。

官方影片素材

OpenAI Developers 有幾條 Codex 官方影片，可以作為呢篇嘅延伸素材。

Introducing the Codex app：
https://www.youtube.com/watch?v=HFM3se4lNiw

Automate tasks with the Codex app：
https://www.youtube.com/watch?v=xHnlzAPD9QI

Multitasking with the Codex app：
https://www.youtube.com/watch?v=9ohXlkbXiM4

我嘅判斷

今次 Codex 最近 3-4 日嘅更新，唔好淨係睇功能名。

真正嘅變化係：佢喺度補齊一個 AI 工位需要嘅嘢。

Appshots 解決現場上下文。

Goal mode 解決任務終局。

瀏覽器批註解決視覺反饋。

鎖屏執行同手機審批解決長任務監督。

所以以後拉開差距嘅，唔係「你識唔識打開 Codex」。

而係你有冇一套自己嘅 AI 工作系統：邊啲任務可以交給佢跑，驗收標準點寫，邊啲命令可以自動批准，邊啲節點一定要等你睇一眼。

取法乎上，得乎其中。你將 Codex 當成聊天框，佢就係聊天框；你將佢當成一個 AI 工位，佢先有可能真係開始幫你跑嘢。

往期：Codex 好勁：MacBook 接管 Mac mini 黑科技

資料來源：OpenAI Help Center、OpenAI 官方 Blog、OpenAI Developers Codex docs、OpenAI Developers Codex Videos。

前 Python 程序員，而家做 AI 編程出海方向嘅創業。

• 需要 AI 生圖/生影片？ → HiAPI.ai，新人 50 張 gpt image2 免費
• 想傾 AI、獨立開發、副業？ → 加微信 257735，備註【AI】

Codex 手機端連接這件事，前面其實已經寫過了。

我今天再看了一遍 OpenAI 官方 release notes，真正值得單獨拎出來講的，是 5 月 21 日這一波更新。

這不是單純多了幾個按鈕。

它說明 Codex 正在從“幫你寫代碼的聊天框”，往“能理解上下文、帶着目標跑流程、能被遠程監督的 AI 工位”演進。

官方這次列了 5 個點：Appshots、Goal mode、瀏覽器批註、locked computer use、browser use improvements。

1. Appshots：少寫背景，讓它直接看現場

以前我們讓 AI 改一個頁面、看一個報錯、理解一個設置面板，經常要寫一大段背景。

比如“左邊那個按鈕有點歪”“彈窗遮住了圖表”“這個窗口裏第二行參數不對”。

這些話寫出來都很彆扭。

Appshots 做的事情很簡單：在 Mac 上把當前 app 窗口發給 Codex，裏面包括截圖和可讀取文本。

這意味着 Codex 不只是讀代碼，它開始能讀你正在看的工作現場。

這個能力對前端、桌面軟件、調試工具尤其有用。

很多時候，AI 缺的不是智商，而是現場感。

2. Goal mode：從“幫我改改”變成“按目標交付”

這次 Goal mode 也正式擴到 Codex app、IDE extension 和 CLI。

我覺得這是這次更新裏最重要的一個點。

以前我們給 AI 發任務，常見說法是“幫我優化一下這個頁面”“把這個 bug 修一下”。

這種 prompt 最大的問題是沒有驗收標準。

Goal mode 的核心，是讓你定義 outcome 和 success criteria。

比如：遷移到 TypeScript，嚴格模式能編譯通過，不允許出現顯式 any；或者修復移動端佈局，375px 寬度下按鈕不能溢出。

這就不是閒聊了。

它更像給一個人安排任務：目標是什麼、完成標準是什麼、做到什麼程度算結束。

AI 編程下一階段，拼的不是誰會寫更玄的 prompt，而是誰更會定義任務終局。

3. 瀏覽器批註：前端反饋開始變短

前端問題最怕純文字描述。

你說“這個卡片不協調”，AI 可能不知道你指的是高度、留白、陰影，還是按鈕位置。

這次 in-app browser annotations 就是為這個場景準備的。

你可以在 Codex 內置瀏覽器裏打開頁面，直接圈出某個按鈕、某個區域，然後讓它改。

官方這次還提到 browser use improvements，包括高級批註模式、更快的資產提取、只讀 JavaScript context、標籤頁分組可用性、減少 Chrome 擴展標籤頁干擾，以及可靠性提升。

這些都不是大詞，但很實用。

因為 AI 寫前端，真正耗時間的不是生成第一版，而是來回指出“哪裏不對”。

4. 鎖屏執行：它要跑更長的任務

簡單說，Mac 鎖屏以後，在你開啓權限的情況下，Codex 仍然可以通過 Computer Use 繼續處理任務。

官方也強調，這不是通用遠程解鎖，而是給 Codex 當前任務用的受限能力。

這個點很關鍵。

AI 以前經常像一個“你盯着它才幹活”的實習生。

鎖屏執行、手機遠程審批、host 保持喚醒這些能力放在一起，就說明 OpenAI 想讓 Codex 跑更長的任務。

比如復現桌面 App bug、跑瀏覽器測試、看頁面、執行命令、等你手機上批准下一步。

5. 手機端只是入口，host 才是工位

手機端我前面不展開了，因為這部分之前已經講過。

但把 5 月 14 日的 mobile preview 和 5 月 21 日這波更新連起來看，邏輯就很清楚了。

手機不是一個新 IDE，它更像方向盤。

真正幹活的是 host：你的 Mac、Mac mini，或者 devbox。

項目文件、憑據、權限、插件、瀏覽器環境、本地工具，都在 host 上。

你在手機上做的是監督、審批、糾偏。

這個模式和遠程桌面不一樣。

遠程桌面是你在操作電腦。Codex 這個模式是 AI 在電腦上幹活，你在關鍵節點接管方向。

官方視頻素材

OpenAI Developers 有幾條 Codex 官方視頻，可以作為這篇的延伸素材。

Introducing the Codex app：
https://www.youtube.com/watch?v=HFM3se4lNiw

Automate tasks with the Codex app：
https://www.youtube.com/watch?v=xHnlzAPD9QI

Multitasking with the Codex app：
https://www.youtube.com/watch?v=9ohXlkbXiM4

我的判斷

這次 Codex 最近 3-4 天的更新，不要只看功能名。

真正的變化是：它在補齊一個 AI 工位需要的東西。

Appshots 解決現場上下文。

Goal mode 解決任務終局。

瀏覽器批註解決視覺反饋。

鎖屏執行和手機審批解決長任務監督。

所以以後拉開差距的，不是“你會不會打開 Codex”。

而是你有沒有一套自己的 AI 工作系統：哪些任務可以交給它跑，驗收標準怎麼寫，哪些命令可以自動批准，哪些節點必須等你看一眼。

取法乎上，得乎其中。你把 Codex 當聊天框，它就是聊天框；你把它當一個 AI 工位，它才可能真的開始替你跑事。

往期：Codex 牛逼：MacBook 接管 Mac mini 黑科技

資料來源：OpenAI Help Center、OpenAI 官方 Blog、OpenAI Developers Codex docs、OpenAI Developers Codex Videos。

前 Python 程序員，現在做 AI 編程出海方向的創業。

• 需要 AI 生圖/生視頻？ → HiAPI.ai，新人 50 張gpt image2 免費
• 想聊 AI、獨立開發、副業？ → 加微信 257735，備註【AI】