移動端Codex不是讓你寫代碼，而是給你一個口袋遙控器

作者：知識藥丸

日期：2026年5月16日下午8:07

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

移動端 Codex 定位係口袋遙控器，唔係寫代碼工具

整理版摘要

呢篇文章係一個成日喺街摸魚嘅開發者（作者）刷到 OpenAI 移動端 Codex 嘅下一波改進清單之後寫嘅。作者成日想遠程盯住個項目，對「唔使坐喺電腦前等 Agent 跑完」呢個需求好有共鳴。佢指出，桌面端 Codex 已經夠好用，移動端嘅真正定位唔係俾你喺手機寫代碼，而係一個口袋遙控器——你唔喺工位，都可以睇一眼、點一下、改個方向。

作者逐項解讀咗 OpenAI 預告嘅改進，包括推送通知、/fork 分支、權限恢復、更好嘅重連、跨設備控制、git diff 同 plan mode。佢認為呢啲改進冇一條係 AI 黑科技，而係經典工程問題：通知、分支、權限解耦、斷線重連、跨設備協同、移動 diff 同計劃確認。但 Agent 產品好唔好用，正正就係被呢啲唔性感但要命嘅細節決定。模型再聰明，連唔上、會話丟、睇唔清、控唔到，都係白搭。

移動端 Codex 嘅核心定位係口袋遙控器，唔係寫代碼工具。
推送通知將「輪詢」換成「中斷」，減少焦慮。
/fork 令對話從線性變成樹狀，方案 A、B 可以並存。
權限回收唔等於數據銷燬，體現可逆嘅產品哲學。
Plan mode 修復後，Agent 會先交計劃再動手，慳咗好多走冤枉路嘅時間。

值得記低

連結 x.com

原推文

OpenAI Devs 發佈嘅移動端 Codex 改進預告

整理重點

口袋遙控器：移動端 Codex 嘅真正定位

桌面端 Codex 已經好夠用，點解仲要做移動端？答案好簡單：Agent 唔需要你喺度睇住。佢跑測試、裝依賴、改代碼，動輒十幾分鍾，你坐喺電腦前等？太嘥時間。所以移動端 Codex 嘅定位，唔係「喺手機寫代碼」（癲咗先咁做），而係俾你一個

遙控器

——你唔喺工位，都可以「睇一眼」「點一下」「改個方向」。理解咗呢個定位，下面啲改進就全部串得埋。

整理重點

關鍵改進逐個拆解

推送通知：將

輪詢換成中斷

呢個功能聽落普通，但對 Agent 類產品係命脈。冇推送，你只能成日開 App 睇進度，好似睇微波爐轉盤咁焦慮。有咗推送，你可以掉低手機去飲咖啡，叮一聲就搞掂。

撤權限後仲可以恢復：呢度藏住一種成熟嘅產品哲學——

可逆操作

用戶嘅破壞性操作，應該係可逆嘅。「權限回收」同「數據銷燬」已經解耦，唔會因為手滑就冇咗成個會話。

更好嘅重連：移動端網絡好脆弱，地鐵、電梯、隧道分分鐘斷線。桌面嗰套 WebSocket 硬抗邏輯喺手機水土不服。背後係一串 IM 級別嘅工程：

消息序號、心跳、斷點續傳、狀態同步

做好咗你唔會覺，做差咗就係各種詭異 bug。

修復「控制其他設備」：呢條信息量最大。簡單講就係你電腦掛住 Agent 跑緊，手機點一下，電腦就響應。手機係指揮棒，電腦係手腳——

跨設備協同

呢個能力一旦穩定，移動端 Codex 嘅定位就徹底立住。

git diff 同 full-file：喺手機睇 Codex 改咗啲咩，體驗真係好火滾。折行、空格亂跳、上下文丟失……喺 6 吋屏幕做好 code review，難度唔低過

火柴盒上畫油畫

期待佢哋嘅方案：語法高亮 + 摺疊 + 橫滾？定係 AI 幫你總結 diff 重點？

plan mode 修好咗：Agent 會先交計劃再動手，俾你一個叫停機會。呢個模式好重要，因為 Agent 一旦行錯方向，會一路錯落去，寫一堆無用 code。

整理重點

背後嘅產品哲學同工程思維

呢份改進清單入面冇一條係「AI 黑科技」。通知、分支、權限解耦、斷線重連、跨設備、移動 diff、計劃確認——全都係經典工程問題。但

Agent 產品好唔好用，就係被呢啲經典問題決定

OpenAI 仲好務實咁公開 changelog，承認「仲喺預覽，我哋快改」。呢種坦誠比發佈會仲有用。

🌟星標 + 👆關注，第一時間知最新、最有用嘅AI編程技巧

《賈傑嘅AI編程秘籍》付費合集，總共10篇，而家已經完結。30蚊交個朋友，學唔到真嘢揾我退錢；）

同埋我最新嘅付費合集《又100個思維碎片》墨問，把我返一日工，AI自己喺屋企寫一日代碼嘅秘訣，分享畀你

寫喺前面

刷到了 ChatGPT 移動端 Codex 嘅下一波改進清單。

我作為一個成日喺出面偷懶、又想「遠程睇住個項目」嘅開發者，睇完覺得好有共鳴，記低佢。

P.S. 原文係個預告 changelog，我會照自己嘅理解嚟解說。

先問一個問題：Codex 落到手機，到底為咩？

桌面版 Codex 已經夠好用，點解仲要做流動版？

答案其實好簡單：Agent 唔使你成日睇住。

佢跑測試、裝依賴、改代碼，成日都要十幾分鍾。你坐喺電腦前面等？太唔抵。

所以流動版 Codex 嘅定位，唔係「喺手機寫代碼」（癲咗先會咁做），而係畀你一個遙控器——你唔喺位，都可以「睇一睇」「㩒一下」「改個方向」。

明咗呢個定位，下面啲改進就全部串返埋。

推送通知：將「輪詢」換成「中斷」

呢個功能聽落普通，但對 Agent 類產品係命脈。

點解？

冇推送，你只可以不斷打開 App 睇進度，好似睇微波爐轉盤咁焦慮。

有咗推送，你可以掉低手機去飲咖啡，叮一聲響，啲嘢就做曬。

用電腦術語講，呢個係將輪詢換成了中斷。CPU 都知道中斷比輪詢慳事，何況人腦。

`/fork`：將 git 思維搬入對話

呢個改動最優雅。

fork 呢個詞，識 git 嘅一睇就明：由某個點分叉。

放喺對話裏面，意思就係：我想由某條消息開始行條新路，但唔會掉咗條舊路。

舉個例。Codex 幫你寫咗方案 A，你想睇睇方案 B。

舊方法係點做？編輯嗰條消息，重新發，然後方案 A 就消失咗——呢個係破壞性操作。

/fork 唔同。佢令對話由線性變成樹狀，方案 A、B 並存，版本控制嘅腦長咗喺對話裏面。

其實 ChatGPT 一路都有「編輯消息」功能，但嗰個係隱式分支，收得太深。/fork 係將佢顯式化，令你好似 git checkout -b 咁清晰。

撤權限後仲可以恢復：令「反悔」變成可能

呢個改動睇落唔起眼，踩過坑嘅先明。

場景係咁：你授權 Codex 訪問某個倉庫，後來手痕（或者為咗安全）收返權限，結果連之前嘅對話記錄都冇曬。

麻煩。

新邏輯係：權限收回 ≠ 數據銷毀。兩者解耦。

呢個背後藏住一種成熟嘅產品哲學：用戶嘅破壞性操作，應該係可逆嘅。

唔好令用戶因為一次手滑，付出唔成比例嘅代價。

更好嘅重連：同「地鐵信號」鬥爭

流動端嘅網絡係出名嘅脆弱。

地鐵、電梯、隧道、信號差嘅咖啡館，分分鐘將你條長連接cut斷。

更慘嘅係，App 一退到後台，iOS 會凍結你個進程；網絡由 WiFi 轉去 4G，IP 仲會變。

桌面端 WebSocket 嗰套硬撐邏輯，喺手機上水土不服。

所以「better reconnects」呢一句話背後，可能係消息序號、心跳、斷點續傳、狀態同步……一整套IM 級別嘅工程。

做好咗你唔覺，做差咗就會有各種奇怪 bug。

修復「控制其他設備」：手機當遙控器

呢條信息量最大，但官方講得最含糊。

我嘅理解係：你電腦上面掛住一個 Codex Agent 喺度做緊嘢，手機㩒一下，電腦嗰邊就會有反應。

跨設備協同。手機係指揮棒，電腦係手腳。

呢個能力如果穩定咗，咁流動端 Codex 嘅定位就徹底立得住——佢唔會同你嘅 IDE 爭飯食，佢淨係想做你嘅口袋遙控器。

git diff 同 full-file：喺火柴盒上面畫油畫

之前喺手機睇 Codex 改咗啲咩，體驗真係令人火滾。

diff 折行、空格亂跳、上下文丟失、要切來切去……

code review 呢家嘢，對屏幕同排版嘅要求係出名嘅挑剔。

喺 6 吋屏幕上面做好 code review，難度唔低過喺火柴盒上面畫油畫。

我有啲好奇佢哋嘅方案。語法高亮 + 摺疊 + 橫滾？定係更激進嘅「AI 幫你總結 diff 重點」？拭目以待。

plan mode 修好咗：叫 Agent 交計劃先好動手

Codex 有個 plan mode：動手之前先列計劃，等你 review 完先開工。

呢個模式很重要。

點解？因為 Agent 一旦行歪，損失係會放大——佢會跟住錯嘅方向寫一堆代碼、行一堆命令，最後全廢。

plan mode 就係叫 AI 喺「做」之前先「講」，畀你一個叫停嘅機會。

如果呢個功能本身有 bug，就等於剎車失靈。今次修好，係底線工程。

一啲零碎嘅諗法

呢條推文雖然短，但藏住幾個有意思嘅嘢。

第一，OpenAI 諗清楚咗「手機上 Codex 係乜」。佢係遙控器，唔係工作枱。呢個定位準。

第二，佢哋猛咁補「對話魯棒性」。reconnect、restore、fork、push——全部都係圍住「對話唔可以丟、唔可以亂、唔可以僵」嚟搞。

Agent 產品嘅護城河，可能就藏喺呢啲唔性感但要命嘅細節裏面。

第三，佢哋公開 changelog 嘅姿態好務實。「仲喺預覽，我哋喺度快速改緊」——呢種坦誠比起開發佈會管用。

總結

返轉頭睇，呢份清單裏面冇一條係「AI 黑科技」。

通知、分支、權限解耦、斷線重連、跨設備、流動 diff、計劃確認——全部係經典工程問題。

但Agent 產品好唔好用，正正就係由呢啲經典問題決定。

模型再聰明，連唔到、對話丟、睇唔清、控制唔到，白搭。

期待呢啲改完之後，「喺地鐵上面 review 自己 Agent 寫嘅 PR」可以變成日常。

參考資料

原推文：https://x.com/OpenAIDevs/status/2055452557204717737

作者：Andrew Ambrosino（OpenAI 團隊），由 @OpenAIDevs 轉發

堅持創作唔易，求個一鍵三連，多謝你～❤️

以及「AI Coding技術交流羣」，聯絡 ayqywx 我拉你入羣，一齊交流學習～

🌟星標 + 👆關注，第一時間知道最新、最有用的AI編程姿勢

《賈傑的AI編程秘籍》付費合集，共10篇，現已完結。30元交個朋友，學不到真東西找我退錢；）

以及我最新的付費合集《又100個思維碎片》墨問，把我上一天班，AI自己在家寫一天代碼的焚訣，分享給你

寫在前面

刷到了 ChatGPT 移動端 Codex 的下一波改進清單。

我作為一個常在外面摸魚、又想“遠程盯項目”的開發者，看完挺有共鳴，記一下。

P.S. 原文是個預告 changelog，我會按自己的理解展開。

先問一個問題：Codex 跑到手機上，到底圖什麼？

桌面端 Codex 已經夠好用了，為什麼還要做移動端？

答案其實很簡單：Agent 不需要你盯着。

它跑測試、裝依賴、改代碼，動輒十幾分鍾。你坐在電腦前等？太虧了。

所以移動端 Codex 的定位，不是“在手機上寫代碼”（瘋了才這麼幹），而是給你一個遙控器——你不在工位，也能“看一眼”“點一下”“改個方向”。

理解了這個定位，下面這些改進就都串起來了。

推送通知：把"輪詢"換成"中斷"

這個功能聽上去普通，但對 Agent 類產品是命脈。

為什麼？

沒有推送，你只能反覆打開 App 看進度，像看微波爐轉盤一樣焦慮。

有了推送，你可以扔下手機去喝咖啡，叮一聲響起來，活兒幹完了。

用計算機術語說，這是把輪詢換成了中斷。CPU 都知道中斷比輪詢省事，何況人腦。

`/fork`：把 git 思維搬進對話

這個改動最優雅。

fork 這個詞，懂 git 的一看就明白：從某個點分叉。

放到對話裏，意思就是：我想從某條消息開始走條新路，但不丟老路。

舉個例子。Codex 給你寫了方案 A，你想再看看方案 B。

老辦法是怎麼做？編輯那條消息，重新發，然後方案 A 就消失了——這是破壞性操作。

/fork 不一樣。它讓對話從線性變成樹狀，方案 A、B 並存，版本控制的腦子長在了對話裏。

其實 ChatGPT 一直有“編輯消息”功能，但那是隱式分支，藏得太深。/fork 是把它顯式化，讓你像 git checkout -b 一樣清晰。

撤權限後還能恢復：讓"反悔"成為可能

這個改動看着不起眼，踩過坑的才懂。

場景是這樣的：你授權 Codex 訪問某個倉庫，後來手賤（或者出於安全）把權限收了，結果連之前的會話記錄都沒了。

麻煩。

新邏輯是：權限收回 ≠ 數據銷燬。兩者解耦。

這背後藏着一種成熟的產品哲學：用戶的破壞性操作，應該是可逆的。

不要讓用戶因為一次手滑，付出不成比例的代價。

更好的重連：和"地鐵信號"作鬥爭

移動端的網絡是出了名的脆弱。

地鐵、電梯、隧道、信號差的咖啡館，分分鐘把你的長連接掐斷。

更糟糕的是，App 一切後台，iOS 會凍結你的進程；網絡從 WiFi 切到 4G，IP 還會變。

桌面端的 WebSocket 那套硬抗邏輯，在手機上水土不服。

所以“better reconnects”這一句話背後，可能是消息序號、心跳、斷點續傳、狀態同步……一整套IM 級別的工程。

做好了你感覺不到，做差了就是各種詭異 bug。

修復"控制其他設備"：手機當遙控器

這條信息量最大，但官方說得最含糊。

我的理解是：你電腦上掛着一個 Codex Agent 在跑活，手機點一下，電腦那頭就響應。

跨設備協同。手機是指揮棒，電腦是手腳。

這個能力如果穩了，那移動端 Codex 的定位就徹底立住了——它不和你的 IDE 搶飯碗，它只想做你的口袋遙控器。

git diff 和 full-file：在火柴盒上畫油畫

之前在手機看 Codex 改了啥，體驗真的讓人發火。

diff 折行、空格亂跳、上下文丟失、要切來切去……

代碼 review 這事，對屏幕和排版的要求是出了名的挑剔。

在 6 英寸屏幕上做好 code review，難度不亞於在火柴盒上畫油畫。

我挺好奇他們的方案。語法高亮 + 摺疊 + 橫滾？還是更激進的“AI 幫你總結 diff 重點”？拭目以待。

plan mode 修好了：讓 Agent 先交計劃再動手

Codex 有個 plan mode：動手前先列計劃，讓你 review 一下再開幹。

這個模式很重要。

為啥？因為 Agent 一旦跑偏，損失是放大的——它會沿着錯誤方向寫一堆代碼、跑一堆命令，最後全廢。

plan mode 相當於讓 AI 在“做”之前先“說”，給你一個叫停的機會。

它本身有 bug 的話，就等於剎車失靈。這次修好，是底線工程。

一些零散的思考

這條推文雖然短，但藏着幾個有意思的東西。

第一，OpenAI 想清楚了“手機上 Codex 是什麼”。它是遙控器，不是工作台。這個定位準。

第二，他們在猛補“會話魯棒性”。reconnect、restore、fork、push——全圍着“會話不能丟、不能亂、不能僵”打轉。

Agent 產品的護城河，可能就藏在這些不性感但要命的細節裏。

第三，他們公開 changelog 的姿態很務實。“還在預覽，我們在快速改”——這種坦誠比發佈會管用。

總結

回頭看，這份清單裏沒有一條是“AI 黑科技”。

通知、分支、權限解耦、斷線重連、跨設備、移動 diff、計劃確認——全是經典工程問題。

但Agent 產品好不好用，恰恰就是被這些經典問題決定的。

模型再聰明，連不上、會話丟、看不清、控不了，白搭。

期待這些改完之後，“在地鐵上 review 自家 Agent 寫的 PR”能成為日常。

參考資料

原推文：https://x.com/OpenAIDevs/status/2055452557204717737

作者：Andrew Ambrosino（OpenAI 團隊），由 @OpenAIDevs 轉發

堅持創作不易，求個一鍵三連，謝謝你～❤️

以及「AI Coding技術交流羣」，聯繫 ayqywx 我拉你進羣，共同交流學習～

口袋遙控器：移動端 Codex 嘅真正定位

關鍵改進逐個拆解

背後嘅產品哲學同工程思維

寫喺前面

先問一個問題：Codex 落到手機，到底為咩？

推送通知：將「輪詢」換成「中斷」

/fork：將 git 思維搬入對話

撤權限後仲可以恢復：令「反悔」變成可能

更好嘅重連：同「地鐵信號」鬥爭

修復「控制其他設備」：手機當遙控器

git diff 同 full-file：喺火柴盒上面畫油畫

plan mode 修好咗：叫 Agent 交計劃先好動手

一啲零碎嘅諗法

總結

參考資料

寫在前面

先問一個問題：Codex 跑到手機上，到底圖什麼？

推送通知：把"輪詢"換成"中斷"

/fork：把 git 思維搬進對話

撤權限後還能恢復：讓"反悔"成為可能

更好的重連：和"地鐵信號"作鬥爭

修復"控制其他設備"：手機當遙控器

git diff 和 full-file：在火柴盒上畫油畫

plan mode 修好了：讓 Agent 先交計劃再動手

一些零散的思考

總結

參考資料

`/fork`：將 git 思維搬入對話

`/fork`：把 git 思維搬進對話