移動端Codex不是讓你寫代碼,而是給你一個口袋遙控器

作者:知識藥丸
日期:2026年5月16日 下午8:07
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

移動端 Codex 定位係口袋遙控器,唔係寫代碼工具

整理版摘要

呢篇文章係一個成日喺街摸魚嘅開發者(作者)刷到 OpenAI 移動端 Codex 嘅下一波改進清單之後寫嘅。作者成日想遠程盯住個項目,對「唔使坐喺電腦前等 Agent 跑完」呢個需求好有共鳴。佢指出,桌面端 Codex 已經夠好用,移動端嘅真正定位唔係俾你喺手機寫代碼,而係一個口袋遙控器——你唔喺工位,都可以睇一眼、點一下、改個方向。

作者逐項解讀咗 OpenAI 預告嘅改進,包括推送通知、/fork 分支、權限恢復、更好嘅重連、跨設備控制、git diff 同 plan mode。佢認為呢啲改進冇一條係 AI 黑科技,而係經典工程問題:通知、分支、權限解耦、斷線重連、跨設備協同、移動 diff 同計劃確認。但 Agent 產品好唔好用,正正就係被呢啲唔性感但要命嘅細節決定。模型再聰明,連唔上、會話丟、睇唔清、控唔到,都係白搭。

  • 移動端 Codex 嘅核心定位係口袋遙控器,唔係寫代碼工具。
  • 推送通知將「輪詢」換成「中斷」,減少焦慮。
  • /fork 令對話從線性變成樹狀,方案 A、B 可以並存。
  • 權限回收唔等於數據銷燬,體現可逆嘅產品哲學。
  • Plan mode 修復後,Agent 會先交計劃再動手,慳咗好多走冤枉路嘅時間。
值得記低
連結 x.com

原推文

OpenAI Devs 發佈嘅移動端 Codex 改進預告

整理重點

口袋遙控器:移動端 Codex 嘅真正定位

桌面端 Codex 已經好夠用,點解仲要做移動端?答案好簡單:Agent 唔需要你喺度睇住。佢跑測試、裝依賴、改代碼,動輒十幾分鍾,你坐喺電腦前等?太嘥時間。所以移動端 Codex 嘅定位,唔係「喺手機寫代碼」(癲咗先咁做),而係俾你一個

遙控器

——你唔喺工位,都可以「睇一眼」「點一下」「改個方向」。理解咗呢個定位,下面啲改進就全部串得埋。

整理重點

關鍵改進逐個拆解

推送通知:將

輪詢換成中斷

呢個功能聽落普通,但對 Agent 類產品係命脈。冇推送,你只能成日開 App 睇進度,好似睇微波爐轉盤咁焦慮。有咗推送,你可以掉低手機去飲咖啡,叮一聲就搞掂。

撤權限後仲可以恢復:呢度藏住一種成熟嘅產品哲學——

可逆操作

用戶嘅破壞性操作,應該係可逆嘅。「權限回收」同「數據銷燬」已經解耦,唔會因為手滑就冇咗成個會話。

更好嘅重連:移動端網絡好脆弱,地鐵、電梯、隧道分分鐘斷線。桌面嗰套 WebSocket 硬抗邏輯喺手機水土不服。背後係一串 IM 級別嘅工程:

消息序號、心跳、斷點續傳、狀態同步

做好咗你唔會覺,做差咗就係各種詭異 bug。

修復「控制其他設備」:呢條信息量最大。簡單講就係你電腦掛住 Agent 跑緊,手機點一下,電腦就響應。手機係指揮棒,電腦係手腳——

跨設備協同

呢個能力一旦穩定,移動端 Codex 嘅定位就徹底立住。

git diff 同 full-file:喺手機睇 Codex 改咗啲咩,體驗真係好火滾。折行、空格亂跳、上下文丟失……喺 6 吋屏幕做好 code review,難度唔低過

火柴盒上畫油畫

期待佢哋嘅方案:語法高亮 + 摺疊 + 橫滾?定係 AI 幫你總結 diff 重點?

plan mode 修好咗:Agent 會先交計劃再動手,俾你一個叫停機會。呢個模式好重要,因為 Agent 一旦行錯方向,會一路錯落去,寫一堆無用 code。

整理重點

背後嘅產品哲學同工程思維

呢份改進清單入面冇一條係「AI 黑科技」。通知、分支、權限解耦、斷線重連、跨設備、移動 diff、計劃確認——全都係經典工程問題。但

Agent 產品好唔好用,就係被呢啲經典問題決定

OpenAI 仲好務實咁公開 changelog,承認「仲喺預覽,我哋快改」。呢種坦誠比發佈會仲有用。

 

🌟星標 + 👆關注,第一時間知最新、最有用嘅AI編程技巧

《賈傑嘅AI編程秘籍》付費合集,總共10篇,而家已經完結。30蚊交個朋友,學唔到真嘢揾我退錢;)

 

 

同埋我最新嘅付費合集《又100個思維碎片》墨問,把我返一日工,AI自己喺屋企寫一日代碼嘅秘訣,分享畀你


 

寫喺前面

刷到了 ChatGPT 移動端 Codex 嘅下一波改進清單。

我作為一個成日喺出面偷懶、又想「遠程睇住個項目」嘅開發者,睇完覺得好有共鳴,記低佢。

P.S. 原文係個預告 changelog,我會照自己嘅理解嚟解說。

先問一個問題:Codex 落到手機,到底為咩?

桌面版 Codex 已經夠好用,點解仲要做流動版?

答案其實好簡單:Agent 唔使你成日睇住

佢跑測試、裝依賴、改代碼,成日都要十幾分鍾。你坐喺電腦前面等?太唔抵。

所以流動版 Codex 嘅定位,唔係「喺手機寫代碼」(癲咗先會咁做),而係畀你一個遙控器——你唔喺位,都可以「睇一睇」「㩒一下」「改個方向」。

明咗呢個定位,下面啲改進就全部串返埋。

推送通知:將「輪詢」換成「中斷」

呢個功能聽落普通,但對 Agent 類產品係命脈

點解?

冇推送,你只可以不斷打開 App 睇進度,好似睇微波爐轉盤咁焦慮。

有咗推送,你可以掉低手機去飲咖啡,叮一聲響,啲嘢就做曬。

用電腦術語講,呢個係將輪詢換成了中斷。CPU 都知道中斷比輪詢慳事,何況人腦。

/fork:將 git 思維搬入對話

呢個改動最優雅

fork 呢個詞,識 git 嘅一睇就明:由某個點分叉

放喺對話裏面,意思就係:我想由某條消息開始行條新路,但唔會掉咗條舊路

舉個例。Codex 幫你寫咗方案 A,你想睇睇方案 B。

舊方法係點做?編輯嗰條消息,重新發,然後方案 A 就消失咗——呢個係破壞性操作

/fork 唔同。佢令對話由線性變成樹狀,方案 A、B 並存,版本控制嘅腦長咗喺對話裏面。

其實 ChatGPT 一路都有「編輯消息」功能,但嗰個係隱式分支,收得太深。/fork 係將佢顯式化,令你好似 git checkout -b 咁清晰。

撤權限後仲可以恢復:令「反悔」變成可能

呢個改動睇落唔起眼,踩過坑嘅先明

場景係咁:你授權 Codex 訪問某個倉庫,後來手痕(或者為咗安全)收返權限,結果連之前嘅對話記錄都冇曬。

麻煩

新邏輯係:權限收回 ≠ 數據銷毀。兩者解耦

呢個背後藏住一種成熟嘅產品哲學:用戶嘅破壞性操作,應該係可逆嘅

唔好令用戶因為一次手滑,付出唔成比例嘅代價。

更好嘅重連:同「地鐵信號」鬥爭

流動端嘅網絡係出名嘅脆弱

地鐵、電梯、隧道、信號差嘅咖啡館,分分鐘將你條長連接cut斷。

更慘嘅係,App 一退到後台,iOS 會凍結你個進程;網絡由 WiFi 轉去 4G,IP 仲會變。

桌面端 WebSocket 嗰套硬撐邏輯,喺手機上水土不服

所以「better reconnects」呢一句話背後,可能係消息序號、心跳、斷點續傳、狀態同步……一整套IM 級別嘅工程。

做好咗你唔覺,做差咗就會有各種奇怪 bug。

修復「控制其他設備」:手機當遙控器

呢條信息量最大,但官方講得最含糊

我嘅理解係:你電腦上面掛住一個 Codex Agent 喺度做緊嘢,手機㩒一下,電腦嗰邊就會有反應。

跨設備協同。手機係指揮棒,電腦係手腳

呢個能力如果穩定咗,咁流動端 Codex 嘅定位就徹底立得住——佢唔會同你嘅 IDE 爭飯食,佢淨係想做你嘅口袋遙控器

git diff 同 full-file:喺火柴盒上面畫油畫

之前喺手機睇 Codex 改咗啲咩,體驗真係令人火滾

diff 折行、空格亂跳、上下文丟失、要切來切去……

code review 呢家嘢,對屏幕同排版嘅要求係出名嘅挑剔

喺 6 吋屏幕上面做好 code review,難度唔低過喺火柴盒上面畫油畫

我有啲好奇佢哋嘅方案。語法高亮 + 摺疊 + 橫滾?定係更激進嘅「AI 幫你總結 diff 重點」?拭目以待。

plan mode 修好咗:叫 Agent 交計劃先好動手

Codex 有個 plan mode:動手之前先列計劃,等你 review 完先開工。

呢個模式很重要

點解?因為 Agent 一旦行歪,損失係會放大——佢會跟住錯嘅方向寫一堆代碼、行一堆命令,最後全廢

plan mode 就係叫 AI 喺「做」之前先「講」,畀你一個叫停嘅機會。

如果呢個功能本身有 bug,就等於剎車失靈。今次修好,係底線工程

一啲零碎嘅諗法

呢條推文雖然短,但藏住幾個有意思嘅嘢。

第一,OpenAI 諗清楚咗「手機上 Codex 係乜」。佢係遙控器,唔係工作枱。呢個定位準。

第二,佢哋猛咁補「對話魯棒性」。reconnect、restore、fork、push——全部都係圍住「對話唔可以丟、唔可以亂、唔可以僵」嚟搞。

Agent 產品嘅護城河,可能就藏喺呢啲唔性感但要命嘅細節裏面。

第三,佢哋公開 changelog 嘅姿態好務實。「仲喺預覽,我哋喺度快速改緊」——呢種坦誠比起開發佈會管用

總結

返轉頭睇,呢份清單裏面冇一條係「AI 黑科技」。

通知、分支、權限解耦、斷線重連、跨設備、流動 diff、計劃確認——全部係經典工程問題

Agent 產品好唔好用,正正就係由呢啲經典問題決定

模型再聰明,連唔到、對話丟、睇唔清、控制唔到,白搭

期待呢啲改完之後,「喺地鐵上面 review 自己 Agent 寫嘅 PR」可以變成日常。

參考資料

原推文:https://x.com/OpenAIDevs/status/2055452557204717737

作者:Andrew Ambrosino(OpenAI 團隊),由 @OpenAIDevs 轉發

           

 


 

 

 

堅持創作唔易,求個一鍵三連,多謝你~❤️

以及「AI Coding技術交流羣」,聯絡 ayqywx 我拉你入羣,一齊交流學習~

 

 

 

 

 

🌟星標 + 👆關注,第一時間知道最新、最有用的AI編程姿勢

《賈傑的AI編程秘籍》付費合集,共10篇,現已完結。30元交個朋友,學不到真東西找我退錢;)

 

 

以及我最新的付費合集《又100個思維碎片》墨問,把我上一天班,AI自己在家寫一天代碼的焚訣,分享給你


 

寫在前面

刷到了 ChatGPT 移動端 Codex 的下一波改進清單。

我作為一個常在外面摸魚、又想“遠程盯項目”的開發者,看完挺有共鳴,記一下。

P.S. 原文是個預告 changelog,我會按自己的理解展開。

先問一個問題:Codex 跑到手機上,到底圖什麼?

桌面端 Codex 已經夠好用了,為什麼還要做移動端?

答案其實很簡單:Agent 不需要你盯着

它跑測試、裝依賴、改代碼,動輒十幾分鍾。你坐在電腦前等?太虧了。

所以移動端 Codex 的定位,不是“在手機上寫代碼”(瘋了才這麼幹),而是給你一個遙控器——你不在工位,也能“看一眼”“點一下”“改個方向”。

理解了這個定位,下面這些改進就都串起來了。

推送通知:把"輪詢"換成"中斷"

這個功能聽上去普通,但對 Agent 類產品是命脈

為什麼?

沒有推送,你只能反覆打開 App 看進度,像看微波爐轉盤一樣焦慮。

有了推送,你可以扔下手機去喝咖啡,叮一聲響起來,活兒幹完了。

用計算機術語說,這是把輪詢換成了中斷。CPU 都知道中斷比輪詢省事,何況人腦。

/fork:把 git 思維搬進對話

這個改動最優雅

fork 這個詞,懂 git 的一看就明白:從某個點分叉

放到對話裏,意思就是:我想從某條消息開始走條新路,但不丟老路

舉個例子。Codex 給你寫了方案 A,你想再看看方案 B。

老辦法是怎麼做?編輯那條消息,重新發,然後方案 A 就消失了——這是破壞性操作

/fork 不一樣。它讓對話從線性變成樹狀,方案 A、B 並存,版本控制的腦子長在了對話裏。

其實 ChatGPT 一直有“編輯消息”功能,但那是隱式分支,藏得太深。/fork 是把它顯式化,讓你像 git checkout -b 一樣清晰。

撤權限後還能恢復:讓"反悔"成為可能

這個改動看着不起眼,踩過坑的才懂

場景是這樣的:你授權 Codex 訪問某個倉庫,後來手賤(或者出於安全)把權限收了,結果連之前的會話記錄都沒了。

麻煩

新邏輯是:權限收回 ≠ 數據銷燬。兩者解耦

這背後藏着一種成熟的產品哲學:用戶的破壞性操作,應該是可逆的

不要讓用戶因為一次手滑,付出不成比例的代價。

更好的重連:和"地鐵信號"作鬥爭

移動端的網絡是出了名的脆弱

地鐵、電梯、隧道、信號差的咖啡館,分分鐘把你的長連接掐斷。

更糟糕的是,App 一切後台,iOS 會凍結你的進程;網絡從 WiFi 切到 4G,IP 還會變。

桌面端的 WebSocket 那套硬抗邏輯,在手機上水土不服

所以“better reconnects”這一句話背後,可能是消息序號、心跳、斷點續傳、狀態同步……一整套IM 級別的工程。

做好了你感覺不到,做差了就是各種詭異 bug。

修復"控制其他設備":手機當遙控器

這條信息量最大,但官方說得最含糊

我的理解是:你電腦上掛着一個 Codex Agent 在跑活,手機點一下,電腦那頭就響應。

跨設備協同。手機是指揮棒,電腦是手腳

這個能力如果穩了,那移動端 Codex 的定位就徹底立住了——它不和你的 IDE 搶飯碗,它只想做你的口袋遙控器

git diff 和 full-file:在火柴盒上畫油畫

之前在手機看 Codex 改了啥,體驗真的讓人發火

diff 折行、空格亂跳、上下文丟失、要切來切去……

代碼 review 這事,對屏幕和排版的要求是出了名的挑剔

在 6 英寸屏幕上做好 code review,難度不亞於在火柴盒上畫油畫

我挺好奇他們的方案。語法高亮 + 摺疊 + 橫滾?還是更激進的“AI 幫你總結 diff 重點”?拭目以待。

plan mode 修好了:讓 Agent 先交計劃再動手

Codex 有個 plan mode:動手前先列計劃,讓你 review 一下再開幹。

這個模式很重要

為啥?因為 Agent 一旦跑偏,損失是放大的——它會沿着錯誤方向寫一堆代碼、跑一堆命令,最後全廢

plan mode 相當於讓 AI 在“做”之前先“說”,給你一個叫停的機會。

它本身有 bug 的話,就等於剎車失靈。這次修好,是底線工程

一些零散的思考

這條推文雖然短,但藏着幾個有意思的東西。

第一,OpenAI 想清楚了“手機上 Codex 是什麼”。它是遙控器,不是工作台。這個定位準。

第二,他們在猛補“會話魯棒性”。reconnect、restore、fork、push——全圍着“會話不能丟、不能亂、不能僵”打轉。

Agent 產品的護城河,可能就藏在這些不性感但要命的細節裏。

第三,他們公開 changelog 的姿態很務實。“還在預覽,我們在快速改”——這種坦誠比發佈會管用

總結

回頭看,這份清單裏沒有一條是“AI 黑科技”。

通知、分支、權限解耦、斷線重連、跨設備、移動 diff、計劃確認——全是經典工程問題

Agent 產品好不好用,恰恰就是被這些經典問題決定的

模型再聰明,連不上、會話丟、看不清、控不了,白搭

期待這些改完之後,“在地鐵上 review 自家 Agent 寫的 PR”能成為日常。

參考資料

原推文:https://x.com/OpenAIDevs/status/2055452557204717737

作者:Andrew Ambrosino(OpenAI 團隊),由 @OpenAIDevs 轉發

           

 


 

 

 

堅持創作不易,求個一鍵三連,謝謝你~❤️

以及「AI Coding技術交流羣」,聯繫 ayqywx 我拉你進羣,共同交流學習~