移動端Codex不是讓你寫代碼,而是給你一個口袋遙控器
整理版優先睇
移動端 Codex 定位係口袋遙控器,唔係寫代碼工具
呢篇文章係一個成日喺街摸魚嘅開發者(作者)刷到 OpenAI 移動端 Codex 嘅下一波改進清單之後寫嘅。作者成日想遠程盯住個項目,對「唔使坐喺電腦前等 Agent 跑完」呢個需求好有共鳴。佢指出,桌面端 Codex 已經夠好用,移動端嘅真正定位唔係俾你喺手機寫代碼,而係一個口袋遙控器——你唔喺工位,都可以睇一眼、點一下、改個方向。
作者逐項解讀咗 OpenAI 預告嘅改進,包括推送通知、/fork 分支、權限恢復、更好嘅重連、跨設備控制、git diff 同 plan mode。佢認為呢啲改進冇一條係 AI 黑科技,而係經典工程問題:通知、分支、權限解耦、斷線重連、跨設備協同、移動 diff 同計劃確認。但 Agent 產品好唔好用,正正就係被呢啲唔性感但要命嘅細節決定。模型再聰明,連唔上、會話丟、睇唔清、控唔到,都係白搭。
- 移動端 Codex 嘅核心定位係口袋遙控器,唔係寫代碼工具。
- 推送通知將「輪詢」換成「中斷」,減少焦慮。
- /fork 令對話從線性變成樹狀,方案 A、B 可以並存。
- 權限回收唔等於數據銷燬,體現可逆嘅產品哲學。
- Plan mode 修復後,Agent 會先交計劃再動手,慳咗好多走冤枉路嘅時間。
原推文
OpenAI Devs 發佈嘅移動端 Codex 改進預告
口袋遙控器:移動端 Codex 嘅真正定位
桌面端 Codex 已經好夠用,點解仲要做移動端?答案好簡單:Agent 唔需要你喺度睇住。佢跑測試、裝依賴、改代碼,動輒十幾分鍾,你坐喺電腦前等?太嘥時間。所以移動端 Codex 嘅定位,唔係「喺手機寫代碼」(癲咗先咁做),而係俾你一個
遙控器
——你唔喺工位,都可以「睇一眼」「點一下」「改個方向」。理解咗呢個定位,下面啲改進就全部串得埋。
關鍵改進逐個拆解
推送通知:將
輪詢換成中斷
呢個功能聽落普通,但對 Agent 類產品係命脈。冇推送,你只能成日開 App 睇進度,好似睇微波爐轉盤咁焦慮。有咗推送,你可以掉低手機去飲咖啡,叮一聲就搞掂。
撤權限後仲可以恢復:呢度藏住一種成熟嘅產品哲學——
可逆操作
用戶嘅破壞性操作,應該係可逆嘅。「權限回收」同「數據銷燬」已經解耦,唔會因為手滑就冇咗成個會話。
更好嘅重連:移動端網絡好脆弱,地鐵、電梯、隧道分分鐘斷線。桌面嗰套 WebSocket 硬抗邏輯喺手機水土不服。背後係一串 IM 級別嘅工程:
消息序號、心跳、斷點續傳、狀態同步
做好咗你唔會覺,做差咗就係各種詭異 bug。
修復「控制其他設備」:呢條信息量最大。簡單講就係你電腦掛住 Agent 跑緊,手機點一下,電腦就響應。手機係指揮棒,電腦係手腳——
跨設備協同
呢個能力一旦穩定,移動端 Codex 嘅定位就徹底立住。
git diff 同 full-file:喺手機睇 Codex 改咗啲咩,體驗真係好火滾。折行、空格亂跳、上下文丟失……喺 6 吋屏幕做好 code review,難度唔低過
火柴盒上畫油畫
期待佢哋嘅方案:語法高亮 + 摺疊 + 橫滾?定係 AI 幫你總結 diff 重點?
plan mode 修好咗:Agent 會先交計劃再動手,俾你一個叫停機會。呢個模式好重要,因為 Agent 一旦行錯方向,會一路錯落去,寫一堆無用 code。
背後嘅產品哲學同工程思維
呢份改進清單入面冇一條係「AI 黑科技」。通知、分支、權限解耦、斷線重連、跨設備、移動 diff、計劃確認——全都係經典工程問題。但
Agent 產品好唔好用,就係被呢啲經典問題決定
OpenAI 仲好務實咁公開 changelog,承認「仲喺預覽,我哋快改」。呢種坦誠比發佈會仲有用。
🌟星標 + 👆關注,第一時間知最新、最有用嘅AI編程技巧
《賈傑嘅AI編程秘籍》付費合集,總共10篇,而家已經完結。30蚊交個朋友,學唔到真嘢揾我退錢;)
同埋我最新嘅付費合集《又100個思維碎片》墨問,把我返一日工,AI自己喺屋企寫一日代碼嘅秘訣,分享畀你
寫喺前面
刷到了 ChatGPT 移動端 Codex 嘅下一波改進清單。
我作為一個成日喺出面偷懶、又想「遠程睇住個項目」嘅開發者,睇完覺得好有共鳴,記低佢。
P.S. 原文係個預告 changelog,我會照自己嘅理解嚟解說。
先問一個問題:Codex 落到手機,到底為咩?
桌面版 Codex 已經夠好用,點解仲要做流動版?
答案其實好簡單:Agent 唔使你成日睇住。
佢跑測試、裝依賴、改代碼,成日都要十幾分鍾。你坐喺電腦前面等?太唔抵。
所以流動版 Codex 嘅定位,唔係「喺手機寫代碼」(癲咗先會咁做),而係畀你一個遙控器——你唔喺位,都可以「睇一睇」「㩒一下」「改個方向」。
明咗呢個定位,下面啲改進就全部串返埋。
推送通知:將「輪詢」換成「中斷」
呢個功能聽落普通,但對 Agent 類產品係命脈。
點解?
冇推送,你只可以不斷打開 App 睇進度,好似睇微波爐轉盤咁焦慮。
有咗推送,你可以掉低手機去飲咖啡,叮一聲響,啲嘢就做曬。
用電腦術語講,呢個係將輪詢換成了中斷。CPU 都知道中斷比輪詢慳事,何況人腦。
/fork:將 git 思維搬入對話
呢個改動最優雅。
fork 呢個詞,識 git 嘅一睇就明:由某個點分叉。
放喺對話裏面,意思就係:我想由某條消息開始行條新路,但唔會掉咗條舊路。
舉個例。Codex 幫你寫咗方案 A,你想睇睇方案 B。
舊方法係點做?編輯嗰條消息,重新發,然後方案 A 就消失咗——呢個係破壞性操作。
/fork 唔同。佢令對話由線性變成樹狀,方案 A、B 並存,版本控制嘅腦長咗喺對話裏面。
其實 ChatGPT 一路都有「編輯消息」功能,但嗰個係隱式分支,收得太深。/fork 係將佢顯式化,令你好似 git checkout -b 咁清晰。
撤權限後仲可以恢復:令「反悔」變成可能
呢個改動睇落唔起眼,踩過坑嘅先明。
場景係咁:你授權 Codex 訪問某個倉庫,後來手痕(或者為咗安全)收返權限,結果連之前嘅對話記錄都冇曬。
麻煩。
新邏輯係:權限收回 ≠ 數據銷毀。兩者解耦。
呢個背後藏住一種成熟嘅產品哲學:用戶嘅破壞性操作,應該係可逆嘅。
唔好令用戶因為一次手滑,付出唔成比例嘅代價。
更好嘅重連:同「地鐵信號」鬥爭
流動端嘅網絡係出名嘅脆弱。
地鐵、電梯、隧道、信號差嘅咖啡館,分分鐘將你條長連接cut斷。
更慘嘅係,App 一退到後台,iOS 會凍結你個進程;網絡由 WiFi 轉去 4G,IP 仲會變。
桌面端 WebSocket 嗰套硬撐邏輯,喺手機上水土不服。
所以「better reconnects」呢一句話背後,可能係消息序號、心跳、斷點續傳、狀態同步……一整套IM 級別嘅工程。
做好咗你唔覺,做差咗就會有各種奇怪 bug。
修復「控制其他設備」:手機當遙控器
呢條信息量最大,但官方講得最含糊。
我嘅理解係:你電腦上面掛住一個 Codex Agent 喺度做緊嘢,手機㩒一下,電腦嗰邊就會有反應。
跨設備協同。手機係指揮棒,電腦係手腳。
呢個能力如果穩定咗,咁流動端 Codex 嘅定位就徹底立得住——佢唔會同你嘅 IDE 爭飯食,佢淨係想做你嘅口袋遙控器。
git diff 同 full-file:喺火柴盒上面畫油畫
之前喺手機睇 Codex 改咗啲咩,體驗真係令人火滾。
diff 折行、空格亂跳、上下文丟失、要切來切去……
code review 呢家嘢,對屏幕同排版嘅要求係出名嘅挑剔。
喺 6 吋屏幕上面做好 code review,難度唔低過喺火柴盒上面畫油畫。
我有啲好奇佢哋嘅方案。語法高亮 + 摺疊 + 橫滾?定係更激進嘅「AI 幫你總結 diff 重點」?拭目以待。
plan mode 修好咗:叫 Agent 交計劃先好動手
Codex 有個 plan mode:動手之前先列計劃,等你 review 完先開工。
呢個模式很重要。
點解?因為 Agent 一旦行歪,損失係會放大——佢會跟住錯嘅方向寫一堆代碼、行一堆命令,最後全廢。
plan mode 就係叫 AI 喺「做」之前先「講」,畀你一個叫停嘅機會。
如果呢個功能本身有 bug,就等於剎車失靈。今次修好,係底線工程。
一啲零碎嘅諗法
呢條推文雖然短,但藏住幾個有意思嘅嘢。
第一,OpenAI 諗清楚咗「手機上 Codex 係乜」。佢係遙控器,唔係工作枱。呢個定位準。
第二,佢哋猛咁補「對話魯棒性」。reconnect、restore、fork、push——全部都係圍住「對話唔可以丟、唔可以亂、唔可以僵」嚟搞。
Agent 產品嘅護城河,可能就藏喺呢啲唔性感但要命嘅細節裏面。
第三,佢哋公開 changelog 嘅姿態好務實。「仲喺預覽,我哋喺度快速改緊」——呢種坦誠比起開發佈會管用。
總結
返轉頭睇,呢份清單裏面冇一條係「AI 黑科技」。
通知、分支、權限解耦、斷線重連、跨設備、流動 diff、計劃確認——全部係經典工程問題。
但Agent 產品好唔好用,正正就係由呢啲經典問題決定。
模型再聰明,連唔到、對話丟、睇唔清、控制唔到,白搭。
期待呢啲改完之後,「喺地鐵上面 review 自己 Agent 寫嘅 PR」可以變成日常。
參考資料
原推文:https://x.com/OpenAIDevs/status/2055452557204717737
作者:Andrew Ambrosino(OpenAI 團隊),由 @OpenAIDevs 轉發
堅持創作唔易,求個一鍵三連,多謝你~❤️
以及「AI Coding技術交流羣」,聯絡 ayqywx 我拉你入羣,一齊交流學習~
🌟星標 + 👆關注,第一時間知道最新、最有用的AI編程姿勢
《賈傑的AI編程秘籍》付費合集,共10篇,現已完結。30元交個朋友,學不到真東西找我退錢;)
以及我最新的付費合集《又100個思維碎片》墨問,把我上一天班,AI自己在家寫一天代碼的焚訣,分享給你
寫在前面
刷到了 ChatGPT 移動端 Codex 的下一波改進清單。
我作為一個常在外面摸魚、又想“遠程盯項目”的開發者,看完挺有共鳴,記一下。
P.S. 原文是個預告 changelog,我會按自己的理解展開。
先問一個問題:Codex 跑到手機上,到底圖什麼?
桌面端 Codex 已經夠好用了,為什麼還要做移動端?
答案其實很簡單:Agent 不需要你盯着。
它跑測試、裝依賴、改代碼,動輒十幾分鍾。你坐在電腦前等?太虧了。
所以移動端 Codex 的定位,不是“在手機上寫代碼”(瘋了才這麼幹),而是給你一個遙控器——你不在工位,也能“看一眼”“點一下”“改個方向”。
理解了這個定位,下面這些改進就都串起來了。
推送通知:把"輪詢"換成"中斷"
這個功能聽上去普通,但對 Agent 類產品是命脈。
為什麼?
沒有推送,你只能反覆打開 App 看進度,像看微波爐轉盤一樣焦慮。
有了推送,你可以扔下手機去喝咖啡,叮一聲響起來,活兒幹完了。
用計算機術語說,這是把輪詢換成了中斷。CPU 都知道中斷比輪詢省事,何況人腦。
/fork:把 git 思維搬進對話
這個改動最優雅。
fork 這個詞,懂 git 的一看就明白:從某個點分叉。
放到對話裏,意思就是:我想從某條消息開始走條新路,但不丟老路。
舉個例子。Codex 給你寫了方案 A,你想再看看方案 B。
老辦法是怎麼做?編輯那條消息,重新發,然後方案 A 就消失了——這是破壞性操作。
/fork 不一樣。它讓對話從線性變成樹狀,方案 A、B 並存,版本控制的腦子長在了對話裏。
其實 ChatGPT 一直有“編輯消息”功能,但那是隱式分支,藏得太深。/fork 是把它顯式化,讓你像 git checkout -b 一樣清晰。
撤權限後還能恢復:讓"反悔"成為可能
這個改動看着不起眼,踩過坑的才懂。
場景是這樣的:你授權 Codex 訪問某個倉庫,後來手賤(或者出於安全)把權限收了,結果連之前的會話記錄都沒了。
麻煩。
新邏輯是:權限收回 ≠ 數據銷燬。兩者解耦。
這背後藏着一種成熟的產品哲學:用戶的破壞性操作,應該是可逆的。
不要讓用戶因為一次手滑,付出不成比例的代價。
更好的重連:和"地鐵信號"作鬥爭
移動端的網絡是出了名的脆弱。
地鐵、電梯、隧道、信號差的咖啡館,分分鐘把你的長連接掐斷。
更糟糕的是,App 一切後台,iOS 會凍結你的進程;網絡從 WiFi 切到 4G,IP 還會變。
桌面端的 WebSocket 那套硬抗邏輯,在手機上水土不服。
所以“better reconnects”這一句話背後,可能是消息序號、心跳、斷點續傳、狀態同步……一整套IM 級別的工程。
做好了你感覺不到,做差了就是各種詭異 bug。
修復"控制其他設備":手機當遙控器
這條信息量最大,但官方說得最含糊。
我的理解是:你電腦上掛着一個 Codex Agent 在跑活,手機點一下,電腦那頭就響應。
跨設備協同。手機是指揮棒,電腦是手腳。
這個能力如果穩了,那移動端 Codex 的定位就徹底立住了——它不和你的 IDE 搶飯碗,它只想做你的口袋遙控器。
git diff 和 full-file:在火柴盒上畫油畫
之前在手機看 Codex 改了啥,體驗真的讓人發火。
diff 折行、空格亂跳、上下文丟失、要切來切去……
代碼 review 這事,對屏幕和排版的要求是出了名的挑剔。
在 6 英寸屏幕上做好 code review,難度不亞於在火柴盒上畫油畫。
我挺好奇他們的方案。語法高亮 + 摺疊 + 橫滾?還是更激進的“AI 幫你總結 diff 重點”?拭目以待。
plan mode 修好了:讓 Agent 先交計劃再動手
Codex 有個 plan mode:動手前先列計劃,讓你 review 一下再開幹。
這個模式很重要。
為啥?因為 Agent 一旦跑偏,損失是放大的——它會沿着錯誤方向寫一堆代碼、跑一堆命令,最後全廢。
plan mode 相當於讓 AI 在“做”之前先“說”,給你一個叫停的機會。
它本身有 bug 的話,就等於剎車失靈。這次修好,是底線工程。
一些零散的思考
這條推文雖然短,但藏着幾個有意思的東西。
第一,OpenAI 想清楚了“手機上 Codex 是什麼”。它是遙控器,不是工作台。這個定位準。
第二,他們在猛補“會話魯棒性”。reconnect、restore、fork、push——全圍着“會話不能丟、不能亂、不能僵”打轉。
Agent 產品的護城河,可能就藏在這些不性感但要命的細節裏。
第三,他們公開 changelog 的姿態很務實。“還在預覽,我們在快速改”——這種坦誠比發佈會管用。
總結
回頭看,這份清單裏沒有一條是“AI 黑科技”。
通知、分支、權限解耦、斷線重連、跨設備、移動 diff、計劃確認——全是經典工程問題。
但Agent 產品好不好用,恰恰就是被這些經典問題決定的。
模型再聰明,連不上、會話丟、看不清、控不了,白搭。
期待這些改完之後,“在地鐵上 review 自家 Agent 寫的 PR”能成為日常。
參考資料
原推文:https://x.com/OpenAIDevs/status/2055452557204717737
作者:Andrew Ambrosino(OpenAI 團隊),由 @OpenAIDevs 轉發
堅持創作不易,求個一鍵三連,謝謝你~❤️
以及「AI Coding技術交流羣」,聯繫 ayqywx 我拉你進羣,共同交流學習~