重磅更新!codex、claude code 上線原生語音vibe coding

作者:噪點noisepoint
日期:2026年3月5日 上午12:32
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

codex 同 Claude Code 上線原生語音,vibe coding 正式進入口講時代

整理版摘要

呢篇文章係由噪點寫嘅,佢一直留意 AI 編程工具,見到 codex 同 Claude Code 最近都推出咗原生語音輸入功能,勁興奮。之前 vibe coding 要用第三方付費工具好似 typeless、whisp flow 先做到語音輸入,而家官方免費提供,體驗仲更好。作者認為呢次更新唔單止係功能疊加,而係改變咗人機交互嘅方式。

作者親自試過 codex 嘅版本,覺得識別準確、連貫,只係有少少延遲;codex 嘅使用好簡單:只要係 ~/.codex/config.toml 加入 [features] voice_transcription = true,然後重啟,按住空格就得。而 Claude Code 就要喺歡迎界面見到提示,輸入 /voice 指令,同樣按住空格。Claude Code 用實時流式輸出,仲可以打字同語音無縫切換,不過暫時只灰度測試緊 5% 用戶。整體嚟講,呢次更新大大降低 vibe coding 嘅門檻,令開發者可以更自然地用口講指令,提高效率。由打字變做口講,未來仲可能用手機遠程控制,真係好值得期待。作者好期待呢個趨勢會令開發效率再上一層樓。

  • codex 同 Claude Code 都推出咗原生語音輸入,免費取代第三方工具。
  • codex 需手動開啓 config,cc 用 /voice 命令,操作都係按住空格錄音。
  • codex 用 Wispr Flow 引擎,識別準確但略帶延遲;cc 用實時流式,打字語音可無縫切換。
  • cc 仲未全量,得 5% 用戶試到,官方話未來幾週會逐步開放。
  • 語音輸入令 vibe coding 更自然,由打字轉口講,係人機交互嘅一次升級。
值得記低
連結 x.com

codex 語音功能公告

Twitter 上嘅官方公告

整理重點

原生語音終於來了

codex 同 Claude Code 最近都大版本更新,最令人興奮嘅係原生語音輸入功能。

原生語音輸入功能係最大亮點

以前要靠第三方工具,每個月俾百幾蚊,而家免費內置,真係造福「懶人」開發者。

免費內置取代付費第三方

codex 已經全量開放,版本 v0.105.0 以上就可以用。Claude Code 就仲係灰度測試,得 5% 用戶用到。

codex 全量開放,Claude Code 灰度測試

整理重點

點樣開啓同使用?

codex 嘅設定好簡單:打開 ~/.codex/config.toml,加入 [features] voice_transcription = true,然後重啟。

設定 codex 語音:改 config.toml

程式內容 toml
[features]
voice_transcription = true

使用時,將光標放喺輸入框,按住空格鍵開始錄音,鬆開就自動轉寫。如果見到黃色提示,只係話緊呢個係實驗功能。

按住空格錄音,鬆開自動轉寫

黃色提示係實驗功能,唔使理

Claude Code 方面,如果被灰度到,打開時會有提示,輸入 /voice 命令,同樣按住空格使用。佢嘅語音係實時流式輸出,仲可以打字同語音無縫切換,唔會重疊。

Claude Code 實時流式語音,打字同語音無縫切換

整理重點

codex vs Claude Code 語音功能對比

兩者嘅語音輸入功能有啲唔同,可以睇下表:

  • codex:使用 Wispr Flow 語音引擎,已全量,版本 v0.105.0+,按住空格錄音,識別準確但少少延遲。
  • Claude Code:實時流式語音,打字語音無縫切換,唔會重疊;目前灰度 5%,未來幾週陸續開放,輸入 /voice 啟動。
  • 共同點:都係免費,按住空格錄音,鬆開轉寫,適合 vibe coding 使用。

共同點:免費、按住空格、適合 vibe coding

codex 識別準確有延遲,Claude Code 流式無縫切換

作者覺得 codex 嘅體驗唔錯,識別一致性同連貫性都好。Claude Code 雖然未試到,但官方創始人話自己連續用咗一個星期,應該好穩定。

由打字到口講,再到手機控制,人機交互升級

由打字到口講,再到手機控制,真係好期待。


大家好,我係噪點


近排codex、claude code兩個工具都做咗大版本更新;響呢啲更新入面最令我興奮嘅,我相信都係大家體感最強、期待好耐嘅,就係兩邊都陸續推出咗語音轉文字功能:


原生支援語音vibe coding,唔使鍵盤打字,直接對住電腦用把口講需求,codex同claude code就會自動將佢轉成文字指令開始做嘢


其實喺呢之前,靠語音輸入嚟做vibe coding已經好流行,甚至帶起咗一波電容咪同usb咪高峯,畢竟大家都本住「能唔鬱就唔鬱,能鬱口就唔鬱手」嘅懶人精神用ai;

圖片


但係響呢兩個cli用語音嗰陣,都係靠typeless、whisp flow呢啲第三方付費工具,當然體驗都幾好,但畢竟一個月都要百幾蚊嘅費用,而而家終於可以體驗官方原生嘅,唔單止免費,體感肯定都會唔同



codex

Codex cli嘅語音轉寫功能已經全面開放咗,用嘅係Wispr Flow語音引擎;


對應嘅發布版本係v0.105.0,所以只要係>=0.105.0版本嘅都用到,我哋只要更新到最新版本就得(v0.106);


用法亦都好簡單:


先入去配置文件

~/.codex/config.toml,輸入下面嘅命令開啟語音轉寫功能

[features]
 voice_transcription = true
圖片


然後重啟codex,將遊標放到輸入框,響輸入框按住空白鍵使用:撳住空白鍵開始錄音,放開之後自動轉寫


重啟之後,可能會有一個黃色提示,呢個唔係錯誤,意思係你開咗語音輸入呢個實驗功能,仲喺內部測試中,我哋唔使理佢,正常撳住空白鍵用就得;


我試咗下,效果都幾好,無論係語音識別準確性、一致性定係連貫性,效果體驗都幾好;只係延遲感方面有啲測試感覺少少慢,問題唔大;下圖係一次直接輸出嘅效果:


圖片


claude code

響codex發布語音轉寫功能冇幾耐,cc就宣佈推出咗自己嘅語音功能;

圖片


cc嘅語音轉寫採用實時流式輸出;可以手動打字同語音輸入兩種方式無縫切換銜接,兩者內容唔會重疊覆蓋;


只不過暫時未全面開放,大約灰度測試咗5%嘅用戶,我睇咗下我個帳户仲未俾灰度到,唔知有冇朋友用咗,用咗嘅朋友可以講下體感如何?


官方話接下來幾個星期會陸續開放


俾內部測試揀中嘅用戶打開Claude Code嘅時候,歡迎界面會出現提示,輸入/voice命令就可以開啟,一樣係撳住空白鍵開始錄音,放開之後自動轉寫;


cc創辦人話過去一個星期都係用呢個功能嚟用claude code;


圖片


兩者比較

codex同claude code嘅語音輸入功能對比如下:

圖片

其實,無論係codex定係claude code,最近呢幾次嘅功能更新,似乎係響不斷完善我哋同ai嘅交互體驗,由打字到語音口講,由一定要喺電腦前面處理需求到手提電話就可以遠程控制,越來越期待之後嘅人機交互體驗喇。


如果你已經俾Claude Code灰度到,都歡迎喺留言區分享你嘅體感~



如果對AI產品工具、vibe coding、AIGC內容有興趣,可以俾『噪點』加個星標 ⭐️,第一時間收到推送唔怕迷路!歡迎按讚、分享、訂閲~


圖片

參考資料:

https://x.com/i/status/2028628570692890800




大家好,我是噪點


近一週codex、claude code 2個工具都進行了大版本更新;在這些更新裏最讓我興奮,我相信也是大家體感最強,期待已久的,就是2家都陸續上線了語音轉文字功能:


原生支持語音vibe coding,不用鍵盤打字,直接對着電腦口噴需求, codex、claude code就能自動將其轉為文字指令開始幹活


其實在這之前,通過語音輸入進行vibe coding就很火了,甚至還帶火了一波電容麥和usb麥克風,畢竟大家都本着“能不動就不動,能動嘴就不動手”的懶人精神使用ai;

圖片


但在這2個cli中使用語音時,還是靠的typeless、whisp flow這些第三方付費工具,當然體驗也很不錯,但畢竟一個月也是百元左右的費用,而現在終於可以體驗官方原生的了,不僅免費,體感肯定也會不同



codex

Codex cli 的語音轉寫功能已經全量了,用的是Wispr Flow語音引擎;


對於的發佈版本是v0.105.0,所以只需>= 0.105.0版本的都能使用,我們只需更新到最新版本就行了(v0.106);


使用也非常簡單:


先進入配置文件

~/.codex/config.toml,輸入下方命名開啓語音轉寫功能

[features]
 voice_transcription = true
圖片


然後重啓codex,把光標放到輸入框,在輸入框按住空格使用:按下空格開始錄音,鬆開後自動轉寫


重啓後,可能會有一個黃色提示,這不是錯誤,這個意思是你開啓了語音輸入這個實驗功能,還在內測中,我們不用管它,正常按住空格鍵使用即可;


我試了下,效果還是很不錯的,不管是語音識別準確性,一致性,還是連貫性,效果體驗都還不錯;就是在延遲感上有些測試感覺稍有點慢,問題不大;下圖是一次直出效果:


圖片


claude code

在codex發佈語音轉寫功能沒幾天,cc就宣佈發佈了自己的語音功能;

圖片


cc的語音轉寫採用實時流式輸出;可以手動打字和語音輸入2種方式無縫切換銜接,兩者內容不會重疊覆蓋;


只是目前還沒有全量,約灰度測試了5%的用戶,我看了下我的賬户還沒被灰度到,不知道有沒有朋友用上了,用上的朋友可以說下體感如何?


官方說接下來幾週會陸續放開


被內測到的用戶打開 Claude Code 時,歡迎界面會出現提示,輸入/voice命令即可開啓,同樣是按住空格鍵開始錄音,鬆開後自動轉寫;


cc創始人說過去一週都在用這個功能去使用claude code;


圖片


2者對比

codex 與 claude code的語音輸入功能對比如下:

圖片

其實,不管是codex、還是claude code,最近這幾次的功能更新,似乎是在不斷的完整我們與ai的交互體驗,從打字到語音口噴,從必須在電腦前處理需求到手機就能遠程控制,越來越期待後面的人機交互體驗了。


如果你已經被 Claude Code 灰度到了,也歡迎在評論區分享你的體感~



如果對AI產品工具、vibe coding、AIGC內容感興趣,可以給『噪點』加個星標 ⭐️,第一時間獲取推送不迷路!歡迎一鍵三連~


圖片

參考資料:

https://x.com/i/status/2028628570692890800