重磅更新!codex、claude code 上線原生語音vibe coding
整理版優先睇
codex 同 Claude Code 上線原生語音,vibe coding 正式進入口講時代
呢篇文章係由噪點寫嘅,佢一直留意 AI 編程工具,見到 codex 同 Claude Code 最近都推出咗原生語音輸入功能,勁興奮。之前 vibe coding 要用第三方付費工具好似 typeless、whisp flow 先做到語音輸入,而家官方免費提供,體驗仲更好。作者認為呢次更新唔單止係功能疊加,而係改變咗人機交互嘅方式。
作者親自試過 codex 嘅版本,覺得識別準確、連貫,只係有少少延遲;codex 嘅使用好簡單:只要係 ~/.codex/config.toml 加入 [features] voice_transcription = true,然後重啟,按住空格就得。而 Claude Code 就要喺歡迎界面見到提示,輸入 /voice 指令,同樣按住空格。Claude Code 用實時流式輸出,仲可以打字同語音無縫切換,不過暫時只灰度測試緊 5% 用戶。整體嚟講,呢次更新大大降低 vibe coding 嘅門檻,令開發者可以更自然地用口講指令,提高效率。由打字變做口講,未來仲可能用手機遠程控制,真係好值得期待。作者好期待呢個趨勢會令開發效率再上一層樓。
- codex 同 Claude Code 都推出咗原生語音輸入,免費取代第三方工具。
- codex 需手動開啓 config,cc 用 /voice 命令,操作都係按住空格錄音。
- codex 用 Wispr Flow 引擎,識別準確但略帶延遲;cc 用實時流式,打字語音可無縫切換。
- cc 仲未全量,得 5% 用戶試到,官方話未來幾週會逐步開放。
- 語音輸入令 vibe coding 更自然,由打字轉口講,係人機交互嘅一次升級。
codex 語音功能公告
Twitter 上嘅官方公告
原生語音終於來了
codex 同 Claude Code 最近都大版本更新,最令人興奮嘅係原生語音輸入功能。
原生語音輸入功能係最大亮點
以前要靠第三方工具,每個月俾百幾蚊,而家免費內置,真係造福「懶人」開發者。
免費內置取代付費第三方
codex 已經全量開放,版本 v0.105.0 以上就可以用。Claude Code 就仲係灰度測試,得 5% 用戶用到。
codex 全量開放,Claude Code 灰度測試
點樣開啓同使用?
codex 嘅設定好簡單:打開 ~/.codex/config.toml,加入 [features] voice_transcription = true,然後重啟。
設定 codex 語音:改 config.toml
[features]
voice_transcription = true
使用時,將光標放喺輸入框,按住空格鍵開始錄音,鬆開就自動轉寫。如果見到黃色提示,只係話緊呢個係實驗功能。
按住空格錄音,鬆開自動轉寫
黃色提示係實驗功能,唔使理
Claude Code 方面,如果被灰度到,打開時會有提示,輸入 /voice 命令,同樣按住空格使用。佢嘅語音係實時流式輸出,仲可以打字同語音無縫切換,唔會重疊。
Claude Code 實時流式語音,打字同語音無縫切換
codex vs Claude Code 語音功能對比
兩者嘅語音輸入功能有啲唔同,可以睇下表:
- codex:使用 Wispr Flow 語音引擎,已全量,版本 v0.105.0+,按住空格錄音,識別準確但少少延遲。
- Claude Code:實時流式語音,打字語音無縫切換,唔會重疊;目前灰度 5%,未來幾週陸續開放,輸入 /voice 啟動。
- 共同點:都係免費,按住空格錄音,鬆開轉寫,適合 vibe coding 使用。
共同點:免費、按住空格、適合 vibe coding
codex 識別準確有延遲,Claude Code 流式無縫切換
作者覺得 codex 嘅體驗唔錯,識別一致性同連貫性都好。Claude Code 雖然未試到,但官方創始人話自己連續用咗一個星期,應該好穩定。
由打字到口講,再到手機控制,人機交互升級
由打字到口講,再到手機控制,真係好期待。
大家好,我係噪點
近排codex、claude code兩個工具都做咗大版本更新;響呢啲更新入面最令我興奮嘅,我相信都係大家體感最強、期待好耐嘅,就係兩邊都陸續推出咗語音轉文字功能:
原生支援語音vibe coding,唔使鍵盤打字,直接對住電腦用把口講需求,codex同claude code就會自動將佢轉成文字指令開始做嘢;
其實喺呢之前,靠語音輸入嚟做vibe coding已經好流行,甚至帶起咗一波電容咪同usb咪高峯,畢竟大家都本住「能唔鬱就唔鬱,能鬱口就唔鬱手」嘅懶人精神用ai;

但係響呢兩個cli用語音嗰陣,都係靠typeless、whisp flow呢啲第三方付費工具,當然體驗都幾好,但畢竟一個月都要百幾蚊嘅費用,而而家終於可以體驗官方原生嘅,唔單止免費,體感肯定都會唔同;
Codex cli嘅語音轉寫功能已經全面開放咗,用嘅係Wispr Flow語音引擎;
對應嘅發布版本係v0.105.0,所以只要係>=0.105.0版本嘅都用到,我哋只要更新到最新版本就得(v0.106);
用法亦都好簡單:
先入去配置文件
~/.codex/config.toml,輸入下面嘅命令開啟語音轉寫功能:
[features]
voice_transcription = true

然後重啟codex,將遊標放到輸入框,響輸入框按住空白鍵使用:撳住空白鍵開始錄音,放開之後自動轉寫;
重啟之後,可能會有一個黃色提示,呢個唔係錯誤,意思係你開咗語音輸入呢個實驗功能,仲喺內部測試中,我哋唔使理佢,正常撳住空白鍵用就得;
我試咗下,效果都幾好,無論係語音識別準確性、一致性定係連貫性,效果體驗都幾好;只係延遲感方面有啲測試感覺少少慢,問題唔大;下圖係一次直接輸出嘅效果:

響codex發布語音轉寫功能冇幾耐,cc就宣佈推出咗自己嘅語音功能;

cc嘅語音轉寫採用實時流式輸出;可以手動打字同語音輸入兩種方式無縫切換銜接,兩者內容唔會重疊覆蓋;
只不過暫時未全面開放,大約灰度測試咗5%嘅用戶,我睇咗下我個帳户仲未俾灰度到,唔知有冇朋友用咗,用咗嘅朋友可以講下體感如何?
官方話接下來幾個星期會陸續開放;
俾內部測試揀中嘅用戶打開Claude Code嘅時候,歡迎界面會出現提示,輸入/voice命令就可以開啟,一樣係撳住空白鍵開始錄音,放開之後自動轉寫;
cc創辦人話過去一個星期都係用呢個功能嚟用claude code;


其實,無論係codex定係claude code,最近呢幾次嘅功能更新,似乎係響不斷完善我哋同ai嘅交互體驗,由打字到語音口講,由一定要喺電腦前面處理需求到手提電話就可以遠程控制,越來越期待之後嘅人機交互體驗喇。
如果你已經俾Claude Code灰度到,都歡迎喺留言區分享你嘅體感~
如果對AI產品工具、vibe coding、AIGC內容有興趣,可以俾『噪點』加個星標 ⭐️,第一時間收到推送唔怕迷路!歡迎按讚、分享、訂閲~

參考資料:
https://x.com/i/status/2028628570692890800
大家好,我是噪點
近一週codex、claude code 2個工具都進行了大版本更新;在這些更新裏最讓我興奮,我相信也是大家體感最強,期待已久的,就是2家都陸續上線了語音轉文字功能:
原生支持語音vibe coding,不用鍵盤打字,直接對着電腦口噴需求, codex、claude code就能自動將其轉為文字指令開始幹活;
其實在這之前,通過語音輸入進行vibe coding就很火了,甚至還帶火了一波電容麥和usb麥克風,畢竟大家都本着“能不動就不動,能動嘴就不動手”的懶人精神使用ai;

但在這2個cli中使用語音時,還是靠的typeless、whisp flow這些第三方付費工具,當然體驗也很不錯,但畢竟一個月也是百元左右的費用,而現在終於可以體驗官方原生的了,不僅免費,體感肯定也會不同;
Codex cli 的語音轉寫功能已經全量了,用的是Wispr Flow語音引擎;
對於的發佈版本是v0.105.0,所以只需>= 0.105.0版本的都能使用,我們只需更新到最新版本就行了(v0.106);
使用也非常簡單:
先進入配置文件
~/.codex/config.toml,輸入下方命名開啓語音轉寫功能:
[features]
voice_transcription = true

然後重啓codex,把光標放到輸入框,在輸入框按住空格使用:按下空格開始錄音,鬆開後自動轉寫;
重啓後,可能會有一個黃色提示,這不是錯誤,這個意思是你開啓了語音輸入這個實驗功能,還在內測中,我們不用管它,正常按住空格鍵使用即可;
我試了下,效果還是很不錯的,不管是語音識別準確性,一致性,還是連貫性,效果體驗都還不錯;就是在延遲感上有些測試感覺稍有點慢,問題不大;下圖是一次直出效果:

在codex發佈語音轉寫功能沒幾天,cc就宣佈發佈了自己的語音功能;

cc的語音轉寫採用實時流式輸出;可以手動打字和語音輸入2種方式無縫切換銜接,兩者內容不會重疊覆蓋;
只是目前還沒有全量,約灰度測試了5%的用戶,我看了下我的賬户還沒被灰度到,不知道有沒有朋友用上了,用上的朋友可以說下體感如何?
官方說接下來幾週會陸續放開;
被內測到的用戶打開 Claude Code 時,歡迎界面會出現提示,輸入/voice命令即可開啓,同樣是按住空格鍵開始錄音,鬆開後自動轉寫;
cc創始人說過去一週都在用這個功能去使用claude code;


其實,不管是codex、還是claude code,最近這幾次的功能更新,似乎是在不斷的完整我們與ai的交互體驗,從打字到語音口噴,從必須在電腦前處理需求到手機就能遠程控制,越來越期待後面的人機交互體驗了。
如果你已經被 Claude Code 灰度到了,也歡迎在評論區分享你的體感~
如果對AI產品工具、vibe coding、AIGC內容感興趣,可以給『噪點』加個星標 ⭐️,第一時間獲取推送不迷路!歡迎一鍵三連~

參考資料:
https://x.com/i/status/2028628570692890800