阿里斷了閃電說的路

作者:大個青椒
日期:2026年5月8日 下午7:23
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

阿里加入戰局,語音輸入法小團隊冇乜出路

整理版摘要

呢篇文章係一位科技博主嘅分析,佢睇到阿里最近推出咗語音輸入法,覺得呢個動作會衝擊Typeless同閃電說呢類創業公司。作者認為語音輸入法唔係技術問題,而係流量同入口嘅問題,大廠有直播語料同用戶基礎,小團隊好難競爭。整體結論係:Typeless靠海外市場可能仲有得打,但閃電說呢類國內團隊,喺免費係王道嘅環境下,空間好細,好大機會撐唔住。

作者先讚賞Typeless嘅產品體驗,話佢哋將語音輸入做成閉環,畀用戶感覺到「畀野馬裝咗方向盤」。但同時批評月費20美金太貴,因為背後嘅AI成本其實好低,利潤可能用咗喺運營。佢又提到閃電說雖然有產品經理同用戶量,但體驗唔夠Typeless流暢,而且大廠一齊落場,細公司好難突圍。

最後作者強調,AI降低咗產品開發門檻,但商業邏輯冇變,小團隊面對大廠同個人開發者兩邊擠壓,賺錢愈嚟愈難。佢希望閃電說明年底仲喺度,但語氣唔樂觀。

  • 阿里語音輸入法上線,基於自家開源模型,中文同方言識別超越OpenAI Whisper,對Typeless同閃電說係直接衝擊。
  • Typeless成功在於軟件工程同用戶體驗,將語音輸入變成閉環,但貴嘅月費(20美金)主要用喺運營,唔係AI成本。
  • 閃電說體驗一般,只得基本口癖整理,唔夠Typeless流暢,而且大廠有直播語料(淘寶、抖音、微信)同入口優勢。
  • 語音輸入賽道本質係流量問題,大廠有用戶同數據,小團隊好難用技術門檻護城,最終只會被壓縮空間。
  • AI降低產品門檻但冇改變商業邏輯,小團隊面對大廠同個人開發者兩頭擠壓,賺錢更難,留畀閃電說嘅空間好細。
整理重點

大廠落場,小團隊惡啃

阿里最近推出咗自家語音輸入法,跟住豆包同微信之後。呢件事一啲都唔意外,因為佢哋嘅開源語音模型已經超越OpenAI Whisper,特別喺中文同方言方面。但對閃電說呢啲小團隊嚟講,呢個唔係好消息。

阿里好早就因為監管搞語音,所以語音技術好強,只係好多人冇留意到。

點解字節跳動嘅豆包語音效果咁好?作者話係因為抖音直播有大量音視頻素材,字節就咁儲到巨大語料庫。阿里有淘寶直播,騰訊有微信語音同視頻號,但佢哋之前唔重視,係因為「老登意識」,懶得鬱。

整理重點

Typeless點樣「畀野馬裝方向盤」

作者之前唔慣對住電腦講嘢,因為手敲文字可以形成思維閉環,語音就好似「噴」咁冇結構。但Typeless改變咗呢個感覺:佢將語音即時識別,再整理成半書面語言,令口語變有邏輯。

Typeless嘅核心唔係語音識別,亦唔係文字整理,而係軟件工程、用戶體驗同運營。

佢哋做到「畀野馬裝方向盤」嘅體驗,效率提高幾倍,但月費20美金實在太貴。

作者估佢哋嘅利潤去咗運營,因為Typeless從籍籍無名到眾所周知,靠產品亦靠運營。文字整理成本其實好低,用deepseek v4 flash一日唔使2毫子,語音識別都唔貴。

利潤去邊?作者推測係用喺運營,因為佢做過多年運營,知道呢個環節又貴又費人。

整理重點

閃電說嘅困局:前有大廠,後有Typeless

閃電說係國內團隊,創始人去年仲喺GitHub項目下面推自己嘢,今年已經有唔少用戶。上個月仲搞到劉韌送兑換碼,證明佢哋有產品經理開始做運營。

閃電說體驗一般,同冇語音輸入法比係好啲,但同微信輸入法比只多咗口癖整理,唔夠Typeless咁流暢。

作者話自己唔係咒閃電說,但真心覺得呢條賽道冇出路。原因有三:

  1. 1 語音輸入高頻、用戶基數大,但付費意願弱。
  2. 2 佢天然可以收集語音素材,開發門檻又唔高,大廠好易入局。
  3. 3 有直播嘅公司唔缺語料,有用戶嘅公司唔缺入口,小團隊冇競爭優勢。

Typeless憑產品力同海外市場仲有一戰之力,但喺國內免費係王道,留畀閃電說嘅空間好細。

 

你有冇試過對住個手機講嘢,然後發現屏幕上全部係「嗯,啊,即係,嗰個」?早期嘅語音輸入法唔單止識別率唔高,仲要「忠實」咁反映你講咗啲乜。

呢種情況已經唔同咗,兩款語音輸入法產品,Typeless 同閃電說,唔單止識別準確,仲會整理輸出嘅文字。令到廢話消失,邏輯再現。

前幾日阿里跟住豆包、微信之後,發佈咗自己嘅語音輸入法。呢樣嘢唔意外——佢哋嘅開源語音模型已經超越咗 OpenAI 嘅 Whisper,尤其係中文同方言識別。但係對閃電說呢啲小團隊嚟講,呢個唔係好消息。

作為互聯網大廠,阿里好早就因為監管嘅緣故喺語音方面落咗好多工夫。想用語音避開文字審查嘅小伎倆早就冇用啦,只係好多人冇意識到。

個個都覺得豆包語音效果最好,識別成功率高,語氣似人。我認為一個重要原因係抖音直播。太多直播間,太多音視頻畫面,呢啲素材令到字節毫不費力咁積累起巨大嘅語料庫,於是就有咗豆包,以及豆包輸入法。

阿里都唔差,阿里有淘寶直播。騰訊就有微信語音,有視頻號。呢兩間之所以冇能夠迅速喺語音輸入上發力,都係因為自己唔夠重視,企業有咗老登意識,懶得鬱。如果冇字節呢隻猛獸,AT 兩間仲喺度靠用戶量發夢。

之前我寫語音識別文章嘅時候,有讀者留言,推薦閃電說。我內心係拒絕嘅,我仲未習慣對住電腦講嘢。我更鍾意用手打字,睇住文字喺屏幕上顯示出嚟,令我可以輸出有邏輯嘅思維。呢個係一個閉環。如果換成語音,冇閉環,就係噴。

語音輸入法嘅第一關係識別率,更重要嘅就係要幫「噴」加上蓋。冇人鍾意見到屏幕上一大堆嗯、啊、嗎。識別率高又點,無效語氣詞應該喺空氣裡面消散,而唔係出現喺屏幕上。

語音輸入法一定會成為產品熱點,但佢一定唔可以係原來嗰個樣。

所以 Typeless 紅咗。佢真係將語音輸入呢件事做成閉環。用戶可以實時睇到自己講嘅嘢被識別出嚟,然後好似打字咁又被規整成有邏輯嘅半書面語言。呢種感覺好得意,就好似俾野馬裝咗個方向盤,可以指邊打邊。

由 Typeless 到國產閃電說,並唔係小團隊嘅技術創新,而係基於 AI 嘅快速發展,係踩喺啱先呢幾間大廠膊頭上面做出嚟嘅應用。

Typeless 嘅核心唔係語音識別,亦唔係文字整理。呢兩件事都可以睇成係 Typeless 對大模型嘅套殼。我認為 Typeless 嘅技術價值在於佢嘅軟件工程、用戶體驗,同埋運營。

能唔能夠令用戶體會到俾野馬裝方向盤嘅感覺,令口噴文字好似經過思考嘅手打輸入咁保證質量,效率卻提高幾倍,中間好幾個環節都需要耐心細緻嘅優化。

Typeless 做到咗。優雅、流暢、體驗極佳。

但係月費 20 美金實在太貴,簡直係搶錢。文字整理換成 deepseek v4 flash,大部分人一日花唔到 2 毫子,語音識別亦唔貴。中間嘅利潤用嚟做乜?

我有個猜測,後面講。

見到 Typeless 賺錢,實有人會跟。嗅覺靈敏嘅小團隊首先登場。閃電說就係咁樣嚟嘅。佢嘅創始人舊年仲喺熱門 github 項目後面留言,推薦自己嘅項目,今年已經積累咗唔少用戶量。

上個月劉韌送咗一張兑換碼,可以兑換閃電說一年 Pro 使用。呢個係閃電說產品經理做推廣發出來嘅。我嘅意思係,佢哋有產品經理啦,開始做運營啦。

所以,利潤去咗邊呢?我推測係運營。我做咗好多年運營,呢個係又使錢又費人嘅嘢。搞唔好嘅話,可以食曬成間公司嘅利潤。

如果產品係一把刀,運營就係揸刀嘅人。超級爆款產品係削鐵如泥嘅寶刀,唔使點用力就穿透到人羣。大部分產品想做到呢種水平係異想天開。所以大家只能用錢用人用力咁砸。

Typeless 由籍籍無名到眾所周知,既靠產品亦靠運營。閃電說我用咗一陣,體驗一般。同冇語音輸入法相比,當然係有提升。同微信語音輸入法比,多咗口癖整理,好少少,但仲未夠好,冇 Typeless 流式輸出嗰種流暢感覺。

我唔係咒閃電說,但我真心覺得,語音輸入呢條賽道根本冇出路。

點解?

諗嚇,語音輸入符合高頻、用戶基數大、付費意願唔強嘅特徵。佢天然就能收集用戶語音素材,作為用戶每日用 App 嘅必備應用,而且開發門檻唔高。

語音輸入唔係技術問題,係流量問題。有直播嘅人唔缺語料,有用戶嘅人唔缺入口。

喺大廠有人有錢有用戶基礎嘅前提下,無論係閃電說定係 Typeless,都冇錢途。Typeless 憑住自己嘅產品力同國外市場,仲有一戰之力。喺免費即王道嘅國內市場,留俾閃電說嘅空間太細啦。

AI 降低咗製造產品嘅門檻,但就冇辦法撼動基本嘅商業邏輯。小團隊必然面對大廠同個人開發者兩邊擠壓,賺錢變得更加難。

希望出年呢個時候,閃電說仲喺度。

 


 

你有沒有試過對着手機說一段話,然後發現屏幕上全是“嗯,啊,就是,那個”?早期的語音輸入法不僅識別率不高,而且“忠實”反映你說了什麼。

這種情況已經改變了,兩款語音輸入法產品,Typeless 和閃電說,不僅識別準確而且會整理輸出的文字。讓廢話消失,邏輯再現。

前幾天阿里繼豆包,微信之後,發佈了自己的語音輸入法。這不意外——他們的開源語音模型已經超過了 OpenAI 的 Whisper,尤其是中文和方言識別。但對閃電說這樣的小團隊來說,這不是好消息。

作為互聯網大廠,阿里很早就因為監管的緣故在語音上下足了功夫。企圖用語音躲避文字審查的小伎倆早就失效了,只是很多人沒意識到。

大家都覺得豆包語音效果最好,識別成功率高,語氣像人。我覺得一個重要原因是抖音直播。太多直播間,太多音視頻畫面,這些素材讓字節毫不費力的積累起巨大的語料庫,於是有了豆包,以及豆包輸入法。

阿里也不差,阿里有淘寶直播。騰訊則有微信語音,有視頻號。這兩家之所以沒能迅速在語音輸入上發力,還是自家不夠重視,企業有了老登意識,懶得動。如果沒有字節這頭猛獸,AT 兩家還躺在用戶量上做夢呢。

之前我寫語音識別文章的時候,有讀者留言,推薦閃電說。我內心是拒絕的,我還不習慣對着電腦講話。我更喜歡手敲文字,看着文字在屏幕上顯現出來,讓我能輸出有邏輯的思維。這是一個閉環。如果換成語音,沒有閉環,就是噴。

語音輸入法的第一道關是識別率,更重要的則是給“噴”加上蓋子。沒人喜歡看到屏幕上一大堆嗯,啊,嗎。識別率高又怎樣,無效語氣詞應該在空氣裏消散而不是出現在屏幕上。

語音輸入法一定會成為產品熱點,但它一定不能是原來的樣子。

所以 Typeless 火了。它真的把語音輸入這件事做成閉環了。用戶可以實時看到自己說出的話被識別出來,然後就像敲字一樣又被規整成有邏輯的半書面語言。這種感覺很奇妙,就像給野馬裝了方向盤,可以指哪兒打哪兒了。

從 Typeless 到國產閃電說,並不是小團隊的技術創新,而是基於 AI 的快速發展,是踩在剛才這幾家大廠肩膀上做出來的應用。

Typeless 的核心不是語音識別,也不是文字整理。這兩件事都可以看作是 Typeless 對大模型的套殼。我認為 Typeless 的技術價值在於它的軟件工程,用戶體驗,還有運營。

能不能讓用戶體會到給野馬裝方向盤的感覺,讓口噴文字想經過思考的手敲錄入一樣保證質量,效率卻提高好幾倍,這中間好幾個環節都需要耐心細緻的優化。

Typeless 做到了。優雅,流暢,體驗極佳。

但是月費 20 美金還是太貴了,簡直是搶錢。文字整理換成 deepseek v4 flash,大部分人一天花不了 2 毛錢,語音識別也不貴。中間的利潤用來幹啥了?

我有個猜測,後面說。

看到Typeless 賺錢,必然有人卷。嗅覺靈敏的小團隊首先登場。閃電說就是這麼來的。他的創始人去年還在熱門 github 項目後面留言,推薦自己的項目,今年已經積攢了不少用戶量。

上個月劉韌送了一張兑換碼,可以兑換閃電說一年 Pro 使用。這是閃電說產品經理做推廣發出來的。我的意思是,他們有產品經理了,開始做運營了。

所以,利潤去哪兒了呢?我推測是運營。我做了很多年運營,這是個又花錢又費人的活兒。弄不好的話,可以吃掉整個公司的利潤。

如果產品是一把刀,運營就是握刀的人。超級爆款產品是削鐵如泥的寶刀,不用費力就能穿透人羣。大部分產品想做到這樣的水平是異想天開。所以大家只能用錢用人用力砸。

Typeless 從籍籍無名到眾所周知,既靠產品也靠運營。閃電說我用了一陣子,體驗一般。和沒有語音輸入法相比,當然是個提高。和微信語音輸入法比,多了口癖整理,好一些,但還不夠好,沒有 Typeless 流式輸出的流暢感覺。

我不是咒閃電說,但我真心覺得,語音輸入這條賽道根本沒有出路。

為什麼?

想想看,語音輸入符合高頻,用戶基數大,付費意願不強的特徵。它天然就能收集用戶語音素材,作為用戶每天使用 App 的必備應用,而且開發門檻不高。

語音輸入不是技術問題,是流量問題。有直播的人不缺語料,有用戶的人不缺入口。

在大廠有人有錢有用戶基礎的前提下,不管是閃電說還是 Typeless,都沒錢途。Typeless 憑藉自己的產品力和國外市場,還有一戰之力。在免費即王道的國內市場,留給閃電說的空間太小了。

AI 降低了製造產品的門檻,但卻無法撼動基本的商業邏輯。小團隊必然面臨大廠和個人開發者兩頭擠壓,賺錢變得更難。

希望明年這時候,閃電說還活着。