為什麼 Gemini 被調侃為「美國版豆包」?

作者:黑衣執事
日期:2026年5月21日 下午8:24
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Gemini 3.5 Flash定價暴漲、實測跑唔起Code,Google AI已掉隊成「美國版豆包

整理版摘要

呢篇文章係整理自知名開發者博主 Theo(T3 Chat 作者、YouTube 百萬訂閲頻道主理人)嘅視頻。佢喺Google I/O 2026之後,將Gemini 3.5 Flash發佈會入面畀Google刻意遮掩嘅問題逐一揭露,引發開發者圈子廣泛討論。文章核心係指出Gemini系列模型已經從第一梯隊滑落,被中文AI圈戲稱為「美國版豆包」——唔係話豆包差,而係形容佢嘅定位類似安卓:跑分仲睇得嚇,但實際體驗同Claude(蘋果)差距越拉越遠。

整體結論好清楚Google喺AI領域嘅掉隊方式唔係突然放棄,而係跑分繼續做、發佈會繼續開,但價格悄悄暴漲、開發者工具一件件爛掉、好嘅團隊被內部政治換走、真正在乎產品嘅人選擇離開。外界感知到嘅就係一種「好似差啲嘢」嘅模糊感覺。Theo甚至話,而家佢幫Google嘅朋友揾新工嘅時間,仲多過用任何Google產品。

深層原因在於Google組織結構下已經冇能力「在乎」:頂級工程師、TPU集羣、前沿研究,但資源從未穩定匯聚。人未做完事就離開,項目未上線就內鬥,收購團隊入嚟,原有開發者關係清零。呢啲問題令產品方向錯曬,最終用戶同開發者都成為犧牲品。

  • Gemini 3.5 Flash定價暴漲:輸入端每百萬token由$0.10升至$1.5(15倍),輸出端由$0.40升至$9(22.5倍),加上推理模型思維鏈token成本,實際使用成本比Gemini 3.1 Pro高近一倍,係測評池第四貴模型。
  • 跑分雖高但實測失敗Terminal-Bench得分僅次於GPT-5.5,但Theo用遊戲項目「Fish Slap」重構任務,Gemini 3.5 Flash係唯一無法完成嘅模型,生成嘅代碼不能運行,第二版更差,而GPT-5.5一次完成並做到3D風格轉換。
  • 開源項目被犧牲Google關閉擁有10萬Star、合併6000 PR嘅Gemini CLI,轉用閉源Go重寫嘅Antigravity CLI,實測bug多多(滾動錯亂、無法退出、無持久會話、UI殘影等),而且UI明顯抄襲OpenAI Codex。
  • 雲端服務災難Google I/O當日,每月花200萬美元嘅大客戶RailwayGoogle Cloud無預警封賬號導致全站宕機,類似事件並非首次(曾意外刪除900億美元養老基金帳户)。
  • 組織文化敗壞Theo點名三位開發者關係團隊成員(Dimitri, Jack, Gal)因為認真聽反饋而令佢保持沉默近一年,但呢啲人被Antigravity團隊取代後,影片終於出街;Google內部政治鬥爭、收購團隊反客為主、人才流失,令產品無法做好。
整理重點

價格悄悄漲咗二十倍

Gemini 3.5 Flash 嘅定價係輸入端每百萬 token 1.5 美元,輸出端 9 美元。Flash 系列輸出端賣到 9 美元,呢個數字本身就夠刺眼。Theo 用自己最熟悉嘅模型做咗橫向對比:

  • Gemini 2.0 Flash(已下架):輸入 $0.10,輸出 $0.40
  • Gemini 3 Flash:輸入 $0.50,輸出 $3.00
  • Gemini 3.5 Flash(最新):輸入 $1.50,輸出 $9.00

單純睇 token 單價,輸入端漲咗 15 倍,輸出端漲咗 22.5 倍。

但呢個只係表面數字。3.5 Flash 係推理模型,每次回答都會生成大量思維鏈 token。第三方測評機構 Artificial Analysis 嘅數據顯示,佢喺標準測評集裏面產出嘅 token 總量同上一代 Flash 接近,但要按三倍嘅單價結算。

實際算落,3.5 Flash 係目前測評池裏面第四貴嘅模型,真實使用成本比 Gemini 3.1 Pro 仲高將近一倍。

谷歌喺發佈頁上唔放價格,係有道理嘅。

整理重點

跑分係新高,但 Code 跑唔起

發佈會 PPT 上,3.5 FlashTerminal-Bench 得分僅次於 GPT-5.5,SWE-Bench 超過咗 Gemini 3.1 Pro,仲拿下 Finance Agent 同 MCP Toolathon 等多項「最優」標註。睇起嚟係谷歌迄今為止最強嘅 Flash 模型,代理任務方向嘅旗艦。

Theo 用自己嘅遊戲項目「Fish Slap」做咗實測:畀模型完整嘅原始源碼,要佢重寫出一個更穩定、更易維護嘅版本。任務唔複雜,就係一次真實嘅代碼重構。

所有參測模型中,只有 Gemini 3.5 Flash 冇完成任務。

佢生成咗無法運行嘅代碼;Theo 要求修復後,第二版比第一版更糟,遊戲嘅核心機制一個冇實現,圖片透明度錯誤,畫面上仲莫名出現一圈光暈特效。同樣嘅任務交畀 GPT-5.5,唔單止一次完成,Theo 追加要求「改成 3D 風格」,佢都順利做到。

呢個同「跑分好高」並唔矛盾,反而恰好說明咗問題所在:谷歌嘅模型喺強化學習上仲未有真正突破。

整理重點

砍掉十萬 Star 嘅開源項目,換嚟 bug 爆棚嘅閉源 CLI

Google I/O 同台宣佈Gemini CLI 正式併入全新嘅 Antigravity CLI,唔再單獨維護。Gemini CLI 係一個開源項目,GitHub 上積累咗超過 10 萬 Star,合併咗 6000 多個社區 PR。佢並唔完美,但佢喺持續迭代,社區關係亦一步步建立。

呢次「接替」佢嘅,係一個用 Go 重寫嘅閉源 Antigravity CLI

  • 向上滾動時,舊輸入內容被寫入當前輸入框而非正常翻頁
  • Ctrl+C 無法退出,必須手動輸入 /exit
  • 每次啟動都要重新登錄,無持久會話
  • 登錄郵件地址喺 CLI 內無法隱藏,全程暴露
  • 輸入框持續跳位,UI 殘影無法清除

更值得注意嘅細節Antigravity 應用嘅 UI 被廣泛認為同 OpenAICodex 應用高度相似。

官方演示視頻入面,演示者向 Antigravity 添加咗一個本地文件夾,嗰個文件夾嘅名就叫「Codex」,根本冇嚟得及換。背後原因係:谷歌花重金收購咗 Windsurf 嘅聯合創始團隊,引入主導 Antigravity 嘅開發。

整理重點

I/O 當日封大客,組織混亂係根本

就喺 Google I/O 當日,部署平台 Railway 全站宕機。原因唔係網絡攻擊,亦唔係 Railway 自身嘅故障,而係谷歌雲喺冇任何預警嘅情況下,封禁咗 Railway 嘅 Google Cloud 賬户。

Railway 每月喺谷歌雲上嘅支出超過 200 萬美元。

賬號被封後,Railway 所有對外嘅 Web 層同 CDN 立即離線,部分用戶一開始以為遭遇咗大規模攻擊。Theo 話佢聽過太多類似嘅故事,呢個並非個例。兩年前,谷歌雲曾「意外刪除」澳洲一家管理規模約 900 億美元嘅養老基金 UniSuper 嘅整個私有雲訂閲,連谷歌雲 CEO 都要親自下場道歉。

Theo 喺視頻入面點名咗三個人DimitriJack 同 Gal,佢哋係之前 Gemini 開發者關係團隊入面令佢保持耐心、冇公開批評嘅核心原因。呢三個人會主動 DM 佢,聽真實反饋,亦會確認佢講啱嘅地方。隨住 Antigravity 團隊嘅接管,呢三人嘅職能全部被替代。

視頻終於發咗出嚟,因為令佢選擇沉默嘅理由消失咗。

Theo 話,而家佢幫 Google 嘅朋友揾新工,花嘅時間比用任何 Google 產品都要多。佢口頭上話希望自己判斷錯,但心裏清楚並非如此。

Google I/O 2026

Google AI 已經落後咗

如果 Claude 係蘋果模型,咁 Gemini 就係 Android 模型。

內容整理自 Theo 頻道影片


Google I/O 2026 上面,Google 發佈咗 Gemini 3.5 Flash,附帶一張密密麻麻嘅跑分圖表,但成個過程都冇寫 API 價格。

同一日,知名開發者博主 Theo(T3 Chat 作者、YouTube 過百萬訂閲頻道主持人)發佈咗一條佢話「可能搞垮我職業生涯」嘅影片,將 Google 呢場發佈會入面刻意隱瞞嘅嘢,逐樣攞出嚟講清楚,呢件事喺開發者圈子入面好快傳開咗。

喺中文 AI 圈有一個笑話話:Gemini 已經變咗做美國版豆包。呢句說話唔係話豆包有幾差,而係話 Gemini 喺頂級模型嘅競爭入面,已經靜靜雞由第一梯隊跌咗落嚟。就好似有人開始將 Claude 比喻做蘋果,Gemini 就係嗰個跑分仲可以睇、但實際體驗越嚟越遠嘅 Android。Google 到底做咗啲乜,令用戶得出呢個結論?

價格靜悄悄加咗廿倍

Gemini 3.5 Flash 嘅定價係輸入端每百萬 token 1.5 美元,輸出端 9 美元。Flash 系列輸出端賣到 9 美元,呢個數字本身就夠曬刺眼。

Theo 用自己最熟嘅模型做咗橫向對比:

Gemini Flash 系列定價演變
模型
輸入 /1M
輸出 /1M
Gemini 2.0 Flash(下架)
$0.10
$0.40
Gemini 3 Flash
$0.50
$3.00
Gemini 3.5 Flash(最新)
$1.50
$9.00

淨睇 token 單價,輸入端加咗 15 倍,輸出端加咗 22.5 倍。但呢個只係表面數字。

3.5 Flash 係一個推理模型,每次回答都會產生大量思維鏈 token。第三方測評機構 Artificial Analysis 嘅數據顯示,佢喺標準測評集入面產生嘅 token 總量同上一代 Flash 差唔多,但要按三倍嘅單價結算。實際計落,3.5 Flash 係目前測評池入面第四貴嘅模型,真實使用成本比 Gemini 3.1 Pro 仲高差唔多一倍。Google 喺發佈頁唔標價格,係有原因嘅。

跑分創新高,但生成嘅 code 卻行唔到

發佈會 PPT 上面,3.5 Flash 嘅 Terminal-Bench 得分僅次於 GPT-5.5,SWE-Bench 超過咗 Gemini 3.1 Pro,仲拎咗 Finance Agent 同 MCP Toolathon 等多項「最優」標記。睇起嚟係 Google 史上最強嘅 Flash 模型,代理任務嘅旗艦。

Theo 用自己嘅遊戲項目「Fish Slap」做咗實測:俾曬完整嘅原始源碼佢,叫佢 rewrite 一個更穩定、更容易維護嘅版本。任務唔複雜,就係一次真實嘅 code 重構。佢用呢個任務試咗市面上多個主流模型,結果:

所有參測模型入面,得 Gemini 3.5 Flash 完成唔到任務。佢產生咗行唔到嘅 code;Theo 叫佢修復之後,第二版仲衰過第一版,遊戲嘅核心機制一個都冇實現,圖片透明度錯曬,畫面仲莫名其妙出現一圈光暈效果。

同樣嘅任務交俾 GPT-5.5,唔單止一次搞掂,Theo 再加要求「改成 3D 風格」,佢都順利做到。

呢個同「跑分好高」並冇矛盾,反而正好說明咗問題所在:Google 嘅模型喺強化學習上仲未真正突破。佢唔識得驗證自己嘅輸出,唔會喺偏離方向時自我糾正,只會不斷燒 token,產生一條睇起嚟好長嘅推理鏈,但冇任何實質進展。跑分測嘅係某種特定能力嘅切片,實際工程任務暴露嘅係另一件事。

「呢個對一個號稱最先進嘅模型嚟講,係真係好尷尬。佢用咗好多時間,產生咗好多 token,交出嚟嘅嘢仲衰過乜都唔做。」

砍咗十萬 Star 嘅開源項目,換嚟嘅係一堆 bug 嘅閉源 CLI

Google I/O 同一日宣佈:Gemini CLI 正式併入全新嘅 Antigravity CLI,唔再單獨維護。

Gemini CLI 係一個開源項目,GitHub 上累積咗超過10 萬 Star,合併咗 6000 幾個社區 PR,國內外唔少團隊用佢作為 AI 編碼工具鏈嘅參考基準。佢並唔完美,但佢持續喺度迭代,社區關係亦一步步建立緊。

今次「接替」佢嘅,係一個用 Go 重寫嘅閉源Antigravity CLI。發佈當日,Theo 做咗實測,記錄到嘅 bug 包括:

  • 向上 scroll 時,舊輸入內容被寫入當前輸入框而唔係正常翻頁
  • Ctrl+C
    無法退出,要手動輸入/exit
  • 每次開都要重新登入,冇持久會話
  • 登入電郵地址喺 CLI 入面冇得隱藏,成個暴露曬
  • 輸入框成日跳位,UI 殘影清除唔到

更加值得留意嘅細節:Antigravity 應用嘅 UI 被廣泛認為同 OpenAI 嘅 Codex 應用極度相似。官方 demo 影片入面,演示者向 Antigravity 加咗一個本地文件夾,嗰個文件夾名就叫「Codex」,根本冇嚟得切改。

背後嘅原因係:Google 用重金收購咗 Windsurf 嘅聯合創始團隊,引入主導 Antigravity 嘅開發。呢個做法直接導致原本負責 Gemini CLI 嘅內部團隊成個被邊緣化,開源策略宣告終止,多年累積嘅社區信任亦隨之清零。

喺發佈會當日,搞到個月花 200 萬美金嘅大客戶成個冧咗

就喺 Google I/O 當日,部署平台 Railway 全站宕機。原因唔係網絡攻擊,亦唔係 Railway 自己出錯,而係 Google Cloud 喺冇任何預警嘅情況下,封咗 Railway 嘅 Google Cloud 帳户。

Railway 每個月喺 Google Cloud 嘅支出超過 200 萬美金。帳號被封之後,Railway 所有對外嘅 Web 層同 CDN 即刻離線,部分用戶一開始以為俾大規模攻擊,因為個故障嚴重得唔尋常。

Theo 話佢聽過太多類似嘅故事,呢個唔係個別事件。兩年前,Google Cloud 曾經「意外刪除」澳洲一間管理規模大約 900 億美金嘅退休基金 UniSuper 嘅成個私有雲訂閲,搞到 Google Cloud CEO 都要親自出嚟道歉。嗰次好彩對方喺另一間雲服務商有備份,否則就係災難性嘅數據損失。

「Azure 有時慢、有時古怪,但只要你投訴夠多次,佢哋會做啲嘢。佢哋肯定唔會喺你每個月俾佢哋兩百萬美金嘅情況下封你帳號。AWS 依然穩陣,佢排第一係有原因嘅。Google Cloud 係個笑話。」

唔係 Google 唔想做得好,而係方向錯咗

Theo 喺影片入面講得好清楚:Google 唔係一間「唔在乎」嘅公司,更準確嚟講,佢喺而家嘅組織結構下,已經冇能力去「在乎」了。

Google 擁有一切:頂級工程師、獨有嘅 TPU 集羣、最前沿嘅 AI 研究、龐大嘅雲端基建。但呢啲資源從來冇機會喺一個穩定嘅框架下匯聚,因為:

  • 人未做完嘢就走咗
  • 項目未上線就俾內部政治鬥走咗
  • 外部收購團隊入嚟,原本嘅開發者關係直接清零

佢喺影片入面點名咗三個人:Dimitri、Jack 同 Gal,佢哋係之前 Gemini 開發者關係團隊入面令佢保持耐性、冇公開批評嘅核心原因。呢三個人會主動 DM 佢,聽真實 feedback,亦會喺佢講啱嘅地方 confirm,係真正在乎產品嘅人。正係因為佢哋,先令呢條影片推遲咗差唔多一年先出。

隨着 Antigravity 團隊嘅接管,呢三個人嘅職能全部被取代。影片出咗,因為令佢選擇沉默嘅理由消失咗。

點解 Gemini 俾人笑係「美國版豆包」

呢個笑話嘅意思唔係話豆包好差,而係描述一種相對位置:如果頂尖開發者要將模型由好到差排序,咁 Gemini 大概同豆包同一級。

如果話 Claude 係呢一波 AI 嘅蘋果,咁 Gemini 正喺度扮演 Android 嘅角色:市佔率高、跑分唔錯、生態龐大,但喺精挑細選嘅專業用戶眼裏,整體體驗同可靠性就係爭咗一截,而且差距似乎仲喺度擴大。豆包係呢個比喻喺中文語境嘅映射,兩者都代表「夠用,但唔係優先選擇」。

一間公司喺 AI 上落後嘅方式,好少係突然宣佈放棄。更常見嘅路徑係:跑分仲繼續做,發佈會仲繼續開,價格靜靜雞加上去,開發者工具一件一件爛咗,好嘅團隊俾內部政治換走,真正在乎產品嘅人選擇離開,而外界感受到嘅只係一種越來越模糊嘅「好似爭啲嘢」嘅感覺。

Theo 話,而家佢幫 Google 嘅朋友揾新工,花嘅時間仲多過用 Google 任何產品。佢口話希望自己判斷錯,但心裡清楚唔係咁。


內容整理自 Theo 頻道影片完整字幕,數據來源包括 Google I/O 2026 官方發佈材料及 Artificial Analysis 測評報告,價格及性能數據以發佈時點為準。

Google I/O 2026

谷歌 AI 已經掉隊了

如果 Claude 是蘋果模型,那麼 Gemini 就是安卓模型。

內容整理自 Theo 頻道視頻


Google I/O 2026 上,谷歌發佈了 Gemini 3.5 Flash,配套一張密密麻麻的跑分圖表,卻全程沒有寫 API 價格。

就在同一天,知名開發者博主 Theo(T3 Chat 作者、YouTube 百萬訂閲頻道主理人)發佈了一期他自稱「可能毀掉我職業生涯」的視頻,把谷歌這場發佈會裏被刻意遮掩的東西,一件一件翻出來講清楚了,這場風波在開發者圈子裏迅速擴散。

在中文 AI 圈有一個梗是:Gemini 已經成為美國版豆包。這話並不是說豆包多差,而是說 Gemini 在頂級模型的競爭序列裏,已經悄悄從第一梯隊滑落了。就像有人開始把 Claude 比作蘋果,Gemini 就是那個跑分還能看、實際體驗越差越遠的安卓。谷歌到底做了什麼,讓用戶們得出這個結論?

價格悄悄漲了二十倍

Gemini 3.5 Flash 的定價是輸入端每百萬 token 1.5 美元,輸出端 9 美元。Flash 系列輸出端賣到 9 美元,這個數字本身就足夠刺眼了。

Theo 用自己最熟悉的模型做了橫向對比:

Gemini Flash 系列定價演變
模型
輸入 /1M
輸出 /1M
Gemini 2.0 Flash(下架)
$0.10
$0.40
Gemini 3 Flash
$0.50
$3.00
Gemini 3.5 Flash(最新)
$1.50
$9.00

單看 token 單價,輸入端漲了 15 倍,輸出端漲了 22.5 倍。但這還只是表面數字。

3.5 Flash 是一個推理模型,每次回答都會生成大量思維鏈 token。第三方測評機構 Artificial Analysis 的數據顯示,它在標準測評集裏產出的 token 總量與上一代 Flash 接近,但要按三倍的單價結算。實際算下來,3.5 Flash 是目前測評池裏第四貴的模型,真實使用成本比 Gemini 3.1 Pro 還高將近一倍。谷歌在發佈頁上不放價格,是有道理的。

跑分是新高,生成的代碼卻跑不起來

發佈會 PPT 上,3.5 Flash 的 Terminal-Bench 得分僅次於 GPT-5.5,SWE-Bench 超過了 Gemini 3.1 Pro,還拿下了 Finance Agent 和 MCP Toolathon 等多項「最優」標註。看起來是谷歌迄今為止最強的 Flash 模型,代理任務方向的旗艦。

Theo 用自己的遊戲項目「Fish Slap」做了實測:給模型完整的原始源碼,讓它重寫出一個更穩定、更易維護的版本。任務不復雜,就是一次真實的代碼重構。他用這個任務跑了市面上多個主流模型,結果:

所有參測模型中,只有 Gemini 3.5 Flash 沒有完成任務。它生成了無法運行的代碼;Theo 要求修復後,第二版比第一版更糟,遊戲的核心機制一個沒實現,圖片透明度錯誤,畫面上還莫名出現一圈光暈特效。

同樣的任務交給 GPT-5.5,不僅一次完成,Theo 追加要求「改成 3D 風格」,它也順利做到了。

這與「跑分很高」並不矛盾,反而恰好說明了問題所在:谷歌的模型在強化學習上還沒有真正突破。它不具備驗證自己輸出的能力,不會在偏離方向時自我糾正,只會持續燃燒 token,生成一條看起來很長的推理鏈,卻沒有任何實質性進展。跑分測的是某種特定的能力切片,實際工程任務暴露的是另一件事。

「這對一個號稱最先進的模型來說,是真實意義上的尷尬。它花了很多時間,生成了很多 token,交出來的東西比什麼都不做還糟糕。」

砍掉十萬 Star 的開源項目,換來的是一堆 bug 的閉源 CLI

Google I/O 同台宣佈:Gemini CLI 正式併入全新的 Antigravity CLI,不再單獨維護。

Gemini CLI 是一個開源項目,GitHub 上積累了超過10 萬 Star,合併了 6000 多個社區 PR,國內外不少團隊用它作為 AI 編碼工具鏈的參考基準。它並不完美,但它在持續迭代,社區關係也在一步步建立。

這次「接替」它的,是一個用 Go 重寫的閉源Antigravity CLI。發佈當天,Theo 進行了實測,記錄到的 bug 包括:

  • 向上滾動時,舊輸入內容被寫入當前輸入框而非正常翻頁
  • Ctrl+C
    無法退出,必須手動輸入/exit
  • 每次啓動都要重新登錄,無持久會話
  • 登錄郵件地址在 CLI 內無法隱藏,全程暴露
  • 輸入框持續跳位,UI 殘影無法清除

更值得注意的細節:Antigravity 應用的 UI 被廣泛認為與 OpenAI 的 Codex 應用高度相似。官方演示視頻裏,演示者向 Antigravity 添加了一個本地文件夾,那個文件夾的名字就叫「Codex」,根本沒來得及換。

背後的原因是:谷歌花重金收購了 Windsurf 的聯合創始團隊,引入主導 Antigravity 的開發。此舉的直接結果是,原本負責 Gemini CLI 的內部團隊被整體邊緣化,開源策略宣告終止,多年積累的社區信任也隨之清零。

在發佈會當天,把每月花 200 萬美元的大客戶整崩了

就在 Google I/O 當天,部署平台 Railway 全站宕機。原因不是網絡攻擊,也不是 Railway 自身的故障,而是谷歌雲在沒有任何預警的情況下,封禁了 Railway 的 Google Cloud 賬户。

Railway 每月在谷歌雲上的支出超過 200 萬美元。賬號被封后,Railway 所有對外的 Web 層和 CDN 立即離線,部分用戶一開始以為遭遇了大規模攻擊,因為故障的嚴重程度太不尋常了。

Theo 說他聽過太多類似的故事了,這並非個例。兩年前,谷歌雲曾「意外刪除」澳大利亞一家管理規模約 900 億美元的養老基金 UniSuper 的整個私有云訂閲,連谷歌雲 CEO 都不得不親自下場道歉。那次幸好對方在另一家雲服務商存有備份,否則將是災難性的數據損失。

「Azure 有時候慢、有時候怪,但只要你投訴夠多次,他們會做點什麼。他們肯定不會在你每個月給他們花兩百萬美元的情況下把你賬號封掉。AWS 依然穩健,它排第一是有原因的。谷歌雲是個笑話。」

不是谷歌不想做好,而是方向錯了

Theo 在視頻裏把話說得很清楚:谷歌並非一家「不在乎」的公司,更準確的說法是,它在當前的組織結構下,已經沒有能力「在乎」了。

谷歌擁有一切:頂級工程師、獨有的 TPU 集羣、最前沿的 AI 研究、龐大的雲端基礎設施。但這些資源從來沒有機會在一個穩定的框架下匯聚,因為:

  • 人還沒做完事就離開了
  • 項目還沒上線就被內部政治鬥掉了
  • 外部收購團隊進來,原有的開發者關係直接清零

他在視頻裏點名了三個人:Dimitri、Jack 和 Gal,他們是之前 Gemini 開發者關係團隊裏讓他保持耐心、沒有公開批評的核心原因。這三個人會主動 DM 他,聽真實反饋,也會在他說對了的地方給予確認,是真正在乎產品的人。正是他們,讓這期視頻推遲了將近一年才發出來。

隨着 Antigravity 團隊的接管,這三人的職能全部被替代。視頻發出來了,因為那個讓他選擇沉默的理由消失了。

為什麼 Gemini 被調侃為「美國版豆包」

這個調侃的意思不是說豆包很差,而是在描述一種相對位置:如果頂尖開發者要給模型從夯到拉排序,那麼 Gemini 差不多跟豆包一桌。

如果說 Claude 是這波 AI 裏的蘋果,那 Gemini 正在扮演安卓的角色:市佔率廣、跑分不錯、生態龐大,但在精挑細選的專業用戶眼裏,整體體驗和可靠性就是差了那麼一截,而且差距似乎還在擴大。豆包是這個類比在中文語境裏的映射,兩者都代表「夠用,但不是優先選項」。

一家公司在 AI 上掉隊的方式,很少是突然宣佈放棄。更常見的路徑是:跑分依然在做,發佈會依然在開,價格悄悄往上漲,開發者工具一件一件爛掉,好的團隊被內部政治換掉,真正在乎產品的人選擇離開,而外界感知到的只是一種越來越模糊的「好像差點意思」。

Theo 說,如今他幫谷歌的朋友找新工作,花的時間比用谷歌任何產品都要多。他嘴上說希望自己判斷錯了,可心裏清楚並非如此。


內容整理自 Theo 頻道視頻完整字幕,數據來源包括 Google I/O 2026 官方發佈材料及 Artificial Analysis 測評報告,價格及性能數據以發佈時點為準。