Google I/O 2026 總覽:Gemini 3.5、Antigravity、Spark龍蝦全線登場

作者:字節筆記本
日期:2026年5月20日 上午8:09
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Google I/O 2026重點Antigravity 2.0多智能體架構成功12小時自建OS,Gemini 3.5 Flash以高速低成本驅動,但整體創新不足,產品分散。

整理版摘要

呢篇文章係對Google I/O 2026大會嘅總覽整理,作者作為科技觀察者,梳理咗大會嘅重點發佈。佢認為雖然睇落眼花繚亂,但核心只有三個:一個模型(Gemini 3.5 Flash)、一個智能體入口(Gemini Spark)、一套開發者工具(Antigravity 2.0同Android CLI)。

最震撼嘅示範係Antigravity 2.0平台用主代理-子代理架構,將「從零構建操作系統」呢個任務拆成93個子任務,每個子代理喺隔離嘅Git工作樹異步並行執行,最終12小時內成功寫出一個可運行嘅OS。呢個示範證明咗多智能體協作嘅威力,而背後嘅動力引擎係全新嘅Gemini 3.5 Flash,佢以289 tokens/s嘅恐怖速度同極低嘅token成本,成為Agent模型嘅理想基座。

另外,Google推出Android CLI 1.0,容許AI代理直接調用Android Studio嘅專業能力,包括UI預覽、靜態分析同自然語言用戶旅程測試。仲有Gemini Spark,一個可以24/7離線自主執行嘅龍蝦體,喺隔離虛擬沙盒入面完成長期任務,涉及高風險動作時會要求用戶確認。

  • Antigravity 2.0用主代理-子代理架構將OS拆成93個子任務,異步並行執行,12小時成功自建操作系統,證明多智能體協作嘅可行性。
  • Gemini 3.5 Flash以289 tokens/s吞吐速度同極低token成本,成為多智能體時代嘅理想模型基座,優先考慮速度與成本而非純粹智力。
  • Android CLI 1.0讓AI代理直接調用Android Studio嘅專業功能,包括render-compose-preview、analyze-file、自然語言用戶旅程測試,大幅提升開發效率。
  • Gemini Spark提供24/7離線自主執行能力,喺隔離虛擬沙盒中安全運行,高風險操作需用戶確認,為長期任務自動化帶來新可能。
  • Google技術有亮點但整體創新不足,產品分散且缺乏整合,被批評為「美國版豆包」,在AI領域掉隊,未能做出真正好用嘅應用。
整理重點

多智能體架構Antigravity 2.0:12小時自建OS

今次I/O最震撼嘅示範,係用Antigravity 2.0平台由零開始寫一個操作系統。以往寫OS核心極難,內存管理、中斷向量、線程調度等,任何偏差都會導致系統崩潰。

Antigravity 2.0採用「主代理-子代理」架構,主代理接收指令後先規劃再拆解,將任務極端解耦。

主代理將OS拆成93個相互關聯但邏輯獨立嘅子任務,動態生成93個子代理,每個分配到一個隔離嘅Git Worktrees,負責極侷限嘅代碼片段,避免上下文污染。

  1. 1 主代理接收「從零構建操作系統」指令,先規劃後拆解成93個子任務。
  2. 2 每個子代理喺隔離Git工作樹中獨立工作,只處理極侷限代碼片段,消除長文本幻覺。
  3. 3 子代理之間異步並行,通過定義API握手,非阻塞執行大幅提升效率。
整理重點

Gemini 3.5 Flash:Agent模型新基座

OS構建實驗嘅動力引擎係Gemini 3.5 Flash,而唔係更聰明嘅Pro模型。點解?因為多智能體協作下,速度同成本先係核心保障。

Gemini 3.5 Flash係天然嘅Agent模型基座,擁有289 tokens/s嘅恐怖吞吐速度。

智能體需要頻繁進行思考、修改、自我糾錯嘅內省閉環,慢模型會導致災難性延遲。3.5 Flash嘅高速讓93個代理並行迭代成為現實。

呢個項目消耗近26億個token,但整體API費用控制在1000美元以內,成本極低。

相比之下,用Pro模型成本可能係數十倍。要AI幹髒活累活,就必須畀佢又便宜、又跑得飛快嘅發動機。

整理重點

Android CLI與Skills:開發者工具整合

GoogleGemini CLI全面下線,統一收攏到Antigravity平台,包括桌面、CLI、SDK、IDE。CLI用Go語言原生重寫,帶嚟零啟動延遲同強大併發能力。

Android CLI 1.0穩定版正式推出,容許AI代理直接調用Android Studio十幾年嘅專業分析能力。

  • render-compose-preview:AI代理可喺冇模擬器情況下直接渲染Jetpack Compose UI預覽,進行像素級微調。
  • analyze-file與find-declaration:藉助靜態分析引擎,AI精準發現WarningError,快速定位類、方法或顏色常量源頭。
  • Journeys自然語言用戶旅程測試:用自然語言描述體驗,AI驅動測試環境自動點擊、滑動、輸入,完成回歸測試。

Google仲擴充咗大量Android Skills,包括智能眼鏡嘅Jetpack Compose Glimmer for XR、相機開發嘅CameraX遷移指南、自然語言轉Perfetto SQL查詢嘅性能調優工具。

整理重點

Gemini Spark:官方龍蝦登場

谷歌正式推出對標OpenClaw嘅龍蝦體Gemini Spark,可以24/7離線自主執行。例如指派長期任務後,佢會喺後台自動整理會議紀要、生成項目看板、草擬計劃郵件,你可以合埋電腦去瞓覺。

Spark喺雲端隔離臨時虛擬機入面執行,24小時不間斷閲讀Gmail、提取雲端硬盤數據、調用各種App。

安全方面,Spark收集信息、起草方案時完全自主,但涉及高風險行為(如發送郵件)時會被強制掛起,喺手機彈出確認卡片,必須用戶批准先繼續。

Gemini Spark本週向測試者推出,下週作為美國Google AI Ultra用戶嘅Beta版本推出。

整理重點

觀後反思:谷歌掉隊嘅隱憂

今次I/O雖然有亮眼技術,但作者認為驚豔程度遠不及2025年。Gemini 3之後谷歌喺AI領域掉隊太多,產品分散、模型降智、Antigravity Bug多、Gemini交互體驗差。

作為十幾年老粉,作者都希望谷歌能夠徹底支稜起來,成為御三家嘅頭牌。

 

Google I/O 2026 完咗。

睇起嚟眼花撩亂,其實總結落嚟就係:一個模型,一個智能體入口,一套開發者工具。

93 個 subagents,12 個鐘手動整操作系統

以前我哋成日講笑話,等 AI 勁咗,叫佢幫我寫個操作系統。

今年,Google 將呢個笑話變成真。

但係只要有做過底層開發嘅人都知,寫一個操作系統核心有幾難,記憶體管理、中斷向量、執行緒調度、檔案系統……呢啲根本唔係單模態 AI 生成幾千行 code 就可以搞掂,任何一點偏差,系統就會直接死機藍畫面。

今次 Google 做到咗!

用嘅就係今次強勢推出嘅 Antigravity 2.0 平台嘅「主代理 - 子代理」架構。

圖片
任務嘅極端解耦同微隔離

主代理(Main Agent)收到「由零開始建立操作系統」嘅最高指令之後,冇亂咁開始寫 code。先規劃,再拆解,將呢個龐然大物拆成 93 個互相關聯但邏輯獨立嘅子任務。

圖片

Antigravity 2.0 容許主代理喺背景動態、程序化噉生成 93 個子代理。每個子代理都分配咗一個完全隔離嘅 Git 工作樹(Git Worktrees),各司其職。

圖片

有負責「記憶體頁表映射」嘅子代理,亦有專門負責「檔案系統讀寫」嘅 code,子代理之間互相隔離。

為咗避免上下文污染,每個子代理只處理極其有限嘅 code 片段,佢哋嘅上下文窗口始終保持絕對乾淨,消除咗大模型喺長文本下容易邏輯前後矛盾嘅 hallucination 問題。

異步並行與非阻塞執行

喺傳統嘅 AI 輔助寫程式入面,開發係同步兼且阻塞嘅,一般都係 AI 寫完一段,你 compile 一下,出錯咗,你再 copy 俾 AI,AI debug 完再俾返你。

喺 Antigravity 2.0 入面,任務係完全非同步執行嘅。93 個子代理就好似一個編制完整、紀律嚴謹嘅分散式開發團隊,喺背景並發推進。

負責檔案系統嘅代理喺等磁碟 I/O 模擬器 compile 嗰陣,主執行緒同其他 92 個子代理完全唔會被阻塞。

各個代理之間透過定義嘅 API 接口進行協議握手,開發吞吐量呈指數級上升。

Gemini 3.5 Flash:唯快不破

今次 OS 建立實驗入面,做引擎嘅唔係未發佈嘅 Gemini 4,而係全新登場嘅 Gemini 3.5 Flash。

點解唔用更聰明嘅 Pro 模型,而要用 Flash?

因為喺多智能體協作嘅模式下,速度同成本,先係智能體高效運轉嘅關鍵保證。

圖片
Gemini 3.5 Flash 可以話就係天生嘅 Agent 模型基座。

1. 驚人嘅吞吐速度 289 tokens/s

智能體喺背景工作嗰陣,需要成日進行「思考、修改、自我糾錯、重試」嘅內省閉環。如果模型生成速度得每秒幾十個 token,93 個代理並行會引致災難性嘅延遲死機。

Gemini 3.5 Flash 急升 4 倍嘅吞吐速度,令到 12 個鐘內完成咁大量嘅互動迭代成為現實。

2. 平到笑嘅 Token 成本:

喺呢個系統建立項目入面,AI 用咗近 26 億個 token,但整體 API 費用控制喺 1000 美元以內。如果用上一代嘅 Pro 模型,呢個成本可能係幾十倍。

要 AI 做污糟嘢辛苦嘢,就一定要俾佢一個又平、跑得又快嘅引擎。

Gemini 3.5 Flash,就係為咗呢樣嘢而造嘅。

Antigravity 統一開發四件套

Google 宣佈會將原本嘅 Gemini CLI 全面下架並合併。

Google 放棄 Gemini CLI 開源項目之後,基於 Gemini CI 建立嘅 Qwen CLI,估計已經喊死咗喺廁所入面。作為決策人,佢大概完全唔瞭解 Google 殺咗幾多自家產品。

但係 Google 今次斷腕都有佢嘅理由,就係要將所有開發者力量統一集中到全新嘅 Google Antigravity,集中力量做大事,將包括 Desktop、CLI、SDK、IDE 統一用 Antigravity 作為平台同未來工具。

圖片

Google 放棄咗累贅嘅 Python script,直接用 Go 語言原生重寫咗 CLI。

圖片

採用 Go 重寫呢個 CLI 之後,獲益良多:

啟動延遲,Go 語言帶嚟嘅單檔案 binary 程式反應極其敏捷,叫即到,完美匹配程式員嘅 flow。

利用 Go 語言天生嘅並發優勢,就算喺 terminal 入面同時叫幾十個子代理去行測試、改 bug,本地 terminal 依然流暢無比。

Android CLI command line 寫應用

Android CLI 正式推出穩定版。

將來無論你用咩 AI Agent,都可以透過 Android CLI 1.0,直接調用 Android Studio 累積咗十幾年嘅專業開發同分析能力。

圖片

透過喺 terminal 輸入 android studio check 建立連線,你嘅 AI 代理就可以解鎖以下呢啲勁到爆嘅命令:

render-compose-preview:喺冇執行 emulator 嘅情況下,AI 代理可以直接 render 出 Jetpack Compose 嘅 UI 預覽,拎到圖片同 UI 層次。AI 可以喺完全 black box 嘅情況下,見到自己寫嘅界面好唔好睇,並進行即時 pixel level 微調!

analyze-file 同 find-declaration:藉助 Android Studio 強大嘅 static analysis 同 semantic analysis 引擎,AI 可以精準發現 code 入面嘅 Warning 同 Error,並喺一瞬間跨過整個龐大嘅 project library,定位到任何一個 class、method、甚至 Material 顏色常量嘅定義源頭,徹底告別盲人摸象式嘅亂估改寫。

Journeys natural language 用戶旅程測試:呢個簡直係測試人員嘅好消息。而家可以直接用 natural language 寫一段對核心體驗嘅描述,AI 代理就可以透過 Android CLI 驅動測試環境,好似真實用戶噉喺你嘅 App 入面點擊、滑動、輸入。所有 regression test、data collection,全部由 AI 自動做完。

唔單止咁,Google 仲一次過增加咗大量 Android Skills,包括針對 smart glasses 嘅 Jetpack Compose Glimmer for XR、camera development 嘅 CameraX migration guide、甚至係將 natural language 直接翻譯成 Perfetto SQL query 嘅 performance tuning 工具。

Gemini Spark,官方龍蝦嚟喇!

Google 官方正式推出針對 OpenClaw 嘅龍蝦體,Gemini Spark。

圖片

Gemini Spark 可以 24/7 offline 自主執行。例如俾 Gemini Spark 指派咗一個長期任務之後,佢會喺背景自主執行,例如:「幫我將上個禮拜同客戶開會嘅會議紀錄整理出嚟,結合來往電郵生成 project board,並起草一封下個禮拜計劃俾老細」,可以直接熄電腦去瞓覺,將手機熄機。

圖片

之後完全喺背景執行。Google 會喺 cloud 暫時生成一個完全隔離安全嘅臨時 virtual machine。Spark 會喺呢個 virtual sandbox 入面,24小時不停噉讀 Gmail、提取 cloud drive 數據、叫用各種 App 幫寫文件,第二日朝早起身,開手機就可以睇到任務完成通知。

安全權限方面,Spark 喺收集資訊、起草計劃、甚至寫 code 時完全自主,一旦涉及高風險行為,佢會被強制暫停,並喺手機上彈出確認卡,一定要由你㩒批准,佢先會執行下一步。

Gemini Spark 會喺呢個星期向測試人員推出,下個星期作為美國 Google AI Ultra 用戶嘅 Beta 版本推出。

一條香蕉都可以變做遊戲

喺今屆 I/O 大會嘅創意展示入面,Google 仲展示咗點樣用網頁版 Gemini 入面嘅 Gemini 3.5 Flash 現場整出小遊戲。

圖片

你只需要隨手畫一個簡單線條畫,或者影一張枱上嘅香蕉、咖啡杯相,然後對 Canvas 輸入:

「呢隻係外星『納米香蕉』。當玩家㩒佢嗰陣,佢會分裂並向四周彈跳。幫我用 HTML5 Canvas 寫一個遊戲,等我可以嘅猴子飛船接住佢哋。」

唔需要設置任何開發環境,Gemini 3.5 Flash 會喺幾秒鐘內用 frontend code 將遊戲 render 喺 browser 右側,而且你可以直接用 mouse 開始試玩。

圖片

覺得唔好玩,可以直接開口講:「俾香蕉加啲霓虹光效,每接住十個,背景音樂就變得更緊張啲。」 

AI 會喺背景進行無縫嘅 hot reload,遊戲畫面即時更新,直到你滿意為止。唔需要識複雜嘅 3D 建模,唔需要識物理碰撞 formula,你只需要提供創意,其餘嘅 AI 幫你喺幾秒鐘內完成。

不過講真話,今次 Google I/O 大會嘅驚艷程度遠不及 2025 年,Gemini 3 之後嘅 Google 喺 AI 領域落後太多,產品分散而且冇突出作品,模型變蠢到冇辦法用,Antigravity Bug 周圍飛,Gemini 互動體驗一言難盡,以至於俾人送咗個花名叫美國版豆包,做咩都得,但做咩都唔係最頂尖。

亦都唔係人手、財力同技術嘅問題,而係 Google 好多時候更像一間研究院,佢可以發明 AI 最底層最核心嘅技術,但好難整出俾普通人真正用到嘅應用。I/O 官方宣佈嘅呢啲似乎都只係重複人哋行過嘅舊路。不過作為十幾年嘅老 fans,都希望佢可以徹底振作,成為御三家嘅龍頭。

 

Google I/O 2026閉幕。

看起來眼花繚亂,其實總結下來就是:一個模型,一個智能體入口,一套開發者工具。

93 個 subagents,12 小時手搓操作系統

以往我們總開玩笑說,等 AI 厲害了,讓它給我寫個操作系統。

今年,Google 把這個玩笑變成了現實。

但只要是做過底層開發的人都知道,寫一個操作系統核心有多難,內存管理、中斷向量、線程調度、文件系統……這根本不是單模態 AI 吐出幾千行代碼就能搞定的,任何一點偏移,系統就會直接崩潰藍屏。

這次Google 做到了!

用的就是本次重磅推出Antigravity 2.0 平台的“主代理 - 子代理”架構。

圖片
任務的極端解耦與微隔離

主代理(Main Agent)在接收到“從零構建操作系統”的最高指令後,並沒有盲目開始寫代碼。先規劃,再拆解,將這個龐然大物拆成了 93 個相互關聯但邏輯獨立的子任務。

圖片

Antigravity 2.0 允許主代理在後台動態、程序化地生成 93 個子代理。每個子代理都被分派到一個完全隔離的 Git 工作樹(Git Worktrees)中,各司其職。

圖片

有負責“內存頁表映射”的子代理,也有專門負責“文件系統讀寫”的代碼,子代理與子代理之間互相隔離。

為了規避上下文污染,每個子代理只處理極其侷限的代碼片段,它們的上下文窗口始終保持絕對的乾淨,消除了大模型在長文本下容易邏輯前後矛盾的幻覺問題。

異步並行與非阻塞執行

在傳統的 AI 輔助編程中,開發是同步且阻塞的,一般都是AI 寫完一段,你編譯一下,報錯了,你再複製給 AI,AI 調試完再給你。

在 Antigravity 2.0 中,任務是完全異步執行的。93 個子代理如同一個編制完善、紀律嚴明的分佈式研發團隊,在後台併發推進。

負責文件系統的代理在等待磁盤 I/O 模擬器編譯時,主線程和其它 92 個子代理完全不被阻塞。

各個代理之間通過定義的 API 接口進行協議握手,開發吞吐量呈指數級上升。

Gemini 3.5 Flash:唯快不破

這次OS 構建實驗中,扮演動力引擎的並不是尚未發佈的 Gemini 4,而是全新亮相的 Gemini 3.5 Flash。

為什麼不用更聰明的 Pro 模型,而是用 Flash?

因為在多智能體協作的範式下,速度與成本,才是智能體高效運轉的核心保障。

圖片
Gemini 3.5 Flash可以說就是天然的Agent 模型基座

1.恐怖的吞吐速度289 tokens/s

智能體在後台工作時,需要頻繁地進行“思考、修改、自我糾錯、重試”的內省閉環。如果模型生成速度只有每秒幾十個 token,93 個代理並行會導致災難性的延遲崩潰。

Gemini 3.5 Flash 飆升 4 倍的吞吐速度,讓 12 小時內完成如此巨量的交互迭代成為現實。

2.白菜價的 Token 成本:

在這個系統構建項目裏,AI 消耗近26億個 token,但整體 API 費用控制在 1000 美元以內。如果用上一代的Pro模型,這個成本可能是數十倍。

要把 AI幹髒活累活,就必須給它一顆又便宜、跑得又飛快的發動機。

Gemini 3.5 Flash,就是為此而生的。

Antigravity統一開發四件套

Google 宣佈將原有的Gemini CLI全面下線併合並。

谷歌拋棄Gemini CLI開源項目之後,基於Gemini CI構建的Qwen CLI,估計已經哭暈在廁所裏面了,作為決策者,他大概是完全不瞭解谷歌殺死了多少自家的產品。

但是谷歌這次斷腕也有它的理由,那就是要將所有的開發者力量統一收攏到全新的 Google Antigravity ,集中力量幹大事,把包括桌面、CLI、SDK、IDE統一使用 Antigravity 作為平台和未來利用工具。

圖片

Google 放棄了笨重的 Python 腳本,直接用 Go 語言原生重寫了 CLI。

圖片

採用Go重寫這個CLI之後,收益良多:

啓動延遲,Go 語言帶來的單文件二進制程序響應極其敏捷,隨喚隨到,完美匹配程序員的心流。

藉助 Go 語言天生的併發優勢,哪怕在終端裏同時讓幾十個子代理去跑測試、改 Bug,本地終端依然流暢如絲。

Android CLI 命令行寫應用

Android CLI 正式推出穩定版。

以後無論你使用什麼 AI Agent,都可以通過 Android CLI 1.0,直接調用 Android Studio 積攢了十多年的專業開發與分析能力。

圖片

通過在終端裏輸入 android studio check 建立連接,你的 AI 代理就可以解鎖以下這些逆天命令:

render-compose-preview:在沒有運行模擬器的情況下,AI 代理可以直接渲染出 Jetpack Compose 的 UI 預覽,拿到圖片和 UI 層級。AI 可以在完全黑盒的情況下,看見它自己寫出的界面好不好看,並進行實時像素級微調!

analyze-file 與 find-declaration:藉助 Android Studio 強大的靜態分析和語義解析引擎,AI 可以精準發現代碼裏的 Warning 和 Error,並在一瞬間跨越整個龐大的項目庫,定位到任何一個類、方法、甚至 Material 顏色常量的定義源頭,徹底告別盲人摸象式的瞎猜改寫。

Journeys自然語言用戶旅程測試:這簡直是測試人員的福音。現在可以直接用自然語言寫一段對核心體驗的描述,AI 代理就可以通過 Android CLI 驅動測試環境,像真實用戶一樣在你的 App 裏點擊、滑動、輸入。所有的迴歸測試、數據收集,全部由 AI 自動跑完。

不僅如此,Google 還一口氣擴充了大量的 Android Skills,包括針對智能眼鏡的 Jetpack Compose Glimmer for XR、相機開發的 CameraX 遷移指南、甚至是將自然語言直接翻譯成 Perfetto SQL 查詢的性能調優工具。

Gemini Spark,官方龍蝦來了!

谷歌官方正式推出對標OpenClaw的龍蝦體,Gemini Spark。

圖片

Gemini Spark可以24/7 離線自主執行。比如給 Gemini Spark 指派了一個長週期的任務後自主後台運行比如:“幫我把上週和客戶開會的紀要整理出來,結合往來郵件生成項目看板,並草擬一封下週計劃發給老闆”,可以直接合上電腦去睡覺,把手機關機。

圖片

之後完全運行在後台。Google 會在雲端臨時生成一個完全隔離安全的臨時虛擬機。Spark 將在這個虛擬沙盒中,24小時不間斷地閲讀 Gmail、提取雲端硬盤數據、調用各種 App 幫寫文檔,第二天早上醒來,打開手機就可以看任務完成通知。

安全權限方面,Spark 在收集信息、起草方案、甚至寫代碼時完全自主,一旦涉及到高風險行為時,它會被強制掛起,並在手機上彈出確認卡片,必須由你點擊批准,它才會執行下一步。

Gemini Spark 將在本週向測試者推出,下週作為美國 Google AI Ultra 用戶的 Beta 版本推出。

一根香蕉也能變成遊戲

在本屆 I/O 大會的創意展示中,Google 還展示瞭如何用網頁版本Gemini中 Gemini 3.5 Flash 現場搓出小遊戲。

圖片

你只需要隨手畫一個簡筆畫,或者拍一張桌子上的香蕉、咖啡杯照片,然後對 Canvas輸入:

“這是一隻外星‘納米香蕉’。當玩家點擊它時,它會分裂並向四周彈跳。幫我用 HTML5 Canvas 寫一個遊戲,讓我可以用猴子飛船接住它們。”

不需要配置任何開發環境,Gemini 3.5 Flash 會在幾秒鐘內用前端代碼把遊戲渲染在瀏覽器右側,並且你可以直接用鼠標開始試玩。

圖片

覺得不好玩,可直接開口說:“給香蕉加點霓虹光效,每接住十個,背景音樂就變得更急促一些。” 

AI 會在後台進行無縫的熱重構,遊戲畫面實時更新,直到你滿意為止。不需要懂複雜的 3D 建模,不需要懂物理碰撞公式,你只需要提供創意,剩下的AI 幫你在幾秒鐘內補全。

不過說實話,本次谷歌I/O大會的驚豔程度遠不及2025年,Gemini3之後的谷歌在AI領域掉隊太多,產品分散且無亮眼之作,模型降智到沒法用,Antigravity Bug滿天飛,Gemini交互體驗一言難盡,以至於被人送外號美國版豆包,幹啥啥都行,幹啥啥都不頂尖。

倒也不是人力、財力以及技術的問題,而是谷歌在很多時候更像一家研究院,它可以發明AI最底層最核心的技術,卻很難做出讓普通人真正用起來的應用,I/O的官宣的這些似乎也只是在重複別人走過的老路。不過作為十幾年的老粉,也希望它能夠徹底支稜起來,成為御三家的頭牌。