你的電腦終端成了新戰場，五家 AI 公司都想住進來

作者：O神經網絡

日期：2026年5月24日下午9:45

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

五家AI公司齊搶終端入口，開發者進入多工具編碼時代

整理版摘要

作者係一個成日寫code嘅開發者，以前用Copilot補code，而家用Claude Code成個倉庫自動改，體驗好到返唔到轉頭。佢睇到Hassan盤點五家AI做終端編碼Agent嘅帖，同埋OpenAI聯合創始人Greg Brockman話Codex開源被低估，於是整理咗呢盤競爭局勢。

呢篇文章指出，AI寫code已經從逐行補全進化到任務委派，而終端係開發者嘅原生環境——code、Git、Docker、CI/CD全部喺嗰度，所以AI編碼Agent一定要佔領終端先至真正有用。五家公司——Anthropic、OpenAI、月之暗面、Google、DeepSeek——各自用唔同策略搶呢個入口：Anthropic用最強模型拉體驗，OpenAI開源引社區，Kimi平價開源，Google整合生態，DeepSeek主打便宜好用。

整體結論係：競爭越激烈，工具越好用越平，開發者已經唔再爭論AI能唔能夠寫code，而係糾結用邊個AI寫。終局唔會係一個工具贏，而係底層能力趨同，工程體驗成為關鍵差異。

AI編碼從逐行補全進化到任務委派，終端成為AI觸達開發者工作流嘅唯一合法入口。
五家公司打法各異：Anthropic用最強模型（Opus 4.7），OpenAI開源Codex，Kimi平價開源（TypeScript+低價），Google整合生態，DeepSeek主打便宜好用。
成本差異巨大：Claude Opus每次任務1.1美元，GPT-5.4要16美元，Kimi K2.6只需0.3美元，DeepSeek Flash僅0.01美元。
開發者已經開始同時用多個AI工具（如AionUI管理20幾個Agent），按任務切換，冇人一家通吃。
建議根據任務成本選擇模型：日常任務用平價模型（如Kimi、DeepSeek），複雜任務用頂級模型（Claude、GPT）。

值得記低

工具

AionUI

一個界面同時管理20幾個AI Agent，支援Claude Code、Codex、Hermes Agent等，自動識別，提供WebUI、Telegram、飛書介面。

整理重點

終端點解突然咁值錢

作者分享自己寫code嘅明顯變化：以前打開編輯器先諗功能點拆，而家打開終端先諗prompt點寫。唔係佢變咗，係工具變咗。Claude Code已經可以自己讀曬成個倉庫，改文件、跑測試、自己修報錯，作者全程只要睇輸出，喺關鍵節點話「繼續」或者「回退」就得。呢種體驗一旦習慣就返唔到轉頭。

作者睇到Hassan嘅帖，盤點五家AI公司同時喺終端編碼發力：DeepSeek招人做coding CLI、Kimi已經推出Kimi Code、OpenAI有Codex、Anthropic有Claude Code、Google有Antigravity CLI。同一日，OpenAI聯合創始人Brockman特別出嚟話Codex開源被低估，佢在乎嘅唔係開源本身，而係終端呢個入口。

整理重點

五種打法，同一個目標

Claude Code目前跑得最快，Auto Mode全面開放，背後係Opus 4.7模型，同GPT 5.4並列第一（97分）。策略係用最強模型拉高體驗天花板，令你覺得「AI編碼就係咁」。
Codex係OpenAI嘅回應，Brockman強調開源，令社區可以自己集成、改、接唔同模型後端。最近API額度頻繁重置，擺明燒錢補貼用戶習慣。
Kimi Code係月之暗面新推出，TypeScript寫嘅，開源。K2.6模型編碼87分，排第五，但價格只係GPT嘅三十分之一，對個人開發者幾乎冇決策門檻。
Antigravity CLI已經公開，係Gemini CLI嘅繼任者，支援多文件編輯、多步推理、子Agent並行，仲可以接Claude同開源模型做後端。Google嘅牌係多模態能力同龐大生態整合。
DeepSeek最有意思，據傳已經招人做終端編碼工具。DeepSeek V4 Pro有89分，成本每次約3美元，V4 Flash成本一分錢，定位係「平靚正高性能選擇」。

呢五間公司嘅策略各有側重，但目標一致：佔領終端，佔據開發者每日8小時嘅工作時間。正如作者所講，誰佔領終端，誰就佔據開發者嘅工作時間。

整理重點

數據比感覺誠實

獨立開發者akitaonrails做咗實測，用相同prompt叫多個模型自主構建Rails應用（code + Docker + CI）。結果：Claude Opus 4.7同GPT 5.4並列第一，97分，但成本差15倍（Opus 1.1美元，GPT 5.4要16美元）。

其他模型：Kimi K2.6得87分，成本0.3美元；DeepSeek V4 Pro 89分，3.14美元；DeepSeek V4 Flash 78分，成本0.01美元。換句話講，Claude Opus做一次嘅錢，DeepSeek Flash可以做110次。

整理重點

終局：唔會一個工具贏

作者提到一個有趣現象：有開發者整咗AionUI（2.6萬星），同一界面管理20幾個AI Agent，包括Claude Code、Codex、Hermes Agent等，裝完自動識別，支援WebUI、Telegram、飛書。呢說明開發者已經同時用多個AI編碼工具，冇人一家通吃，大家各有所長，按任務切換。

對開發者嚟講係好事：競爭越激烈，工具越好用，價格越平。一年前你仲喺度爭論AI能唔能夠寫code，而家已經糾結用邊個AI寫code——呢個轉變本身就說明咗好多。

最近寫代碼有條好明顯嘅變化。以前打開編輯器會先諗功能點拆，而家打開終端會先諗 prompt 點寫。

唔係因為我變咗，係工具變咗。

半年前我仲喺 ChatGPT 度複製代碼片段，貼落去項目入面除錯。而家 Claude Code 已經可以自己讀我成個倉庫，自己改檔案，自己行測試，遇到報錯自己修。我全程只需睇住輸出，喺關鍵節點講句「繼續」或者「唔啱，回退一下」。

呢種體驗一習慣咗就返唔到轉頭。

噚日刷 X 嘅時候留意到一件事。有個叫 Hassan 嘅開發者出咗個 post，將最近各家做嘅終端編碼 Agent 盤點咗一次：DeepSeek 畀人爆料話正在請人做 coding CLI，Kimi 已經將 Kimi Code 整咗出嚟，OpenAI 有 Codex，Anthropic 有 Claude Code，Google 嘅 Antigravity CLI 已經公開咗。

五間 AI 實驗室，同一時間喺同一個方向發力。

同一日，OpenAI 嘅聯合創辦人 Greg Brockman 出咗個 tweet，「under appreciated that codex is open source」。Brockman 係 OpenAI 嘅聯合創辦人兼總裁，佢專登出嚟話 Codex 開源呢件事被低估咗，唔係隨口講講。

佢在意嘅唔係開源本身，係終端呢個入口。

終端點解突然間值錢

AI 寫代碼呢件事，經歷咗一條好清晰嘅升級路線。

最早是 Copilot 時代，AI 喺你嘅編輯器入面補齊代碼，你寫一行佢估一行，似高級自動完成。效率有提升，但寫代碼嘅依然係人，AI 只係幫手。

然後到 Agent 時代。你唔再一段段咁寫代碼，而係將需求掉畀 AI，等佢自己規劃、自己實現、自己驗證。呢個過程中，你同 AI 嘅互動由「逐行合作」變成任務委派。

而呢個委派發生嘅地方，就係你個黑掹掹嘅終端視窗。

終端係開發者嘅原生環境。你嘅代碼喺呢度，你嘅 Git 喺呢度，你嘅建置同部署 script 喺呢度，你嘅 Docker 和 CI/CD 全部都喺呢度。AI 編碼 Agent 要真正有用，就必須可以直接操作你嘅項目檔案同開發環境。瀏覽器做唔到，IDE 插件做得唔好，只有終端得。

所以每間 AI 公司都做緊 CLI。唔係因為 CLI 技術門檻高，係因為終端係 AI 接觸開發者工作流程嘅唯一合法入口。邊個佔領咗終端，邊個就霸佔咗開發者每日 8 個鐘嘅工作時間。

五種打法，同一目標

Claude Code 目前跑得最快。最近 Auto Mode 全面開放咗，Shift+Tab 一按掣，Claude 自己讀項目、改代碼、行指令、處理報錯，全程唔需要你撳回車確認。背後嘅模型係 Anthropic 嘅 Opus 4.7，喺主流編碼基準測試同 GPT 5.4 並列第一，97 分。Claude Code 嘅策略好清楚，用最強嘅模型能力拉高體驗天花板，令你覺得「AI 編碼就應該係咁樣」。

Codex 係 OpenAI 嘅回應。Brockman 不斷強調佢開源，呢步棋行得聰明。開源意味住社羣可以自己整合、自己改、自己駁唔同嘅模型後端，甚至可以用 DeepSeek 或者 Kimi 嘅模型。Codex 最近動作頻密，API 配額經常重置，有人喺 X 上面笑「奧特曼大善人」，側面反映 OpenAI 在燒錢補貼用戶習慣。

Kimi Code 係呢個禮拜先冒出嚟嘅新對手。月之暗面做嘅，TypeScript 寫嘅，係基於 pi-tui 嚟整，直接開源。技術棧揀 TypeScript 而唔係 Python 或 Rust，反映佢哋在意開發者社羣嘅接受程度。Kimi K2.6 模型喺編碼基準測試攞咗 87 分，排喺 GPT 5.5 後面，但價錢只係佢嘅三十分之一。對個人開發者嚟講，呢個定價幾乎唔使猶豫。

Google 嘅 Antigravity CLI 已經公開咗。佢係 Gemini CLI 嘅接班人，基於 Gemini 模型家族，支援多檔案編輯、多步推理、子 Agent 並行工作，仲可以駁 Claude 同開源模型做後端。Google 嘅牌係 Gemini 嘅多模態能力同龐大嘅開發者生態。如果 Antigravity CLI 可以深度接入 Google Cloud、Android Studio、Firebase 呢套工具鏈，形成由編碼到部署嘅閉環，呢種整合能力係其他家好難複製。

DeepSeek 最得意。根據開發者社羣嘅消息，DeepSeek 已經在請人做終端編碼工具。考慮到 DeepSeek V4 Pro 已經可以跑到 89 分（透過 DeepClaude 方式），一旦有咗自己嘅 CLI 工具，定位好大機會係「平靚正嘅高效能選擇」。而家 DeepSeek V4 Flash 每次任務成本先一分錢，V4 Pro 都只係大約 3 美元。對預算敏感嘅團隊嚟講，呢個價錢幾乎冇決策門檻。

數據比感覺老實

有位獨立開發者 akitaonrails 做咗一組實測。佢叫多個主流模型用相同嘅 prompt，自主建立一個 Rails 應用，由代碼到 Docker 到 CI，完整嘅交付流程。

結果幾有趣。

Claude Opus 4.7 和 GPT 5.4 並列第一，97 分。但成本相差 15 倍，Opus 每次任務大約 1.1 美元，GPT 5.4 要 16 美元。

Kimi K2.6 攞咗 87 分，排第五，成本只係 0.3 美元。DeepSeek V4 Pro 89 分，3.14 美元。DeepSeek V4 Flash 雖然得 78 分，但成本係 0.01 美元。

換算一下，Claude Opus 做一件事嘅錢，DeepSeek Flash 可以做 110 件。質量有冇差距？當然有。但對於大量日常編碼任務嚟講，呢個差距值唔值 110 倍嘅差價，每個開發者同每個團隊都要自己計呢條數。

仲有一個現象值得諗嚇。有人做咗個叫 AionUI 嘅工具，2.6 萬粒星，做嘅係喺同一個介面入面同時管理 20 幾個 AI Agent。Claude Code、Codex、Hermes Agent、OpenCode、Qwen Code、Kiro、Snow CLI，裝完自動識別，一套介面統一管理，支援 WebUI、Telegram、飛書。

開發者已經在同時用多個 AI 編碼工具。冇邊個可以一家通吃，大家各有長處，按任務切換。

終局會係點

呢場終端爭奪戰嘅結局，可能唔係某個工具贏。

就好似瀏覽器之爭嘅終局唔係某個瀏覽器一統天下，而係 Web 標準統一咗。編碼 Agent 嘅大概率終局都係咁，底層模型能力會趨同，差別會集中在工程體驗上。上下文管理嘅效率、工具調用嘅穩定性、多檔案編輯嘅可靠性、錯誤恢復嘅智能程度，呢啲「非模型」嘅能力會變成真正嘅競爭力。

但喺標準統一之前，我哋正在經歷一個混亂但有趣嘅過渡期。每間都喺度用自己的方法定義「AI 編碼助手應該係點樣」，每間都喺度賭自己嘅路線係啱嘅。對開發者嚟講呢件係好事，競爭越激烈，工具越好用，價錢越平。

一年前你仲喺度同人拗 AI 能唔能夠寫代碼。而家你已經喺度煩惱用邊個 AI 嚟寫代碼。

淨係呢個轉變本身，已經講明咗好多嘢。

Macaron 🧁 | 終端先係AI嘅真正入口

最近寫代碼有個很明顯的變化。以前打開編輯器先想功能怎麼拆，現在打開終端先想 prompt 怎麼寫。

不是因為我變了，是工具變了。

半年前我還在 ChatGPT 裏複製代碼片段，貼到項目裏調試。現在 Claude Code 已經能自己讀我的整個倉庫，自己改文件，自己跑測試，遇到報錯自己修。我全程只要盯着輸出，在關鍵節點說一句「繼續」或者「不對，回退一下」。

這種體驗一旦習慣就回不去了。

昨天刷 X 的時候注意到一件事。一個叫 Hassan 的開發者發了一條帖子，把最近各家做的終端編碼 Agent 盤了一遍：DeepSeek 被曝在招人做 coding CLI，Kimi 已經把 Kimi Code 做出來了，OpenAI 有 Codex，Anthropic 有 Claude Code，Google 的 Antigravity CLI 已經公開。

五個 AI 實驗室，同時在一個方向上發力。

同一天，OpenAI 的聯合創始人 Greg Brockman 發了一條推，「under appreciated that codex is open source」。Brockman 是 OpenAI 的聯合創始人兼總裁，他專門出來說 Codex 開源這件事被低估了，不是隨便發發。

他在乎的不是開源本身，是終端這個入口。

終端為什麼突然值錢了

AI 寫代碼這件事，經歷了一個很清晰的升級路徑。

最早是 Copilot 時代，AI 在你的編輯器裏補全代碼，你寫一行它猜一行，像高級自動補全。效率有提升，但寫代碼的還是人，AI 只是打輔助。

然後是 Agent 時代。你不再一段一段地寫代碼，而是把需求扔給 AI，讓它自己規劃、自己實現、自己驗證。這個過程中，你和 AI 的交互從「逐行協作」變成了任務委派。

而這個委派發生的地方，就是你那個黑乎乎的終端窗口。

終端是開發者的原生環境。你的代碼在這裏，你的 Git 在這裏，你的構建和部署腳本在這裏，你的 Docker 和 CI/CD 都在這裏。AI 編碼 Agent 要真正有用，就必須能直接操作你的項目文件和開發環境。瀏覽器做不到，IDE 插件做不好，只有終端能。

所以每家 AI 公司都在做 CLI。不是因為 CLI 技術門檻高，是因為終端是 AI 觸達開發者工作流的唯一合法入口。誰佔領了終端，誰就佔據了開發者每天 8 小時的工作時間。

五種打法，同一個目標

Claude Code 目前跑在最前面。最近 Auto Mode 全面開放了，Shift+Tab 一按，Claude 自己讀項目、改代碼、跑命令、處理報錯，全程不需要你按回車確認。背後的模型是 Anthropic 的 Opus 4.7，在主流編碼基準測試裏和 GPT 5.4 並列第一，97 分。Claude Code 的策略很清楚，用最強的模型能力拉高體驗天花板，讓你覺得「AI 編碼就該是這個樣子」。

Codex 是 OpenAI 的回應。Brockman 反覆強調它開源，這步棋走得聰明。開源意味着社區可以自己集成、自己改、自己接不同的模型後端，甚至可以跑 DeepSeek 或者 Kimi 的模型。Codex 最近動作頻繁，API 額度頻繁重置，有人在 X 上調侃「奧特曼大善人」，側面說明 OpenAI 在燒錢補貼用戶習慣。

Kimi Code 是這周剛冒出來的新選手。月之暗面做的，TypeScript 寫的，基於 pi-tui 構建，直接開源。技術棧選 TypeScript 而不是 Python 或 Rust，說明他們在意開發者社區的接受度。Kimi K2.6 模型在編碼基準測試裏拿了 87 分，排在 GPT 5.5 後面，但價格只有它的三十分之一。對個人開發者來說，這個定價幾乎不需要猶豫。

Google 的 Antigravity CLI 已經公開了。它是 Gemini CLI 的繼任者，基於 Gemini 模型家族，支持多文件編輯、多步推理、子 Agent 並行工作，還能接 Claude 和開源模型做後端。Google 的牌是 Gemini 的多模態能力和龐大的開發者生態。如果 Antigravity CLI 能深度接入 Google Cloud、Android Studio、Firebase 這一套工具鏈，形成從編碼到部署的閉環，這個整合力是其他家很難複製的。

DeepSeek 最有意思。據開發者社區的消息，DeepSeek 已經在招人做終端編碼工具了。考慮到 DeepSeek V4 Pro 已經能跑到 89 分（通過 DeepClaude 方式），一旦有了自己的 CLI 工具，定位很可能是「便宜好用的高性能選擇」。現在 DeepSeek V4 Flash 每次任務成本才一分錢，V4 Pro 也只要 3 美元左右。對預算敏感的團隊來說，這個價格幾乎沒有決策門檻。

數據比感覺誠實

一個獨立開發者 akitaonrails 跑了一組實測。他讓多個主流模型用相同的 prompt，自主構建一個 Rails 應用，從代碼到 Docker 到 CI，完整的交付流程。

結果挺有意思。

Claude Opus 4.7 和 GPT 5.4 並列第一，97 分。但成本差了 15 倍，Opus 每次任務大約 1.1 美元，GPT 5.4 要 16 美元。

Kimi K2.6 拿了 87 分，排名第五，成本只要 0.3 美元。DeepSeek V4 Pro 89 分，3.14 美元。DeepSeek V4 Flash 雖然只有 78 分，但成本是 0.01 美元。

換算一下，Claude Opus 幹一件事的錢，DeepSeek Flash 能幹 110 件。質量有差距嗎？當然有。但對於大量日常編碼任務來說，這個差距值不值 110 倍的差價，每個開發者和每個團隊都得自己算這筆賬。

還有一個現象值得琢磨。有人做了一個叫 AionUI 的工具，2.6 萬顆星，乾的事情是在同一個界面裏同時管理 20 多個 AI Agent。Claude Code、Codex、Hermes Agent、OpenCode、Qwen Code、Kiro、Snow CLI，裝完自動識別，一套界面統一管，支持 WebUI、Telegram、飛書。

開發者已經在同時用多個 AI 編碼工具了。沒有誰的一家通吃，大家各有所長，按任務切換。

終局會是什麼樣

這場終端爭奪戰的結局，可能不是某個工具贏。

就像瀏覽器之爭的終局不是某個瀏覽器一統天下，而是 Web 標準統一了。編碼 Agent 的大概率終局也是這樣，底層模型能力會趨同，差異會集中在工程體驗上。上下文管理的效率、工具調用的穩定性、多文件編輯的可靠性、錯誤恢復的智能程度，這些「非模型」的能力會變成真正的競爭力。

但在標準統一之前，我們正在經歷一個混亂但有趣的過渡期。每家都在用自己的方式定義「AI 編碼助手應該長什麼樣」，每家都在賭自己的路線是對的。對開發者來說這是好事，競爭越激烈，工具越好用，價格越便宜。

一年前你還在跟人爭論 AI 能不能寫代碼。現在你已經在糾結用哪個 AI 寫代碼了。

光是這個轉變本身，就已經說明了很多。

Macaron 🧁 | 終端才是AI的真正入口