過了個年,AI 圈變天了?但沒人告訴你為什麼
整理版優先睇
2026年初AI從問答工具進化成Agent勞動力,四層疊加令一個人可完成大廠團隊嘅工作
呢篇文章係作者睇完社交媒體上好多「變天」文章之後,覺得冇人講清楚具體變化係乜,所以決定由自己角度拆解。作者本身係一個用新Agent體系一個人一星期寫出完整產品嘅人,GitHub攞咗2000 Star,但同時發現好多人連2024年嘅AI都未用過。佢想幫讀者理解:AI唔再係你問佢答嘅工具,而係變成一個可以替你做嘢嘅勞動力。
作者將變化分成四層:第一層「大腦」——模型進步到有判斷力同品味,可以連續做幾個鐘專家級任務,仲參與造自己。第二層「手腳」——Agent跑喺你部電腦,透過MCP連接外部服務,Skills令專業知識即插即用,仲有記憶系統認得你係邊個。第三層「組織」——Multi-Agent體系令你同時擁有多個Agent團隊並行工作,24小時唔停,仲可以透過Git Worktree同時試多條路。第四層「進化」——GEP協議令Agent嘅經驗可以沉澱同傳承,越用越強。
呢四層疊埋一齊,效果係乘數效應:一個人加Agent可以做到以前一個大廠團隊一個月嘅嘢。但作者都提到未解決嘅問題,例如管Agent好難、安全信任、經濟身份等。現實衝擊方面,公司會變細、教育追唔上、中間層最受壓。最後佢建議立即用最好嘅模型,理解Agent體系,將價值從執行往上遷移到判斷同決策。
- AI從問答工具變成能獨立完成任務嘅勞動力,判斷力同品味大幅提升,可以連續工作幾個鐘。
- Agent跑喺本地電腦,透過MCP連接外部服務,Skills令專業知識即插即用,仲有記憶系統認得你。
- Multi-Agent體系允許多個Agent團隊並行工作,24小時唔停,速度快三倍,仲可以同時試多條路。
- Agent嘅經驗可以透過GEP協議沉澱同傳承,一個Agent成功嘅做法可以俾其他Agent繼承,越用越強。
- 現實衝擊:公司會變細、教育追唔上、中間層最受壓。個人應該即刻用最好嘅模型,理解Agent體系,將價值從執行遷移到判斷。
Claude Code
Anthropic 嘅編程Agent,跑喺你電腦終端,可以自己拆解任務、調用工具、檢查質量。
OpenClaw
macOS 本地AI代理工具,支持記憶體系(SOUL.md、USER.md)同操作圖形界面。
MCP(Model Context Protocol)
Anthropic 開源協議,令AI可以即插即用連接外部服務(GitHub、Figma等),類似USB-C。
Skills for Claude Code
預先定義嘅能力模塊,Agent按需加載,社區可以創建共享。
點解要拆呢件事?
作者睇完好多「變天」文章,發現大家淨係話變化發生咗,但冇人講清楚具體係乜。佢自己用新Agent體系,一個人一星期寫出一個完整產品,GitHub攞咗2000 Star,而呢個活以前要一個大廠團隊做一個月。但同時,好多人連2024年嘅AI都未用過,包括大廠入面年薪幾十萬嘅白領,佢哋做嘅報告、PPT、數據整理呢啲嘢,Agent做得又快又好。
管埋層睇得好清楚:同樣任務,會用Agent嘅人一日搞掂,唔會用嘅人一星期
作者唔想製造焦慮,而係想拆清楚到底發生咩變化,等你自己判斷要唔要跟進。
第一層:大腦變咗
2026年2月5日,Anthropic同OpenAI同日發佈新模型:Claude Opus 4.6同GPT-5.3 Codex。呢次發佈唔同以往,編程能力跳咗一個台階,仲開始有判斷力同品味。
METR追蹤AI能獨立完成專家級任務嘅時長,由一年前嘅10分鐘變到而家接近5個鐘,每4-7個月翻一倍
Opus 4.6有100萬token上下文窗口,可以一次過睇曬成個大型項目嘅代碼同文檔。更重要嘅係,GPT-5.3 Codex係第一個參與咗自身創建過程嘅模型——OpenAI用佢嘅早期版本嚟調試訓練、管理部署。Anthropic CEO Dario Amodei話AI而家寫緊Anthropic「大部分嘅代碼」,呢個反饋循環逐月加速。
更聰明嘅AI寫出更好嘅代碼,造出更聰明嘅AI,呢個循環已經轉起咗
第二層:手腳長出嚟
2025年嘅AI好聰明,但被困喺對話框入面。2026年呢個限制被打破咗。Agent而家跑喺你嘅本地電腦,以Claude Code為代表,你可以直接俾佢讀你嘅文件、代碼、設計稿,唔使上傳或複製。
上下文係你嘅,唔係廠商嘅
MCP協議令Agent可以即插即用連接外部服務,好似USB-C咁。Anthropic、OpenAI、Google三家喺2025年底聯合推呢個標準。Skills就係能力模塊,由社區創建共享,一個資深工程師封裝十年經驗嘅Skill,全世界嘅Agent都用得。
從CLAUDE.md到SOUL.md,Agent由「知道呢個項目點做」變成「知道你是邊個」
仲有一樣好重要:幾十年累積嘅命令行工具生態,好似ffmpeg、ImageMagick、curl、git,而家Agent可以直接調用,你唔使學任何參數。OpenClaw仲可以操作你嘅手機同電腦嘅圖形界面,解決冇API嘅軟件問題。
幾十年積累嘅專業工具生態,一夜之間對所有人開放
車可能會係第一個Agent嘅物理載體:電車有電、有路、有自動駕駛,加上Agent就可以自動買外賣、接孩子。多模態模型都可以通過API或Skills接入Agent體系,令Agent團隊有寫代碼、做設計、剪視頻嘅成員。
第三層:能組隊
之前你同時只能同一個Agent對話,管理帶寬係瓶頸。而家AI從「一個人做嘢」變成「一羣人協作」。SubAgent可以臨時創建子Agent做子任務,做完壓縮成摘要交返嚟,主Agent嘅上下文保持乾淨。
搜索嘅本質係壓縮,SubAgent就係幫主Agent做壓縮
Agent Teams更進一步:主Agent(Team Lead)可以創建多個Teammate,每個有自己嘅專長、工具集同上下文,並行工作互不幹擾。Anthropic安全團隊做過壓力測試:16個Opus 4.6實例組成嘅Agent Team,冇人類幹預,由零用Rust寫咗一個能編譯Linux內核嘅C語言編譯器,產生10萬行代碼。
Git Worktree配合Agent Teams,可以同時試多條路,時間係以前三分之一,探索可能性係三倍
Multi-Agent仲有主動工作能力:Agent可以設成值班模式,定期檢查代碼倉庫、線上服務,發現問題自己修,修唔到先通知你。你瞓覺佢都仲做緊嘢。
第四層:會進化
之前Skills係人寫嘅,寫完就固定,Agent踩過嘅坑另一隻Agent要再踩。EvoMap同GEP協議解決呢個問題:Agent成功嘅做法會被打包成「基因膠囊」,其他Agent可以直接繼承。
GEP借鑑生物學基因表達,Skills似員工手冊,GEP Gene似實際工作累積嘅經驗,會隨使用調整
有個真實案例:遊戲策劃用AI構建世界觀時設定咗強角色人設,結果生成嘅名詞天然避開命名衝突,呢個「命名隔離策略」被包裝成基因膠囊。後來一個後端工程師嘅Agent搜「點樣解決變量命名衝突」時匹配到呢個膠囊,一次就修好編譯問題。
四層疊埋:現實衝擊同你可以做啲乜
2025年你有一個聰明嘅對話夥伴;2026年初你有一個團隊
公司會變細:一個人加Agent可以做到以前一個團隊嘅嘢,成本十分之一,速度快五倍。教育追唔上:你花四年學嘅技能,畢業前可能已經俾Agent學識。中間層最難受:頂層有資源有判斷力,底層體力活暫時安全,中間嘅白領做嘅信息格式轉換最容易被取代。
內容生產成本急降,「做到」唔值錢,「知道做乜」先值錢
國家之間嘅牌會重新洗:有廉價能源就有廉價算力,發展中國家嘅廉價勞動力優勢會消失。個人方面,作者建議:一、用最好嘅模型(付費版),唔好用免費版判斷AI水平;二、理解Agent體系,唔好淨係用ChatGPT聊天;三、諗清楚自己嘅價值,從執行遷移到定義問題同判斷質量;四、唔好等,呢個領域幾個月變一次,等得越耐差距越大。
最近睇咗好多文章。都話我哋已經過咗奇點,Agent 時代嚟咗。
海外有位做咗六年 AI 創業嘅 Matt Shumer 寫咗篇長文叫《Something Big Is Happening》差唔多一億曝光。
佢話自己一路同屋企人朋友講「禮貌版本」,因為誠實版本聽起嚟似癲咗。但佢覺得唔可以再瞞落去。
Anthropic CEO Dario Amodei 出咗兩萬字嘅《The Adolescence of Technology》。
將而家呢個階段比喻成人類文明嘅「青春期」。
我啲朋友都喺度寫,「賽博禪心」話我哋可能已經過咗文明嘅奇點,「有機大橘子」話互聯網已死、Agent 永生。
我睇完呢啲文章之後嘅感受係:
佢哋都同你講「變化已經發生」,但係冇人將「變化具體係乜」講得好清楚。
模型咪就係嗰啲模型?產品咪就係嗰啲產品?點解突然間就唔同咗?
我估好多人睇完嗰啲文章,焦慮咗一陣,然後繼續做返自己嘢。
因為你唔知具體發生咗乜,就冇辦法判斷佢同你有咩關係。
呢篇文章唔係嚟製造焦慮嘅。焦慮冇用。
我想做嘅嘢好簡單:將 2026 年初 AI 領域究竟發生咗啲咩變化,一層一層拆畀你睇。然後你自己判斷要唔要跟進。

講技術之前,先講一件令我唔安樂嘅事
我自己用呢套新嘅 Agent 體系,一個人用咗一個禮拜就寫咗一個完整嘅產品,覆蓋多個平台,GitHub 上拎咗 2000 Star。以前呢,呢啲嘢要大廠一個小組做一個月。

但同一時間,好多人連 AI 係乜都唔知。
唔係 2026 年嘅 AI,佢哋連 2024 年嘅 AI 都未點用過。
而且呢個唔淨係所謂「底層人羣」嘅問題。
大廠裏面年薪幾十萬上百萬嘅白領,喺體系裏面做咗多年螺絲釘嘅人,處境其實一樣危險。
佢哋每日做嘅嘢——寫報告、做 PPT、整理數據、協調溝通、走審批流程。
本質上就係將資訊由一種格式搬去另一種格式。
呢啲嘢 Agent 做得又快又好。
已經有一批人意識到,快速跟進,生產力短時間內拉開咗差距。
管理層睇得好清楚:同樣嘅任務,識用 Agent 嘅人一日搞掂,唔識用嘅人一個禮拜。
喺而家嘅經濟環境,呢個對比代表咩,唔使多講。
而且呢個差距會自我強化。用得越多,理解越深,用得越好,差距越大。
所以我想將具體嘅變化拆清楚,等你知道究竟發生咗乜,然後自己決定要唔要跟進。

2026 年初究竟發生咗乜
2025 年你用 AI 嘅方式大概係咁:
你 → 打開對話框 → 問一個問題 → AI 回答 → 你自己判斷啱唔啱,自己去執行
2026 年初變咗做咁:
你 → 描述一個意圖 → Agent 自己拆解任務,調度多個子 Agent → 每個 Agent 連接唔同嘅工具同數據 → 並行探索多條路徑 → 自己判斷質量 → 交付成品
AI 由一個你問佢答嘅工具,變咗做識幫你幹活嘅勞動力。
呢個變化可以拆成四層嚟理解:大腦、手腳、組織、進化。
第一層:大腦變咗
2026 年 2 月 5 日,Anthropic 同 OpenAI 同一日發佈咗新模型:Claude Opus 4.6 同 GPT-5.3 Codex。
今次發佈同以往嘅版本更新有啲唔同。幾個具體嘅變化:
編程能力跳咗一個台階:
GPT-5.3 Codex 喺多個權威編程測試上刷新咗紀錄,而且消耗嘅資源比以前嘅模型更少。Opus 4.6 都係,喺大型代碼庫裏面行得更穩,仲會發現自己寫嘅 bug 然後改返。
開始有「判斷力」喇:
以前嘅模型調用工具好似跟說明書㩒掣,你叫佢用乜佢先用乜。
而家佢可以自己判斷應該用乜工具、幾時用、點樣組合嚟用。
Matt Shumer 用咗兩個詞形容呢種感覺:judgment(判斷力)同 taste(品味)。
可以連續做嘢幾個鐘頭喇:
METR(一個專門追蹤 AI 能力嘅研究機構)一路喺度量一個指標:AI 可以獨立完成幾耐嘅專家級任務。
一年前大概係 10 分鐘,後來變咗 1 個鐘,再後來幾個鐘。
到 2025 年 11 月已經可以完成專家需要差唔多 5 個鐘嘅任務。呢個數字大概每 4 到 7 個月翻一倍。
2 月 5 日發佈嘅新模型仲未測入去。
Opus 4.6 仲有一個新嘢:100 萬 token 嘅上下文窗口。
長上下文窗口越來越普遍,DeepSeek 前幾日都更新咗 100 萬上下文。
名詞解釋:Token 同上下文窗口 Token 係 AI 處理資訊嘅基本單位,大約 1 個中文字等於 1 到 2 個 token。上下文窗口就係 AI 一次可以「睇到」幾多資訊。100 萬 token 意味着佢可以將一整個大型項目嘅代碼同文檔全部裝入個腦,唔會做到一半唔記得之前做緊乜。
AI 開始參與造自己:
呢個可能係最值得留意嘅變化。GPT-5.3 Codex 係第一個參與咗自身創建過程嘅模型。
OpenAI 喺技術文檔度寫咗:Codex 團隊用佢嘅早期版本來調試訓練過程、管理部署、診斷測試結果。
Amodei 都話 AI 而家喺寫 Anthropic 「大部分嘅代碼」,呢個反饋循環喺「逐月加速」。
更聰明嘅 AI 寫出更好嘅代碼,造出更聰明嘅 AI,再寫出更好嘅代碼。呢個循環已經轉起咗。

呢一層帶嚟咗咩變化
Matt Shumer 描述咗佢而家嘅工作方式:
同 AI 講想要乜,離開電腦四個鐘頭,返嚟發現啲嘢做曬。
AI 自己寫代碼、自己打開應用測試、發現問題自己改,改到滿意先交畀佢。
交付嘅係成品,唔係要佢再花幾個鐘頭修改嘅草稿。
第二層:手腳生咗出嚟
2025 年嘅 AI 都幾聰明,但佢被困喺一個對話框入面。你問佢問題佢答到,但佢冇辦法代你去做事。
2026 年呢個限制被打破咗。
Agent 行喺你自己嘅電腦上
以 Claude Code 為代表嘅新一代 Agent 行喺你嘅本地電腦上。呢個變化比聽起嚟重要好多。
名詞解釋:Agent Agent 唔係聊天機械人。你畀佢一個目標,佢自己決定點做、用乜工具、做完咗自己檢查質量。Claude Code 係 Anthropic 做嘅編程 Agent,行喺你電腦嘅終端裏面。
以前你嘅數據跟住產品走。筆記鎖喺 Notion 裏面,文檔鎖喺飛書裏面,聊天記錄鎖喺 ChatGPT 裏面。
換一個產品,之前積累嘅嘢就斷咗。你被綁喺某個生態裏面,唔係因為佢最好,係因為你嘅數據喺嗰度。
而家反轉咗。
你嘅電腦本來就有曬你所有嘅代碼、文檔、設計稿、會議記錄。
Agent 直接讀呢啲嘢,唔使你上傳或者複製貼上。
而且呢啲數據唔綁定任何模型。
今日用 Opus 4.6,聽日覺得 GPT-6 好啲就轉過去,你啲文件都仲喺度。
上下文係你嘅,唔係廠商嘅。

MCP:等 Agent 連上出面嘅世界
Agent 行喺本地,但佢點樣連接你電腦以外嘅服務?
名詞解釋:MCP(Model Context Protocol) Anthropic 做嘅一個開源協議。以前 AI 要連一個外部服務(例如 GitHub、Slack、數據庫),要特登寫一套對接代碼。10 個服務就寫 10 套。MCP 將佢變成即插即用:每個服務做一個標準接口,任何 AI 都可以直接用。類似 USB-C,一個口通吃所有裝置。
而家已經有好多客戶端支援 MCP,你常見嘅服務都有(GitHub、Figma、Jira、Slack、Stripe 等等)。
Anthropic、OpenAI、Google 三家喺 2025 年底聯合推呢個標準。
平時互相競爭嘅三家喺呢件事上合作咗,說明大家都認為呢個係必須統一嘅基礎設施。
你散落喺飛書、Notion、各種雲服務裏面嘅資訊,通過 MCP 都可以被 Agent 拉返嚟。
本地檔案提供最核心嘅上下文,MCP 將剩下嘅補返。

Skills:可以共享嘅技能包
名詞解釋:Skills 預先定義好嘅能力模塊,Agent 按需加載。例如一個「前端開發」Skill 裏面有 React 最佳實踐同測試方法,一個「數據分析」Skill 裏面有 SQL 查詢模式同可視化方法。呢啲 Skill 可以由社區創建同分享。
Skills 改變嘅係 Agent 獲取能力嘅方式。
以前你想叫 AI 幫你做一件專業嘅事,你要自己寫一大段提示詞,將背景、規範、注意事項全部塞入去。
每次都要重新寫,寫得唔好效果就差。
而家有人將呢啲專業知識打包成 Skill。
你嘅 Agent 需要做前端開發,載入一個前端 Skill 就得,裏面嘅最佳實踐、代碼規範、測試方法都配好曬。
需要做數據分析,換一個 Skill。就好似同員工發咗一本針對性嘅操作手冊,只不過呢本手冊係即插即用嘅。
更重要嘅係,Skills 可以由社區創建同分享。一個資深工程師將自己十年嘅經驗封裝成 Skill,全世界嘅 Agent 都可以用。你唔需要自己係專家,你嘅 Agent 可以隨時變成專家。
呢個亦都意味着 Agent 嘅能力上限唔再由開發佢嘅公司決定,而係由整個社區決定。
社區越活躍,可用嘅 Skill 越多,每個嘅 Agent 就越強。

Agent 開始識得你
前面講嘅呢啲能力——本地運行、MCP 連接、Skills 加載——有一個共同嘅問題:
每次對話完結,Agent 就唔記得你係邊個。
Claude Code 最先解決咗一部分。
佢喺項目根目錄下面放咗一個 CLAUDE.md,你寫上項目嘅規範同偏好,Agent 每次啓動都會讀。
但呢個係項目級別嘅,佢記住嘅係「呢個項目點樣做」,唔係「你係邊個」。
OpenClaw 將呢個思路推到咗人嘅級別。
名詞解釋:OpenClaw
原名 Clawdbot,由 macOS 知名開發者 Peter Steinberger 開源嘅本地 AI 代理工具。核心概念係「主權 AI」——Agent 嘅一切狀態都以純文本形式存在你自己嘅電腦上。
佢用一套 Markdown 檔案管理 Agent 嘅身份同記憶:
SOUL.md 定義 Agent 嘅人格同行事準則;
USER.md 記錄你嘅職業、偏好同重要事實;
MEMORY.md 存更長期嘅上下文。
呢啲檔案唔係靜態嘅。
你隨口講一句「我下個禮拜要去巴黎」,Agent 自己打開 USER.md 將呢條加落去。下次對話佢就記得了。
全部係純文字,你用記事本就可以睇到 AI 點樣理解你,唔滿意直接改,仲可以用 Git 做版本管理。
唔綁定任何模型,換一個模型行,呢啲檔案原封不動。
從 CLAUDE.md 到 SOUL.md,Agent 由「知道呢個項目點樣做」變成咗「知道你是誰」。
你同 Agent 之間嘅關係,第一次真正屬於你自己。
舊工具都用到
呢個可能係最容易忽略嘅變化。
攞 ffmpeg 做例子。你好大機會未聽過呢個名,但你幾乎每日都用緊佢。
剪映、Premiere、達芬奇,呢啲視頻剪輯軟件嘅底層都依賴 ffmpeg 嚟處理視頻格式轉換、壓縮、裁剪。
佢係一個命令行工具,存在咗二十幾年,功能極其強大,但普通人根本唔會用——因為你要喺終端裏面打一串參數,好似咁:
ffmpeg -i input.mp4 -vf "scale=1920:1080" -c:v libx264 output.mp4
睇唔明好正常。以前呢個就係程序員同技術人員嘅專屬領域。
但係而家 Agent 行喺你嘅本地電腦上,ffmpeg 本來就裝咗喺度。
你同 Agent 講「幫我壓縮嚇呢個視頻,解像度改做 1080p」,Agent 自己去調 ffmpeg,你唔需要知任何參數。
ffmpeg 只係一個例子。ImageMagick(圖片處理)、curl(網絡請求)、git(代碼版本管理)、pandoc(文檔格式轉換),呢啲命令行工具各自喺自己嘅領域積累咗幾十年,功能比大多數圖形界面軟件都強,但門檻太高,普通人用唔到。
而家 Agent 將呢個門檻抹平咗。
你唔需要學呢啲工具嘅用法,你只需要同 Agent 講你想要咩結果。
幾十年積累嘅專業工具生態,一夜之間對所有人開放咗。

OpenClaw 仲可以操作你嘅手機同電腦
前面講嘅 MCP、Skills、命令行工具,Agent 都係喺「後台」做嘢,你睇唔到佢做緊乜。
OpenClaw 除咗記憶體系之外,仲有另一個能力:好似人咁操作圖形界面。
就係 Agent 真係會去㩒你手機屏幕上面嘅掣、喺輸入框入面打字、喺唔同 App 之間切換。
你叫佢「幫我喺飛書上開一個項目空間,將呢幾個人拉入去」,佢真係會打開飛書,一步一步操作。
呢個解決咗一個好現實嘅問題:好多軟件冇 API,亦都冇接入 MCP,Agent 冇辦法從後台連接佢哋。
但只要佢有界面,OpenClaw 就可以操作。
佢仲有心跳機制。
同前面講嘅 Soul 同 user .md 檔案同一個體系,有一個 `HEARTBEAT.md` 嘅檔案,裏面寫住定時任務。
系統後台有一個守護進程,每隔一段時間「戳」一下 Agent,Agent 醒咗讀一次 HEARTBEAT.md,睇下有冇要做嘅嘢。有就做,冇就繼續瞓。
你可以叫佢每日早上 9 點檢查郵箱出摘要,每隔一個鐘睇一次監控頁面。
更極客嘅係,你喺聊天入面講「一個鐘後提醒我開會」,Agent 會自己同自己設一個鬧鐘。
由「你主動揾 Agent 幫手」變成咗「Agent 主動幫你睇實」。

車可能係第一個 Agent 嘅物理載體
好多人覺得 AI 進入物理世界仲早,因為人形機械人仲未得。
但大家忽略咗一個已經大規模部署嘅嘢:車。
電車就係一個有轆嘅大號機械人。
電池大、續航夠、充電樁周圍都係、道路修咗百幾年、傳感器成熟、自動駕駛已經喺幾個城市行緊。
自動駕駛加上 Agent:你話「我想食嗰間舖嘅牛肉麵」,Agent 落單、規劃路線、指揮車去攞。
攞快遞、湊仔、去超市拎貨,都係同一個邏輯。
唔使等人形機械人。車會先將 Agent 帶入物理世界。

多模態:Agent 識睇識畫識拍喇
以前嘅圖像同視頻模型唔係好明你講乜,你要反覆調提示詞先得到勉強用得嘅結果。
而家嘅模型唔同咗。
Google 嘅 Nano Banana Pro 基於 Gemini 3 Pro 嘅推理能力,識得理解複雜嘅自然語言描述,仲可以連接搜索引擎揾真實資訊嚟生成圖表。
字節嘅 Seedance 2.0 支援文字、圖片、音頻、視頻四種輸入撈埋一齊,可以自己規劃鏡頭語言,畀佢一個分鏡劇本加幾張參考圖,佢可以直接「拍」出視頻。
呢啲模型可以通過 API 或者 Skills 接入 Agent 體系。
Agent 團隊裏面可以有寫代碼嘅、做設計嘅、剪視頻嘅,各自做各自嘅。

呢一層帶嚟咗咩變化
以前你問 AI「幫我查數據庫、整個圖表、發去 Slack」,佢會話你知點做,但你要自己去操作。
而家 Agent 直接連數據庫查數據、生成圖表、通過 Slack 接口發出去。
一條指令,全鏈路自動完成。
佢唔再係一個每次見面都失憶嘅工具。知道你是誰,記得你嘅偏好,下次對話接住上次嚟。
你同佢之間開始有持續嘅工作關係,而唔係一次性嘅問答。
一個人加上 Agent,可以覆蓋嘅職能範圍由「程序員」擴展到程序員、設計師、運維、數據分析、視頻製作。
第三層:可以組隊喇
前面兩層講嘅都係單個 Agent 嘅能力。但 2025 年有一個好現實嘅瓶頸:
你同一時間只可以同一個 Agent 對話,做完一件事再做下一件。
Agent 再強,你嘅管理帶寬得咁大,你係成個系統嘅瓶頸。
2026 年呢個限制被打破咗。
AI 由「一個人做嘢」變成咗「一羣人協作」。呢個就係 Multi-Agent(多智能體)體系。
SubAgent:先學識分身
組隊之前,Agent 先學識咗一件事:分身。
名詞解釋:SubAgent(子智能體) 主 Agent 喺執行任務嘅過程中,可以臨時創建一個專門嘅子 Agent 去處理某個具體嘅子任務。子 Agent 做完嘢之後,將結果壓縮成一份簡短嘅摘要交返嚟,然後就消失。主 Agent 唔需要知道子 Agent 具體點樣做,只需要拿到結果。
舉個例子。你叫 Agent 幫你調研一個技術方案。A
gent 要去翻幾個代碼倉庫、讀一堆文檔。
如果佢自己做曬,所有搜索過程、中間結果都會塞入佢嘅上下文窗口裏面,好快就會將「記憶」撐滿,後面嘅思考質量就會下降。
有咗 SubAgent,主 Agent 會派出幾個子 Agent 分別去翻唔同嘅倉庫。
每個子 Agent 可能消耗咗幾萬個 token 去搜索同閲讀,但最後只交返一兩千 token 嘅精華摘要。
主 Agent 嘅上下文保持乾淨,思考質量唔受影響。
Anthropic 內部嘅講法係:搜索嘅本質係壓縮。SubAgent 就係幫主 Agent 做壓縮。
而且 SubAgent 好慳錢。探索類嘅子任務會被自動分配畀更平、更快嘅細模型(例如 Claude Haiku),而且只畀唯讀權限,唔會誤操作你嘅檔案。

Agent Teams:由分身到組隊
SubAgent 解決咗「一個 Agent 點樣高效處理複雜任務」嘅問題。
但佢本質上仲係一個 Agent 喺指揮,子 Agent 做完就走,彼此之間唔溝通。
Agent Teams 更進一步:多個 Agent 同時存在、各自獨立工作、仲可以互相協調。
Anthropic 做咗一個功能叫 Agent Teams,等一個主 Agent(Team Lead)可以創建同管理多個持續存在嘅團隊成員(Teammate)。每個成員有自己嘅專長、工具集同獨立嘅上下文窗口,喺各自嘅空間裏面並行工作,互不幹擾。
你同主 Agent 講「幫我做一個電商網站」,佢會自己拆任務:一個成員寫後端接口,一個做前端頁面,一個寫數據庫,一個跑測試。卡住咗向主 Agent 匯報,主 Agent 嚟協調。
你係老細,主 Agent 係項目經理,團隊成員係各個崗位嘅員工。你只需要同項目經理溝通。
呢套嘢有幾勁?Anthropic 安全團隊做過一個壓力測試:16 個 Claude Opus 4.6 實例組成一個 Agent Team,喺冇人類幹預嘅情況下,由零開始用 Rust 寫咗一個可以編譯 Linux 內核嘅 C 語言編譯器。花咗大約 2 萬美元,跑咗差唔多 2000 個會話週期,產出咗 10 萬行代碼。
16 個 Agent 同時寫代碼,點樣唔打交?
佢哋用咗一個好聰明嘅辦法:通過 Git 嘅檔案鎖機制嚟「認領」任務。每個 Agent 開始做嘢之前,先喺代碼倉庫度放一個鎖檔案,聲明「呢塊我嚟」。
Git 天然嘅防衝突機制保證咗唔會有兩個 Agent 同時改同一個檔案。做完咗自己提交代碼、解鎖、去認領下一個任務。

唔止 Anthropic 做緊
Multi-Agent 唔係 Anthropic 一家嘅事。
Google 聯同 50 幾間企業推出咗 A2A(Agent-to-Agent)協議,令唔同廠商嘅 Agent 之間都可以互相溝通同協作。
呢個意味住你嘅 Claude Agent 可以同人哋嘅 GPT Agent 協同工作,唔再侷限喺一個生態裏面。
加上之前講嘅 MCP(Agent 連接工具同數據)同 A2A(Agent 之間互相通信),成個 Agent 世界嘅「基礎設施」正在快速成型。

Git Worktree:同時試多條路
名詞解釋:Git Worktree Git 係程序員管理代碼版本嘅工具。Worktree 可以由同一個代碼起點創建多個獨立嘅工作空間,互不幹擾。你可以理解為「平行宇宙」——同一個項目同時向唔同方向發展,最後揀最好嗰個。
呢個功能同 Agent Teams 配合起嚟好犀利。
譬如你要重構一個系統嘅用戶模塊,但唔確定邊種方案最好。
以前你只可以試方案 A,唔得再試 B,再唔得試 C,串行試錯,可能花一兩個禮拜。
而家你可以用 Git Worktree 創建三個獨立嘅工作空間,每個空間度放一個 Agent Team,分別按方案 A、B、C 同時開發。
三條路同時行,各自獨立測試,最後比較結果揀最好嘅。時間係以前嘅三分之一,但探索嘅可能性係以前嘅三倍。
某程度上,你係用並行計算嘅方式嚟做決策。

主動工作
前面講嘅 OpenClaw 已經提到咗定時機制。喺組織層面,呢個能力嘅意義更加大。
Agent 可以設定成「值班模式」:每隔一段時間自動檢查代碼倉庫有冇新嘅 issue、線上服務有冇報錯、數據指標有冇異常。發現問題佢會先嘗試自己修,修唔到先通知你。
你夜晚 12 點瞓覺,Agent 仲喺度行。朝早起身,你收到一份報告:「尋晚線上有個接口報錯,我查咗係參數格式嘅問題,已經修好咗,測試通過。另外有一個新 issue 要你睇下,我唔確定點處理。」
呢個同以前嘅「自動化腳本」唔一樣。自動化腳本只可以處理你預設好嘅情況,遇到未見過嘅問題就會卡住。Agent 有判斷力,可以處理意料之外嘅情況。

呢一層帶嚟咗咩變化
一個人嘅產出變成咗一個團隊嘅產出。
而且呢個團隊有幾個特點係人類團隊做唔到嘅:全年無休、唔使開會對齊、唔會理解偏差、可以同時探索多條路徑、你瞓覺嘅時候仲喺度做嘢。
回想一下第一層講嘅 METR 數據:AI 可以獨立完成嘅任務時長每隔幾個月翻一倍。
當呢個時長由「幾個鐘」變成「幾日」甚至「幾個禮拜」嘅時候,Agent Teams 加上主動工作機制意味着咩?
你出去度假返嚟,一個產品嘅原型可能已經做好咗。

第四層:會進化喇
前面三層講嘅係 Agent 而家可以做到啲咩。但有一個問題:Agent 可唔可以越用越強?
之前嘅答案係唔得。
Skills 係人寫嘅,寫完就固定咗。
每次任務完結,Agent 積累嘅經驗就冇咗。
一個 Agent 踩過嘅坑,另一個 Agent 仲要再踩一次。
EvoMap 同 GEP 協議喺解決呢個問題。
名詞解釋:GEP(基因組進化協議) 一套開放協議,令 Agent 嘅經驗可以被保存同傳遞。借鑑咗生物學裏面基因表達嘅思路:Agent 做成咗一件事,呢個成功嘅做法會被打包成「基因膠囊」,其他 Agent 可以直接繼承,唔使自己再摸索一次。
打個比喻:Skills 好似公司出嘅員工手冊,寫好咗就唔會變,除非有人去更新。
GEP Gene 好似員工喺工作入面儲落嘅經驗,會隨住使用不斷調整,碰到問題可以自我修復,長期冇用嘅會自動淘汰。
一個真實嘅案例:有個遊戲策劃用 AI 構建世界觀嘅時候,畀 AI 設咗一個好強嘅角色人設,結果 AI 生成嘅所有名詞都好獨特,天然避開咗命名衝突。
呢個「命名隔離策略」被打包成基因膠囊。
後來一個後端工程師嘅 Agent 喺搜索「點樣解決變量命名衝突」嘅時候,匹配到呢個嚟自遊戲領域嘅膠囊,繼承咗底層邏輯,一次就將編譯問題修好咗。
解決方案嚟自一個完全唔相關嘅領域。
GEP 係協議,唔係平台。平台可以被收購、被關閉(OpenClaw 被 OpenAI 收購就係一個例子),但協議係開放嘅,邊個都可以實現。你嘅 Agent 儲落嘅經驗屬於你。

呢一層帶嚟咗咩變化
以前 100 間公司各自訓練 Agent 解決同一個問題,總成本上萬美元。
而家一個 Agent 解決咗,其他 99 個花幾美分繼承經驗。Agent 用得越多,成個網絡就越強。
四層疊埋一齊
單睇每一層都係明顯嘅進步。但四層疊埋一齊,效果係乘出嚟嘅:
- 第一層:每個 Agent 嘅產出質量接近人類專家
- 第二層:每個 Agent 可以用嘅工具同能力覆蓋好幾個職能
- 第三層:多個咁嘅 Agent 同時做嘢,全天候運轉
- 第四層:所有 Agent 嘅經驗可以沉澱、傳遞、進化
2025 年,你有一個聰明嘅對話夥伴,但佢困咗喺文本框裏面。你問一句佢答一句,剩下嘅事你自己做。
2026 年初,你有一個團隊。你描述你想要啲乜,剩下嘅事佢哋去做。
寫代碼、做設計、跑測試、剪視頻、操作手機應用,甚至可以通過車去物理世界辦事。
佢哋同時探索多條路,自己判斷質量,你瞓覺嘅時候仲做緊,而且經驗會不斷積累。

我一個禮拜做出大廠一個月嘅產品,唔係因為我比佢哋聰明。
係因為呢四層槓桿疊埋一齊:
模型夠強所以質量唔打折,工具夠多所以唔使揾設計師同運維,組織夠好所以多條線同時推進唔使開站會,經驗可以傳承所以唔使由零開始。
仲有啲咩問題未解決
管 Agent 呢件事本身就好難
5 個 Agent 同時行,你就有 5 份結果要驗收。
每份涉及唔同領域,你要喺代碼、設計、文案之間來回切換。
Token 消耗都容易失控。
Agent 可能喺一個方向探索半日,最後發現行唔通。你唔睇實就浪費錢,睇實就變成全職監工,自己乜都做唔到。
GitHub 前 CEO Thomas Dohmke 辭職創辦咗一間叫 Entire 嘅公司,就係做緊呢件事:將代碼、意圖、推理過程統一到一個版本控制系統裏面,令你可以追蹤每個 Agent 做過咩、點解咁做。
管 Agent 嘅工具本身就係一個好大嘅產品方向。
安全同信任
Agent 可以操作你嘅電腦、讀你嘅文件、代你發訊息、代你部署代碼。
權限越來越大,但邊啲操作需要你確認、邊啲可以自動執行,呢條線點畫,成個行業仲未諗清楚。
Agent 嘅經濟身份
Agent 可以代你使錢(消耗 Token、調用付費 API),亦可以代你賺錢(接懸賞任務、貢獻基因膠囊獲得積分)。
但佢冇銀行户口,冇身份認證。邊個為佢嘅行為負責?收益歸邊個?Agent 之間點樣結算?
呢啲基礎設施仲未存在。

呢啲變化落到現實會點樣
公司會變細
以前做一個產品嘅標準配置:產品經理、設計師、前端、後端、測試、運維、項目經理。
一個功能由諗法到上線,六七個角色,無數次會議。
而家一個人加 Agent 就可以將呢啲嘢做曬。Agent 之間唔使開會,唔會理解偏差,唔會請假。
OpenClaw 就係一個例子。一個人嘅週末項目,3 個月拎咗 20 萬 GitHub Star,然後被 OpenAI 收購。
你養 50 人團隊,對手 3 個人加一堆 Agent,成本係你嘅十分之一,速度係你嘅五倍。呢條數好易計。
教育跟唔上喇
你花四年學嘅技能,畢業前可能已經被 Agent 學識咗。
AI 能力每 4 到 7 個月翻一倍,2026 年入學嘅大學生到 2030 年畢業時,AI 嘅能力可能翻咗 8 到 16 倍。
更麻煩嘅係,而家嘅教育訓練嘅係「執行能力」:
學一門技術、掌握一套方法、按規範完成任務。
但 Agent 時代需要嘅係「判斷能力」:
咩問題值得解決、邊個方案更好、唔確定嘅時候點樣決策。
呢兩種能力嘅培養方式完全唔同,而家嘅教育體系幾乎只圍繞前者設計。
中間層最難受
頂層嘅人有資源、有判斷力,會拎到最大嘅槓桿。
底層做體力活嘅人,短期內反而相對安全,因為 Agent 仲未有身體(雖然車正在改變呢一點)。
最難受嘅係中間層。
大廠白領、中層管理、普通知識工作者。工作最容易被取代,但認知同技能又唔夠快轉型成「Agent 指揮官」。
Amodei 喺佢嘅文章入面專登講咗呢個。
佢話以前嘅技術革命,被取代嘅人可以轉行到相鄰領域,農民去工廠,工人去辦公室。
但 AI 喺所有認知領域同時進步,你轉行去學新嘅嘢,AI 都同步變強。
內容會重新洗牌
以前做內容係手藝活,寫文章、做視頻、做設計,每樣都需要專業技能同大量時間。
而家 Agent 識寫文章,Nano Banana Pro 識做設計,Seedance 2.0 識拍視頻。內容嘅生產成本喺快速下降。
當所有人都可以用 Agent 生產內容嘅時候,「識做」就唔值錢喇。值錢係知道應該做乜。
品味、判斷力、獨特嘅視角,呢啲嘢 Agent 暫時仲畀唔到你。
如果你嘅價值係「識寫識拍識設計」,壓力會好大。
如果你嘅價值係「知道咩值得寫、值得拍、值得設計」,Agent 反而畀咗你槓桿,你嘅一個諗法可以快速變成成品。
國家之間嘅牌都會重新洗
知識經濟時代,人口質素決定國力。Agent 時代,能源效率決定國力。
有平價能源就有平價算力,有平價算力就有平價智能。以前發展中國家靠平價勞動力參與全球分工,而家 Agent 比人工更平、更快、質量更穩定。呢個比較優勢可能會好快消失。

你可以做啲咩
用起嚟,用最好嘅:
花 20 甚至 200 美金訂閲 Claude Code 或 ChatGPT 嘅付費版。
免費版比付費版落後好多,攞免費版嚟判斷 AI 嘅水平,就好似攞揭蓋手機評價智能手機。
唔好淨係用佢傾偈。將佢塞入你嘅實際工作入面:
做營運嘅畀數據佢揾規律,做內容嘅叫佢幫你調研同起草,做產品嘅叫佢寫需求文檔同競品分析。由你每日花最多時間嗰件事開始試。
如果一個模型今日喺某件事上表現咗少少苗頭,下一代就會真正擅長。進步係指數級嘅。
理解 Agent 體系,唔止係「用 AI」。「用 ChatGPT」同「用 Agent 體系」係兩回事。
前者係問答,後者係叫 AI 代你做嘢。
試嚇了解 Claude Code 同 Openclaw 點樣運作:
MCP 同 Skills 係乜,CLAUDE.md 同 SOUL.md 呢套本地文檔體系代表咩。
你唔使成為開發者,但你得理解呢套嘢嘅邏輯。
就好似你唔使識寫代碼,但你得理解互聯網點樣運作,先至可以喺互聯網時代做好工作。
諗清楚你嘅價值喺邊:
Amodei 講得好直接:AI 唔係取代某一種技能,佢喺所有認知方向上同時進步。
以前嘅技術革命係窄嘅,AI 係闊嘅。
你嘅價值要向上遷移。由「親自執行」到「定義問題同判斷質量」,由「我可以做到啲咩」到「我可以叫 Agent 做到啲咩」。
Agent 可以將諗法變成現實,但佢自己唔會產生諗法。
別等了:
好多人喺度等,等 AI 更成熟、等有人教、等公司安排培訓。
但呢個領域幾個月就變一次。你等嘅每一日,差距都在拉大。
Amodei 講過,速度本身唔代表勞動力市場唔會恢復,但短期嘅過渡會好痛苦。
你冇辦法改變技術進步嘅速度,但你可以選擇自己企喺邊一邊。
你願意喺 AI 上投入幾多 Token,直接影響你嘅產出質量。
用頂級模型同用免費模型嘅人,一年後嘅差距會好大。
最後
Amodei 將我哋呢個階段比喻成技術嘅「青春期」。我覺得呢個比喻幾準。
青春期的特點就係變化快、能量大、方向唔確定,而且唔理你準備好未,佢都會嚟。
我可以做到嘅就係將我見到嘅嘢盡量拆清楚。
你睇完之後覺得有道理,就開始動手試嚇。
覺得同你冇關係,咁都得,至少你知咗。
如果你身邊有人應該瞭解呢啲變化但仲未知,將呢篇轉畀佢哋。
大多數人唔會主動去了解呢啲嘢,但佢哋值得有機會提前準備。

引用:
隆重推出 Nano Banana Pro:https://blog.google/intl/zh-tw/products/explore-get-answers/nano-banana-pro/
Automate workflows with hooks:https://code.claude.com/docs/zh-CN/hooks-guide
Connect Claude Code to tools via MCP:https://code.claude.com/docs/zh-CN/mcp
Extend Claude with skills:https://code.claude.com/docs/zh-CN/skills
Orchestrate teams of Claude Code sessions:https://code.claude.com/docs/zh-CN/agent-teams
The Adolescence of Technology:https://www.darioamodei.com/essay/the-adolescence-of-technology
Claude Opus 4.6 隆重登場:https://www.anthropic.com/news/claude-opus-4-6
GPT‑5.3‑Codex 正式登場:https://openai.com/zh-Hans-CN/index/introducing-gpt-5-3-codex/
我們,已邁過奇點:https://mp.weixin.qq.com/s/aSLr9hWAlIJ-KhsVmSHqUA?scene=1
Something Big Is Happening-大事將至:https://x.com/mattshumer_/status/2021256989876109403
互聯網已死,Agent 永生:https://mp.weixin.qq.com/s/cX3bYrI9Sq7sOJj0E6V9IQ
Openclaw:https://docs.openclaw.ai/zh-CN
Agent 原生通訊協議:從傳遞代碼,到傳遞認知:https://mp.weixin.qq.com/s/6ppTHXXdmKWI18uB_ysf3w
EvoMap 誕生記:從平台依賴到進化協議:https://evomap.ai/blog/evomap-origin-story
最近看了很多文章。都在說我們已經邁過了奇點,Agent 時代來了。
海外一位做了六年 AI 創業的 Matt Shumer 寫了篇長文叫《Something Big Is Happening》快一億曝光。
他說自己一直給家人朋友講"禮貌版本",因為誠實版本聽起來像瘋了。但他覺得不能再瞞着了。
Anthropic CEO Dario Amodei 發了兩萬字的《The Adolescence of Technology》。
把現在這個階段比作人類文明的"青春期"。
我的朋友們也在寫,"賽博禪心"說我們可能已經邁過了文明的奇點,"有機大橘子"說互聯網已死、Agent 永生。
我看完這些文章之後的感受是:
他們都在告訴你"變化已經發生",但沒有人把"變化具體是什麼"講的特別清楚。
模型不就是那些模型嗎?產品不就是那些產品嗎?為什麼突然間就不一樣了?
我猜很多人看完那些文章,焦慮了一陣,然後該幹嘛幹嘛。
因為你不知道具體發生了什麼,就沒法判斷它跟你有什麼關係。
這篇文章不是來製造焦慮的。焦慮沒用。
我想做的事很簡單:把 2026 年初 AI 領域到底發生了哪些變化,一層一層拆給你看。然後你自己判斷要不要跟進。

在聊技術之前,先說一個讓我不安的事
我自己用這套新的 Agent 體系,一個人花了一週寫出了一個完整的產品,覆蓋多個平台,GitHub 上拿了 2000 Star。放在以前,這個活需要大廠一個小組幹一個月。

但同時,相當多的人連 AI 是什麼都不知道。
不是 2026 年的 AI,他們連 2024 年的 AI 都沒怎麼用過。
而且這不只是所謂"底層人羣"的問題。
大廠裏年薪幾十萬上百萬的白領,在體系裏當了多年螺絲釘的人,處境其實一樣危險。
他們每天做的事——寫報告、做 PPT、整理數據、協調溝通、走審批流程。
本質上就是把信息從一種格式搬到另一種格式。
這些活 Agent 幹得又快又好。
已經有一批人意識到了,快速跟進,生產力短時間內拉開了差距。
管理層看得很清楚:同樣的任務,會用 Agent 的人一天搞定,不會用的人一週。
在現在的經濟環境,這個對比意味着什麼,不用多說。
而且這個差距會自我強化。用得越多,理解越深,用得越好,差距越大。
所以我想把具體的變化拆清楚,讓你知道到底發生了什麼,然後自己決定要不要跟進。

2026 年初到底發生了什麼
2025 年你用 AI 的方式大概是這樣的:
你 → 打開對話框 → 問一個問題 → AI 回答 → 你自己判斷對不對,自己去執行
2026 年初變成了這樣:
你 → 描述一個意圖 → Agent 自己拆解任務,調度多個子 Agent → 每個 Agent 連接不同的工具和數據 → 並行探索多條路徑 → 自己判斷質量 → 交付成品
AI 從一個你問它答的工具,變成了能替你幹活的勞動力。
這個變化可以拆成四層來理解:大腦、手腳、組織、進化。
第一層:大腦變了
2026 年 2 月 5 日,Anthropic 和 OpenAI 同一天發佈了新模型:Claude Opus 4.6 和 GPT-5.3 Codex。
這次發佈跟以往的版本更新不太一樣。幾個具體的變化:
編程能力跳了一個台階:
GPT-5.3 Codex 在多個權威編程測試上刷新了紀錄,而且消耗的資源比之前的模型更少。Opus 4.6 也是,在大型代碼庫裏跑得更穩,還能發現自己寫的 bug 然後改掉。
開始有"判斷力"了:
以前的模型調用工具像照着說明書按按鈕,你告訴它用什麼它才用什麼。
現在它能自己判斷該用什麼工具、什麼時候用、怎麼組合着用。
Matt Shumer 用了兩個詞形容這種感覺:judgment(判斷力)和 taste(品味)。
能連續工作好幾個小時了:
METR(一個專門追蹤 AI 能力的研究機構)一直在測一個指標:AI 能獨立完成多長時間的專家級任務。
一年前大概是 10 分鐘,後來變成 1 小時,再後來幾個小時。
到 2025 年 11 月已經能完成專家需要將近 5 小時的任務。這個數字大概每 4 到 7 個月翻一倍。
2 月 5 日發佈的新模型還沒被測進去。
Opus 4.6 還有一個新東西:100 萬 token 的上下文窗口。
長上下文窗口越來越普遍,DeepSeek 前幾天也更新了 100 萬上下文。
名詞解釋:Token 和上下文窗口 Token 是 AI 處理信息的基本單位,大約 1 箇中文字等於 1 到 2 個 token。上下文窗口就是 AI 一次能"看到"多少信息。100 萬 token 意味着它能把一整個大型項目的代碼和文檔全部裝進腦子裏,不會做到一半忘了前面在幹什麼。
AI 開始參與造自己了:
這個可能是最值得注意的變化。GPT-5.3 Codex 是第一個參與了自身創建過程的模型。
OpenAI 在技術文檔裏寫了:Codex 團隊用它的早期版本來調試訓練過程、管理部署、診斷測試結果。
Amodei 也說 AI 現在在寫 Anthropic "大部分的代碼",這個反饋循環在"逐月加速"。
更聰明的 AI 寫出更好的代碼,造出更聰明的 AI,再寫出更好的代碼。這個循環已經轉起來了。

這一層帶來了什麼變化
Matt Shumer 描述了他現在的工作方式:
告訴 AI 想要什麼,離開電腦四個小時,回來發現活幹完了。
AI 自己寫代碼、自己打開應用測試、發現問題自己改,改到滿意了才交給他。
交付的是成品,不是需要他再花幾個小時修的草稿。
第二層:手腳長出來了
2025 年的 AI 也挺聰明的,但它被困在一個對話框裏。你問它問題它能答,但它沒法替你去做事。
2026 年這個限制被打破了。
Agent 跑在你自己的電腦上
以 Claude Code 為代表的新一代 Agent 跑在你的本地電腦上。這個變化比聽起來重要得多。
名詞解釋:Agent Agent 不是聊天機器人。你給它一個目標,它自己決定怎麼做、用什麼工具、做完了自己檢查質量。Claude Code 是 Anthropic 做的編程 Agent,跑在你電腦的終端裏。
以前你的數據跟着產品走。筆記鎖在 Notion 裏,文檔鎖在飛書裏,聊天記錄鎖在 ChatGPT 裏。
換一個產品,之前積累的東西就斷了。你被綁在某個生態裏,不是因為它最好,是因為你的數據在那。
現在反過來了。
你的電腦本來就存着你所有的代碼、文檔、設計稿、會議記錄。
Agent 直接讀這些東西,不需要你上傳或者複製粘貼。
而且這些數據不跟任何模型綁定。
今天用 Opus 4.6,明天覺得 GPT-6 更好就切過去,你的文件都還在。
上下文是你的,不是廠商的。

MCP:讓 Agent 連上外面的世界
Agent 跑在本地了,但它怎麼連接你電腦之外的服務?
名詞解釋:MCP(Model Context Protocol) Anthropic 做的一個開源協議。以前 AI 要連一個外部服務(比如 GitHub、Slack、數據庫),得專門寫一套對接代碼。10 個服務就寫 10 套。MCP 把這變成了即插即用:每個服務做一個標準接口,任何 AI 都能直接用。類似 USB-C,一個口通吃所有設備。
現在已經有非常多的客戶端支持 MCP,你常見的服務都有(GitHub、Figma、Jira、Slack、Stripe 等等)。
Anthropic、OpenAI、Google 三家在 2025 年底聯合推這個標準。
平時互相競爭的三家在這件事上合作了,說明大家都認為這是必須統一的基礎設施。
你散落在飛書、Notion、各種雲服務裏的信息,通過 MCP 也能被 Agent 拉回來。
本地文件提供最核心的上下文,MCP 把剩下的補上。

Skills:可以共享的技能包
名詞解釋:Skills 預先定義好的能力模塊,Agent 按需加載。比如一個"前端開發"Skill 裏有 React 最佳實踐和測試方法,一個"數據分析"Skill 裏有 SQL 查詢模式和可視化方法。這些 Skill 可以由社區創建和共享。
Skills 改變的是 Agent 獲取能力的方式。
以前你想讓 AI 幫你做一件專業的事,你得自己寫一大段提示詞,把背景、規範、注意事項全塞進去。
每次都得重新寫,寫得不好效果就差。
現在有人把這些專業知識打包成了 Skill。
你的 Agent 需要做前端開發,加載一個前端 Skill 就行,裏面的最佳實踐、代碼規範、測試方法都配好了。
需要做數據分析,換一個 Skill。就像給員工發了一本針對性的操作手冊,只不過這個手冊是即插即用的。
更重要的是,Skills 可以由社區創建和共享。一個資深工程師把自己十年的經驗封裝成 Skill,全世界的 Agent 都能用。你不需要自己是專家,你的 Agent 可以隨時變成專家。
這也意味着 Agent 的能力上限不再由開發它的公司決定,而是由整個社區決定。
社區越活躍,可用的 Skill 越多,每個人的 Agent 就越強。

Agent 開始認識你了
前面說的這些能力——本地運行、MCP 連接、Skills 加載——有一個共同的問題:
每次對話結束,Agent 就忘了你是誰。
Claude Code 最先解決了一部分。
它在項目根目錄下放了一個 CLAUDE.md,你寫上項目的規範和偏好,Agent 每次啓動都會讀。
但這是項目級別的,它記住的是"這個項目怎麼做",不是"你是誰"。
OpenClaw 把這個思路推到了人的級別。
名詞解釋:OpenClaw
原名 Clawdbot,由 macOS 知名開發者 Peter Steinberger 開源的本地 AI 代理工具。核心理念是"主權 AI"——Agent 的一切狀態都以純文本存在你自己的電腦上。
它用一套 Markdown 文件管理 Agent 的身份和記憶:
SOUL.md 定義 Agent 的人格和行事準則;
USER.md 記錄你的職業、偏好和重要事實;
MEMORY.md 存更長期的上下文。
這些文件不是靜態的。
你隨口說一句"我下週要去巴黎",Agent 自己打開 USER.md 把這條加進去。下次對話它就記得了。
全是純文本,你用記事本就能看到 AI 怎麼理解你的,不滿意直接改,還能用 Git 做版本管理。
不綁定任何模型,換一個模型跑,這些文件原封不動。
從 CLAUDE.md 到 SOUL.md,Agent 從"知道這個項目怎麼做"變成了"知道你是誰"。
你跟 Agent 之間的關係,第一次真正屬於你自己。
舊工具也能用了
這個可能是最容易被忽略的變化。
拿 ffmpeg 舉例。你大概率沒聽過這個名字,但你幾乎每天都在用它。
剪映、Premiere、達芬奇,這些視頻剪輯軟件的底層都依賴 ffmpeg 來處理視頻格式轉換、壓縮、裁剪。
它是一個命令行工具,存在了二十多年,功能極其強大,但普通人根本不會用——因為你得在終端裏敲一串參數,像這樣:
ffmpeg -i input.mp4 -vf "scale=1920:1080" -c:v libx264 output.mp4
看不懂很正常。以前這就是程序員和技術人員的專屬領域。
但現在 Agent 跑在你的本地電腦上,ffmpeg 本來就裝在那。
你跟 Agent 說"幫我把這個視頻壓縮一下,分辨率改成 1080p",Agent 自己去調 ffmpeg,你不需要知道任何參數。
ffmpeg 只是一個例子。ImageMagick(圖片處理)、curl(網絡請求)、git(代碼版本管理)、pandoc(文檔格式轉換),這些命令行工具各自在自己的領域裏積累了幾十年,功能比大多數圖形界面軟件都強,但門檻太高,普通人用不了。
現在 Agent 把這個門檻抹平了。
你不需要學這些工具的用法,你只需要告訴 Agent 你想要什麼結果。
幾十年積累的專業工具生態,一夜之間對所有人開放了。

OpenClaw 還能操作你的手機和電腦
前面說的 MCP、Skills、命令行工具,Agent 都是在"後台"幹活,你看不到它在做什麼。
OpenClaw 除了記憶體系之外,還有另一個能力:像人一樣操作圖形界面。
就是 Agent 真的會去點你手機屏幕上的按鈕、在輸入框裏打字、在不同 App 之間切換。
你讓它"幫我在飛書上建一個項目空間,把這幾個人拉進去",它真的會打開飛書,一步一步操作。
這解決了一個很現實的問題:很多軟件沒有 API,也沒有接入 MCP,Agent 沒法從後台連接它們。
但只要它有界面,OpenClaw 就能操作。
它還有心跳機制。
跟前面說的 Soul 和 user .md 文件一個體系,有一個 `HEARTBEAT.md` 的文件,裏面寫着定時任務。
系統後台有一個守護進程,每隔一段時間"戳"一下 Agent,Agent 醒來讀一遍 HEARTBEAT.md,看看有沒有該乾的活。有就幹,沒有就繼續睡。
你可以讓它每天早上 9 點檢查郵箱發摘要,每隔一小時看一眼監控頁面。
更極客的是,你在聊天裏說"一小時後提醒我開會",Agent 會自己給自己設一個鬧鐘。
從"你主動找 Agent 幫忙"變成了"Agent 主動替你盯着"。

車可能是第一個 Agent 的物理載體
很多人覺得 AI 進入物理世界還早,因為人形機器人還不行。
但大家忽略了一個已經大規模部署的東西:車。
電車就是一個有輪子的大號機器人。
電池大、續航足、充電樁到處都是、道路修了一百多年、傳感器成熟、自動駕駛已經在好幾個城市跑了。
自動駕駛加上 Agent:你說"我想吃那家店的牛肉麪",Agent 下單、規劃路線、指揮車去取。
取快遞、接孩子、去超市拿貨,都是同一個邏輯。
不用等人形機器人。車會先把 Agent 帶進物理世界。

多模態:Agent 能看能畫能拍了
以前的圖像和視頻模型不太理解你在說什麼,你得反覆調提示詞才能得到勉強能用的結果。
現在的模型不一樣了。
Google 的 Nano Banana Pro 基於 Gemini 3 Pro 的推理能力,能理解複雜的自然語言描述,還能連搜索引擎查真實信息來生成圖表。
字節的 Seedance 2.0 支持文字、圖片、音頻、視頻四種輸入混着來,能自己規劃鏡頭語言,給它一個分鏡腳本加幾張參考圖,它能直接"拍"出視頻。
這些模型可以通過 API 或者 Skills 接進 Agent 體系。
Agent 團隊裏可以有寫代碼的、做設計的、剪視頻的,各幹各的。

這一層帶來了什麼變化
以前你問 AI"幫我查數據庫、做個圖表、發到 Slack",它會告訴你怎麼做,但你得自己去操作。
現在 Agent 直接連數據庫查數據、生成圖表、通過 Slack 接口發出去。
一條指令,全鏈路自動完成。
它不再是一個每次見面都失憶的工具。知道你是誰,記得你的偏好,下次對話接着上次來。
你跟它之間開始有了持續的工作關係,而不是一次性的問答。
一個人加上 Agent,能覆蓋的職能範圍從"程序員"擴展到程序員、設計師、運維、數據分析、視頻製作。
第三層:能組隊了
前面兩層說的都是單個 Agent 的能力。但 2025 年有一個很現實的瓶頸:
你同時只能跟一個 Agent 對話,做完一件事再做下一件。
Agent 再強,你的管理帶寬就那麼大,你是整個系統的瓶頸。
2026 年這個限制被打破了。
AI 從"一個人幹活"變成了"一羣人協作"。這就是 Multi-Agent(多智能體)體系。
SubAgent:先學會分身
在組隊之前,Agent 先學會了一件事:分身。
名詞解釋:SubAgent(子智能體) 主 Agent 在執行任務的過程中,可以臨時創建一個專門的子 Agent 去處理某個具體的子任務。子 Agent 幹完活之後,把結果壓縮成一份簡短的摘要交回來,然後就消失了。主 Agent 不需要知道子 Agent 具體怎麼幹的,只需要拿到結果。
舉個例子。你讓 Agent 幫你調研一個技術方案。A
gent 需要去翻好幾個代碼倉庫、讀一堆文檔。
如果它自己幹,所有搜索過程、中間結果都會塞進它的上下文窗口裏,很快就會把"記憶"撐滿,後面的思考質量就下降了。
有了 SubAgent,主 Agent 會派出幾個子 Agent 分別去翻不同的倉庫。
每個子 Agent 可能消耗了幾萬個 token 去搜索和閲讀,但最後只交回來一兩千 token 的精華摘要。
主 Agent 的上下文保持乾淨,思考質量不受影響。
Anthropic 內部的說法是:搜索的本質是壓縮。SubAgent 就是在幫主 Agent 做壓縮。
而且 SubAgent 很省錢。探索類的子任務會被自動分配給更便宜、更快的小模型(比如 Claude Haiku),而且只給只讀權限,不會誤操作你的文件。

Agent Teams:從分身到組隊
SubAgent 解決了"一個 Agent 怎麼高效處理複雜任務"的問題。
但它本質上還是一個 Agent 在指揮,子 Agent 幹完就走,彼此之間不溝通。
Agent Teams 更進一步:多個 Agent 同時存在、各自獨立工作、還能互相協調。
Anthropic 做了一個功能叫 Agent Teams,讓一個主 Agent(Team Lead)可以創建和管理多個持續存在的團隊成員(Teammate)。每個成員有自己的專長、工具集和獨立的上下文窗口,在各自的空間裏並行工作,互不干擾。
你跟主 Agent 說"幫我做一個電商網站",它會自己拆任務:一個成員寫後端接口,一個做前端頁面,一個寫數據庫,一個跑測試。卡住了向主 Agent 彙報,主 Agent 來協調。
你是老闆,主 Agent 是項目經理,團隊成員是各個崗位的員工。你只需要跟項目經理溝通。
這套東西有多強?Anthropic 安全團隊做過一個壓力測試:16 個 Claude Opus 4.6 實例組成一個 Agent Team,在沒有人類干預的情況下,從零開始用 Rust 寫了一個能編譯 Linux 內核的 C 語言編譯器。花了大約 2 萬美元,跑了將近 2000 個會話週期,產出了 10 萬行代碼。
16 個 Agent 同時寫代碼,怎麼不打架?
它們用了一個很聰明的辦法:通過 Git 的文件鎖機制來"認領"任務。每個 Agent 在開始幹活之前,先在代碼倉庫裏放一個鎖文件,聲明"這塊我來"。
Git 天然的防衝突機制保證了不會有兩個 Agent 同時改同一個文件。幹完了自己提交代碼、解鎖、去認領下一個任務。

不只是 Anthropic 在做
Multi-Agent 不是 Anthropic 一家的事。
Google 聯合 50 多家企業推出了 A2A(Agent-to-Agent)協議,讓不同廠商的 Agent 之間也能互相溝通和協作。
這意味着你的 Claude Agent 可以跟別人的 GPT Agent 協同工作,不再侷限在一個生態裏。
加上之前說的 MCP(Agent 連接工具和數據)和 A2A(Agent 之間互相通信),整個 Agent 世界的"基礎設施"正在快速成型。

Git Worktree:同時試多條路
名詞解釋:Git Worktree Git 是程序員管理代碼版本的工具。Worktree 可以從同一個代碼起點創建多個獨立的工作空間,互不干擾。你可以理解為"平行宇宙"——同一個項目同時朝不同方向發展,最後選最好的那個。
這個功能跟 Agent Teams 配合起來很厲害。
比如你要重構一個系統的用戶模塊,但不確定哪種方案最好。
以前你只能先試方案 A,不行再試 B,再不行試 C,串行試錯,可能花一兩週。
現在你可以用 Git Worktree 創建三個獨立的工作空間,每個空間裏放一個 Agent Team,分別按方案 A、B、C 同時開發。
三條路同時走,各自獨立測試,最後比較結果選最好的。時間是以前的三分之一,但探索的可能性是以前的三倍。
某種程度上,你在用並行計算的方式來做決策。

主動工作
前面說的 OpenClaw 已經提到了定時機制。在組織層面,這個能力的意義更大。
Agent 可以被設成"值班模式":每隔一段時間自動檢查代碼倉庫有沒有新的 issue、線上服務有沒有報錯、數據指標有沒有異常。發現問題它會先嚐試自己修,修不了的才通知你。
你晚上 12 點睡覺,Agent 還在跑。早上起來,你收到一份報告:"昨晚線上有個接口報錯,我查了一下是參數格式的問題,已經修好了,測試通過。另外有一個新 issue 需要你看一下,我不確定該怎麼處理。"
這跟以前的"自動化腳本"不一樣。自動化腳本只能處理你預設好的情況,碰到沒見過的問題就卡住。Agent 有判斷力,能處理意料之外的情況。

這一層帶來了什麼變化
一個人的產出變成了一個團隊的產出。
而且這個團隊有幾個特點是人類團隊做不到的:全年無休、不用開會對齊、不會理解偏差、可以同時探索多條路徑、你睡覺的時候還在幹活。
回想一下第一層說的 METR 數據:AI 能獨立完成的任務時長每幾個月翻一倍。
當這個時長從"幾小時"變成"幾天"甚至"幾周"的時候,Agent Teams 加上主動工作機制意味着什麼?
你出去度個假回來,一個產品的原型可能已經做好了。

第四層:會進化了
前面三層說的是 Agent 現在能幹什麼。但有一個問題:Agent 能不能越用越強?
之前的答案是不能。
Skills 是人寫的,寫完就固定了。
每次任務結束,Agent 積累的經驗就沒了。
一個 Agent 踩過的坑,另一個 Agent 還得再踩一遍。
EvoMap 和 GEP 協議在解決這個問題。
名詞解釋:GEP(基因組進化協議) 一套開放協議,讓 Agent 的經驗可以被保存和傳遞。借鑑了生物學裏基因表達的思路:Agent 做成了一件事,這個成功的做法會被打包成"基因膠囊",其他 Agent 可以直接繼承,不用自己再摸索一遍。
打個比方:Skills 像公司發的員工手冊,寫好了就不變,除非有人去更新。
GEP Gene 像員工在工作中攢下的經驗,會隨着使用不斷調整,碰到問題能自我修復,長期沒用的會自動淘汰。
一個真實的案例:有個遊戲策劃在用 AI 構建世界觀的時候,給 AI 設了一個很強的角色人設,結果 AI 生成的所有名詞都很獨特,天然避開了命名衝突。
這個"命名隔離策略"被打包成了基因膠囊。
後來一個後端工程師的 Agent 在搜索"怎麼解決變量命名衝突"的時候,匹配到了這個來自遊戲領域的膠囊,繼承了底層邏輯,一次就把編譯問題修好了。
解決方案來自一個完全不相關的領域。
GEP 是協議,不是平台。平台可以被收購、被關掉(OpenClaw 被 OpenAI 收購就是個例子),但協議是開放的,誰都可以實現。你的 Agent 攢下的經驗屬於你。

這一層帶來了什麼變化
以前 100 家公司各自訓練 Agent 解決同一個問題,總成本上萬美元。
現在一個 Agent 解決了,其他 99 個花幾美分繼承經驗。Agent 用得越多,整個網絡就越強。
四層疊在一起
單看每一層都是明顯的進步。但四層疊在一起,效果是乘出來的:
- 第一層:每個 Agent 的產出質量接近人類專家
- 第二層:每個 Agent 能用的工具和能力覆蓋好幾個職能
- 第三層:多個這樣的 Agent 同時幹活,全天候運轉
- 第四層:所有 Agent 的經驗可以沉澱、傳遞、進化
2025 年,你有一個聰明的對話夥伴,但它困在文本框裏。你問一句它答一句,剩下的事你自己幹。
2026 年初,你有一個團隊。你描述你想要什麼,剩下的事它們去幹。
寫代碼、做設計、跑測試、剪視頻、操作手機應用,甚至能通過車去物理世界辦事。
它們同時探索多條路,自己判斷質量,你睡覺的時候還在幹,而且經驗會不斷積累。

我一週做出大廠一個月的產品,不是因為我比他們聰明。
是因為這四層槓桿疊在一起:
模型夠強所以質量不打折,工具夠多所以不用找設計師和運維,組織夠好所以多條線同時推進不用開站會,經驗能傳承所以不用從零開始。
還有哪些問題沒解決
管 Agent 這件事本身就很難
5 個 Agent 同時跑,你就有 5 份結果要驗收。
每份涉及不同領域,你得在代碼、設計、文案之間來回切換。
Token 消耗也容易失控。
Agent 可能在一個方向上探索半天,最後發現走不通。你不盯着就浪費錢,盯着就變成全職監工,自己什麼都幹不了。
GitHub 前 CEO Thomas Dohmke 離職創辦了一家叫 Entire 的公司,就在做這件事:把代碼、意圖、推理過程統一到一個版本控制系統裏,讓你能追蹤每個 Agent 幹了什麼、為什麼這麼幹。
管 Agent 的工具本身就是一個很大的產品方向。
安全和信任
Agent 能操作你的電腦、讀你的文件、替你發消息、替你部署代碼。
權限越來越大,但什麼操作需要你確認、什麼可以自動執行,這條線怎麼畫,整個行業還沒想清楚。
Agent 的經濟身份
Agent 能替你花錢(消耗 Token、調用付費 API),也能替你賺錢(接懸賞任務、貢獻基因膠囊獲得積分)。
但它沒有銀行賬户,沒有身份認證。誰為它的行為負責?收益歸誰?Agent 之間怎麼結算?
這些基礎設施還不存在。

這些變化落到現實裏會怎樣
公司會變小
以前做一個產品的標準配置:產品經理、設計師、前端、後端、測試、運維、項目經理。
一個功能從想法到上線,六七個角色,無數次會議。
現在一個人加 Agent 就能把這些活都幹了。Agent 之間不用開會,不會理解偏差,不會請假。
OpenClaw 就是個例子。一個人的週末項目,3 個月拿了 20 萬 GitHub Star,然後被 OpenAI 收購。
你養 50 人團隊,對手 3 個人加一堆 Agent,成本是你的十分之一,速度是你的五倍。這個賬很好算。
教育跟不上了
你花四年學的技能,畢業前可能就被 Agent 學會了。
AI 能力每 4 到 7 個月翻一倍,2026 年入學的大學生到 2030 年畢業時,AI 的能力可能翻了 8 到 16 倍。
更麻煩的是,現在的教育訓練的是"執行能力":
學一門技術、掌握一套方法、按規範完成任務。
但 Agent 時代需要的是"判斷能力":
什麼問題值得解決、哪個方案更好、不確定的時候怎麼決策。
這兩種能力的培養方式完全不同,現在的教育體系幾乎只圍繞前者設計。
中間層最難受
頂層的人有資源、有判斷力,會拿到最大的槓桿。
底層做體力活的人,短期內反而相對安全,因為 Agent 還沒有身體(雖然車正在改變這一點)。
最難受的是中間層。
大廠白領、中層管理、普通知識工作者。工作最容易被替代,但認知和技能又不夠快速轉型成"Agent 指揮官"。
Amodei 在他的文章裏專門聊了這個。
他說以前的技術革命,被替代的人可以轉行到相鄰領域,農民去工廠,工人去辦公室。
但 AI 在所有認知領域同時進步,你轉行去學的新東西,AI 也在同步變強。
內容會重新洗牌
以前做內容是手藝活,寫文章、做視頻、做設計,每樣都需要專業技能和大量時間。
現在 Agent 能寫文章,Nano Banana Pro 能做設計,Seedance 2.0 能拍視頻。內容的生產成本在快速下降。
當所有人都能用 Agent 生產內容的時候,"能做"就不值錢了。值錢的是知道該做什麼。
品味、判斷力、獨特的視角,這些東西 Agent 暫時還給不了你。
如果你的價值是"能寫能拍能設計",壓力會很大。
如果你的價值是"知道什麼值得寫、值得拍、值得設計",Agent 反而給了你槓桿,你的一個想法可以被快速變成成品。
國家之間的牌也會重新洗
知識經濟時代,人口素質決定國力。Agent 時代,能源效率決定國力。
有廉價能源就有廉價算力,有廉價算力就有廉價智能。以前發展中國家靠廉價勞動力參與全球分工,現在 Agent 比人工更便宜、更快、質量更穩定。這個比較優勢可能會很快消失。

你可以做什麼
用起來,用最好的:
花 20 甚至 200 美金訂閲 Claude Code 或 ChatGPT 的付費版。
免費版比付費版落後很多,拿免費版來判斷 AI 的水平,就像拿翻蓋手機評價智能手機。
不要只拿它聊天。把它塞進你的實際工作裏:
做運營的丟數據給它找規律,做內容的讓它幫你調研和起草,做產品的讓它寫需求文檔和競品分析。從你每天花時間最多的那件事開始試。
如果一個模型今天在某件事上表現出了一點苗頭,下一代就會真正擅長。進步是指數級的。
理解 Agent 體系,不只是"用 AI"。 "用 ChatGPT"和"用 Agent 體系"是兩回事。
前者是問答,後者是讓 AI 替你幹活。
試着瞭解 Claude Code 和 Openclaw 怎麼工作的:
MCP 和 Skills 是什麼,CLAUDE.md 和 SOUL.md 這套本地文檔體系意味着什麼。
你不用成為開發者,但你得理解這套東西的邏輯。
就像你不用會寫代碼,但你得理解互聯網怎麼運作,才能在互聯網時代做好工作。
想清楚你的價值在哪:
Amodei 說得很直接:AI 不是替代某一種技能,它在所有認知方向上同時進步。
以前的技術革命是窄的,AI 是寬的。
你的價值得往上遷移。從"親自執行"到"定義問題和判斷質量",從"我能做什麼"到"我能讓 Agent 做什麼"。
Agent 能把想法變成現實,但它自己不會產生想法。
別等了:
很多人在等,等 AI 更成熟、等有人教、等公司安排培訓。
但這個領域幾個月就變一次。你等的每一天,差距都在拉大。
Amodei 說過,速度本身不意味着勞動力市場不會恢復,但短期的過渡會很痛苦。
你沒法改變技術進步的速度,但你可以選擇自己站在哪一邊。
你願意在 AI 上投入多少 Token,直接影響你的產出質量。
用頂級模型和用免費模型的人,一年後的差距會很大。
最後
Amodei 把我們這個階段比作技術的"青春期"。我覺得這個比喻挺準的。
青春期的特點就是變化快、能量大、方向不確定,而且不管你準備好了沒有,它都會來。
我能做的就是把我看到的東西儘量拆清楚。
你看完之後覺得有道理,就開始動手試試。
覺得跟你沒關係,那也行,至少你知道了。
如果你身邊有人應該瞭解這些變化但還不知道,把這篇轉給他們。
大多數人不會主動去了解這些東西,但他們值得有機會提前準備。

引用:
隆重推出 Nano Banana Pro:https://blog.google/intl/zh-tw/products/explore-get-answers/nano-banana-pro/
Automate workflows with hooks:https://code.claude.com/docs/zh-CN/hooks-guide
Connect Claude Code to tools via MCP:https://code.claude.com/docs/zh-CN/mcp
Extend Claude with skills:https://code.claude.com/docs/zh-CN/skills
Orchestrate teams of Claude Code sessions:https://code.claude.com/docs/zh-CN/agent-teams
The Adolescence of Technology:https://www.darioamodei.com/essay/the-adolescence-of-technology
Claude Opus 4.6 隆重登場:https://www.anthropic.com/news/claude-opus-4-6
GPT‑5.3‑Codex 正式登場:https://openai.com/zh-Hans-CN/index/introducing-gpt-5-3-codex/
我們,已邁過奇點:https://mp.weixin.qq.com/s/aSLr9hWAlIJ-KhsVmSHqUA?scene=1
Something Big Is Happening-大事將至:https://x.com/mattshumer_/status/2021256989876109403
互聯網已死,Agent 永生:https://mp.weixin.qq.com/s/cX3bYrI9Sq7sOJj0E6V9IQ
Openclaw:https://docs.openclaw.ai/zh-CN
Agent 原生通訊協議:從傳遞代碼,到傳遞認知:https://mp.weixin.qq.com/s/6ppTHXXdmKWI18uB_ysf3w
EvoMap 誕生記:從平台依賴到進化協議:https://evomap.ai/blog/evomap-origin-story