AI時代最扎心的一句話:你可以外包思考,但無法外包理解

作者:有限進步Seven
日期:2026年5月3日 上午10:42
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Andrej Karpathy 指出,AI 已從輔助工具變成自主代理,但人類嘅理解力仍是對 AI 嘅最終控制權。

整理版摘要

呢篇文章係 Andrej Karpathy——OpenAI 聯合創始人、Tesla Autopilot 負責人——喺 Sequoia AI Ascent 2026 大會上嘅演講內容。佢分享咗自己點樣喺 2024 年 12 月開始真正體驗到 AI 嘅飛躍,從嗰陣起佢就好少再需要糾正 AI 寫嘅代碼,從此進入咗「vibe coding」嘅狀態。Karpathy 想解決嘅問題係:好多人仲用緊 2023 年嘅心態去用 AI,當佢係搜索引擎或者自動補全工具,但其實 AI 已經變到可以自主完成複雜任務,甚至令到一啲舊範式嘅 app 變得唔需要存在。

整體結論係:AI 嘅智能係「鋸齒狀」嘅——喺編程、數學呢啲可驗證領域飛快進步,但喺常識推理等地方仍然會犯低級錯誤。所以,人類需要保持「理解力」去控制 agent,而唔係依賴記憶 API 細節。你可以外包思考,但無法外包理解。

Karpathy 用自己嘅 MenuGen app 做例子:佢原本用傳統方式做咗一個 app,但後嚟發現新範式下直接用 GeminiNanabanana 就搞掂,中間唔需要 app、API 調用或部署。呢個頓悟令佢明白,好多舊做法喺新範式下係多餘嘅,而你唯一要留住嘅係對件事嘅理解。

  • AI 編程進入 Software 3.0 時代,人類嘅角色從寫代碼變成俾指示,本質係「複製貼上文字俾 agent」。
  • Vibe coding 拉高地版,令非程序員都可以創造軟件;Agentic engineering 保住天花板,需要專業技能確保質量同安全。
  • AI 能力唔平均,喺 Reinforcement Learning 迴路上嘅任務(如編碼、數學)表現極好,但喺常識推理(如行路定揸車去洗車)會翻車。
  • 理解比記憶更重要:你唔需要記住 API 細節,但必須理解底層概念,先可以判斷 agent 嘅輸出係咪正確。
  • 行動建議:重新審視 AI 使用範式,思考「有咩以前唔可能嘅事而家變可能」,而唔係只諗「快咗幾多」。
值得記低
連結 youtube.com

Andrej Karpathy 演講影片

AI Ascent 2026 大會上完整演講,探討 vibe coding 同 agentic engineering

整理重點

Karpathy 嘅醒悟:Vibe Coding 誕生嘅分界點

Karpathy 話,2024年12月係佢一個清晰嘅分界點。當時佢休假,多咗時間深度用 Claude CodeCursor 呢啲 agentic 工具。以前 AI 寫代碼佢要改,但忽然有一日佢發現——佢已經唔記得上次糾正 AI 係幾時。

代碼出嚟就啱,繼續要繼續啱,佢開始信任呢個系統,然後就 vibe coding 咗。

整理重點

Software 3.0:編程本質變成「複製貼上文字俾 agent」

Karpathy 將軟件演進分三代Software 1.0 係程序員寫詳細代碼;Software 2.0 係機器學習,由數據訓練;Software 3.0 就係而家呢個時代——LLM 本身就係一台可編程嘅計算機,你嘅「代碼」變咗 prompt,context window 就係操控嘅槓桿。

你嘅「代碼」變咗 prompt,context window 就係操控嘅槓桿

佢舉咗個例子OpenClaw 嘅安裝方式。以前係一個 shell 腳本處理兼容性問題;而家只係俾一段文字畀 AI agent,agent 會自己觀察環境、處理報錯、調試,最終安裝成功。

整理重點

鋸齒狀智能:AI 飛嘅地方同掙扎嘅地方

Karpathy 將呢個現象叫做「jagged intelligence」。舉例:同一模型可以重構十萬行代碼庫,但會話「行路去洗車」因為距離近,唔識得你要揸車去洗車。

AI 能力極其不成比例地集中在某些領域,呢個就係鋸齒狀嘅智能

原因係 RL 訓練依賴明確獎勵信號,代碼同數學呢類可驗證領域自然適合,但常識推理唔喺訓練軌道上。用佢嘅話講:如果你喺模型嘅 RL 迴路上,你飛;如果你唔喺,你掙扎。

整理重點

理解力:你對 agents 嘅最終控制權

Karpathy 引述一句 tweet:「You can outsource your thinking, but you can't outsource your understanding.」佢用自己 MenuGen app 做例子:agent 寫咗用 email 匹配 Google 同 Stripe 賬號嘅代碼,但呢個設計有問題,因為用戶可以用唔同 email 註冊。

你可以外包思考,但無法外包理解

呢種設計錯誤係 agent 嘅問題,但發現呢個問題係人嘅責任。你唔需要記住 API 細節,但必須理解底層概念,例如 tensor、view、storage,知道咩操作會產生 memory copy。

Karpathy 最後提醒:而家最頂尖嘅工程師都感覺到自己落後,因為變化速度太快。你要重新審視 AI 使用範式,唔好只諗「快咗幾多」,而係諗「有咩以前唔可能嘅事而家變可能」。

去年,有個人發明了一個詞,讓整個程序員圈子既興奮又不安。

這個詞叫 「vibe coding」

他叫 Andrej Karpathy——OpenAI 聯合創始人、Tesla Autopilot 負責人、現 Eureka Labs 創始人。

上個月,他在 Sequoia 的 AI Ascent 2026 大會上說了一句話,我讀完之後愣了很久:

「"我從沒有像現在這樣感覺自己在編程方面如此落後。"」

這是 Andrej Karpathy 說的。

這是那個幫人類造出了現代 AI、又親手把它講給全世界聽的人說的。

如果連他都說落後了,那我們大多數人算什麼?

那個改變一切的"分界點"

Karpathy 說,2024年12月,是他的一個清晰分界點。

那段時間他在休假,比平時多了一些時間,就開始更深度地使用各種 agentic 工具——Claude Code、Cursor 這些。

以前,AI 寫一段代碼出來,他還得改一改,調一調,有時候甚至需要大幅返工。他已經習慣了這個節奏,把它當成"有幫助的助手"。

然後有一天,他發現——

「他已經不記得上一次糾正 AI 是什麼時候了。」

代碼塊出來,對的。再要一段,還是對的。繼續要,繼續對。他開始越來越信任這個系統,越來越少插手,然後……他就 vibe coding 了。

他說這個轉變非常突然,非常清晰。

很多人還在把 AI 當成"升級版搜索引擎"或者"自動補全工具"。但 Karpathy 想對這些人說:「你們需要重新看一眼了,因為這東西已經變了。」

Software 3.0:你的競爭對手不是 AI,是用 AI 的人

為了理解 Karpathy 在說什麼,你需要先接受一個框架。

他把軟件的演進分成三代:

  • 「Software 1.0」:程序員寫代碼,明確告訴計算機每一步怎麼做
  • 「Software 2.0」:機器學習,程序員不寫邏輯,而是整理數據、設計訓練目標,讓神經網絡自己學
  • 「Software 3.0」:現在這個時代——LLM 本身就是一台可編程的計算機,你的"代碼"變成了 prompt,context window 就是你操控這台解釋器的槓桿

這不是說軟件變快了。這是說「編程這件事本身變了」

他舉了一個例子:OpenClaw 的安裝方式。

以前你安裝一個軟件,會得到一個 shell 腳本——幾百行代碼,處理各種平台兼容性問題。這是 Software 1.0 的思維:把每個細節都寫出來。

現在,OpenClaw 的安裝方式是:「給你一段文字,複製粘貼給你的 AI agent。」

agent 有自己的智能,它會觀察你的環境、處理報錯、自己調試,最終讓安裝成功。你不需要也不應該去操心每個步驟。

「"現在編程的本質問題變成了:我應該把什麼文字複製粘貼給我的 agent?"」

這不是效率提升。這是範式轉移。

一道菜單,讓他徹底醒悟

Karpathy 分享了一個讓他"腦子炸了"的個人經歷。

他有個小項目叫 「MenuGen」——去餐廳的時候,菜單上30%甚至50%的菜他不知道是什麼。所以他想做一個 app,拍下菜單照片,自動給每道菜配上圖片。

他 vibe coded 出來了這個 app:OCR 識別菜名、調用圖片生成 API、在 Vercel 上部署……一套完整的工程流程。

然後有一天,他看到了 Software 3.0 的解法——

「直接把菜單照片扔給 Gemini,讓它用 Nanabanana 把菜的圖片疊加到原始照片上。」

輸入是一張圖,輸出是一張疊加了所有菜品圖片的圖。「中間沒有 app,沒有 API 調用,沒有部署,什麼都沒有。」

Karpathy 的原話是:

"This blew my mind because actually all of my MenuGen is spurious. It's working in the old paradigm. That app shouldn't exist."

「那個 app 不應該存在。」

他花時間建起來的東西,在新的範式裏,是多餘的。

這個頓悟不是悲劇,而是一種解放——如果你理解了新範式,你就能做出以前根本不可能做出的東西。

"鋸齒狀的智能":為什麼 Claude 能重構十萬行代碼,卻告訴你走路去洗車

這是整場演講裏我覺得最深刻的部分。

AI 是不均勻的。不是說它有時候好有時候差,而是它的能力「極其不成比例地集中在某些領域」

Karpathy 把這叫做 「jagged intelligence(鋸齒狀的智能)」

他舉了一個例子:你距離洗車店只有50米,我應該開車去還是走路去?

「當下最先進的模型會告訴你走路,因為很近。」

但去洗車店的目的是洗車,你當然要開車去。

同一個模型,可以重構十萬行代碼庫,可以發現零日漏洞,但會在這道小學生邏輯題上翻車。

為什麼?

Karpathy 的解釋是:「這些模型是被驗證(verifiability)塑造的。」

現在的 frontier LLM 訓練,大量依賴 Reinforcement Learning。RL 需要有明確的獎勵信號——正確答案是什麼,你才能給獎勵。

代碼可以運行,數學可以驗證,這些領域天然適合 RL。所以模型在這裏飛。

但"走路還是開車去洗車"這個問題,涉及的是常識推理和物理世界理解——它不在 RL 的訓練軌道上,所以模型在這裏卡。

「用他的話說:如果你在模型的 RL 迴路上,你飛;如果你不在,你掙扎。」

這對所有在用 AI 的人都是一個重要提醒:「你必須瞭解這個工具,包括它的邊界。」 盲目信任是危險的。

Vibe Coding vs Agentic Engineering:你在哪一層?

Karpathy 對這兩個詞做了非常清晰的區分:

「Vibe coding 是拉高地板。」 它讓每個人都能做到以前做不到的事,這很好,很了不起,讓非程序員也能創造軟件。

「Agentic engineering 是保住天花板。」 你仍然要對代碼負責。不能因為 AI 寫的就可以有安全漏洞。專業軟件的質量標準沒有因為 AI 而降低——但你能不能用 AI 跑得更快?

答案是可以,但這需要技能。

他說以前大家說"10x 工程師",意思是頂尖工程師的產出是普通工程師的10倍。

「Agentic engineering 的加速倍數遠不止10x。」

而區分高手和普通人的,不是誰用了 Claude Code,而是怎麼用。

他描述了理想的招聘測試:給我做一個 Twitter clone,讓它真的好用,真的安全,然後我用10個 AI agent 來試圖攻破你的網站——它們應該攻不進去。

「看你怎麼構建大項目,怎麼協調 agent,怎麼保證質量。這才是真正的 agentic engineering 能力。」

越自動化,越需要這一樣東西

到演講的最後,Karpathy 被問了一個很多人都在問的問題:

「當 AI 越來越便宜,智能越來越廉價,還有什麼東西是值得深度學習的?」

他說他最近看到一條 tweet,讓他反覆思考:

"You can outsource your thinking, but you can't outsource your understanding."

你可以外包你的思考,但無法外包你的理解。

他還是需要知道——我們在構建什麼?為什麼值得做?我怎麼指揮我的 agents?

「如果你不理解,你就沒辦法判斷 agent 做的是對是錯。」

他舉了一個自己踩過的坑:MenuGen 裏,用戶可以用 Google 賬號登錄,但用 Stripe 賬號付款。這兩個賬號的郵件地址可能不一樣。他的 agent 寫了一套代碼,試圖用郵件地址來匹配兩個賬號——這根本行不通,用戶完全可以用不同郵件註冊 Google 和 Stripe。

「這種設計錯誤,是 agent 的問題,但發現這個問題,是人的責任。」

你不需要記住 PyTorch 裏 keepdim 還是 keep_dims,這些 API 細節 agent 記得比你好。

但你需要知道底層有 tensor,有 view,有 storage,知道什麼操作會產生內存拷貝,什麼不會。「你需要理解,不需要記憶。」

這是 AI 暫時還無法替代你的地方。

不是因為 AI 不行——Karpathy 說得很直接,這不是什麼原理性的限制,只是"labs haven't done it yet"。

但在那一天到來之前,「理解力是你對 agents 的最終控制權。」

你現在站在哪裏?

2024年的年底,一個行業裏最頂尖的工程師,感覺到了自己的落後。

不是因為他不夠聰明,而是因為他真的看見了變化的速度。

很多人在用 AI,但用的是2023年的心智模型——把它當搜索引擎,當代碼補全,當更快的 Google。

Karpathy 說,你需要重新看一眼。

「不要只想着"這件事變快了",要想"有什麼以前不可能的事情,現在變可能了"。」

那個 app 也許不應該存在。

但那個理解,必須在你這裏。


視頻連結:https://www.youtube.com/watch?v=96jN2OCOfLs