工具會過時,框架不會

作者:沐風
日期:2026年4月30日 上午5:15
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

學AI工具背後的迭代框架,比追逐具體工具更長遠。

整理版摘要

呢篇文章出自WeChat,作者係一位經常使用AI工具嘅開發者。佢發現AI工具迭代得極快,兩年前嘅提示詞技巧已經有一半唔適用,去年必學嘅工具今年已有更好替代。佢想提出一個核心問題:與其不斷追新工具,不如學識背後嘅框架。

作者用Karpathy開源嘅autoresearch項目做例子——630行Python代碼,核心邏輯只係「改一個嘢→打分→分高保留,分低迴滾」。佢指出呢個循環唔係ML專利,而係通用迭代框架,套落廣告文案、產品定價、內容生成都得。然後佢分享自己用Claude Code半年嘅經驗,話真正沉澱落嚟嘅係三種能力:將模糊需求拆成AI可執行步驟、設計最小版本逐步迭代、將「感覺唔對」轉化為可檢查嘅標準。呢啲能力換咗任何工具都適用。

最後佢區分兩種人:無框架嘅人見到新工具就學操作,下一個工具出咗再重學;有框架嘅人見到新工具會問「呢個可以點樣幫我改→打分→迭代」,然後嵌落自己嘅框架入面。學工具係戰術,學框架係戰略。真正值錢嘅係個框架,因為它唔會過時。

  • AI工具迭代極快,學框架比學工具更長遠。
  • Karpathy嘅autoresearch揭示咗一個通用迭代框架:改→打分→保留/回滾,適用於任何可打分嘅任務。
  • Claude Code真正學到嘅係拆解問題、設計迭代、驗證假設嘅能力,而非具體快捷鍵。
  • 有框架嘅人會將新工具嵌入已有迭代流程,無框架嘅人則不斷追新工具。
  • 行動建議:下次見到新AI工具,先問「佢背後嘅框架係咩?點樣幫我迭代?
整理重點

工具會過時,框架唔會

你而家學嘅AI工具,出年可能就廢咗。呢個唔係嚇你,係正在發生嘅事。兩年前大家瘋狂學嘅提示詞技巧,有一半已經唔適用。去年覺得一定要掌握嘅某個AI工具,今日已經有三個更好嘅替代品。學AI工具嘅速度,永遠追唔上佢迭代嘅速度。

工具會過時,框架唔會

但有一件事唔會過時:理解背後嘅框架。

整理重點

Karpathy嘅autoresearch:一個通用迭代框架

最近Karpathy開源咗一個叫autoresearch嘅項目,630行Python代碼,MIT協議,短短幾日衝到五萬star。多數人睇完覺得「呢個係ML工具,同我無關」,然後關咗。呢個係一個典型誤解。

autoresearch核心邏輯:改一個嘢 → 打分 → 分高保留,分低迴滾 → 再改下一個

Karpathy用呢個循環優化AI模型訓練代碼。但將「訓練代碼」換成廣告文案、冷啓動郵件、產品定價策略、內容生成規則,呢套邏輯一字不差地成立。呢個唔係ML工具,而係一個通用嘅迭代框架。

任何你能打分的東西,都能套進去自動優化

Karpathy真正貢獻嘅,唔係630行代碼,而係一個任何人都能拿走嘅方法論。

整理重點

框架 vs 工具:一個真實案例

有人睇完autoresearch之後,無用一行代碼,只係借咗嗰個「打分→改→再打分」嘅框架,用嚟做內容生成嘅評審。佢設計咗雙層打分:第一層按規則逐條核查,每條要過唔過;第二層切換成讀者視角,憑感受打分。兩層結合,再決定內容直接通過、定向重寫定係推倒重來。

結果:有框架同無框架嘅差距,從第一輪33%擴大到第二輪62%

佢無用Karpathy任何代碼,佢用嘅係嗰個框架。呢個就係工具同框架嘅分別:工具係載體,框架係內核。工具會被迭代掉,框架唔會。

整理重點

從Claude Code學到嘅三件事

用咗Claude Code開發大約半年,最早以為學嘅係快捷鍵、prompt技巧、某個slash command點用。呢啲確實有用,但版本一更新就失效。真正沉澱落嚟嘅係呢啲:

  1. 1 拆解問題:將一個模糊需求拆成AI能夠執行嘅步驟。呢個唔係Claude Code技巧,係分解問題嘅能力,換任何工具都用得上。
  2. 2 設計迭代:先跑一個最小版本,驗證方向,再逐步擴展,而唔係一開始就想覆蓋所有情況。呢個同autoresearch嘅邏輯一致。
  3. 3 驗證假設:AI生成咗嘢,點判斷佢係啱嘅?將「感覺唔對」翻譯成可以檢查嘅標準。呢步最難,亦最值錢。

呢三件事——分解問題、設計迭代、驗證假設——放到任何AI工具裡都成立

就算Claude Code被替代咗,呢套思路仲喺度。

整理重點

兩種人:追工具 vs 用框架

無框架嘅人見到一個新AI工具,第一個反應係「呢個可以用嚟做乜」,然後花時間學界面、學操作,等嚇一個工具出咗再重學。有框架嘅人見到新工具,第一個反應係「佢喺邊個環節可以幫我改→打分→迭代」,然後將工具嵌入已有框架,加速某個步驟。

前者永遠在追工具,後者永遠在用工具

呢個唔係天賦差距,係思維習慣嘅差距。Karpathy開源autoresearch嗰日,多數人見到一個ML項目。但有一類人見到:哦,呢個循環我可以套落我嘅業務,打分標準我嚟定,執行交俾AI。

同一件事,完全唔同嘅映射方式

下次見到一個新AI工具,試嚇問自己:佢背後解決嘅係咩問題?用嘅係咩框架?諗清楚呢個問題,工具過時咗都無關係——框架仲喺度,換個工具繼續行。

圖片

你而家學嘅 AI 工具,出年可能就廢咗喇。

呢個唔係嚇你。呢啲係真係發生緊嘅事。兩年前大家狂學嘅提示詞技巧,有一半已經唔適用喇。舊年覺得一定要掌握嘅某個 AI 工具,今日已經有三個更好嘅替代品。

學 AI 工具嘅速度,永遠追唔上佢迭代嘅速度。

但有一件事唔會過時。


autoresearch:630 行 code 裏面藏嘅唔係技術

最近 Karpathy 開源咗一個叫 autoresearch 嘅項目,630 行 Python code,MIT 協議,短短幾日就衝到五萬 star。

多數人睇咗一眼,覺得「呢個係 ML 工具,關我咩事」,然後就關咗。

呢個係一個非常典型嘅誤解。

autoresearch 嘅核心邏輯得一句話:改一個嘢 → 打分 → 分高就保留,分低就回滾 → 再改下一個。

Karpathy 用呢個循環嚟優化 AI 模型訓練 code。但如果將「訓練 code」換成任何嘢——廣告文案、冷啟動 email、產品定價策略、內容生成規則——呢套邏輯一個字都唔差咁成立。

圖片

呢個唔係 ML 工具。呢個係一個通用嘅迭代框架。任何你打分嘅嘢,都可以套入去自動優化。

Karpathy 真正貢獻嘅,唔係 630 行 code,而係一個任何人都可以攞走嘅方法論。


框架係咩,工具係咩

有人睇咗 autoresearch 之後,冇用一行 code,而係借咗個「打分 → 改 → 再打分」嘅框架,叫 AI 嚟做內容生成嘅評審。

佢設計咗雙層打分:第一層按規則逐條核查,每條一係過一係唔過;第二層切換成讀者視角,憑感受打分。兩層結合,再決定呢篇內容係直接通過、定向重寫定係推倒重來。

結果,有呢套框架同冇嘅差距,由第一輪嘅 33% 擴大到第二輪嘅 62%。

佢冇用 Karpathy 嘅任何 code。佢用嘅係個框架。

圖片

呢個就係工具同框架嘅分別:工具係載體,框架係內核。工具會被迭代走,框架唔會。


學 Claude Code 嘅過程中,我真正學到咗啲咩

轉用 Claude Code 開發大概半年喇。

最早以為學嘅係快捷鍵、係 prompt 技巧、係某個 slash command 點用。呢啲的確有用,但亦的確容易過時——版本一更新,某啲技巧就失效喇。

真正沉澱落嚟嘅,係另啲嘢。

譬如,點樣將一個模糊嘅需求拆解成 AI 可以執行嘅步驟。呢個唔係 Claude Code 嘅技巧,而係分解問題嘅能力,換任何工具都用得上。

譬如,點樣設計迭代——先 run 一個最小版本,驗證方向,再逐步擴展,而唔係一開始就想 cover 曬所有情況。呢個係 autoresearch 做緊嘅嘢,亦係 Claude Code workflow 裏面最有價值嘅部分。

譬如,點樣驗證假設——AI 生成咗一個嘢,點判斷佢係啱嘅?點樣將「感覺唔對路」翻譯成可以檢查嘅標準?呢個係最難嘅一步,亦係最值錢嘅一步。

圖片

呢三件事——分解問題、設計迭代、驗證假設——擺喺任何 AI 工具裏面都成立。Claude Code 被替代咗,呢套思路仲喺度。


兩種人嘅分別

冇框架嘅人見到一個新 AI 工具,第一個反應係「呢個可以用嚟做咩」,然後花時間學佢嘅界面、學佢嘅操作,等而下一個工具出咗之後再重新學過。

有框架嘅人見到一個新工具,第一個反應係「佢喺邊個環節可以幫我改 → 打分 → 迭代」,然後將工具嵌落已有嘅框架度,用佢加速某個步驟。

前者永遠係追工具,後者永遠係用工具。

呢個唔係天賦嘅差距,而係思維習慣嘅差距。

Karpathy 開源 autoresearch 嗰日,多數人見到嘅係一個 ML 項目。但有一類人見到嘅係:哦,呢個循環我可以套落我嘅業務度,打分標準我嚟定,執行交俾 AI。

同一件事,完全唔同嘅映射方式。


下次見到一個新 AI 工具,試嚇問自己:佢背後解決嘅係咩問題,用嘅係咩框架?將呢個問題諗清楚,工具過時咗都冇問題——框架仲喺度,換個工具繼續 run。

學工具係戰術,學框架係戰略。真正值錢嘅,係嗰個唔會過時嘅部分。

你而家用緊邊個 AI 工具,背後嘅框架係咩?歡迎留言交流。

2026.04.30 10:25
上海·趙巷

圖片

你現在學的 AI 工具,明年可能就廢了。

這不是在嚇你。這是正在發生的事。兩年前大家瘋學的提示詞技巧,有一半已經不適用了。去年覺得必須掌握的某個 AI 工具,今天已經有三個更好的替代品。

學 AI 工具的速度,永遠趕不上它迭代的速度。

但有一件事不會過時。


autoresearch:630 行代碼裏藏的不是技術

最近 Karpathy 開源了一個叫 autoresearch 的項目,630 行 Python 代碼,MIT 協議,短短几天衝到了五萬 star。

大多數人看了一眼,覺得"這是個 ML 工具,跟我沒關係",然後關掉了。

這是一個非常典型的誤解。

autoresearch 的核心邏輯只有一句話:改一個東西 → 打分 → 分高了保留,分低了回滾 → 再改下一個。

Karpathy 用這個循環來優化 AI 模型訓練代碼。但把"訓練代碼"換成任何東西——廣告文案、冷啓動郵件、產品定價策略、內容生成規則——這套邏輯一字不差地成立。

圖片

這不是 ML 工具。這是一個通用的迭代框架。任何你能打分的東西,都能套進去自動優化。

Karpathy 真正貢獻的,不是 630 行代碼,而是一個任何人都能拿走的方法論。


框架是什麼,工具是什麼

有人看了 autoresearch 之後,沒有用一行代碼,而是借了那個"打分 → 改 → 再打分"的框架,讓 AI 來做內容生成的評審。

他設計了雙層打分:第一層按規則逐條核查,每條要麼過要麼不過;第二層切換成讀者視角,憑感受打分。兩層結合,再決定這篇內容是直接通過、定向重寫還是推倒重來。

結果,有這套框架和沒有的差距,從第一輪的 33% 擴大到第二輪的 62%。

他沒有用 Karpathy 的任何代碼。他用的是那個框架。

圖片

這就是工具和框架的區別:工具是載體,框架是內核。工具會被迭代掉,框架不會。


學 Claude Code 的過程中,我真正學到了什麼

切換到 Claude Code 開發大概半年了。

最早以為學的是快捷鍵、是 prompt 技巧、是某個 slash command 怎麼用。這些確實有用,但也確實容易過時——版本一更新,某些技巧就失效了。

真正沉澱下來的,是另一些東西。

比如,怎麼把一個模糊的需求拆解成 AI 能夠執行的步驟。這不是 Claude Code 的技巧,這是分解問題的能力,換任何工具都用得上。

比如,怎麼設計迭代——先跑一個最小版本,驗證方向,再逐步擴展,而不是一開始就想把所有情況都覆蓋到。這是 autoresearch 在做的事,也是 Claude Code 工作流裏最有價值的部分。

比如,怎麼驗證假設——AI 生成了一個東西,怎麼判斷它是對的?怎麼把"感覺不對"翻譯成可以檢查的標準?這是最難的一步,也是最值錢的一步。

圖片

這三件事——分解問題、設計迭代、驗證假設——放到任何 AI 工具裏都成立。Claude Code 被替代了,這套思路還在。


兩種人的區別

沒有框架的人看到一個新 AI 工具,第一個反應是"這能用來幹什麼",然後花時間學它的界面、學它的操作,等下一個工具出來了再重學一遍。

有框架的人看到一個新工具,第一個反應是"它在哪個環節能幫我改 → 打分 → 迭代",然後把工具嵌進已有的框架裏,用它加速某個步驟。

前者永遠在追工具,後者永遠在用工具。

這不是天賦的差距,是思維習慣的差距。

Karpathy 開源 autoresearch 的那天,大多數人看到的是一個 ML 項目。但有一類人看到的是:哦,這個循環我可以套在我的業務上,打分標準我來定,執行交給 AI。

同一件事,完全不同的映射方式。


下次看到一個新 AI 工具,試着問自己:它背後解決的是什麼問題,用的是什麼框架?把這個問題想清楚了,工具過時了也沒關係——框架還在,換個工具繼續跑。

學工具是戰術,學框架是戰略。真正值錢的,是那個不會過時的部分。

你現在用的哪個 AI 工具,背後的框架是什麼?歡迎留言交流。

2026.04.30 10:25
滬·趙巷