全網都在抄 Karpathy 的知識庫,但大多數人只學到了皮毛
整理版優先睇
Karpathy 知識庫方法嘅精髓係人機分工,唔係俾 AI 由頭做到尾
作者艾康係一個深度用咗 Obsidian 做知識管理超過一年嘅用家。佢見到 Karpathy 喺 4 月 3 號分享用 LLM 搭建個人知識庫嘅方法後,全網跟風模仿,但大多數人只係抄到表面,跳過咗最重要嘅部分。
Karpathy 嘅方法係將知識管理拆成兩層:人負責選素材、問問題、把關質素;AI 負責總結、連結、歸檔呢啲苦力活。佢仲公開咗一個 GitHub Gist 叫「llm wiki」,強調 LLM 寫同維護個 wiki,人負責 sourcing、探索同問啱嘅問題。但好多模仿者嘅流程係:見到文章就丟入 Obsidian、叫 AI 生成概念筆記然後自動建立連結,最後截張關係圖譜就完事——人喺第一步之後就消失咗。
整體結論係:知識管理係一個過程,唔係結果;工具不斷變,但自己嘅思考無可取代。AI 可以幫你編譯信息,但唔可以代替你理解概念、形成判斷、建立認知框架。最好嘅做法係將 AI 研究庫同個人知識庫分開:前者解決廣度,後者解決深度,先透過 AI 庫睇清森林,再親自走進每一棵樹。
- Karpathy 將知識管理拆成兩層:人負責選材、提問、把關;AI 負責總結、連結、歸檔,呢個係佢方法最值錢嘅部分。
- 常見模仿者跳過咗人的判斷,讓 AI 由頭做到尾,最終只得到一堆筆記同圖譜,但冇經過自己嘅內化。
- 作者用河流隱喻組織知識庫:收件箱 → 泥石 → 晶石 → 山脈,強調每一層都需要主動轉化,唔可以跳步。
- AI 研究庫解決「廣度」,個人知識庫解決「深度」,兩者應該分開,前者係後者嘅前置篩選器。
- 知識管理係一個過程,唔係結果;工具會迭代,但自己嘅思考先係核心,冇工具可以代替內化過程。
Karpathy 原始推文
Karpathy 喺 4 月 3 號分享用 LLM 搭建個人知識庫嘅長推,瀏覽量 1800 萬。
Karpathy 嘅 llm wiki Gist
GitHub Gist,說明 LLM 寫同維護 wiki,人負責 sourcing、探索同提問。
全網跟風模仿 Karpathy 知識庫
Karpathy 嘅推文爆紅之後,國內外都出現大量「手把手教你搭建 Karpathy 知識庫」嘅教程,Obsidian 圖譜截圖滿天飛。
但作者作為深度用家,發現好多人的用法偏離咗核心:只抄到表面,跳過咗最有價值嘅部分。
模仿者嘅典型流程:見到文章就丟入 Obsidian,叫 AI 生成概念筆記,自動建立連結,最後截張關係圖譜發出來,然後結束。
Karpathy 嘅原意:人機分工
Karpathy 嘅方法係將原始素材(文章、論文、代碼庫等)丟入 raw/ 文件夾,然後讓 LLM「編譯」成結構化嘅 Markdown Wiki,包括概念提煉、文章生成、反向連結、交叉引用,最後用 Obsidian 瀏覽,用 LLM 查詢維護。
換句話講,佢將知識管理拆成高層加工同低層加工兩層。高層由人做:揀嘢入系統、把關 AI 產出、提出深度問題;低層由 AI 做:總結、連結、歸檔、一致性檢查。
偏離之處:人的缺席
- 模仿者跳過選擇素材時嘅判斷——唔清楚乜嘢值得進入系統。
- 模仿者跳過對 AI 產出嘅審閲同追問——呢個概念提煉得啱唔啱?
- 模仿者跳過基於 Wiki 提出深度問題嘅環節——我仲想知道啲乜?
最終得到嘅只係一堆 AI 生成嘅筆記同一個靚靚嘅圖譜,冇經過自己任何加工。
作者問:十年前用 Evernote 瘋狂收藏文章然後唔打開,而家讓 AI 幫手生成筆記然後唔思考,兩者有咩分別?工具變咗,問題冇變。
知識管理係一個內化過程
作者用河流隱喻組織自己嘅知識庫:收件箱(信息入口)、泥石(原始素材)、晶石(加工產出)、山脈(最終認知框架)。
每一層之間都需要「轉化」:泥石唔會自動變成晶石,晶石唔會自動堆成山脈,每一步都需要你主動參與。
- 1 提取關鍵概念。
- 2 用自己的話重新表述。
- 3 同已有認知建立連接。
呢個「慢」嘅過程,恰恰就係知識管理本身。
如果讓 AI 幫你跳過呢啲步驟,即使得到靚靚圖譜,自己個腦乜都留唔低。AI 唔會令思想空洞嘅人變深刻,只會令深刻嘅人更璀璨。
將 AI 庫同個人庫分開
Obsidian 創辦人 Kepano 喺 Karpathy 原帖下面建議:將個人 Vault 同 AI Agent 嘅 Vault 分開。個人 Vault 保持高信噪比,來源清晰;唔好混埋一齊,否則 Vault 唔再只係「你嘅想法」。
Karpathy 嘅方法幫你睇見森林,但走進每一棵樹,仍然要靠你自己。
工具同方法不斷迭代,但你嘅思考冇任何工具可以取代。
AI 可以編譯信息、建立連結、維護一致性,但唔可以代替你理解概念、形成判斷、建立屬於自己嘅認知框架。呢啲一定要經過你個腦,經歷嗰個可能慢啲、笨啲但不可替代嘅內化過程。
呢篇文章有2286字,大約要4分鐘閲讀。
呢幾日刷推特,成個畫面都係 Karpathy 同佢嘅知識庫。
起因係佢喺4月3號發咗條長推,講自己最近點樣用 LLM 搭建個人知識庫。
呢條推文嘅瀏覽量直接飆到 1800 萬,留言區迫滿曬各路大神。

Obsidian 嘅創始人 Kepano 來了,Lex Fridman 嚟咗,各種開發者都喺下面分享自己嘅實踐。
跟住,呢股風好快就吹到嚟大陸。
公眾號、小紅書、影片號,周圍都係「逐步教你搭建 Karpathy 知識庫」嘅教程,Obsidian 圖譜嘅截圖周圍飛,睇落每個人都好似一夜之間擁有咗一個「第二大腦」。
作為一個深度用 Obsidian 做知識管理一年幾嘅人,呢幾日睇落嚟,我有個好強烈嘅感受:
好多人嘅用法,偏咗。
唔係話 Karpathy 嘅方法有問題,啱啱相反,佢嘅方法本身非常精妙。
只係好多人在模仿嘅過程中,只係抄到表面,但跳過咗最有價值嘅部分。
先搞清楚 Karpathy 究竟做緊咩
喺傾邊度偏咗之前,我哋先返去 Karpathy 嘅原帖,睇下佢自己究竟係點樣用呢套嘢嘅。
原帖地址:https://x.com/karpathy/status/2039805659525644595

佢嘅核心思路其實唔複雜:將各種原始材料(文章、論文、代碼庫、數據集等)丟入一個 raw/ 資料夾,然後俾 LLM 將呢啲材料「編譯」成一個結構化嘅 Markdown Wiki。
概念提煉、文章生成、反向連結、交叉引用,全部交俾 AI 完成,最後用 Obsidian 嚟瀏覽呢個 Wiki,用 LLM 嚟查詢同維護。
佢目前喺某個研究方向上面嘅知識庫,大約有 100 篇文章、40 萬字。
帖子爆咗之後,Karpathy 又做咗一件事,佢冇開源代碼,亦冇發佈任何 App。
佢發咗個 GitHub Gist,叫「llm wiki」,裏面有段話非常關鍵:
You never (or rarely) write the wiki yourself — the LLM writes and maintains all of it. You're in charge of sourcing, exploration, and asking the right questions.

GitHub Gist 地址:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
譯返出嚟就係:LLM 負責苦力工——總結、交叉引用、歸檔、格式維護。而你負責嘅係:揀咩材料、探索咩方向、問出咩問題。
即係話,佢將知識管理呢件事拆成兩層:
高層加工:揀咩材料值得入系統、對 AI 嘅產出做質量把關、基於 Wiki 提出深度問題 → 人做
低層加工:總結、連結、歸檔、一致性檢查 → LLM 做
另外有位作者專登寫咗篇文章拆解 Karpathy 嘅知識庫,其中有段分析得好到位:

呢個知識庫與其話係 LLM 嘅產物,不如話係 Karpathy 不斷打磨嗰個 CLAUDE.md 嘅產物,LLM 只係大規模執行佢嘅指令。
佢嘅系統,本質上係一個信息編譯器,解決嘅係研究效率問題。
咁偏咗喺邊呢?
明白咗 Karpathy 做緊咩之後,再睇返好多人嘅實踐,就會發現問題喺邊。
我呢幾日喺小紅書同公眾號上面見到嘅大量案例,流程基本係咁:
1. 見到一篇文章,丟入 Obsidian 2. 俾 AI 一鍵生成各種概念筆記 3. 俾概念之間自動建立連結 4. 得到一張關係圖譜嘅截圖,截圖發出來 5. 結束了

睇落同 Karpathy 做嘅差唔多?
但係有一個非常關鍵嘅分別:喺 Karpathy 嘅流程裏面,人嘅判斷貫穿始終,而喺好多模仿者嘅流程裏面,人喺第1步之後就消失咗。
佢哋跳過咗揀材料時嘅判斷,咩值得入系統?
跳過咗對 AI 產出嘅審閲同追問,呢個概念提煉得啱唔啱?跳過咗基於 Wiki 提出深度問題嘅環節,我仲想知道啲咩?
最後得到嘅,係一堆 AI 生成嘅筆記同一個好靚嘅圖譜。
但呢啲嘢,冇經過自己嘅任何加工。
十年前我哋喺 Evernote 裏面瘋狂收藏文章,然後唔再打開。而家換咗俾 AI 幫我哋生成筆記,然後唔再思考,呢兩者有咩分別呢?
工具變咗,問題冇變。
知識管理,到底管緊啲咩?
傾到呢度,我想講下自己嘅理解。
我用 Obsidian 做知識管理已經一年幾,有一個越來越強烈嘅感受:知識管理應該係一個過程,唔係一個結果。
佢唔係話今日透過 AI 產出咗 50 篇筆記、筆記之間形成咗一個好靚嘅關係圖譜,呢件事就算完成咗。

真正嘅知識管理,係信息從輸入到加工、再到內化嘅一個完整閉環。
我自己嘅知識庫,用咗一套河流比喻嚟組織成個過程:
• 收件箱:信息嘅入口,咩都可以先丟入嚟 • 泥石:我讀過嘅文章、書、課程、Podcast,呢啲係原始材料 • 晶石:經過自己加工後嘅產出,我寫嘅文章、導航筆記、隨筆 • 山脈:最終沉澱落嚟嘅認知框架

呢套結構嘅核心唔在於資料夾有幾整齊,佢嘅核心在於,每一層之間都有一個「轉化」嘅過程。
泥沙唔會自動變成晶石,晶石唔會自動堆成山脈。
每一步都需要我主動參與——提取關鍵概念、用自己嘅話重新表述、同已有認知建立連結。
呢個過程可能慢少少。
但呢個「慢」嘅過程,恰恰就係知識管理本身。
如果俾 AI 幫你跳過咗呢啲步驟,就算得到嘅係一個好靚嘅關係圖譜,但自己個腦裏面咩都冇留低。
AI 唔會令思想空洞嘅人變得深刻,只會令深刻嘅人更加璀璨,知識管理都係同理。
兩者並唔矛盾
講到呢度,可能有人覺得我喺否定 Karpathy 嘅方法。
真係冇。
佢嘅方法解決咗一個非常實際嘅問題:傳統嘅 RAG 每次提問都由零開始檢索,冇積累,佢嘅 Wiki 方式令知識可以持久編譯、增量更新,呢個喺研究效率上係一個好大嘅進步。
問題從來唔在方法本身,而在於你用佢嚟做啲咩。
Obsidian 嘅創始人 Kepano,喺 Karpathy 原帖下面回覆咗一條好值得睇嘅建議:

大意係:將個人嘅 Vault 同 AI Agent 嘅 Vault 分開。
你自己嘅 Vault 應該保持高信噪比,裏面嘅內容來源清晰。如果將兩者溝埋一齊,你嘅 Vault 就唔再只係「你嘅想法」喇。
我覺得呢個思路非常啱。
呢兩個庫服務嘅係完全唔同嘅目標:
• AI 研究庫解決「廣度」問題:幫你快速建立一個領域嘅全景認知,發現關鍵概念同關聯。 • 個人知識庫解決「深度」問題:將真正需要掌握嘅嘢,透過主動加工變成自己嘅。
前者係後者嘅前置篩選器。
先在 AI 庫裏面建立全景圖,從中揾到真正重要嘅節點,然後對呢啲節點做深度嘅提取、加工、內化。
Karpathy 嘅方法幫你見到森林,但行入每一棵樹,都仲要靠你自己。

寫喺最後
返去開頭嗰個現象:全網都喺教你點樣搭建 Karpathy 知識庫,但好少人喺討論:搭建完之後,然後呢?
知識管理呢件事,工具同方法永遠喺迭代——從 Evernote 到 Notion 到 Obsidian,從手動筆記到 RAG 到 LLM Wiki。
但有一個嘢始終冇變:你自己嘅思考,冇任何工具可以取代。
AI 可以幫你編譯信息、建立連結、維護一致性,但佢唔可以代替你理解一個概念、形成一個判斷、建立一套屬於你自己嘅認知框架。
呢啲事情必須經過你自己個腦,經過嗰個可能慢少少、笨少少、但不可取代嘅內化過程。

以上,就係呢篇文章嘅全部內容,如果你覺得呢篇文章對你有啟發,點讚、畀心、分享三連就係對我最大嘅支持,謝謝~
• 用 Gemini 解鎖 YouTube 新用法,信息獲取效率提升 10 倍
• 有咗 NotebookLM 之後,仲需要 Obsidian 嗎?
• 我試咗 NotebookLM 學習法之後,徹底拋棄傳統學習方式
• NotebookLM 再次升級,來自 Google 嘅年終禮物
• 我用 NotebookLM 解鎖 PPT 嘅 5 種玩法,實現咗 PPT 自由
本文字數 2286,閲讀大約需 4 分鐘
這幾天刷推特,滿屏都是 Karpathy 和他的知識庫。
起因是他在 4 月 3 號發了一條長推,聊自己最近怎麼用 LLM 搭建個人知識庫。
這條推文的瀏覽量直接幹到了 1800 萬,評論區擠滿了各路大神。

Obsidian 的創始人 Kepano 來了,Lex Fridman 來了,各種開發者都在下面分享自己的實踐。
然後,這股風很快就吹到了國內。
公眾號、小紅書、視頻號,到處都是「手把手教你搭建 Karpathy 知識庫」的教程,Obsidian 圖譜截圖滿天飛,看起來每個人都在一夜之間擁有了一個「第二大腦」。
作為一個深度使用 Obsidian 做知識管理一年多的人,這幾天看下來,我有一個很強烈的感受:
很多人的用法,偏了。
不是說 Karpathy 的方法有問題,恰恰相反,他的方法本身非常精妙。
只是很多人在模仿的過程中,只抄到了表面,卻跳過了最有價值的部分。
先搞清楚 Karpathy 到底在做什麼
在聊哪裏偏了之前,我們先回到 Karpathy 的原帖,看看他自己到底是怎麼用這套東西的。
原帖地址:https://x.com/karpathy/status/2039805659525644595

他的核心思路其實不復雜:把各種原始素材(文章、論文、代碼庫、數據集等)丟進一個 raw/ 文件夾,然後讓 LLM 把這些素材「編譯」成一個結構化的 Markdown Wiki。
概念提煉、文章生成、反向連結、交叉引用,都交給 AI 來完成,最後用 Obsidian 來瀏覽這個 Wiki,用 LLM 來查詢和維護。
他目前在某個研究方向上的知識庫,大約有 100 篇文章、40 萬字。
帖子爆了之後,Karpathy 又做了一件事,他沒有開源代碼,也沒有發佈什麼 App。
他發了一個 GitHub Gist,叫「llm wiki」,裏面有一段話非常關鍵:
You never (or rarely) write the wiki yourself — the LLM writes and maintains all of it. You're in charge of sourcing, exploration, and asking the right questions.

GitHub Gist 地址:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
翻譯過來就是:LLM 負責苦力活——總結、交叉引用、歸檔、格式維護。而你負責的是:選什麼素材、探索什麼方向、問出什麼問題。
也就是說,他把知識管理這件事拆成了兩層:
高層加工:選什麼素材值得進入系統、對 AI 的產出做質量把關、基於 Wiki 提出深度問題 → 人來做
低層加工:總結、連結、歸檔、一致性檢查 → LLM 來做
另外一個作者專門寫了一篇文章拆解 Karpathy 的知識庫,其中有一段分析得很到位:

這個知識庫與其說是 LLM 的產物,不如說是 Karpathy 不斷打磨那個 CLAUDE.md 的產物,LLM 只是在大規模執行他的指令。
他的系統,本質上是一個信息編譯器,解決的是研究效率問題。
那偏在哪了呢?
理解了 Karpathy 在做什麼之後,再來看很多人的實踐,就會發現問題在哪。
我這幾天在小紅書和公眾號上看到的大量案例,流程基本是這樣的:
1. 看到一篇文章,丟進 Obsidian 2. 讓 AI 一鍵生成各種概念筆記 3. 讓概念之間自動建立連結 4. 得到一張關係圖譜的截圖,截圖發出來 5. 結束了

看起來和 Karpathy 做的差不多?
但有一個非常關鍵的區別:在 Karpathy 的流程裏,人的判斷貫穿始終,而在很多模仿者的流程裏,人在第 1 步之後就消失了。
他們跳過了選擇素材時的判斷,什麼值得進入系統?
跳過了對 AI 產出的審閲和追問,這個概念提煉得對不對? 跳過了基於 Wiki 提出深度問題的環節,我還想知道什麼?
最終得到的,是一堆 AI 生成的筆記和一個好看的圖譜。
但這些東西,沒有經過自己的任何加工。
十年前我們在 Evernote 裏瘋狂收藏文章,然後再也不打開。現在換成了讓 AI 幫我們生成筆記,然後再也不思考,這兩者有什麼區別呢?
工具變了,問題沒變。
知識管理,到底在管什麼?
聊到這裏,我想說說自己的理解。
我用 Obsidian 做知識管理已經一年多了,有一個越來越強烈的感受:知識管理應該是一個過程,不是一個結果。
它不是說今天通過 AI 產出了 50 篇筆記、筆記之間形成了一個炫酷的關係圖譜,這件事就算完成了。

真正的知識管理,是信息從輸入到加工、再到內化的一整個閉環。
我自己的知識庫,用了一套河流隱喻來組織整個過程:
• 收件箱:信息的入口,什麼都可以先丟進來 • 泥石:我讀過的文章、書籍、課程、播客,這些是原始素材 • 晶石:經過自己加工後的產出,我寫的文章、導航筆記、隨筆 • 山脈:最終沉澱下來的認知框架

這套結構的核心不在於文件夾有多整齊,它的核心在於,每一層之間都有一個「轉化」的過程。
泥石不會自動變成晶石,晶石不會自動堆成山脈。
每一步都需要我主動參與——提取關鍵概念、用自己的話重新表述、和已有認知建立連接。
這個過程可能有點慢。
但這個「慢」的過程,恰恰就是知識管理本身。
如果讓 AI 幫你跳過了這些步驟,即使得到的是一個漂亮的關係圖譜,但自己的大腦裏什麼都沒留下。
AI 不會讓思想空洞的人變得深刻,只會讓深刻的人更加璀璨,知識管理也是同理。
兩者並不矛盾
說到這裏,可能有人覺得我在否定 Karpathy 的方法。
真沒有。
他的方法解決了一個非常實際的問題:傳統的 RAG 每次提問都從零開始檢索,沒有積累,他的 Wiki 方式讓知識可以持久編譯、增量更新,這在研究效率上是一個很大的進步。
問題從來不在方法本身,而在於你用它來做什麼。
Obsidian 的創始人 Kepano,在 Karpathy 原帖下面回覆了一條非常值得讀的建議:

大意是:把個人的 Vault 和 AI Agent 的 Vault 分開。
你自己的 Vault 應該保持高信噪比,裏面的內容來源清晰。如果讓兩者混在一起,你的 Vault 就不再只是「你的想法」了。
我覺得這個思路非常對。
這兩個庫服務的是完全不同的目標:
• AI 研究庫解決「廣度」問題:幫你快速建立一個領域的全景認知,發現關鍵概念和關聯。 • 個人知識庫解決「深度」問題:把真正需要掌握的東西,通過主動加工變成自己的。
前者是後者的前置篩選器。
先在 AI 庫裏建立全景圖,從中找到真正重要的節點,然後對這些節點做深度的提取、加工、內化。
Karpathy 的方法幫你看見森林,但走進每一棵樹,還是得靠你自己。

寫在最後
回到開頭那個現象:全網都在教你怎麼搭建 Karpathy 知識庫,但很少有人在討論:搭建完之後,然後呢?
知識管理這件事,工具和方法永遠在迭代——從 Evernote 到 Notion 到 Obsidian,從手動筆記到 RAG 到 LLM Wiki。
但有一個東西始終沒變:你自己的思考,沒有任何工具可以替代。
AI 可以幫你編譯信息、建立連結、維護一致性,但它不能代替你理解一個概念、形成一個判斷、建立一套屬於你自己的認知框架。
這些事情必須經過你自己的大腦,經過那個也許有點慢、有點笨、但不可替代的內化過程。

以上,就是本文全部內容,如果覺得這篇文章對你有啓發,點贊、比心、分享三連就是對我最大的支持,謝謝~
• 用 Gemini 解鎖 YouTube 新用法,信息獲取效率提升 10 倍
• 有了 NotebookLM 後,還需要 Obsidian 嗎?
• 我試了 NotebookLM 學習法後,徹底拋棄傳統學習方式
• 我用 NotebookLM 解鎖 PPT 的 5 種玩法,實現了 PPT 自由