卡帕西 LLM Wiki 的V2版本來了，由Rohit Ghumare發佈，解決工程化問題。

作者：傑森的效率工坊

日期：2026年6月19日下午3:49

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

LLM Wiki V2 加入知識生命週期同工程化，解決原版知識過期問題

整理版摘要

呢篇文章係關於 Rohit Ghumare 基於 Andrej Karpathy 原始 LLM Wiki 推出嘅擴展版 V2。Rohit 本身仲有兩個高星 GitHub 項目：agentmemory（畀 coding agent 用嘅持久記憶引擎）同 ai-engineering-from-scratch（開源 AI 工程課程）。原版 LLM Wiki 假設寫入嘅知識會長期有效，但現實係知識會過期。V2 嘅核心就係要解決呢個問題，加入工程化思維：知識生命週期、可信度、知識圖譜、混合檢索、自動化 hooks、質量控制同審計隱私。

V2 認為知識需要帶狀態：confidence、last_confirmed、superseded、stale、review_required。佢用 YAML 元數據管理知識狀態，令 Agent 更新時要判斷結論仲有冇效。同時將事實判斷拆成結構化記錄，記錄點知、幾可靠、幾時確認過、有冇被推翻。仲有 typed knowledge graph，唔只係「相關」，而係明確關係類型，例如 uses、depends_on、contradicts，等 Agent 可以推理。

V2 強調自動化 hooks 減少人工操作，例如攝入資料、更新頁面、跑 lint 都自動化。質量控制方面，直接寫入 AGENTS.md 或 CLAUDE.md 設定規則。仲有 crystallization 概念，將成個研究、調試過程…

原版 LLM Wiki 假設知識長期有效，但 V2 指出知識有生命週期，需要狀態管理（confidence、stale、superseded 等）。
V2 用 YAML 元數據嵌入 Markdown，令 Agent 更新時識判斷結論有效性，唔會盲目保留舊資料。
從雙鏈升級到 typed knowledge graph，關係類型包括 uses、depends_on、contradicts，令 Agent 可以推理而非簡單搜尋。
加入混合檢索（關鍵詞 + 語義 + 圖譜），減少 index.md 嘅上下文負擔，適合大型知識庫。
引入 crystallization 概念，將除錯、評測等過程壓縮成可複用知識，實現知識複利，而家唔使每次重頭開始。

值得記低

連結 gist.github.com

LLM Wiki V2 Gist

Rohit Ghumare 寫嘅擴展版 LLM Wiki，包含完整概念同實作建議。

工具 github.com

agentmemory

畀 coding agent 用嘅持久記憶引擎，可以外掛畀 Claude Code、Codex 等 Agent，解決跨 session 記憶問題。

連結 github.com

ai-engineering-from-scratch

開源 AI 工程課程倉庫，Rohit 另一個高星項目。

整理重點

V2 點解要存在？原版假設知識永遠有效

原版 LLM Wiki 有一個隱藏假設：寫入嘅內容會長期有效。但現實唔係咁。Rohit 指出，真實知識有生命週期：啱啱發現嘅 bug 比六個月前嘅 bug 更重要；被驗證過 12 次嘅模式比只出現一次嘅觀察更可靠；新資料可能會削弱甚至推翻舊結論。所以 V2 嘅核心問題就係：知識會過期，要管理佢嘅狀態。

知識有生命週期，唔係永遠正確

整理重點

用 YAML 元數據管理知識狀態

最小實現唔需要數據庫，直接喺 Markdown 加一層 YAML 元數據就得。Agent 更新頁面時要判斷：呢個結論仲有效嗎？有冇新來源支持？有冇相反證據？要唔要人工複核？咁樣知識庫就開始有生命週期。

YAML 元數據示例 yaml

---
status: confirmed
confidence: high
last_confirmed: 2024-03-07
sources:
 - https://example.com/paper
---

另外，可以將事實判斷拆成核心結論庫，每條結論都係結構化記錄，例如：結論內容、來源、可信度、確認日期、是否被替代。咁樣普通筆記只記「我知道咩」，V2 試圖記「我點解知、有幾可靠、幾時確認過、有冇被推翻」。

從「我知道咩」升級到「我點解知」

整理重點

從雙鏈升級到 typed graph

Obsidian 呢類工具嘅雙鏈只係表示「相關」，例如 [[Claude Code]] [[Codex]]。但 V2 需要表達「點樣相關」。所以佢引入 typed knowledge graph，關係類型可以係：uses、depends_on、contradicts、caused_by、fixed_by、superseded_by。咁樣 Agent 就可以沿住關係推理：邊個工具依賴邊個？邊個結論推翻咗舊結論？邊個錯誤被邊個方案修復？

雙鏈只係「相關」，typed graph 講「點樣相關」

uses：A 使用 B
depends_on：A 依賴 B
contradicts：A 同 B 矛盾
fixed_by：問題 A 被方案 B 解決
superseded_by：結論 A 被結論 B 取代

整理重點

混合檢索：唔再靠單一 index.md

原版 LLM Wiki 靠 index.md 做入口，細規模好好用。但頁面一多，index 就會變成上下文負擔。V2 建議用混合檢索：關鍵詞搜到「Claude Code」，向量搜到「AI coding agent」，圖譜再擴展到「agentmemory / MCP / hooks」。

混合檢索：關鍵詞 + 語義 + 圖譜

如果用 Markdown/Obsidian，可以接 QMD 呢類工具做查詢層：search（關鍵詞）、vsearch（語義）、query（混合+重排）。V2 嘅核心思路就係：Wiki 負責沉澱知識，檢索層負責幫 Agent 揾正確上下文。

QMD 工具提供三種查詢能力

整理重點

自動化 hooks 同質量控制，實現知識複利

V2 引入事件驅動流程，減少人工操作：攝入資料、更新頁面、整理結論、跑 lint、寫 log 全部自動化。質量控制方面，直接寫入 AGENTS.md 或 CLAUDE.md 設定規則，避免 LLM 污染同幻覺。

Rohit 嘅 agentmemory 項目就係呢種思維嘅工程實現：畀 AI coding agent 一個本地持久記憶層，解決每個 session 都要重複解釋嘅問題。將 Obsidian 做前端，agentmemory 做後端，就係一條完整鏈路：Wiki 沉澱知識，記憶層畀 Agent 用。

agentmemory：持久記憶引擎，解決 Agent 跨 session 失憶

LLM Wiki V2

LLM Wiki V2 不是Karpathy官方發佈嘅第二版。佢係 Rohit Ghumare 根據 Karpathy 原始 LLM Wiki gist 寫出嚟嘅擴展版。
原版核心係：raw sources + wiki + schema，ingest + query + lint。V2 喺呢個基礎上補咗工程層：記憶生命週期、可信度、知識圖譜、混合檢索、自動化 hooks、質量檢查、審計同私隱。

Rohit 係邊個？佢仲有兩個 GitHub 高星項目你應該聽過：
agentmemory：23.3k stars，coding agent 持久記憶引擎
ai-engineering-from-scratch：34.3k stars，開源 AI Engineering 課程倉庫

V2 嘅核心問題：知識會過期

原版 LLM Wiki 有一個默認假設：寫入 Wiki 嘅內容長期有效。V2 認為呢個假設唔成立。
真實知識有生命週期：

剛發現的 bug，比 6 個月前的 bug 更重要

被驗證 12 次的模式，比只出現 1 次的觀察更可靠

新資料可能會削弱舊結論，甚至直接推翻舊結論

所以 V2 增加咗：confidence、last_confirmed、superseded、stale、review_required。

即係話，知識頁唔再只係 Markdown。佢要帶狀態、來源、時間同可信度。

用 YAML 管理知識狀態

最細實現唔需要數據庫。喺 Markdown 加一層元數據：

咁樣 Agent 喺更新頁面時，就要判斷：呢個結論仲有效嗎？有冇新來源支持？有冇相反證據？使唔使人工複核？呢個就係 V2 最重要嘅變化之一：知識庫開始有「生命週期」。

將事實判斷拆出嚟

如果要更加工程化，可以維護一個核心結論庫。每個關鍵結論都係一條結構化記錄：

咁樣做嘅好處係：可以檢索、更新、降權、標記過期、被新結論替代。普通筆記只記錄「我知道啲乜」。V2 試圖記錄：我點解知道、呢個結論有幾可靠、佢幾時被確認過、佢係咪已經被推翻。

從普通雙鏈升級到 typed graph

Obsidian 嘅雙鏈只能表示「相關」。例如：

[[Claude Code]] [[Codex]] [[Agent Memory]]

但 V2 需要表達「點樣相關」。所以佢引入 typed knowledge graph：

關係類型可以係：uses、depends_on、contradicts、caused_by、fixed_by、superseded_by。呢個會令 Agent 唔只係「搜到頁面」。而係可以沿着關係推理：邊個工具依賴邊個？邊個結論推翻咗舊結論？邊個錯誤俾邊個方案修復？

index.md 嘅侷限性

原版 LLM Wiki 依賴 index.md。細規模好好用：Agent 先讀 index.md，再進入相關頁面。但頁面多咗之後，index 會變成上下文負擔。

V2 嘅建議係混合檢索：

最細實現可以咁理解：關鍵詞搜到「Claude Code」，向量搜到「AI coding agent」，圖譜再擴展到「agentmemory / MCP / hooks」。呢個比單純向量 RAG 更適合長期知識庫。

檢索層實現

如果用 Markdown / Obsidian 做 Wiki，可以接一個本地搜索層。例如 QMD 呢類工具：

三種查詢對應三類能力：search-關鍵詞檢索，vsearch-語義檢索，query-混合檢索 + 重排。
呢個就係 V2 嘅核心思路：Wiki 負責沉澱知識，檢索層負責幫 Agent 揾到正確上下文。

V2 更加強調自動化 hooks：
原版好多動作要手動觸發：攝入資料、更新頁面、整理結論、跑 lint、寫 log。
V2 認為咁樣好難長期堅持。所以佢引入事件驅動流程：

重點係減少人工記錄。

然後就係最重要嘅質量把控：
LLM 自動寫 Wiki，最大風險係污染、AI幻覺。所以 V2 需要質量把控。
可以直接寫入 AGENTS.md或CLAUDE.md：

Crystallization：將過程沉澱成知識:
V2 仲有一個重要概念：crystallization。唔係淨係保存最終答案。而係將一次完整研究、調試、評測過程，壓縮成可複用知識。

例如，以我為例，做咗一次模型評測之後，Agent 唔只生成文章。而係生成：評測方法、命令流程、錯誤案例、修復經驗、指標口徑、下次複用模板。呢個對我呢類內容創作者好有價值。呢啲先係知識複利。

agentmemory：就係作者嗰個高星項目

對於 LLM Wiki V2，agentmemory 更加似佢嘅工程實現之一。
佢嘅定位係：Persistent memory for AI coding agents。即係俾 Codex、Claude Code、Hermes、OpenCode 呢類 Agent 外掛一個本地記憶層。
基本用法：

解決嘅問題係：每個 session 都要重複解釋項目結構，每次都要重新說明技術棧，Agent 記唔住之前踩過嘅坑，唔同 Agent 之間唔可以共享上下文。

同 Obsidian 結合，完整嘅鏈路

呢個比「將資料丟俾 RAG」更長期。亦都比「手動整理筆記」更適合 Agent 時代。
講白咗，V2 補上嘅就係：工程化問題。

Rohit 嘅原文地址：GitHub Gist rohitg00/llm-wiki.md

LLM Wiki V2

LLM Wiki V2 不是卡帕西官方發佈的第二版。它是 Rohit Ghumare 基於卡帕西原始 LLM Wiki gist 寫出的擴展版。
原版核心是：raw sources + wiki + schema，ingest + query + lint。V2 在這個基礎上補了工程層：記憶生命週期、可信度、知識圖譜、混合檢索、自動化hooks、質量檢查、審計與隱私。

Rohit是誰？他還有兩個GitHub高星項目你多少聽過：
agentmemory：23.3k stars，coding agent 持久記憶引擎
ai-engineering-from-scratch：34.3k stars，開源 AI Engineering 課程倉庫

V2 的核心問題：知識會過期

原版 LLM Wiki 有一個默認假設：寫進 Wiki 的內容長期有效。V2 認為這個假設不成立。
真實知識有生命週期：

剛發現的 bug，比 6 個月前的 bug 更重要

被驗證 12 次的模式，比只出現 1 次的觀察更可靠

新資料可能會削弱舊結論，甚至直接推翻舊結論

所以 V2 增加了：confidence、last_confirmed、superseded、stale、review_required。

也就是說，知識頁不再只是 Markdown。它要帶狀態、來源、時間和可信度。

用 YAML 管理知識狀態

最小實現不需要數據庫。在 Markdown 加一層元數據：

這樣 Agent 在更新頁面時，就要判斷：這個結論還有效嗎？有沒有新來源支持？有沒有相反證據？要不要人工複核？這就是 V2 最重要的變化之一：知識庫開始有“生命週期”。

把事實判斷拆出來

如果要更工程化，可以維護一個核心結論庫。每個關鍵結論都是一條結構化記錄：

這樣做的好處是：可以檢索、更新、降權、標記過期、被新結論替代。普通筆記只記錄“我知道什麼”。V2 試圖記錄：我為什麼知道、這個結論有多可靠、它什麼時候被確認過、它是否已經被推翻。

從普通雙鏈升級到 typed graph

Obsidian 的雙鏈只能表示“相關”。比如：

[[Claude Code]] [[Codex]] [[Agent Memory]]

但 V2 需要表達“怎麼相關”。所以它引入 typed knowledge graph：

關係類型可以是：uses、depends_on、contradicts、caused_by、fixed_by、superseded_by。這會讓 Agent 不只是“搜到頁面”。而是能沿着關係推理：哪個工具依賴誰？哪個結論推翻了舊結論？哪個錯誤被哪個方案修復？

index.md 的侷限性

原版 LLM Wiki 依賴 index.md。小規模很好用：Agent 先讀 index.md，再進入相關頁面。但頁面多了以後，index 會變成上下文負擔。

V2 的建議是混合檢索：

最小實現可以這樣理解：關鍵詞搜到“Claude Code”，向量搜到“AI coding agent”，圖譜再擴展到“agentmemory / MCP / hooks”。這比單純向量 RAG 更適合長期知識庫。

檢索層實現

如果用 Markdown / Obsidian 做 Wiki，可以接一個本地搜索層。例如 QMD 這類工具：

三種查詢對應三類能力：search-關鍵詞檢索，vsearch-語義檢索，query-混合檢索 + 重排。
這就是 V2 的核心思路：Wiki 負責沉澱知識，檢索層負責幫 Agent 找到正確上下文。

V2 更強調自動化 hooks：
原版很多動作要手動觸發：攝入資料、更新頁面、整理結論、跑 lint、寫 log。
V2 認為這樣很難長期堅持。所以它引入事件驅動流程：

重點是減少人工記錄。

然後就是最重要的質量把控：
LLM 自動寫 Wiki，最大風險是污染、AI幻覺。所以 V2 需要質量把控。
可以直接寫進 AGENTS.md或CLAUDE.md：

Crystallization：把過程沉澱成知識:
V2 還有一個重要概念：crystallization。不是隻保存最終答案。而是把一次完整研究、調試、評測過程，壓縮成可複用知識。

比如，以我為例，做了一次模型評測後，Agent 不只生成文章。而是生成：評測方法、命令流程、錯誤案例、修復經驗、指標口徑、下次複用模板。這對我這樣的內容創作者很有價值。這才是知識複利。

agentmemory：就是作者那個高星項目

對於LLM Wiki V2， agentmemory 更像它的工程實現之一。
它的定位是：Persistent memory for AI coding agents。也就是給 Codex、Claude Code、Hermes、OpenCode 這類 Agent 外掛一個本地記憶層。
基本用法：

解決的問題是：每個 session 都要重複解釋項目結構，每次都要重新說明技術棧，Agent 記不住之前踩過的坑，不同 Agent 之間不能共享上下文。

與 Obsidian 結合，完整的鏈路

這比“把資料丟給 RAG”更長期。也比“手動整理筆記”更適合 Agent 時代。
說白了，V2補上的就是：工程化問題。

Rohit 的原文地址：GitHub Gist rohitg00/llm-wiki.md