AI知識庫不是資料倉庫:從文章連結到選題和大綱的工作流拆解
整理版優先睇
MaxKing提出AI知識庫唔應該只係收藏夾,而係一條從資料輸入到內容輸出嘅加工流水線,透過保存原文、生成資料卡、提取創意積木、選題大綱等步驟,將文章轉化為可複用嘅內容資產。
MaxKing係一位全棧開發者、量化交易實踐者同AI重度用戶,佢發現好多人收藏咗大量文章但最後都用唔起,因為資料只係被保存而未被加工。佢想解決嘅問題係:點樣令知識庫唔再係死資料,而係可以自動產出內容嘅系統?佢提出AIWiki概念,整合Dan Koe嘅輸出思路同LLM Wiki嘅沉澱方法,將兩者連成一個完整流程。
整體結論係:知識庫應該係一條加工流水線,文章或連結進入後,會依次經歷手動收集、原文歸檔、生成Source Card資料卡、提取Creative Assets創意積木、生成選題、產出大綱,最後內容產出並迴流反饋。呢個流程確保資料唔係被存起,而係被拆解、複用同進化。
MaxKing強調第一版唔好急做大而全,應該先專注處理用戶主動收集嘅單篇文章,跑通「保存原文→資料卡→創意積木→選題→大綱」呢條小閉環。佢仲指出,內容產出後必須迴流知識庫,將讀者反饋、數據判斷補充返去,先至形成持續進化嘅系統。
- 知識庫應該係加工流水線,唔係儲存倉庫:資料要經過拆解、複用同進化,先至產生價值。
- 完整流程:手動收集→Raw原文歸檔→Source Card資料卡→Creative Assets創意積木→Topics選題→Outline大綱→內容產出→迴流知識庫。
- 創意積木比原文更適合複用:包括鈎子金句、結構案例、轉化弧等,可以組合到多篇文章。
- 選題同大綱可以由素材自動生成,唔使憑空諗,基於已沉澱嘅資料卡同積木就得。
- 第一版重點:先跑通單篇流程,唔好急住搞全自動。確保每篇有價值嘅資料都加工好,先至考慮批量。
AIWiki個人知識工廠流程圖
作者整理嘅流程圖,包含從文章收集到內容產出嘅完整路徑,可作為搭建AI知識庫嘅參考。
從收藏到加工:AIWiki嘅定位
MaxKing指出,好多人收藏大量文章但最後用唔起,因為資料只係被保存而未被加工。佢提出AIWiki概念,整合Dan Koe嘅輸出思路同LLM Wiki嘅沉澱方法,將兩者連成一個完整流程。
AIWiki要解決嘅核心問題係:一篇文章或連結進入系統後,能否自動經歷加工,產出可複用嘅內容資產。
加工流水線:從原文到創意積木
- 1 手動收集:用戶主動丟入嘅文章已經經過篩選,值得優先處理。唔急住搞全自動監聽。
- 2 Raw原文歸檔:先保留原文,避免AI總結出錯或日後理解改變。原文係原材料倉庫,後面所有拆解都可追溯。
- 3 Source Card資料卡:將原文壓縮成一張快速判斷價值嘅卡片,回答「講咗咩、核心觀點、適合場景、同邊啲主題有關、以後點用」。
- 4 Creative Assets創意積木:拆出可複用嘅鈎子金句、結構案例、轉化弧等,比原文更適合組合使用。
選題與大綱:讓資料進入寫作狀態
寫文章最痛苦嘅一步係諗選題。但如果前面資料卡同創意積木已經積累起,選題就可以從素材裏便長出來,唔使拍腦袋。
選題唔係憑空諗,而係基於已沉澱嘅資料、觀點同積木生成出來。
有咗選題之後,AIWiki會根據資料卡、創意積木同選題生成一個文章大綱。大綱唔需要一次完美,但至少畀一個寫作起點,將文章從「想法」變成「可以開始寫」。
- 選題要問:呢篇資料能支撐邊啲選題?適合寫觀點文、教程文定係案例覆盤?
- 大綱價值:讓一篇文章從「想法」變成「可以開始寫」,降低寫作起步門檻。
第一版原則:先跑通單篇,再談自動化
MaxKing強調第一版唔好做大而全,唔好一開始就追求自動抓取、批量處理、飛書監聽等。最重要係:你畀一篇文章或一個連結,AIWiki能完整跑通保存原文、生成資料卡、提取創意積木、生成選題同大綱。
另外,內容產出後一定要迴流知識庫:邊個標題更有效?邊句話被讀者轉發?邊個觀點被質疑?評論區問咗咩問題?呢啲反饋補充返去,先令知識庫變成持續進化嘅系統。
沒有迴流的知識庫只係輸入系統;有咗迴流,先成為持續進化嘅內容系統。
MaxKing寶藏
全棧開發者 × 量化交易 × AI 重度用戶。呢度記低我用 AI 提高效率、解決問題、優化流程 嘅真實實踐,仲分享工具背後嘅判斷、踩坑同可重用方法。
AIWiki · 個人知識工廠 04

之前幾篇,我不斷喺度講一個問題:
點解我哋收藏咗咁多文章,最後都係用唔返?
第一篇講嘅係收藏食塵。好多資料只係俾人保存咗,但冇被拆開、冇被調用,亦冇進入寫作流程。【點解你收藏咗咁多文章,最後都係寫唔出想要嘅文章?你要打造自己嘅個人知識工廠】
第二篇講嘅係 LLM Wiki。佢俾我嘅啟發係,知識庫唔應該只係臨時揾資料,而係要俾 AI 持續整理、更新同維護。【Karpathy 嘅 LLM Wiki 俾咗我一個啟發:知識庫唔應該只係收藏夾,而係加工成可調用、可維護、可產出嘅內容資產,提升寫作同內容創作效率】
第三篇,我將 Dan Koe 嘅內容輸出思路同 LLM Wiki 嘅知識沉澱思路擺埋一齊睇,發現佢哋其實啱啱好可以拼成一個更完整嘅方向:【AI知識庫唔應該淨係識得收藏:我想打造一個可以自動加工嘅AI知識庫,將 Dan Koe 同 LLM Wiki 合成 AIWiki】
Dan Koe 解決輸出,LLM Wiki 解決沉澱。AIWiki 要做嘅,就係將呢兩件事連埋一齊。
所以呢篇開始,我唔再淨係講「點解」,而係開始講:AIWiki 究竟點樣運行?
01
-MaxKing.cc-
一篇文章入咗 AIWiki 之後,會經歷啲乜?
我對 AIWiki 嘅理解,唔係「將資料儲存入去」。
如果只係儲存入去,咁佢同普通收藏夾冇本質分別。
我真正想要嘅係:一篇文章或者一個連結入咗系統之後,可以自動經歷一輪加工。
文章 / 連結
↓
手動收集資料
↓
Raw 原文歸檔
↓
Source Card 資料卡
↓
Creative Assets 創意積木
↓
Topics 選題
↓
Outline 文章大綱
↓
內容產出 / 迴流知識庫
呢條線睇落唔複雜,但佢解決嘅係一個好核心嘅問題:資料唔係俾人儲起,而係加工成可以繼續使用嘅內容資產。
以前我收藏文章,收藏完就完咗。而家我希望一篇文章入嚟之後,至少可以回答幾個問題:
呢篇文章講咗啲乜?
入面有邊啲觀點值得留低?
有冇可以重用嘅結構?
可唔可以拆出幾個選題?
可唔可以直接生成一篇文章嘅大綱?
如果呢啲問題答唔到,咁佢就只係一個連結。但如果呢啲問題都可以答到,佢先開始變成我嘅知識資產。

02
-MaxKing.cc-
第一步唔係全自動,而係手動收集
好多人一聽到知識庫自動化,就會諗:係咪要自動抓取全網?係咪要自動監聽公眾號、飛書、微信、RSS?係咪要批量抓連結,然後自動入庫?
呢啲之後當然可以做。
但我而家反而覺得,第一版唔應該一嚟就搞得太複雜。
第一步應該係:先處理用戶主動收集嘅資料。
因為你手動掉入嚟嘅文章,本身已經經過咗一次篩選。
佢好大機會係你覺得有價值嘅,可能同你嘅工作有關,可能同你正在寫嘅內容有關,亦可能係你想之後反覆使用嘅資料。
呢種資料,唔需要先搞一套複雜評分。
你都主動掉入嚟,即係話佢已經值得被處理。
所以 AIWiki 嘅第一版,我會先做一個好剋制嘅版本:
用戶俾一篇文章,或者俾一個連結。AIWiki 負責將佢加工好。唔追求一下子批量處理幾百篇,亦唔追求即刻全自動監聽各種渠道。
先將一篇真正有價值嘅資料,完整行通。呢件事做好,後面嘅自動化先有意義。
03
-MaxKing.cc-
先保留原文,再壓縮成資料卡
資料入咗 AIWiki 之後,第一件事唔係總結。
而係保存原文。
呢一步我叫佢 Raw 原文歸檔。
點解要先保留原文?因為 AI 總結可能會錯。佢可能漏咗上下文,可能誤解作者原意,亦可能將一個只係推測嘅內容寫到似結論。
而且我哋自己嘅理解都會變。一篇文章,今日睇可能只係普通資料,過幾個月再睇,可能就會變成一個關鍵案例。
所以原文唔可以掉。
Raw 層嘅作用,唔係要我哋日日去讀原文。佢更加似工廠裏面嘅原材料倉庫。
後面無論點樣拆解、點樣生成資料卡、點樣提取選題,都要可以追溯到原文。
冇 Raw 層,知識庫就容易變成一堆 AI 摘要。睇落好整齊,但底層唔穩。
原文保留低之後,下一步係生成 Source Card,即係資料卡。
點解要有資料卡?因為原文太長喇。
一篇文章幾千字甚至上萬字,你唔可能每次寫嘢嗰陣都重新讀一次。
資料卡嘅作用,就係將呢篇文章壓縮成一張可以快速判斷價值嘅卡片。
注意,呢個唔係普通摘要。
普通摘要只係話俾你知「呢篇文章講咗啲乜」。而 Source Card 更關心嘅係:呢篇文章之後點樣用?
04
-MaxKing.cc-
真正可以被重用嘅,係創意積木
去到呢一步,AIWiki 先真正開始有意思。
因為好多文章真正有價值嘅,唔係成篇原文,而係裏面嗰啲可以拆出嚟、重新組合、反覆使用嘅部分。
我將佢哋叫做:創意積木。
呢啲嘢,比原文本身更適合重用。
你收藏一篇文章,可能之後好少再完整讀佢。但你拆出一個好開頭,可能之後寫 5 篇文章都可以參考。
創意積木,係 AIWiki 由「知識管理」走向「內容生產」嘅關鍵層。
05
-MaxKing.cc-
選題同大綱:令資料進入寫作狀態
好多人寫文章嗰陣,最痛苦嘅一步就係諗選題。
坐喺電腦前諗:今日寫乜?呢個方向有冇人睇?呢個角度係咪太普通?我有冇足夠資料支撐?越諗越卡。
但如果之前資料卡同創意積木已經積累起咗,選題就唔一定要憑空諗。
佢可以從素材裏面生出來。
呢篇資料可以支撐邊啲選題?
適合寫觀點文、教程文,定係案例覆盤?
可唔可以同之前嘅資料組合出新角度?
適合公眾號文章,定係適合視頻腳本?
咁一嚟,選題就唔係拍腦袋,而係基於已經沉澱嘅資料、觀點同積木生成出嚟嘅。
有咗選題,仲唔等於寫得。選題只係方向,真正可以令你開始動筆嘅係大綱。
所以 AIWiki 嘅下一步,係根據之前嘅資料卡、創意積木同選題,生成一個文章大綱。
呢個大綱唔需要一次完美。但佢至少應該俾我一個寫作起點。
大綱嘅價值,係令一篇文章由「想法」變成「可以開始寫」。
06
-MaxKing.cc-
內容產出之後,仲要回流知識庫
好多知識庫去到內容產出呢度就完咗。
但我覺得仲差一步:迴流。
一篇文章發出去之後,佢會產生新嘅信息。
邊個標題更有效?
邊句話俾讀者轉發?
邊個觀點俾人質疑?
評論區問咗邊啲問題?
有冇新嘅選題方向?
呢啲嘢唔可以掉。佢哋應該重新返返去知識庫裏面。
資料入系統,生成內容。內容發佈出去,產生反饋。反饋再返去系統,補充新嘅判斷。
呢個先係閉環。

冇迴流,知識庫只係輸入系統;有咗迴流,佢先開始變成持續進化嘅內容系統。
07
-MaxKing.cc-
第一版先行通單篇,唔好急住批量自動化
最後講下我而家對第一版 AIWiki 嘅判斷。
我唔會一嚟就做大而全。
唔會一開始就追求自動抓取、批量處理、飛書羣監聽、微信入口、Discord 入口。
呢啲後面都可以做。
但第一版最重要嘅係:
將一篇資料加工好。
如果單篇資料都加工唔好,批量只會批量製造垃圾。
如果單篇流程唔穩定,自動收集只會自動製造混亂。
所以第一版 AIWiki 嘅目標好清楚:
你俾佢一篇文章,或者一個連結;
佢可以保存原文;
可以生成資料卡;
可以提取創意積木;
可以生成選題;
可以生成文章大綱。
只要呢條小閉環可以穩定行起嚟,就已經好有價值。
08
-MaxKing.cc-
下一篇,繼續拆 AIWiki 嘅核心產物
到呢度,AIWiki 嘅整體流程就清楚曬。
佢唔係一個收藏夾,亦唔係一個簡單嘅 AI 摘要工具,更加唔係一個淨係識得問答嘅知識庫。
佢係一條由資料輸入到內容輸出嘅加工流水線。
文章或連結入咗嚟之後,唔係結束,而係開始。
下一篇,我會繼續拆:
AIWiki 真正生成嘅唔係筆記,而係呢 4 類內容資產。
包括 Source Card 資料卡、Creative Assets 創意積木、Topics 選題卡、Outline 文章大綱。
如果你都想睇呢套 AI知識庫點樣一步步搭起嚟,可以關注公眾號,回覆:
關注公眾號,回覆:
AIWiki
我會繼續整理《AIWiki 個人知識工廠流程圖》,
亦都會喺羣裏面同步最新開發進度。
下一篇預告
AIWiki 真正生成嘅唔係筆記,而係呢 4 類內容資產。
- END -
關於 MaxKing寶藏
我係 MaxKing,全棧開發者、量化交易實踐者,亦係 AI 重度用戶。呢度分享嘅唔係遙遠概念,而係我喺真實使用、搭建同踩坑之後留低嘅判斷。
如果呢篇文章對你有啟發,歡迎點讚、在看、轉發,亦歡迎加我好友交流 AI 工具同自動化實踐。
MaxKing寶藏
全棧開發者 × 量化交易 × AI 重度用戶。這裏記錄我用 AI 提升效率、解決問題、優化流程 的真實實踐,也分享工具背後的判斷、踩坑和可複用方法。
AIWiki · 個人知識工廠 04

前面幾篇,我一直在講一個問題:
為什麼我們收藏了那麼多文章,最後還是用不起來?
第一篇講的是收藏吃灰。很多資料只是被保存了,但沒有被拆開、沒有被調用,也沒有進入寫作流程。【為什麼你收藏了那麼多文章,最後還是寫不出來想要的文章?你要打造自己的個人知識工廠】
第二篇講的是 LLM Wiki。它給我的啓發是,知識庫不應該只是臨時翻資料,而應該讓 AI 持續整理、更新和維護。【Karpathy 的 LLM Wiki 給了我一個啓發:知識庫不該只是收藏夾,而是加工成可調用、可維護、可產出的內容資產,提寫作和內容創作效率】
第三篇,我把 Dan Koe 的內容輸出思路和 LLM Wiki 的知識沉澱思路放在一起看,發現它們其實剛好能拼成一個更完整的方向:【AI知識庫不該只會收藏:我想打造一個能自動加工的AI知識庫,把 Dan Koe 和 LLM Wiki 合成 AIWiki】
Dan Koe 解決輸出,LLM Wiki 解決沉澱。AIWiki 要做的,就是把這兩件事連起來。
所以這篇開始,我不再只講“為什麼”,而是開始講:AIWiki 到底怎麼跑?
01
-MaxKing.cc-
一篇文章進入 AIWiki 後,會經歷什麼?
我對 AIWiki 的理解,不是“把資料存進去”。
如果只是存進去,那它和普通收藏夾沒有本質區別。
我真正想要的是:一篇文章或一個連結進入系統後,能自動經歷一輪加工。
文章 / 連結
↓
手動收集資料
↓
Raw 原文歸檔
↓
Source Card 資料卡
↓
Creative Assets 創意積木
↓
Topics 選題
↓
Outline 文章大綱
↓
內容產出 / 迴流知識庫
這條線看起來不復雜,但它解決的是一個很核心的問題:資料不是被存起來,而是被加工成可以繼續使用的內容資產。
以前我收藏文章,收藏完就結束了。現在我希望一篇文章進來以後,至少能回答幾個問題:
這篇文章講了什麼?
裏面有哪些觀點值得留下?
有沒有可以複用的結構?
能不能拆出幾個選題?
能不能直接生成一篇文章的大綱?
如果這些問題回答不了,那它就只是一個連結。但如果這些問題都能回答,它才開始變成我的知識資產。

02
-MaxKing.cc-
第一步不是全自動,而是手動收集
很多人一聽到知識庫自動化,就會想到:是不是要自動抓取全網?是不是要自動監聽公眾號、飛書、微信、RSS?是不是要批量抓連結,然後自動入庫?
這些以後當然可以做。
但我現在反而覺得,第一版不應該一上來就搞得太複雜。
第一步應該是:先處理用戶主動收集的資料。
因為你手動丟進來的文章,本身已經經過了一次篩選。
它大概率是你覺得有價值的,可能和你的工作有關,可能和你正在寫的內容有關,也可能是你想以後反覆使用的資料。
這種資料,不需要先搞一套複雜評分。
你都主動丟進來了,說明它已經值得被處理。
所以 AIWiki 的第一版,我會先做一個很剋制的版本:
用戶給一篇文章,或者給一個連結。AIWiki 負責把它加工好。不追求一下子批量處理幾百篇,也不追求馬上全自動監聽各種渠道。
先把一篇真正有價值的資料,完整跑通。這件事做好,後面的自動化才有意義。
03
-MaxKing.cc-
先保留原文,再壓縮成資料卡
資料進入 AIWiki 後,第一件事不是總結。
而是保存原文。
這一步我叫它 Raw 原文歸檔。
為什麼要先保留原文?因為 AI 總結可能會錯。它可能漏掉上下文,可能誤解作者原意,也可能把一個只是推測的內容寫得像結論。
而且我們自己的理解也會變。一篇文章,今天看可能只是普通資料,過幾個月再看,可能就會變成一個關鍵案例。
所以原文不能丟。
Raw 層的作用,不是讓我們天天去讀原文。它更像工廠裏的原材料倉庫。
後面無論怎麼拆解、怎麼生成資料卡、怎麼提取選題,都要能追溯回原文。
沒有 Raw 層,知識庫就容易變成一堆 AI 摘要。看起來很整齊,但底層不穩。
原文保留下來之後,下一步是生成 Source Card,也就是資料卡。
為什麼要有資料卡?因為原文太長了。
一篇文章幾千字甚至上萬字,你不可能每次寫東西時都重新讀一遍。
資料卡的作用,就是把這篇文章壓縮成一張可以快速判斷價值的卡片。
注意,這不是普通摘要。
普通摘要只是告訴你“這篇文章講了什麼”。而 Source Card 更關心的是:這篇文章以後怎麼用?
04
-MaxKing.cc-
真正能被複用的,是創意積木
到了這一步,AIWiki 才真正開始有意思。
因為很多文章真正有價值的,不是整篇原文,而是裏面那些可以被拆出來、重新組合、反覆使用的部分。
我把它們叫做:創意積木。
這些東西,比原文本身更適合複用。
你收藏一篇文章,可能以後很少再完整讀它。但你拆出一個好開頭,可能以後寫 5 篇文章都能參考。
創意積木,是 AIWiki 從“知識管理”走向“內容生產”的關鍵層。
05
-MaxKing.cc-
選題和大綱:讓資料進入寫作狀態
很多人寫文章時,最痛苦的一步就是想選題。
坐在電腦前想:今天寫什麼?這個方向有沒有人看?這個角度是不是太普通?我有沒有足夠資料支撐?越想越卡。
但如果前面資料卡和創意積木已經積累起來,選題就不一定要憑空想。
它可以從素材里長出來。
這篇資料能支撐哪些選題?
適合寫觀點文、教程文,還是案例覆盤?
能不能和之前的資料組合出新角度?
適合公眾號文章,還是適合視頻腳本?
這樣一來,選題就不是拍腦袋,而是基於已經沉澱的資料、觀點和積木生成出來的。
有了選題,還不等於能寫。選題只是方向,真正能讓你開始動筆的是大綱。
所以 AIWiki 的下一步,是根據前面的資料卡、創意積木和選題,生成一個文章大綱。
這個大綱不需要一次完美。但它至少應該給我一個寫作起點。
大綱的價值,是讓一篇文章從“想法”變成“可以開始寫”。
06
-MaxKing.cc-
內容產出之後,還要回流知識庫
很多知識庫到內容產出這裏就結束了。
但我覺得還差一步:迴流。
一篇文章發出去之後,它會產生新的信息。
哪個標題更有效?
哪句話被讀者轉發?
哪個觀點被質疑?
評論區問了哪些問題?
有沒有新的選題方向?
這些東西不能丟。它們應該重新回到知識庫裏。
資料進入系統,生成內容。內容發佈出去,產生反饋。反饋再回到系統,補充新的判斷。
這才是閉環。

沒有迴流,知識庫只是輸入系統;有了迴流,它才開始變成持續進化的內容系統。
07
-MaxKing.cc-
第一版先跑通單篇,別急着批量自動化
最後說一下我現在對第一版 AIWiki 的判斷。
我不會一上來就做大而全。
不會一開始就追求自動抓取、批量處理、飛書羣監聽、微信入口、Discord 入口。
這些後面都可以做。
但第一版最重要的是:
把一篇資料加工好。
如果單篇資料都加工不好,批量只會批量製造垃圾。
如果單篇流程不穩定,自動收集只會自動製造混亂。
所以第一版 AIWiki 的目標很清楚:
你給它一篇文章,或者一個連結;
它能保存原文;
能生成資料卡;
能提取創意積木;
能生成選題;
能生成文章大綱。
只要這條小閉環能穩定跑起來,就已經很有價值。
08
-MaxKing.cc-
下一篇,繼續拆 AIWiki 的核心產物
到這裏,AIWiki 的整體流程就清楚了。
它不是一個收藏夾,也不是一個簡單的 AI 摘要工具,更不是一個只會問答的知識庫。
它是一條從資料輸入到內容輸出的加工流水線。
文章或連結進來之後,不是結束,而是開始。
下一篇,我會繼續拆:
AIWiki 真正生成的不是筆記,而是這 4 類內容資產。
包括 Source Card 資料卡、Creative Assets 創意積木、Topics 選題卡、Outline 文章大綱。
如果你也想看這套 AI知識庫怎麼一步步搭起來,可以關注公眾號,回覆:
關注公眾號,回覆:
AIWiki
我會繼續整理《AIWiki 個人知識工廠流程圖》,
也會在羣裏同步最新開發進度。
下一篇預告
AIWiki 真正生成的不是筆記,而是這 4 類內容資產。
- END -
關於 MaxKing寶藏
我是 MaxKing,全棧開發者、量化交易實踐者,也是 AI 重度用戶。這裏分享的不是遙遠概念,而是我在真實使用、搭建和踩坑後留下的判斷。
如果這篇文章對你有啓發,歡迎點贊、在看、轉發,也歡迎加我好友交流 AI 工具和自動化實踐。