YC CEO把自己第二大腦系統開源了:專供OpenClaw與Hermes,全息記憶打造迷你AGI
整理版優先睇
YC CEO Garry Tan 開源 GBrain:一個讓 AI agent 擁有持續成長記憶嘅知識底座
YC 總裁 Garry Tan 最近開源咗佢自己用嘅第二大腦系統 GBrain,呢套系統專門為 OpenClaw 同 Hermes Agent 設計,目標係解決 AI agent 點樣管理大量個人知識嘅問題。Garry 自己已經用佢管理咗超過 10000 個 Markdown 文件、3000 份人物檔案、13 年日曆數據,仲有大量會議記錄同原始想法。佢發現只要畀 agent 一個可以不斷讀取同寫入嘅知識庫,每次對話都可以累積新資訊,令 agent 愈用愈聰明。文章詳細解釋咗 GBrain 嘅核心邏輯、知識模型、搜索機制、部署方式同技能架構,最後仲提供咗 GitHub 開源連結。
GBrain 嘅核心運作係一個循環:當有新信號(會議、郵件、推文等)到來,agent 先識別入面嘅實體(人物、公司、想法),然後讀取知識庫獲取相關背景,帶住完整上下文回答問題,最後將新資訊寫入知識庫並同步索引。呢個循環每轉一圈,知識庫就積累多一層,agent 嘅記憶就會愈來愈豐富。Garry 仲加入咗「夢境循環」,即係喺佢睡覺時 agent 會自動掃描對話、補充缺失實體、修復斷開引用,令知識庫喺佢醒來時更完整。
呢個系統最值得留意嘅係佢嘅實用性同可擴展性。GBrain 用 PGLite(透過 WASM 執行嘅嵌入式 Postgres)做本地儲存,一條命令就可以初始化,完全唔需要 server。當知識庫超出本地能力,可以一鍵遷移去託管 Supa…
- GBrain 係一個可以讓 AI agent 持續累積知識嘅知識庫系統,每次對話都喺已有基礎上增加新資訊。
- 核心係一個循環:信號 → 識別實體 → 讀取知識庫 → 回答 → 寫入新資訊 → 同步索引。
- 對比傳統無記憶嘅 agent,GBrain 令 agent 隨時間愈用愈聰明,差距每日拉大。
- Garry Tan 用「夢境循環」令 agent 喺佢睡覺時自動掃描對談、修復記憶,實現真正嘅自動化知識管理。
- GBrain 開源咗,30 分鐘內可以部署,支援 MCP 協議,可以對接 Claude Code、Cursor 等工具,仲有完整嘅數據接入方案。
GBrain GitHub 項目
Garry Tan 開源嘅 GBrain 系統,MIT 協議,包含完整安裝指南、配置範例同技能文件。
背景與核心循環:點樣令 AI agent 有記憶
YC 總裁 Garry Tan 開源咗佢自己用嘅第二大腦系統 GBrain,專門為 OpenClaw 同 Hermes Agent 設計。佢嘅規模好誇張:管理緊 10000 多個 Markdown 文件、3000 多份人物檔案、13 年日曆數據、280 多份會議記錄同 300 多個原始想法。
GBrain 嘅核心邏輯係一個循環:信號到來(會議、郵件、推文)→ agent 識別實體(人物、公司、想法)→ 先讀取知識庫 → 帶住完整上下文回答 → 將新資訊寫回知識庫 → 同步索引。呢個循環每轉一圈,知識庫就積累一層。
Garry 仲加入咗 「夢境循環」:agent 喺佢睡覺時自動掃描每一次對話,補充缺失實體,修復斷開嘅引用,整合記憶。佢醒來時,知識庫比睡前更完整。
知識模型與混合搜索:點樣揾得準
GBrain 入面每一頁都遵循「已整理事實 + 時間線」嘅結構。分隔線上面係已整理事實,即係你目前對某件事嘅最佳理解,新證據出現時會整體重寫;分隔線下面係時間線,只追加唔修改。已整理事實係答案,時間線係證據。
搜索方面,系統先用 Claude Haiku 做 多查詢擴展,將問題改寫成多種表達方式,同時跑 向量搜索(HNSW 餘弦相似度)同 關鍵詞搜索(tsvector),再用 RRF 融合排名,最後經過四層去重:每頁只保留最優分塊、餘弦相似度超過 0.85 嘅合併、類型多樣性上限 60%、每頁分塊數量上限。
純關鍵詞搜索會漏概念性匹配,例如「無視常規做法」搜唔到標題叫「天才嘅公交車票理論」嘅文章;純向量搜索喺精確短語會表現變差。RRF 融合兩者兼顧,多查詢擴展則覆蓋你諗唔到嘅表達方式。
部署簡單,數據接入齊全
起步只需一條命令:gbrain init,預設用 PGLite(透過 WASM 執行嘅嵌入式 Postgres 17.5),唔需要 Supabase、Docker 或者連接字符串。當知識庫超出本地能力(1000 個文件以上),可以 gbrain migrate --to supabase 一鍵遷移到託管 Postgres。
GBrain 支援三種使用路徑:獨立命令行(直接喺終端用 gbrain query)、MCP 伺服器(對接 Claude Code、Cursor 等)、遠端 MCP 伺服器(透過 Supabase Edge Functions,可以從任何設備訪問)。
{
"mcpServers": {
"gbrain": {
"command": "gbrain",
"args": ["serve"]
}
}
}
數據接入方面,GBrain 自帶多種集成:Voice-to-Brain(電話通話)、Email-to-Brain(Gmail)、X-to-Brain(推文)、Calendar-to-Brain(Google 日曆)、Meeting Sync(Circleback 會議記錄)。全部由 agent 讀取配置後向你索取 API 密鑰並自動配置。
技能文件:唔係硬編碼,而係行動手冊
GBrain 嘅 agent 行為透過 技能文件 定義,本質上係一批 Markdown 文檔,話畀 agent 點用知識庫,而唔係將邏輯硬編碼入二進制文件。技能文件包括:ingest(如何導入內容)、query(三層搜索)、maintain(定期健康檢查)、enrich(從外部 API 補充內容)、briefing(每日簡報)、migrate(從 Obsidian 等遷移)。
Garry 強調:工具本身唔夠,agent 仲需要行動手冊——幾時讀取,幾時寫入,點樣識別實體,點樣將所有內容關聯埋一齊。
項目已經喺 GitHub 開源,採用 MIT 協議。如果你都想令你嘅 AI agent 有持續成長嘅記憶,不妨試下。

YC CEO 開源咗佢自己搭建嘅OpenClaw/Hermes Agent配置GBrain,如果你希望嘅話,你嘅OpenClaw或者Hermes Agent可以完美記住曬所有10000幾個Markdown檔案,GBrain可以幫到你。
YC總裁Garry Tan啱啱開源咗佢嘅第二大腦系統GBrain,簡單來講,GBrain解決嘅係點樣用AI管理你個腦入面嘅知識。
呢套系統嘅核心思路係:讓AI agent擁有一個持續成長嘅知識庫,喺每次回答問題之前先讀取佢,對話結束之後再寫入新內容。
GBrain係咩?
GBrain係一個AI agent嘅知識底座。佢將你嘅會議記錄、電郵、推文、日曆事件、語音通話、原始想法全部匯入一個可以檢索嘅知識庫,agent喺每次回答之前會先讀取呢個知識庫,對話結束之後再寫入新資訊。每一輪對話都令agent變得更加聰明啲。
由安裝到完整運行,大約需要30分鐘。數據庫初始化只需要2秒,用PGLite,唔需要任何伺服器。
Garry Tan本人嘅部署規模:10000多個Markdown檔案、3000多份人物檔案、13年嘅日曆數據、280多份會議記錄、300多個原始想法。
目前支援Claude Opus 4.6同GPT-5.4 Thinking,唔適合喺細模型上面運行。
複利效應
GBrain嘅核心邏輯係一個循環:
信號嚟到(會議、電郵、推文、連結)→ agent識別實體(人物、公司、想法)→ 先讀取知識庫 → 帶住完整上下文回答 → 將新資訊寫返知識庫 → 同步索引,俾下次檢索使用
呢個循環每轉一圈,知識庫就積累一層。你同某人開咗個會,agent同佢建一個檔案頁,關聯到佢嘅公司,打上相關標籤。下個星期另一個人喺完全唔同嘅話題入面提到呢間公司,agent已經有咗完整背景:你同邊個傾過、傾咗啲咩、仲有邊啲未處理嘅線索。你咩都唔使做。
冇呢個循環,agent每次都從零開始。有咗佢,每次對話都喺已有基礎上累積。差距每日都喺度拉大。
GBrain答得到嘅問題例子:
• 邊個同時識Pedro同Diana,適合邀請嚟一齊食晚飯?(喺3000多個人物檔案構成嘅社交圖譜入面交叉檢索) • 我之前點樣看待「羞恥感同創始人表現之間嘅關係」?(搜你自己嘅思考記錄,唔係搜互聯網) • 30分鐘之後要同Jordan開會,幫我準備一下。(提取檔案、共同歷史、最近動態、未完事項)
呢套嘢係點樣嚟嘅
Garry Tan喺配置自己嘅OpenClaw agent嗰陣,開始維護一個Markdown知識庫:每人一頁,每間公司一頁,頂部係已整理嘅核心資訊,底部係只追加唔修改嘅時間線。隨住持續寫入,agent變得越來越有用,佢就不斷餵佢。
一個禮拜之內,佢就建立咗10000多個檔案。
佢嘅agent喺佢瞓覺嗰陣都喺度運行。所謂「夢境循環」:掃描每一次對話,補充缺失嘅實體,修復斷開嘅引用,整合記憶。佢醒嚟,知識庫比佢瞓前更加完整。詳細嘅定時任務配置見 https://github.com/garrytan/gbrain 入面嘅cron schedule指南。
知識模型
GBrain入面每一頁都跟「已整理事實 + 時間線」嘅結構:
分隔線上面係已整理事實,即係你目前對某件事嘅最佳理解,新證據出現嗰陣會整體重寫。分隔線下面係時間線,只追加,永遠唔修改。
已整理事實係答案,時間線係證據。
搜索點樣運作
問一個問題嗰陣,系統先用Claude Haiku做多查詢擴展,將呢個問題改寫成多種表達方式,然後同時跑向量搜索(HNSW餘弦相似度)同關鍵詞搜索(tsvector),再用RRF融合排名,最後經過四層去重:每頁只保留最優分塊、餘弦相似度超過0.85嘅合併、類型多樣性上限60%、每頁分塊數量上限。
純關鍵詞搜索會漏咗概念性匹配。例如「無視常規做法」搜唔到標題叫「天才嘅公交車票理論」嘅文章,但呢篇文章嘅核心啱啱就係講呢件事。純向量搜索喺精確短語上面表現會變差。RRF融合兩者兼顧,多查詢擴展就覆蓋咗你諗唔到嘅表達方式。
唔需要伺服器起步
gbrain init 默認用PGLite,呢個係經WASM運行嘅嵌入式Postgres 17.5。唔需要Supabase賬號,唔需要Docker,唔需要連接字符串。一條命令就得到完整嘅Postgres知識庫,包含pgvector、混合搜索同全部37個操作。
當知識庫規模超出本地能力(1000個檔案以上),gbrain migrate --to supabase 一鍵遷移到託管Postgres。Supabase免費層(500MB)裝唔到大規模知識庫,需要Pro版(25美元/月,8GB)。
以7500頁規模嘅知識庫為例,總存儲大約750MB,其中嵌入向量134MB,HNSW索引開銷270MB。初始嵌入成本大約4到5美元(經OpenAI text-embedding-3-large)。
三種使用方法
唔一定非要配合OpenClaw或者Hermes Agent,GBrain支援三種接入方式:
獨立命令行:全域安裝之後直接喺終端使用,gbrain query 就可以檢索筆記。
MCP伺服器:對接Claude Code、Cursor、Windsurf等,GBrain經stdio暴露30個MCP工具,包括get_page、put_page、search、query、add_link、traverse_graph、sync_brain等。配置方式:
{
"mcpServers": {
"gbrain": {
"command": "gbrain",
"args": ["serve"]
}
}
}遠端MCP伺服器:部署到Supabase Edge Functions之後,可以從任何設備、任何AI客戶端訪問,支援Claude Desktop、Perplexity、Cowork等。ChatGPT嘅OAuth 2.1支援尚未實現,自託管方案(Tailscale Funnel、ngrok)喺文檔入面有說明。
數據接入
GBrain自帶多種集成方案,由agent讀取配置文件之後向你索取API密鑰並自動完成配置:
技能檔案
GBrain嘅agent行為經技能檔案定義,本質上係一批Markdown文檔,話俾agent知點樣用知識庫,而唔係將邏輯硬編碼入二進制檔案:
• ingest:點樣導入會議、文檔、文章,更新已整理事實,追加時間線,建立交叉引用 • query:三層搜索(關鍵詞 + 向量 + 結構化),帶來源引用,唔知嘅事直接話唔知 • maintain:定期健康檢查,發現矛盾內容、過期已整理事實、孤立頁面、失效連結 • enrich:由外部API補充頁面內容 • briefing:每日簡報,包含今日會議與會者背景、活躍交易同截止日期、近期變化 • migrate:由Obsidian、Notion、Logseq等遷移過嚟
工具本身唔夠,agent仲需要行動手冊:幾時讀取,幾時寫入,點樣識別實體,點樣將所有內容關聯埋一齊。
項目地址:
https://github.com/garrytan/gbrain ,
MIT協議開源。
--end--
最後記得⭐️我,每日都喺更新:如果覺得文章仲唔錯嘅話可以點贊轉發推薦評論
/...@作者:你講得完全正確(YAR師)

YC CEO 開源自己搭建OpenClaw/Hermes Agent 配置GBrain,如果你希望你的 OpenClaw 或 Hermes Agent 能夠完美地記住所有 10,000 多個 markdown 文件,GBrain 可以幫到你。
YC總裁Garry Tan剛剛開源了他的第二大腦系統GBrain,簡單來說GBrain 解決的是怎麼用 AI 管理你腦子裏的知識。
這套系統的核心思路是:讓AI agent擁有一個持續成長的知識庫,在每次回答問題前先讀取它,對話結束後再寫入新內容。
GBrain是什麼
GBrain是一個AI agent的知識底座。它把你的會議記錄、郵件、推文、日曆事件、語音通話、原始想法統統匯入一個可檢索的知識庫,agent在每次回答前會先讀取這個知識庫,對話結束後再寫入新信息。每一輪對話都讓agent變得更聰明一些。
從安裝到完整運行,約需30分鐘。數據庫初始化只需2秒,使用PGLite,無需任何服務器。
Garry Tan本人的部署規模:10000多個Markdown文件、3000多份人物檔案、13年的日曆數據、280多份會議記錄、300多個原始想法。
目前支持Claude Opus 4.6和GPT-5.4 Thinking,不適合在小模型上運行。
複利效應
GBrain的核心邏輯是一個循環:
信號到來(會議、郵件、推文、連結)→ agent識別實體(人物、公司、想法)→ 先讀取知識庫 → 帶着完整上下文回答 → 把新信息寫回知識庫 → 同步索引,供下次檢索使用
這個循環每轉一圈,知識庫就積累一層。你跟某人開了個會,agent給他建一個檔案頁,關聯到他的公司,打上相關標籤。下週另一個人在完全不同的話題裏提到這家公司,agent已經有了完整背景:你跟誰談過、談了什麼、還有哪些待處理的線索。你什麼都不用做。
沒有這個循環,agent每次都從零開始。有了它,每次對話都在已有基礎上累積。差距每天都在拉大。
GBrain能回答的問題示例:
• 誰同時認識Pedro和Diana,適合邀請來一起吃晚飯?(在3000多個人物檔案構成的社交圖譜裏交叉檢索) • 我之前怎麼看待"羞恥感和創始人表現之間的關係"?(搜索你自己的思考記錄,不是搜互聯網) • 30分鐘後要跟Jordan開會,幫我準備一下。(調取檔案、共同歷史、最近動態、未完事項)
這套東西是怎麼來的
Garry Tan在配置自己的OpenClaw agent時,開始維護一個Markdown知識庫:每人一頁,每家公司一頁,頂部是已整理的核心信息,底部是隻追加不修改的時間線。隨着持續寫入,agent變得越來越有用,他也就一直在餵它。
一週內,他就建起了10000多個文件。
他的agent在他睡覺時也在運行。所謂"夢境循環":掃描每一次對話,補充缺失實體,修復斷開的引用,整合記憶。他醒來,知識庫比他睡前更完整。詳細的定時任務配置見 https://github.com/garrytan/gbrain 中的cron schedule指南。
知識模型
GBrain裏每一頁都遵循"已整理事實 + 時間線"的結構:
分隔線上方是已整理事實,即你當前對某件事的最佳理解,新證據出現時會整體重寫。分隔線下方是時間線,只追加,永不修改。
已整理事實是答案,時間線是證據。
搜索怎麼工作
查詢一個問題時,系統先用Claude Haiku做多查詢擴展,把這個問題改寫成多種表達方式,然後同時跑向量搜索(HNSW餘弦相似度)和關鍵詞搜索(tsvector),再用RRF融合排名,最後經過四層去重:每頁只保留最優分塊、餘弦相似度超過0.85的合併、類型多樣性上限60%、每頁分塊數量上限。
純關鍵詞搜索會漏掉概念性匹配。比如"無視常規做法"搜不到標題叫"天才的公交車票理論"的文章,但這篇文章的核心恰好就是講這件事。純向量搜索在精確短語上表現會變差。RRF融合兩者兼顧,多查詢擴展則覆蓋你沒想到的表達方式。
不需要服務器起步
gbrain init 默認使用PGLite,這是通過WASM運行的嵌入式Postgres 17.5。無需Supabase賬號,無需Docker,無需連接字符串。一條命令就能獲得完整的Postgres知識庫,含pgvector、混合搜索和全部37個操作。
當知識庫規模超出本地能力(1000個文件以上),gbrain migrate --to supabase 一鍵遷移到託管Postgres。Supabase免費層(500MB)裝不下大規模知識庫,需要Pro版(25美元/月,8GB)。
以7500頁規模的知識庫為例,總存儲約750MB,其中嵌入向量134MB,HNSW索引開銷270MB。初始嵌入成本約4到5美元(通過OpenAI text-embedding-3-large)。
三種使用路徑
不一定非要配合OpenClaw或Hermes Agent,GBrain支持三種接入方式:
獨立命令行:全局安裝後直接在終端使用,gbrain query 即可檢索筆記。
MCP服務器:對接Claude Code、Cursor、Windsurf等,GBrain通過stdio暴露30個MCP工具,包括get_page、put_page、search、query、add_link、traverse_graph、sync_brain等。配置方式:
{
"mcpServers": {
"gbrain": {
"command": "gbrain",
"args": ["serve"]
}
}
}遠程MCP服務器:部署到Supabase Edge Functions後,可以從任何設備、任何AI客戶端訪問,支持Claude Desktop、Perplexity、Cowork等。ChatGPT的OAuth 2.1支持尚未實現,自託管方案(Tailscale Funnel、ngrok)在文檔中有說明。
數據接入
GBrain自帶多種集成方案,由agent讀取配置文件後向你索取API密鑰並自動完成配置:
技能文件
GBrain的agent行為通過技能文件定義,本質上是一批Markdown文檔,告訴agent如何使用知識庫,而不是把邏輯硬編碼進二進制文件:
• ingest:如何導入會議、文檔、文章,更新已整理事實,追加時間線,建立交叉引用 • query:三層搜索(關鍵詞 + 向量 + 結構化),帶來源引用,不知道的事直接說不知道 • maintain:定期健康檢查,發現矛盾內容、過期已整理事實、孤立頁面、失效連結 • enrich:從外部API補充頁面內容 • briefing:每日簡報,包含今日會議參與者背景、活躍交易及截止日期、近期變化 • migrate:從Obsidian、Notion、Logseq等遷移過來
工具本身不夠,agent還需要行動手冊:何時讀取,何時寫入,如何識別實體,如何把所有內容關聯起來。
項目地址:
https://github.com/garrytan/gbrain ,
MIT協議開源。
--end--
最後記得⭐️我,每天都在更新:如果覺得文章還不錯的話可以點贊轉發推薦評論
/...@作者:你說的完全正確(YAR師)