YC CEO把自己第二大腦系統開源了:專供OpenClaw與Hermes,全息記憶打造迷你AGI

作者:AI寒武紀
日期:2026年4月11日 下午12:26
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

YC CEO Garry Tan 開源 GBrain:一個讓 AI agent 擁有持續成長記憶嘅知識底座

整理版摘要

YC 總裁 Garry Tan 最近開源咗佢自己用嘅第二大腦系統 GBrain,呢套系統專門為 OpenClawHermes Agent 設計,目標係解決 AI agent 點樣管理大量個人知識嘅問題。Garry 自己已經用佢管理咗超過 10000 個 Markdown 文件、3000 份人物檔案、13 年日曆數據,仲有大量會議記錄同原始想法。佢發現只要畀 agent 一個可以不斷讀取同寫入嘅知識庫,每次對話都可以累積新資訊,令 agent 愈用愈聰明。文章詳細解釋咗 GBrain 嘅核心邏輯、知識模型、搜索機制、部署方式同技能架構,最後仲提供咗 GitHub 開源連結。

GBrain 嘅核心運作係一個循環:當有新信號(會議、郵件、推文等)到來,agent 先識別入面嘅實體(人物、公司、想法),然後讀取知識庫獲取相關背景,帶住完整上下文回答問題,最後將新資訊寫入知識庫並同步索引。呢個循環每轉一圈,知識庫就積累多一層,agent 嘅記憶就會愈來愈豐富。Garry 仲加入咗「夢境循環」,即係喺佢睡覺時 agent 會自動掃描對話、補充缺失實體、修復斷開引用,令知識庫喺佢醒來時更完整。

呢個系統最值得留意嘅係佢嘅實用性同可擴展性。GBrainPGLite(透過 WASM 執行嘅嵌入式 Postgres)做本地儲存,一條命令就可以初始化,完全唔需要 server。當知識庫超出本地能力,可以一鍵遷移去託管 Supa…

  • GBrain 係一個可以讓 AI agent 持續累積知識嘅知識庫系統,每次對話都喺已有基礎上增加新資訊。
  • 核心係一個循環:信號 → 識別實體 → 讀取知識庫 → 回答 → 寫入新資訊 → 同步索引。
  • 對比傳統無記憶嘅 agent,GBrain 令 agent 隨時間愈用愈聰明,差距每日拉大。
  • Garry Tan 用「夢境循環」令 agent 喺佢睡覺時自動掃描對談、修復記憶,實現真正嘅自動化知識管理。
  • GBrain 開源咗,30 分鐘內可以部署,支援 MCP 協議,可以對接 Claude CodeCursor 等工具,仲有完整嘅數據接入方案。
值得記低
連結 github.com

GBrain GitHub 項目

Garry Tan 開源嘅 GBrain 系統,MIT 協議,包含完整安裝指南、配置範例同技能文件。

整理重點

背景與核心循環:點樣令 AI agent 有記憶

YC 總裁 Garry Tan 開源咗佢自己用嘅第二大腦系統 GBrain,專門為 OpenClawHermes Agent 設計。佢嘅規模好誇張:管理緊 10000 多個 Markdown 文件、3000 多份人物檔案、13 年日曆數據、280 多份會議記錄同 300 多個原始想法。

GBrain 嘅核心邏輯係一個循環:信號到來(會議、郵件、推文)→ agent 識別實體(人物、公司、想法)→ 先讀取知識庫 → 帶住完整上下文回答 → 將新資訊寫回知識庫 → 同步索引。呢個循環每轉一圈,知識庫就積累一層。

Garry 仲加入咗 「夢境循環」:agent 喺佢睡覺時自動掃描每一次對話,補充缺失實體,修復斷開嘅引用,整合記憶。佢醒來時,知識庫比睡前更完整。

整理重點

部署簡單,數據接入齊全

起步只需一條命令:gbrain init,預設用 PGLite(透過 WASM 執行嘅嵌入式 Postgres 17.5),唔需要 Supabase、Docker 或者連接字符串。當知識庫超出本地能力(1000 個文件以上),可以 gbrain migrate --to supabase 一鍵遷移到託管 Postgres。

GBrain 支援三種使用路徑:獨立命令行(直接喺終端用 gbrain query)、MCP 伺服器(對接 Claude CodeCursor 等)、遠端 MCP 伺服器(透過 Supabase Edge Functions,可以從任何設備訪問)。

MCP 配置範例 json
{
 "mcpServers": {
 "gbrain": {
 "command": "gbrain",
 "args": ["serve"]
 }
 }
}

數據接入方面,GBrain 自帶多種集成:Voice-to-Brain(電話通話)、Email-to-BrainGmail)、X-to-Brain(推文)、Calendar-to-Brain(Google 日曆)、Meeting Sync(Circleback 會議記錄)。全部由 agent 讀取配置後向你索取 API 密鑰並自動配置。

整理重點

技能文件:唔係硬編碼,而係行動手冊

GBrain 嘅 agent 行為透過 技能文件 定義,本質上係一批 Markdown 文檔,話畀 agent 點用知識庫,而唔係將邏輯硬編碼入二進制文件。技能文件包括:ingest(如何導入內容)、query(三層搜索)、maintain(定期健康檢查)、enrich(從外部 API 補充內容)、briefing(每日簡報)、migrate(從 Obsidian 等遷移)。

Garry 強調:工具本身唔夠,agent 仲需要行動手冊——幾時讀取,幾時寫入,點樣識別實體,點樣將所有內容關聯埋一齊。

項目已經喺 GitHub 開源,採用 MIT 協議。如果你都想令你嘅 AI agent 有持續成長嘅記憶,不妨試下。

圖片


↑睇之前記得關注+星標⭐️,😄,每日先可以第一時間收到更新


 

 

YC CEO 開源咗佢自己搭建嘅OpenClaw/Hermes Agent配置GBrain,如果你希望嘅話,你嘅OpenClaw或者Hermes Agent可以完美記住曬所有10000幾個Markdown檔案,GBrain可以幫到你。

 

YC總裁Garry Tan啱啱開源咗佢嘅第二大腦系統GBrain,簡單來講,GBrain解決嘅係點樣用AI管理你個腦入面嘅知識。

呢套系統嘅核心思路係:讓AI agent擁有一個持續成長嘅知識庫,喺每次回答問題之前先讀取佢,對話結束之後再寫入新內容。

GBrain係咩?

GBrain係一個AI agent嘅知識底座。佢將你嘅會議記錄、電郵、推文、日曆事件、語音通話、原始想法全部匯入一個可以檢索嘅知識庫,agent喺每次回答之前會先讀取呢個知識庫,對話結束之後再寫入新資訊。每一輪對話都令agent變得更加聰明啲。

由安裝到完整運行,大約需要30分鐘。數據庫初始化只需要2秒,用PGLite,唔需要任何伺服器。

Garry Tan本人嘅部署規模:10000多個Markdown檔案、3000多份人物檔案、13年嘅日曆數據、280多份會議記錄、300多個原始想法。

目前支援Claude Opus 4.6同GPT-5.4 Thinking,唔適合喺細模型上面運行。

複利效應

GBrain嘅核心邏輯係一個循環:

信號嚟到(會議、電郵、推文、連結)→ agent識別實體(人物、公司、想法)→ 先讀取知識庫 → 帶住完整上下文回答 → 將新資訊寫返知識庫 → 同步索引,俾下次檢索使用

呢個循環每轉一圈,知識庫就積累一層。你同某人開咗個會,agent同佢建一個檔案頁,關聯到佢嘅公司,打上相關標籤。下個星期另一個人喺完全唔同嘅話題入面提到呢間公司,agent已經有咗完整背景:你同邊個傾過、傾咗啲咩、仲有邊啲未處理嘅線索。你咩都唔使做。

冇呢個循環,agent每次都從零開始。有咗佢,每次對話都喺已有基礎上累積。差距每日都喺度拉大。

GBrain答得到嘅問題例子:

  • • 邊個同時識Pedro同Diana,適合邀請嚟一齊食晚飯?(喺3000多個人物檔案構成嘅社交圖譜入面交叉檢索)
  • • 我之前點樣看待「羞恥感同創始人表現之間嘅關係」?(搜你自己嘅思考記錄,唔係搜互聯網)
  • • 30分鐘之後要同Jordan開會,幫我準備一下。(提取檔案、共同歷史、最近動態、未完事項)

呢套嘢係點樣嚟嘅

Garry Tan喺配置自己嘅OpenClaw agent嗰陣,開始維護一個Markdown知識庫:每人一頁,每間公司一頁,頂部係已整理嘅核心資訊,底部係只追加唔修改嘅時間線。隨住持續寫入,agent變得越來越有用,佢就不斷餵佢。

一個禮拜之內,佢就建立咗10000多個檔案。

佢嘅agent喺佢瞓覺嗰陣都喺度運行。所謂「夢境循環」:掃描每一次對話,補充缺失嘅實體,修復斷開嘅引用,整合記憶。佢醒嚟,知識庫比佢瞓前更加完整。詳細嘅定時任務配置見 https://github.com/garrytan/gbrain 入面嘅cron schedule指南。

知識模型

GBrain入面每一頁都跟「已整理事實 + 時間線」嘅結構:

分隔線上面係已整理事實,即係你目前對某件事嘅最佳理解,新證據出現嗰陣會整體重寫。分隔線下面係時間線,只追加,永遠唔修改。

已整理事實係答案,時間線係證據。

搜索點樣運作

問一個問題嗰陣,系統先用Claude Haiku做多查詢擴展,將呢個問題改寫成多種表達方式,然後同時跑向量搜索(HNSW餘弦相似度)同關鍵詞搜索(tsvector),再用RRF融合排名,最後經過四層去重:每頁只保留最優分塊、餘弦相似度超過0.85嘅合併、類型多樣性上限60%、每頁分塊數量上限。

純關鍵詞搜索會漏咗概念性匹配。例如「無視常規做法」搜唔到標題叫「天才嘅公交車票理論」嘅文章,但呢篇文章嘅核心啱啱就係講呢件事。純向量搜索喺精確短語上面表現會變差。RRF融合兩者兼顧,多查詢擴展就覆蓋咗你諗唔到嘅表達方式。

唔需要伺服器起步

gbrain init 默認用PGLite,呢個係經WASM運行嘅嵌入式Postgres 17.5。唔需要Supabase賬號,唔需要Docker,唔需要連接字符串。一條命令就得到完整嘅Postgres知識庫,包含pgvector、混合搜索同全部37個操作。

當知識庫規模超出本地能力(1000個檔案以上),gbrain migrate --to supabase 一鍵遷移到託管Postgres。Supabase免費層(500MB)裝唔到大規模知識庫,需要Pro版(25美元/月,8GB)。

以7500頁規模嘅知識庫為例,總存儲大約750MB,其中嵌入向量134MB,HNSW索引開銷270MB。初始嵌入成本大約4到5美元(經OpenAI text-embedding-3-large)。

三種使用方法

唔一定非要配合OpenClaw或者Hermes Agent,GBrain支援三種接入方式:

獨立命令行:全域安裝之後直接喺終端使用,gbrain query 就可以檢索筆記。

MCP伺服器:對接Claude Code、Cursor、Windsurf等,GBrain經stdio暴露30個MCP工具,包括get_page、put_page、search、query、add_link、traverse_graph、sync_brain等。配置方式:

{
  "mcpServers"
: {
    "gbrain"
: {
      "command"
: "gbrain",
      "args"
: ["serve"]
    }
  }
}

遠端MCP伺服器:部署到Supabase Edge Functions之後,可以從任何設備、任何AI客戶端訪問,支援Claude Desktop、Perplexity、Cowork等。ChatGPT嘅OAuth 2.1支援尚未實現,自託管方案(Tailscale Funnel、ngrok)喺文檔入面有說明。

數據接入

GBrain自帶多種集成方案,由agent讀取配置文件之後向你索取API密鑰並自動完成配置:

集成
用途
Voice-to-Brain
電話通話轉知識庫頁面(需要Twilio + OpenAI Realtime)
Email-to-Brain
Gmail電郵轉實體頁面
X-to-Brain
推文同提及轉知識庫頁面
Calendar-to-Brain
Google日曆轉可以檢索嘅每日頁面
Meeting Sync
Circleback會議記錄轉知識庫(包括與會者)

技能檔案

GBrain嘅agent行為經技能檔案定義,本質上係一批Markdown文檔,話俾agent知點樣用知識庫,而唔係將邏輯硬編碼入二進制檔案:

  • • ingest:點樣導入會議、文檔、文章,更新已整理事實,追加時間線,建立交叉引用
  • • query:三層搜索(關鍵詞 + 向量 + 結構化),帶來源引用,唔知嘅事直接話唔知
  • • maintain:定期健康檢查,發現矛盾內容、過期已整理事實、孤立頁面、失效連結
  • • enrich:由外部API補充頁面內容
  • • briefing:每日簡報,包含今日會議與會者背景、活躍交易同截止日期、近期變化
  • • migrate:由Obsidian、Notion、Logseq等遷移過嚟

工具本身唔夠,agent仲需要行動手冊:幾時讀取,幾時寫入,點樣識別實體,點樣將所有內容關聯埋一齊。

項目地址:

https://github.com/garrytan/gbrain ,

MIT協議開源。



--end--


最後記得⭐️我,每日都喺更新:如果覺得文章仲唔錯嘅話可以點贊轉發推薦評論

/...@作者:你講得完全正確(YAR師)

圖片


↑閲讀之前記得關注+星標⭐️,😄,每天才能第一時間接收到更新


 

 

YC CEO 開源自己搭建OpenClaw/Hermes Agent 配置GBrain,如果你希望你的 OpenClaw 或 Hermes Agent 能夠完美地記住所有 10,000 多個 markdown 文件,GBrain 可以幫到你。

 

YC總裁Garry Tan剛剛開源了他的第二大腦系統GBrain,簡單來說GBrain 解決的是怎麼用 AI 管理你腦子裏的知識。

這套系統的核心思路是:讓AI agent擁有一個持續成長的知識庫,在每次回答問題前先讀取它,對話結束後再寫入新內容。

GBrain是什麼

GBrain是一個AI agent的知識底座。它把你的會議記錄、郵件、推文、日曆事件、語音通話、原始想法統統匯入一個可檢索的知識庫,agent在每次回答前會先讀取這個知識庫,對話結束後再寫入新信息。每一輪對話都讓agent變得更聰明一些。

從安裝到完整運行,約需30分鐘。數據庫初始化只需2秒,使用PGLite,無需任何服務器。

Garry Tan本人的部署規模:10000多個Markdown文件、3000多份人物檔案、13年的日曆數據、280多份會議記錄、300多個原始想法。

目前支持Claude Opus 4.6和GPT-5.4 Thinking,不適合在小模型上運行。

複利效應

GBrain的核心邏輯是一個循環:

信號到來(會議、郵件、推文、連結)→ agent識別實體(人物、公司、想法)→ 先讀取知識庫 → 帶着完整上下文回答 → 把新信息寫回知識庫 → 同步索引,供下次檢索使用

這個循環每轉一圈,知識庫就積累一層。你跟某人開了個會,agent給他建一個檔案頁,關聯到他的公司,打上相關標籤。下週另一個人在完全不同的話題裏提到這家公司,agent已經有了完整背景:你跟誰談過、談了什麼、還有哪些待處理的線索。你什麼都不用做。

沒有這個循環,agent每次都從零開始。有了它,每次對話都在已有基礎上累積。差距每天都在拉大。

GBrain能回答的問題示例:

  • • 誰同時認識Pedro和Diana,適合邀請來一起吃晚飯?(在3000多個人物檔案構成的社交圖譜裏交叉檢索)
  • • 我之前怎麼看待"羞恥感和創始人表現之間的關係"?(搜索你自己的思考記錄,不是搜互聯網)
  • • 30分鐘後要跟Jordan開會,幫我準備一下。(調取檔案、共同歷史、最近動態、未完事項)

這套東西是怎麼來的

Garry Tan在配置自己的OpenClaw agent時,開始維護一個Markdown知識庫:每人一頁,每家公司一頁,頂部是已整理的核心信息,底部是隻追加不修改的時間線。隨着持續寫入,agent變得越來越有用,他也就一直在餵它。

一週內,他就建起了10000多個文件。

他的agent在他睡覺時也在運行。所謂"夢境循環":掃描每一次對話,補充缺失實體,修復斷開的引用,整合記憶。他醒來,知識庫比他睡前更完整。詳細的定時任務配置見 https://github.com/garrytan/gbrain 中的cron schedule指南。

知識模型

GBrain裏每一頁都遵循"已整理事實 + 時間線"的結構:

分隔線上方是已整理事實,即你當前對某件事的最佳理解,新證據出現時會整體重寫。分隔線下方是時間線,只追加,永不修改。

已整理事實是答案,時間線是證據。

搜索怎麼工作

查詢一個問題時,系統先用Claude Haiku做多查詢擴展,把這個問題改寫成多種表達方式,然後同時跑向量搜索(HNSW餘弦相似度)和關鍵詞搜索(tsvector),再用RRF融合排名,最後經過四層去重:每頁只保留最優分塊、餘弦相似度超過0.85的合併、類型多樣性上限60%、每頁分塊數量上限。

純關鍵詞搜索會漏掉概念性匹配。比如"無視常規做法"搜不到標題叫"天才的公交車票理論"的文章,但這篇文章的核心恰好就是講這件事。純向量搜索在精確短語上表現會變差。RRF融合兩者兼顧,多查詢擴展則覆蓋你沒想到的表達方式。

不需要服務器起步

gbrain init 默認使用PGLite,這是通過WASM運行的嵌入式Postgres 17.5。無需Supabase賬號,無需Docker,無需連接字符串。一條命令就能獲得完整的Postgres知識庫,含pgvector、混合搜索和全部37個操作。

當知識庫規模超出本地能力(1000個文件以上),gbrain migrate --to supabase 一鍵遷移到託管Postgres。Supabase免費層(500MB)裝不下大規模知識庫,需要Pro版(25美元/月,8GB)。

以7500頁規模的知識庫為例,總存儲約750MB,其中嵌入向量134MB,HNSW索引開銷270MB。初始嵌入成本約4到5美元(通過OpenAI text-embedding-3-large)。

三種使用路徑

不一定非要配合OpenClaw或Hermes Agent,GBrain支持三種接入方式:

獨立命令行:全局安裝後直接在終端使用,gbrain query 即可檢索筆記。

MCP服務器:對接Claude Code、Cursor、Windsurf等,GBrain通過stdio暴露30個MCP工具,包括get_page、put_page、search、query、add_link、traverse_graph、sync_brain等。配置方式:

{
  "mcpServers"
: {
    "gbrain"
: {
      "command"
: "gbrain",
      "args"
: ["serve"]
    }
  }
}

遠程MCP服務器:部署到Supabase Edge Functions後,可以從任何設備、任何AI客戶端訪問,支持Claude Desktop、Perplexity、Cowork等。ChatGPT的OAuth 2.1支持尚未實現,自託管方案(Tailscale Funnel、ngrok)在文檔中有說明。

數據接入

GBrain自帶多種集成方案,由agent讀取配置文件後向你索取API密鑰並自動完成配置:

集成
用途
Voice-to-Brain
電話通話轉知識庫頁面(需要Twilio + OpenAI Realtime)
Email-to-Brain
Gmail郵件轉實體頁面
X-to-Brain
推文及提及轉知識庫頁面
Calendar-to-Brain
Google日曆轉可檢索的每日頁面
Meeting Sync
Circleback會議記錄轉知識庫(含參會者)

技能文件

GBrain的agent行為通過技能文件定義,本質上是一批Markdown文檔,告訴agent如何使用知識庫,而不是把邏輯硬編碼進二進制文件:

  • • ingest:如何導入會議、文檔、文章,更新已整理事實,追加時間線,建立交叉引用
  • • query:三層搜索(關鍵詞 + 向量 + 結構化),帶來源引用,不知道的事直接說不知道
  • • maintain:定期健康檢查,發現矛盾內容、過期已整理事實、孤立頁面、失效連結
  • • enrich:從外部API補充頁面內容
  • • briefing:每日簡報,包含今日會議參與者背景、活躍交易及截止日期、近期變化
  • • migrate:從Obsidian、Notion、Logseq等遷移過來

工具本身不夠,agent還需要行動手冊:何時讀取,何時寫入,如何識別實體,如何把所有內容關聯起來。

項目地址:

https://github.com/garrytan/gbrain ,

MIT協議開源。



--end--


最後記得⭐️我,每天都在更新:如果覺得文章還不錯的話可以點贊轉發推薦評論

/...@作者:你說的完全正確(YAR師)