為什麼最強 AI Agent 的盡頭,其實是你的文件系統?
整理版優先睇
AI Agent架構最簡單嘅基礎:用文件系統做狀態,唔使複雜工具鏈。
呢篇文章探討AI Agent基礎設施,作者提出最有效嘅架構其實係最簡單嘅文件系統。作者以OpenClaw為例,說明成個上下文就係電腦上嘅文件系統:對話、用戶畫像、記憶都係文件;想接入新數據源就加個新文件就得。呢種「文件優先」思路喺個人場景好管用,對企業級Agent都值得參考。
作者進一步解釋點解文件系統特別對大語言模型胃口:大模型天生就識處理文件結構,成本可以大幅降低(Vercel團隊測試由1美元降到約2毛5)。文件系統仲係天然嘅追加日誌,方便調試;數據飛輪效應令Agent越用越準。作者仲用律所做例子:接新案就喺/cases開目錄,記錄工時就追加去/billing/time-sheet。呢個模型簡單得嚟,已經可以解決企業搞AI嘅兩個硬傷:數據孤島同權限管理。統一命名空間令Agent可以拼湊完整上下文,而文件系統嘅chmod同chown自然對應到公司架構。
總結嚟講,AI Agent架構可以好簡單:將文件系統當狀態,用大模型做編排。用最基礎嘅文件讀寫解決業務問題,可能先係最實在嘅做法。
- 文件系統設計令Agent每次調用成本從1美元降至約0.25美元。
- 大模型本身就擅長處理文件結構,比調用第三方API更順手。
- 文件系統係天然嘅追加日誌,方便調試同狀態管理。
- 數據飛輪效應:接入越多數據源,Agent決策越準,吸引更多數據接入。
- 企業映射為文件系統可統一命名空間解決數據孤島,用chmod/chown自然實現權限管理。
文件優先:OpenClaw嘅啟示
講到AI Agent基礎設施,好多人會諗到複雜工具鏈同API。但其實最好用嘅架構可能係最唔起眼嘅文件系統。OpenClaw嘅設計就係咁:成個上下文就係電腦上嘅文件系統。
用戶對話存在markdown檔案,用戶畫像同AI記憶都係文件。想接入郵件或者睡眠數據?統統變成新文件就得。
呢種「文件優先」思路喺個人場景好管用,對企業級Agent都值得參考。
OpenClaw用文件系統做上下文,證明呢個方向可行
點解文件系統適合大模型?
將系統狀態搞成文件系統聽落好似開倒車,但其實特別對大語言模型胃口。Claude同GPT呢類模型訓練時啃過幾十億行代碼同系統日誌,睇目錄、讀寫文件對佢哋嚟講仲順手過調第三方API。
大模型對文件結構比第三方API更順手
Vercel團隊測試用文件系統方案可將每次調用成本從1美元降到約2毛5。
另外,文件系統就係現成嘅追加日誌。Claude Code會將所有對話同工具調用一行行追加到JSONL檔案,唔使管狀態同步,冇冷起動問題,出bug直接cat檔案就排查到。
追加日誌係天然狀態追蹤機制
仲有數據飛輪效應:接入越多數據源,生成越多文件,Agent掌握嘅上下文就越全,決策更可靠,反過來吸引用戶接入更多數據。
數據飛輪係Agent持續進化嘅關鍵
公司即文件系統:從個人到企業
順住呢個思路,將一間公司映射為文件系統會點?以律所為例,後台可以簡化成一堆資料夾。
- 1 接新案:喺/cases開個目錄
- 2 分俾律師:掉入佢嘅個人目錄
- 3 記錄工時:往/billing/time-sheet追加數據
呢個簡單模型解決企業搞AI嘅兩個硬傷。第一係數據孤島:發票喺財務軟件、郵件喺Outlook、合同喺SharePoint,Agent拼湊唔到完整上下文。
將公司做成文件系統,就等於俾所有數據一個統一命名空間。
統一命名空間解決數據孤島
第二係權限管理:傳統ACL、RBAC好複雜,但文件系統嘅權限同公司架構天然對應——普通員工對自己負責目錄有讀寫權限,主管睇到整個部門。一套chmod同chown就搞掂基礎治理。
chmod同chown自然對應公司架構,大幅降低權限管理複雜度
權限同公司結構天然對應
最實在嘅架構
總結嚟講,AI Agent架構可以好簡單:將文件系統當狀態,用大模型做編排。用最基礎嘅文件讀寫解決業務問題,可能先係最實在嘅做法。
文件系統做狀態,大模型做編排
最簡單架構最實在

一講到 AI Agent 嘅基礎設施,大家第一時間可能會諗到一大堆複雜嘅工具鏈、API 同數據庫。但真正好用嘅架構,其實係最唔起眼嘅文件系統。
睇嚇 OpenClaw 嘅設計就明喇:成個上下文就係電腦上嘅文件系統。用戶嘅對話存在 markdown 文件裏面,用戶畫像同 AI 嘅記憶都係文件。想接入電郵?或者睡眠數據?全部變成新文件就得。呢種「文件優先」嘅思路喺個人場景好有用,對企業級 Agent 嚟講,都係一個值得參考嘅方向。
點解偏偏係文件系統?

將系統狀態整成文件系統,聽起上嚟好似喺度開倒車,但其實佢好啱大語言模型嘅胃口。
首先,大模型天生就識文件系統。好似 Claude 同 GPT 呢類模型,喺訓練嘅時候睇過幾十億行代碼同系統日誌。對佢哋嚟講,睇目錄、讀寫文件、搜索文字,比起調用各種生僻嘅第三方 API 順手好多。Vercel 團隊做過測試,用文件系統方案可以將 Agent 每次調用嘅成本由 1 美金直接降到大概 2 毫 5。
其次,文件系統就係現成嘅追加日誌(Append-only Log)。好似 Claude Code,會將所有嘅對話同工具調用一行行追加到 JSONL 文件裏面。唔使理咩狀態同步,都無冷啓動嘅問題,出 bug 嘅話直接 cat 一下個文件就可以排查。
另外,佢可以行得通數據飛輪。接入嘅數據源越多,生成嘅文件越多,Agent 掌握嘅上下文就越齊全,畀出嘅決策自然更可靠,呢個又會反過來吸引用戶接入更多數據。
公司即係文件系統:由個人到企業

如果順住呢個思路諗落去,將一間公司映射成一個文件系統會點樣?
用律師樓打個比喻,成個後台基本上可以簡化成一堆文件夾。接咗新案件,就喺 /cases 裏面開個目錄;分畀律師之後,就掉入佢嘅個人目錄;記錄工時,就係往 /billing/time-sheet 追加數據。
呢個簡單嘅模型可以解決企業搞 AI 嘅兩個難題。
第一係數據孤島。而家嘅問題係發票喺財務軟件,電郵喺 Outlook,合約喺 SharePoint。數據散曬喺各個 SaaS 裏面,Agent 根本冇辦法拼湊出完整嘅上下文。但如果將公司整成文件系統,就等於俾所有數據建立咗一個統一嘅命名空間。唔理數據本來喺邊,最後都變成咗 /emails/ 或 /contracts/ 下面嘅文件。
第二係權限管理。企業系統嗰啲複雜嘅 ACL、RBAC 模型整合起上嚟令人頭痛。但喺文件系統裏面,權限同公司架構係天生對應嘅:普通員工對自己負責嘅目錄有讀寫權限,主管可以睇曬成個部門嘅檔案。一套 chmod 同 chown 就可以搞掂基本嘅治理結構。
講到尾,AI Agent 嘅架構其實可以好簡單:將文件系統當成狀態,用大模型嚟做編排。呢種用最基本嘅文件讀寫嚟解決業務問題嘅思路,可能係最實在嘅。

一說到 AI Agent 的基礎設施,大家首先想到的可能是一堆複雜的工具鏈、API 和數據庫。但真正好用的架構,其實是最不起眼的文件系統。
看看 OpenClaw 的設計就知道了:整個上下文就是電腦上的文件系統。用戶的對話存在 markdown 文件裏,用戶畫像和 AI 的記憶也是文件。想接入郵件?或者睡眠數據?統統變成新文件就行。這種“文件優先”的思路在個人場景裏很管用,對企業級 Agent 來說,也是個值得參考的思路。
為什麼偏偏是文件系統?

把系統狀態搞成文件系統,聽起來像是在開倒車,但它其實特別對大語言模型的胃口。
首先,大模型天生就懂文件系統。Claude 和 GPT 這種模型,在訓練時啃過幾十億行代碼和系統日誌。對它們來說,看目錄、讀寫文件、搜索文本比調各種生僻的第三方 API 順手得多。Vercel 團隊做過測試,用文件系統方案能把 Agent 每次調用的成本從 1 刀直接降到大概 2 毛 5。
其次,文件系統就是現成的追加日誌(Append-only Log)。比如 Claude Code,會把所有的對話和工具調用一行行追加到 JSONL 文件裏。不用管什麼狀態同步,也沒有冷啓動的問題,出 bug 了直接 cat 一下文件就能排查。
另外,它能跑通數據飛輪。接入的數據源越多,生成的文件越多,Agent 掌握的上下文就越全,給出的決策自然更靠譜,這又會反過來吸引用戶接入更多數據。
公司即文件系統:從個人到企業

如果順着這個思路往下想,把一家公司映射為一個文件系統會怎樣?
拿律所打個比方,整個後台基本能簡化成一套文件夾。接了新案子,就在 /cases 裏建個目錄;分給律師了,就扔進他的個人目錄;記錄工時,就是往 /billing/time-sheet 追加數據。
這個簡單的模型能解決企業搞 AI 的兩個硬傷。
第一是數據孤島。現在的問題是發票在財務軟件,郵件在 Outlook,合同在 SharePoint。數據散在各個 SaaS 裏,Agent 根本拼湊不出完整的上下文。但如果把公司做成文件系統,就相當於給所有數據建了個統一的命名空間。不管數據原來在哪,最後都成了 /emails/ 或 /contracts/ 下的文件。
第二是權限管理。企業系統那些複雜的 ACL、RBAC 模型整合起來讓人頭疼。但在文件系統裏,權限和公司架構是天然對應的:普通員工對自己負責的目錄有讀寫權限,主管能看整個部門的。一套 chmod 和 chown 就能搞定基礎的治理結構。
說到底,AI Agent 的架構其實可以很簡單:把文件系統當狀態,用大模型做編排。這種用最基礎的文件讀寫來解決業務問題的思路,可能才是最實在的。