我的個人 Agent OS:我用 Codex 搭了一個 AI 工作系統

作者:卡卡羅特的貝吉塔星
日期:2026年5月16日 下午10:34
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Codex 搭本地個人 Agent OS,掌控上下文與長期記憶比模型更重要

整理版摘要

呢篇文章由一位重視私隱同掌控感嘅個人開發者分享佢點樣用 CodexOpenAI 嘅執行引擎)搭建一套喺自己電腦度運行嘅個人 AI 工作系統。作者原本用 AI 對話工具同 Agent 平台(例如 OpenClawHermes),但發現呢啲系統本質上係別人嘅機制,冇辦法真正擁有自己嘅長期記憶同上下文。佢拒絕純粹嘅 SaaS 個人助理,因為私隱顧慮同埋遷移成本太高。佢想要嘅係一個基於個人電腦、可同步、可遷移、可自學習嘅個人 Agent。最後揀咗 Codex,因為佢提供掌控感(任務由我觸發)、文件化記憶體系(AGENTS.md、System/Memory/、System/Skills/ 等),同埋背後嘅 OpenAI 生態(執行能力、內容生產、瀏覽器操作等)。佢分享咗自己嘅文件結構,並強調個人 Agent 嘅關鍵唔係模型,而係上下文組織方式。

作者進一步解釋點解 Codex 特別適合承載個人 Agent。Codex 唔係一個完全自主到處走嘅 Agent,而係一個可以被動喚起嘅執行拍檔,任務由人主動觸發,遇到關鍵動作會停低等人確認。呢種關係對個人助理好重要——作者想要嘅係「佢夠懂我」,而唔係「佢亂咁做」。另外,Codex 天生適合讀取項目目錄,可以將個人行為規則寫入 AGENTS.md,將長期偏好放喺 System/Memory/,將高頻工作流沉澱至 System/Skills/。咁樣每次 Codex 進入呢個項目,就唔係由…

  • 個人 Agent 唔應該依賴 SaaS,應該建構喺本機文件系統上以確保私隱同遷移自由。
  • Codex 提供「被動執行拍檔」模式,任務由人觸發,關鍵動作需確認,避免失控。
  • 文件化記憶體系(AGENTS.mdMemory、Skills)令 Agent 每次進入工作環境都能夠讀取長期上下文。
  • 透過流動端連接,Codex 可以喺手機接收指令並喺電腦執行,形成隨身工作流。
  • 真正價值在於上下文組織:聊天機械人回答問題,個人 Agent 基於長期上下文做事同更新系統。
整理重點

點解唔直接用個人助理 SaaS?

作者關注過 Moxt 呢類 Agent workspace,方向好有意思,但係因為私隱同安全顧慮同埋遷移成本,決定唔用。私隱方面,個人助理要接觸大量私人上下文,好似筆記、日程、工作材料、長期偏好呢啲敏感資訊。

私隱同安全

遷移成本

整理重點

我真正想要嘅:五個核心訴求

  1. 1 核心資料喺自己手裡。個人助理要理解長期上下文,但呢啲上下文唔應該完全託管喺外部產品度。
  2. 2 要有穩定嘅記憶體系。唔想每次都重新解釋「我係誰」「我鍾意咩風格」「我做判斷時在意啲咩」。
  3. 3 要足夠可控。任務由我主動觸發,過程畀我睇到,關鍵動作需要我確認。
  4. 4 要能自學習。知道咩唔該記,只沉澱穩定偏好、反覆工作流程同可複用判斷框架。
  5. 5 唔能被鎖死。個人 Agent 最終要係一套我能理解、調整、遷移嘅系統,而唔係一個固定平台嘅黑盒。

穩定嘅記憶體系

自學習

唔能被鎖死

整理重點

點解揀 Codex?

Codex核心原因係掌控感。佢唔係完全自主到處跑嘅 Agent,而係一個可以被動喚起嘅執行拍檔:我畀任務,佢讀取當前項目上下文,遇到關鍵動作會停低等我確認。呢種關係對個人助理好重要——我想要嘅係「佢夠懂我」,而唔係「佢替我亂跑」。

掌控感

任務由我觸發

Codex 好適合承載文件化記憶體系。佢本身喺項目目錄度工作,可以將行為規則寫入 AGENTS.md,將長期偏好放喺 System/Memory/,將高頻工作流沉澱到 System/Skills/。咁樣 Codex 每次進入呢個項目,就唔係由空白對話開始,而係進入一個已經整理好嘅個人工作環境。

文件化記憶體系

AGENTS.md

System/Memory/

另外,Codex 背後有 OpenAI 生態,提供多種底層能力,令你唔使由零造輪子。

  • 基礎執行能力:讀寫項目文件、運行腳本、處理 MarkdownCSV 等。
  • 瀏覽器同電腦操作能力:透過瀏覽器、Chrome 插件、Computer Use 去操作軟件界面。
  • 內容生產能力:配合文檔、PPT、圖片、視頻等生成複雜交付物。
  • 連接外部系統:同 GitHubSlackFigma、Gmail 等整合。
  • 可沉澱嘅 Skill 能力:將反覆做嘅事沉澱成 Skill,變成可複用工作流。

呢個生態持續進化,將個人 Agent 搭喺 Codex 之上,等於放喺一個上升嘅技術底座上,底層能力由生態迭代,自己只需要喺上層搭建個人系統。

可複用工作流

最近 Codex 進入 ChatGPT 流動端預覽版,令佢更似真正個人助理。我可以透過手機連接電腦上嘅 Codex,繼續查看項目上下文、回覆問題、調整方向,甚至喺離開電腦嘅時候推動任務。手機係入口,電腦係執行環境,Agent 係中間嘅調度者。

流動端連接

整理重點

我而家套系統長點樣?同真正有價值嘅地方

整個項目分幾類文件AGENTS.md 放長期行為規則;Context/ 放 Agent 身份同協作方式;System/Memory/ 放長期記憶,好似溝通風格、職業背景、當前關注點呢啲;System/Skills/ 放可複用技能,例如寫公眾號、整理會議紀要;「我嘅筆記」放個人知識庫入口;Outputs/ 放交付物。呢套結構似一個輕量嘅個人 Agent OS。

作者最後總結:個人 Agent 嘅關鍵唔係模型本身,而係上下文嘅組織方式。你需要願意維護文件結構、寫清楚規則、定期清理。如果喺意長期掌控感、私隱邊界同遷移自由,用 Codex 搭本地個人 Agent 係一個好值得試嘅方向。

上下文組織方式

最近我越嚟越明顯咁覺得,個人 AI 助理呢件事,正係由「傾偈工具」變成「工作系統」。

以前我哋用 AI,多數係開個對話框,問一句、答一句。之後開始用 OpenClaw、Hermes 呢類 Agent 工具,等 AI 可以讀文件、叫工具、做任務,體驗的確行前咗一步。

但用耐咗之後,我心入面一路有個唔舒服嘅位:呢啲系統再勁,本質上都係人哋嘅機制。

佢點樣記住我、點樣組織文件、點樣觸發技能、點樣更新長期記憶、點樣決定一件事應唔應該沉澱,好多時我只可以喺佢俾嘅框架裏面配置。用得,但掌控感唔夠強。

而我真正想要嘅,唔係再多一個 AI 產品帳號。

我想要嘅係一個長喺自己電腦裏面嘅個人 Agent 系統。


41f34376-0171-46d4-9928-7dbf33dccb06.png

點解唔直接用現成嘅個人助理 SaaS?

我留意過一類新嘅個人助理產品,例如 Moxt 呢類 Agent workspace。佢哋嘅方向好得意:唔係淨係做傾偈,而係諗住搭建一套適合 Agent 工作嘅文件 OS。

入面有文件、有記憶、有技能、有工具,Agent 可以喺呢個 workspace 入面持續工作,甚至好似團隊成員咁協作。

呢個思路我好認同。

因為 Agent 真正要變得有用,唔可以淨係靠模型聰明。佢一定要有一個穩定嘅工作環境:知道啲資料放喺邊,知道以往嘅結論係乜,知道邊啲規則要長期遵守,亦知道任務完成之後嘅產物應該沉澱去邊。

但如果呢套系統完全放喺人哋嘅雲端產品入面,我會有兩個顧慮。

第一個係私隱同安全。

個人助理要真正有用,就必然要接觸好多私人上下文:筆記、日程、工作材料、長期偏好、溝通習慣、未公開嘅諗法,甚至一啲仲未成形嘅判斷。

呢啲嘢唔似普通文檔。佢哋唔係「某個文件」,而係一個人嘅長期語境。

一旦我將呢套語境完整交俾一個雲端 workspace,我其實係將自己嘅思考方式、工作軌跡同知識結構都託管出去。對團隊協作嚟講,呢個可能合理;但對個人長期系統嚟講,我會自然更謹慎。

第二個係遷移成本。

今日一個產品好好用,唔代表佢會一直符合我嘅工作方式。收費方式會變,產品重點會變,導出能力會變,甚至成個產品方向都可能變。

如果我嘅個人 Agent 已經圍繞某個 SaaS 嘅文件結構、記憶機制、技能體系搭起咗,將來想遷移,就唔係「導出幾個文檔」咁簡單。

真正難遷移嘅係啲隱性嘢:目錄約定、任務流程、提示詞規則、長期記憶、技能觸發方式、沉澱習慣。

亦即係話,你以為自己係用緊一個工具,實際上係將自己嘅個人操作系統種喺人哋嘅地基上面。


我真正想要嘅係乜?

我之後將訴求收窄成一句話:

我想要一個基於個人電腦、可以同步、可以遷移、可以自學習嘅個人 Agent。

佢唔一定一開始就好靚,亦唔一定要有複雜 UI,但佢必須滿足幾個核心要求。

核心資料喺自己手上面。 個人助理真正有價值嘅前提,係佢能夠理解我嘅長期上下文。但呢啲上下文唔應該完全託管喺某個外部產品入面。我嘅筆記、材料、偏好同工作記錄,應該優先沉澱喺我可以管理、可以備份、可以遷移嘅地方。

佢要有一套穩定嘅記憶體系。 我唔希望每次都重新解釋「我係邊個」「我鍾意咩風格」「邊啲內容唔好再提」「我做判斷時在意啲乜」。一個真正嘅個人 Agent,應該可以逐步記住我嘅表達方式、工作習慣、知識結構同長期偏好。

佢要夠可控。 我並唔希望 Agent 完全自動化咁幫我周圍做任務。個人助理接觸嘅係大量私人上下文,佢越強,就越需要清楚嘅界線。我希望任務由我主動觸發,過程我可以睇到,關鍵動作要我確認。

佢要可以自學習。 所謂自學習,唔係要 AI 隨便記住一切。恰恰相反,個人 Agent 最重要嘅能力之一,係知道乜嘢唔應該記。一次性嘅情緒、臨時任務、仲未驗證嘅猜測,唔應該變成長期記憶。真正應該沉澱嘅,係穩定偏好、反覆出現嘅工作流程、可以重用嘅判斷框架,同埋將來仲會用嘅技能。

佢唔可以鎖死我。 我可以接受工具持續變化,但唔可以接受自己嘅長期記憶同工作系統俾某個產品形態綁死。對我嚟講,個人 Agent 最終應該係一套我明、我可以調整、可以遷移嘅系統,而唔係一個淨係喺固定平台入面用到嘅黑盒。


4d895bfe-9ee3-4c1e-882d-2e5f05125b33.png

我點解揀 Codex?

揀 Codex,最核心嘅原因其實唔係佢識寫 Code,而係佢啱啱好符合我對個人 Agent 嘅幾個關鍵要求。

首先係掌控感。

Codex 唔係嗰種完全自主、自動周圍走嘅 Agent。佢更加似一個被我主動叫嘅執行拍檔:我俾任務佢,佢讀取當前項目上下文,執行途中遇到關鍵動作會停低等我確認。

呢種關係對個人助理好重要。我想要嘅係「佢夠瞭解我」,而唔係「佢幫我亂咁走」。佢可以讀我嘅記憶、理解我嘅偏好、叫工具做嘢,但控制權仍然喺我度。

其次,Codex 好適合承載一套文件化嘅記憶體系。

佢本來就係喺項目目錄入面工作,天然適合讀取規則、記憶、技能同輸出文件。我可以將個人 Agent 嘅行為規則寫入 AGENTS.md,將長期偏好放入 System/Memory/,將高頻工作流程沉澱到 System/Skills/,將交付物放到 Outputs/。

咁樣一嚟,Codex 每次進入呢個項目,就唔係由一個空白對話開始,而係進入一個已經整理好嘅個人工作環境。佢知道呢個 Agent 係邊個,知道我係邊個,亦知道唔同類型嘅任務應該點樣處理。

呢個判斷其實嚟自之前嘅一次經歷。我之前用 Claude 做過一套面向外部培訓嘅 PPT 大綱。當時俾我最大衝擊嘅,並唔係佢「會寫大綱」呢件事,而係我發現:只要將個人嘅工作習慣、歷史資料同表達偏好作為上下文餵俾 AI,佢就可以明顯更接近我想要嘅結果。

嗰一刻我意識到,搭建個人 Agent 唔係為咗追求一個更加型嘅工具,而係要 AI 擁有夠貼近我嘅個人上下文。

呢個其實就係個人 Agent 嘅複利。如果一個 Agent 每次都要由零瞭解我,佢永遠只係臨時助手。但如果佢知道我的風格、偏好、常用結構、避雷點同歷史材料,佢先會慢慢變成個人助理。

Codex 吸引我嘅地方就係呢度:佢既可以圍繞一套完整嘅記憶體系辦事,又唔會因為過度自主化而脱離控制。

我想要嘅係「記得住我」,唔係「幫我亂咁走」。

最後,Codex 可以真正將事情推到產物層面。

佢可以讀文件、改文件、執行任務,亦天然適合遵守項目裏面嘅規則。對我嚟講,呢個意味住我唔需要由零做一個完整產品。我只需要將 Codex 當做執行引擎,再用文件系統俾佢搭一個「個人腦袋嘅工作環境」。


Codex 背後嘅生態,令我少造咗好多輪子

仲有一個好現實嘅原因:Codex 背後企咗 OpenAI 嘅整體生態。

如果自己由零搭一個 Agent 系統,最麻煩嘅唔係寫幾條提示詞,而係底層工具鏈。佢要識讀文件、改文件、執行腳本、處理網頁、操作瀏覽器、叫本地能力、生成文檔,甚至將來仲要做 PPT、影片、圖片、自動化流程。

呢啲能力如果全部自己定義一次,好快就會變成另一個工程項目。

而 Codex 嘅好處係,佢已經接咗喺一套比較完整嘅底層能力之上:

  • 基礎執行能力:讀寫項目文件、運行腳本、處理 Markdown、CSV、表格同各種本地材料。唔止係「理解文檔」,而係直接將輸入材料整理成輸出結果。

  • 瀏覽器同電腦操作能力:通過瀏覽器、Chrome 插件、Computer Use 呢類能力,進入網頁、睇頁面、操作軟件界面,做以前一定要人手㩒嘅流程。

  • 內容生產能力:配合文檔、PPT、圖片、影片等能力去生成更複雜嘅交付物。

  • 連接外部系統嘅能力:同 GitHub、Slack、Figma、Gmail、日曆、瀏覽器等生態連接,亦可以透過 MCP、插件或腳本繼續擴展。

  • 可以沉澱嘅 Skill 能力:將反覆做嘅嘢沉澱成 Skill,等 Codex 之後直接按固定規則執行。

呢個就令個人 Agent 由「臨時傾偈」變成「可以重用嘅工作流程」。

更加關鍵嘅係,呢個底座仲喺度持續進化。OpenAI 處於好激烈嘅競爭環境,Anthropic、Google Gemini 都不斷推進,OpenAI 冇可能停喺原地。

如果我將個人 Agent 搭喺 Codex 之上,本質上唔係只用今日呢個版本嘅 Codex,而係將自己嘅文件 OS、記憶體系同工作流程,放喺一個持續上升嘅技術底座上面。

底層能力由生態持續疊代,我只需要喺上層搭自己嘅個人系統。呢種係一個好舒服嘅槓桿。


9bddb7ca-fe1a-4783-98d6-fd3e73435336.png

流動端連接,令佢更加似真正嘅個人助理

最近 Codex 進入 ChatGPT 流動端預覽版之後,呢件事對我嚟講又行前咗一步。

佢唔淨係「手機上都傾到偈」。更加關鍵嘅係,我可以透過 ChatGPT 流動端連接正在電腦上運行嘅 Codex,繼續睇項目上下文、回覆佢嘅問題、調整方向、審批動作,甚至離開電腦嘅時候繼續推動任務。

手機係入口,電腦係執行環境,Agent 係中間嘅調度者。

呢個體驗一旦打通,個人 Agent 就唔再只係一個桌面工具,而更加似一個隨身嘅工作代理。

例如我喺街突然諗到一個文章選題,可以直接叫佢記錄落項目入面;見到一個材料,可以叫佢整理成筆記;某個任務卡住咗,佢可以喺手機問我一嘢,我確認之後佢繼續喺電腦做。

呢類碎片化指揮,以前好難做。但一旦手機同電腦裏面嘅 Agent 項目連埋一齊,佢就變成一個好自然嘅個人工作流程。


image.png

我而家呢套系統係點樣?

我目前嘅做法唔複雜,但係好有效。成個項目大致分成幾類文件:

  • AGENTS.md — 放長期穩定嘅行為規則。例如始終用中文回覆,先理解目標先動手,輸出要自然、結構化、低 AI 痕跡,唔好主動提起我已經唔關注嘅方向。

  • Context/ — 放呢個 Agent 嘅身份同協作方式。佢唔係某個單一產品 Agent,而係我嘅個人 AI 助理,長期幫我做思考、寫作、產品判斷、知識沉澱同複雜任務推進。

  • System/Memory/ — 放長期記憶。唔係堆曬所有細節,而係好似索引咁管理:我嘅溝通風格、職業背景、當前關注點、產品判斷框架、AI 原生思考等。

  • System/Skills/ — 放可以重用嘅技能。例如寫公眾號、整理會議紀要、做週回顧、寫 PRD、閲讀 PDF、沉澱個人記憶。

  • 我的筆記/ — 個人知識庫入口。日常想法、日曆筆記、週回顧、學習資料都喺呢度。

  • Outputs/ — 放交付物。文章、方案、紀要、調研、PPT、圖示,都放喺呢度。

呢套結構睇落似文件夾管理,實際上更加似一個輕量嘅個人 Agent OS。佢解決嘅唔係「文件點樣擺」,而係「Agent 每次應該點樣進入我嘅上下文」。

ba4437bafebe348078837e27725b4aef.png

呢件事真正有價值嘅地方

搭完之後,我最大嘅感受係:個人 Agent 嘅關鍵,唔係模型本身,而係上下文嘅組織方式。

同樣係 Codex,如果每次都係由空白對話開始,佢就係一個好強嘅臨時助手。但如果佢每次都先讀取我嘅規則、身份、記憶、技能同筆記入口,佢就開始似一個長期協作夥伴。

佢知道我寫公眾號時唔好太似 AI。佢知道我嘅產品判斷時關注目標用戶、主鏈路、邊界同驗收標準。佢知道邊啲內容適合沉澱成 Memory,邊啲只係一次性交付物。佢亦知道幾時應該叫 Skill,而唔係所有任務都用同一種方式處理。

聊天機械人回答問題。個人 Agent 進入你嘅工作系統,基於長期上下文做嘢,並喺任務結束之後更新呢個系統。


當然,佢都唔係銀彈

呢套方案亦有門檻。

你需要願意維護文件結構,需要俾 Agent 寫清楚規則,亦需要定期清理嗰啲唔應該沉澱嘅嘢。

如果你期待嘅係開箱即用、界面靚、乜都唔使理,咁 SaaS 產品一定更舒服。

但如果你同我一樣,更在意長期掌控感、私隱邊界同遷移自由,咁用 Codex 搭一個本地個人 Agent,係一個好值得試嘅方向。

佢唔一定要複雜。一開始只需要幾個嘢:一個項目目錄、一份 AGENTS.md、一套個人記憶文件、幾個高頻 Skill,再加埋你嘅筆記入口。

真正緊要嘅係,你要將 Agent 當做一個會長期共事嘅人嚟設計佢嘅工作環境,而唔係將佢當做一個更加聰明嘅輸入框。


最後

我而家越嚟越相信,將來每個人都可能會有自己嘅 Agent。

但係呢個 Agent 唔一定喺某個超級 App 入面出現。佢都有可能就係長喺你嘅電腦文件夾入面,長喺你嘅筆記系統入面,長喺一套你自己明、可以改、可以遷移嘅規則入面。

對我嚟講,呢件事嘅意義唔止係「用 Codex 提升效率」。

而係我終於開始擁有一套屬於自己嘅 AI 工作系統。

佢唔完美,但係喺我手上面。


如果你都喺度諗點樣搭建自己嘅個人 Agent,或者喺度糾結 SaaS 同本地方案之間嘅取捨,希望呢篇文章對你有啲啟發。歡迎留言講嚇你嘅諗法。

最近我越來越明顯地感覺到,個人 AI 助理這件事,正在從“聊天工具”變成“工作系統”。

以前我們用 AI,大多是打開一個對話框,問一句、答一句。後來開始用 OpenClaw、Hermes 這類 Agent 工具,讓 AI 可以讀文件、調用工具、執行任務,體驗確實往前走了一步。

但用久之後,我心裏一直有個彆扭的點:這些系統再強,本質上還是別人的機制。

它怎麼記住我、怎麼組織文件、怎麼觸發技能、怎麼更新長期記憶、怎麼決定一件事該不該沉澱,很多時候我只能在它給出的框架裏配置。能用,但掌控感不夠強。

而我真正想要的,不是再多一個 AI 產品賬號。

我想要的是一個長在自己電腦裏的個人 Agent 系統。


41f34376-0171-46d4-9928-7dbf33dccb06.png

為什麼不是直接用現成的個人助理 SaaS?

我關注過一類新的個人助理產品,比如 Moxt 這類 Agent workspace。它們的方向很有意思:不是單純做聊天,而是試圖搭建一套適合 Agent 工作的文件 OS。

裏面有文件、有記憶、有技能、有工具,Agent 可以在這個 workspace 裏持續工作,甚至像團隊成員一樣協作。

這個思路我很認同。

因為 Agent 真正要變得有用,不能只靠模型聰明。它必須有一個穩定的工作環境:知道資料放在哪裏,知道過往結論是什麼,知道哪些規則要長期遵守,也知道任務完成後產物應該沉澱到哪裏。

但如果這套系統完全放在別人的雲端產品裏,我會有兩個顧慮。

第一個是隱私和安全。

個人助理要真正有用,就必然要接觸非常多私人上下文:筆記、日程、工作材料、長期偏好、溝通習慣、未公開想法,甚至一些還沒成型的判斷。

這些東西不像普通文檔。它們不是“某個文件”,而是一個人的長期語境。

一旦我把這套語境完整交給一個雲端 workspace,我其實是在把自己的思考方式、工作軌跡和知識結構都託管出去。對團隊協作來說,這可能是合理的;但對個人長期系統來說,我會天然更謹慎。

第二個是遷移成本。

今天一個產品很好用,不代表它會一直符合我的工作方式。計費方式會變,產品重點會變,導出能力會變,甚至整個產品方向都可能變。

如果我的個人 Agent 已經圍繞某個 SaaS 的文件結構、記憶機制、技能體系搭起來,未來想遷移,就不是“導出幾個文檔”那麼簡單。

真正難遷移的是那些隱性的東西:目錄約定、任務流、提示詞規則、長期記憶、技能觸發方式、沉澱習慣。

也就是說,你以為自己是在用一個工具,實際上是在把自己的個人操作系統長在別人家的地基上。


我真正想要的是什麼?

我後來把訴求收斂成一句話:

我想要一個基於個人電腦、可同步、可遷移、可自學習的個人 Agent。

它不一定一開始就很炫,也不一定要有複雜 UI,但它必須滿足幾個核心訴求。

核心資料在我自己手裏。 個人助理真正有價值的前提,是它能理解我的長期上下文。但這些上下文不應該完全託管在某個外部產品裏。我的筆記、材料、偏好和工作記錄,應該優先沉澱在我自己可管理、可備份、可遷移的地方。

它要有一套穩定的記憶體系。 我不希望每次都重新解釋“我是誰”“我喜歡什麼風格”“哪些內容不要再提”“我做判斷時在意什麼”。一個真正的個人 Agent,應該能逐步記住我的表達方式、工作習慣、知識結構和長期偏好。

它要足夠可控。 我並不希望 Agent 完全自動化地替我到處執行任務。個人助理接觸的是大量私人上下文,它越強,越需要清楚的邊界。我希望任務由我主動觸發,過程可以被我看到,關鍵動作需要我確認。

它要能自學習。 所謂自學習,不是讓 AI 隨便記住一切。恰恰相反,個人 Agent 最重要的能力之一,是知道什麼不該記。一次性的情緒、臨時任務、還沒驗證的猜測,不應該變成長期記憶。真正應該沉澱的,是穩定偏好、反覆出現的工作流程、可複用的判斷框架,以及未來還會用到的技能。

它不能把我鎖死。 我可以接受工具持續變化,但不能接受自己的長期記憶和工作系統被某個產品形態綁住。對我來說,個人 Agent 最終應該是一套我能理解、能調整、能遷移的系統,而不是一個只能在固定平台裏使用的黑盒。


4d895bfe-9ee3-4c1e-882d-2e5f05125b33.png

我為什麼選擇 Codex?

選擇 Codex,最核心的原因其實不是它能寫代碼,而是它剛好符合我對個人 Agent 的幾個關鍵要求。

首先是掌控感。

Codex 不是那種完全自主、自動到處跑的 Agent。它更像一個被我主動喚起的執行搭檔:我給它任務,它讀取當前項目上下文,執行過程中遇到關鍵動作會停下來讓我確認。

這種關係對個人助理很重要。我想要的是“它足夠懂我”,而不是“它替我亂跑”。它可以讀我的記憶、理解我的偏好、調用工具做事,但控制權仍然在我這裏。

其次,Codex 很適合承載一套文件化的記憶體系。

它本來就工作在項目目錄裏,天然適合讀取規則、記憶、技能和輸出文件。我可以把個人 Agent 的行為規則寫進 AGENTS.md,把長期偏好放進 System/Memory/,把高頻工作流沉澱到 System/Skills/,把交付物放到 Outputs/。

這樣一來,Codex 每次進入這個項目,就不是從一個空白對話開始,而是進入一個已經整理好的個人工作環境。它知道這個 Agent 是誰,知道我是誰,也知道不同類型的任務應該怎麼處理。

這個判斷其實來自我之前的一次經歷。我之前用 Claude 做過一套面向外部培訓的 PPT 大綱。當時給我最大沖擊的,並不是它“會寫大綱”這件事,而是我發現:只要把個人的工作習慣、歷史資料和表達偏好作為上下文餵給 AI,它就能明顯更接近我想要的結果。

那一刻我意識到,搭建個人 Agent 不是為了追求一個更酷的工具,而是必須讓 AI 擁有足夠貼近我的個人上下文。

這其實就是個人 Agent 的複利。如果一個 Agent 每次都要從零理解我,它永遠只是臨時助手。但如果它知道我的風格、偏好、常用結構、避雷點和歷史材料,它才會慢慢變成個人助理。

Codex 吸引我的地方就在這裏:它既可以圍繞一套完整的記憶體系辦事,又不會因為過度自主化而脱離控制。

我想要的是“記得住我”,不是“替我亂跑”。

最後,Codex 可以真正把事情推進到產物層。

它能讀文件、改文件、執行任務,也天然適合遵守項目裏的規則。對我來說,這意味着我不需要從零做一個完整產品。我只需要把 Codex 當作執行引擎,再用文件系統給它搭一個“個人大腦的工作環境”。


Codex 背後的生態,讓我少造了很多輪子

還有一個很現實的原因:Codex 背後站着 OpenAI 的整體生態。

如果自己從零搭一個 Agent 系統,最麻煩的不是寫幾條提示詞,而是底層工具鏈。它要能讀文件、改文件、跑腳本、處理網頁、操作瀏覽器、調用本地能力、生成文檔,甚至未來還要做 PPT、視頻、圖片、自動化流程。

這些能力如果都自己定義一遍,很快就會變成另一個工程項目。

而 Codex 的好處是,它已經嫁接在一套比較完整的底層能力之上:

  • 基礎執行能力:讀寫項目文件、運行腳本、處理 Markdown、CSV、表格和各種本地材料。不只是“理解文檔”,而是直接把輸入材料整理成輸出結果。

  • 瀏覽器和電腦操作能力:通過瀏覽器、Chrome 插件、Computer Use 這類能力,進入網頁、查看頁面、操作軟件界面,做過去必須人手點擊的流程。

  • 內容生產能力:配合文檔、PPT、圖片、視頻等能力去生成更復雜的交付物。

  • 連接外部系統的能力:和 GitHub、Slack、Figma、Gmail、日曆、瀏覽器等生態連接,也可以通過 MCP、插件或腳本繼續擴展。

  • 可沉澱的 Skill 能力:把反覆做的事情沉澱成 Skill,讓 Codex 後續直接按固定規則執行。

這就讓個人 Agent 從“臨時聊天”變成了“可複用工作流”。

更關鍵的是,這個底座還在持續進化。OpenAI 處在非常激烈的競爭環境裏,Anthropic、Google Gemini 都在不斷推進,OpenAI 不可能停在原地。

如果我把個人 Agent 搭在 Codex 之上,本質上不是隻使用今天這個版本的 Codex,而是把自己的文件 OS、記憶體系和工作流,放在一個持續上升的技術底座上。

底層能力由生態持續迭代,我只需要在上層搭自己的個人系統。這是一種很舒服的槓桿。


9bddb7ca-fe1a-4783-98d6-fd3e73435336.png

移動端連接,讓它更像真正的個人助理

最近 Codex 進入 ChatGPT 移動端預覽版後,這件事對我來說又往前走了一步。

它不只是“手機上也能聊天”。更關鍵的是,我可以通過 ChatGPT 移動端連接正在電腦上運行的 Codex,繼續查看項目上下文、回覆它的問題、調整方向、審批動作,甚至在離開電腦的時候繼續推動任務。

手機是入口,電腦是執行環境,Agent 是中間的調度者。

這個體驗一旦打通,個人 Agent 就不再只是一個桌面工具,而更像一個隨身的工作代理。

比如我在路上突然想到一個文章選題,可以直接讓它記錄到項目裏;看到一個材料,可以讓它先整理成筆記;某個任務卡住了,它可以在手機上問我一句,我確認後它繼續在電腦上跑。

這類碎片化指揮,以前很難做。但一旦手機和電腦裏的 Agent 項目連起來,它就變成了一個很自然的個人工作流。


image.png

我現在這套系統長什麼樣?

我目前的做法並不複雜,但很有效。整個項目大概分成幾類文件:

  • AGENTS.md — 放長期穩定的行為規則。比如始終用中文回覆,先理解目標再動手,輸出要自然、結構化、低 AI 痕跡,不要主動提起我已經不關注的方向。

  • Context/ — 放這個 Agent 的身份和協作方式。它不是某個單一產品 Agent,而是我的個人 AI 助理,長期協助我做思考、寫作、產品判斷、知識沉澱和複雜任務推進。

  • System/Memory/ — 放長期記憶。不是堆所有細節,而是像索引一樣管理:我的溝通風格、職業背景、當前關注點、產品判斷框架、AI 原生思考等。

  • System/Skills/ — 放可複用技能。比如寫公眾號、整理會議紀要、做週迴顧、寫 PRD、閲讀 PDF、沉澱個人記憶。

  • 我的筆記/ — 個人知識庫入口。日常想法、日曆筆記、週迴顧、學習資料都在這裏。

  • Outputs/ — 放交付物。文章、方案、紀要、調研、PPT、圖示,都放在這裏。

這套結構看起來像文件夾管理,實際上更像一個輕量的個人 Agent OS。它解決的不是“文件怎麼擺放”,而是“Agent 每次應該如何進入我的上下文”。

ba4437bafebe348078837e27725b4aef.png

這件事真正有價值的地方

搭完之後,我最大的感受是:個人 Agent 的關鍵,不是模型本身,而是上下文的組織方式。

同樣是 Codex,如果每次都從空白對話開始,它就是一個很強的臨時助手。但如果它每次都先讀取我的規則、身份、記憶、技能和筆記入口,它就開始像一個長期協作夥伴。

它知道我寫公眾號時不要太像 AI。它知道我做產品判斷時關注目標用戶、主鏈路、邊界和驗收標準。它知道哪些內容適合沉澱成 Memory,哪些只是一次性交付物。它也知道什麼時候該調用 Skill,而不是所有任務都用同一種方式處理。

聊天機器人回答問題。個人 Agent 進入你的工作系統,基於長期上下文做事,並在任務結束後更新這個系統。


當然,它也不是銀彈

這套方案也有門檻。

你需要願意維護文件結構,需要給 Agent 寫清楚規則,也需要定期清理那些不該沉澱的東西。

如果你期待的是開箱即用、界面漂亮、什麼都不用管,那 SaaS 產品一定更舒服。

但如果你和我一樣,更在意長期掌控感、隱私邊界和遷移自由,那麼用 Codex 搭一個本地個人 Agent,是一個很值得嘗試的方向。

它不一定要複雜。一開始只需要幾個東西:一個項目目錄,一份 AGENTS.md,一套個人記憶文件,幾個高頻 Skill,再加上你的筆記入口。

真正重要的是,你要把 Agent 當成一個會長期共事的人來設計它的工作環境,而不是把它當成一個更聰明的輸入框。


最後

我現在越來越相信,未來每個人都可能會有自己的 Agent。

但這個 Agent 不一定誕生在某個超級 App 裏。它也可能就長在你的電腦文件夾裏,長在你的筆記系統裏,長在一套你自己能理解、能修改、能遷移的規則裏。

對我來說,這件事的意義不只是“用 Codex 提效”。

而是我終於開始擁有一套屬於自己的 AI 工作系統。

它不完美,但它在我手裏。


如果你也在思考怎麼搭建自己的個人 Agent,或者正在糾結 SaaS 和本地方案之間的取捨,希望這篇文章對你有些啓發。歡迎留言聊聊你的想法。