你的 AI agent 老犯錯?問題不在 prompt,在配置文件

作者:竇竇的AI工具庫
日期:2026年4月30日 上午6:40
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Claude.md 係操作系統唔係說明書:十條規則令 AI agent 少犯錯

整理版摘要

呢篇文章係由重度AI研究愛好者竇竇分享嘅實戰經驗。佢發現好多人以為 claude.md 只係說明書,跑個 init 命令就算,但其實呢個文件係操作系統——寫得爛嘅話,你同 AI 就會一直打架。整體結論係:檔案寫得越精確,AI 就越少同你扯皮。

作者整合咗 Andrej Karpathy 公開 repo 同大量項目經驗,總結出 10 條實測有效嘅規則。包括強制 AI 先諗清楚先做、逼佢寫簡單代碼、手術式改動(每行改動都要追溯到用戶要求)、目標驅動執行(定義可驗證嘅成功標準)等等。呢啲規則嘅核心係減少 agent 嘅猜測同多餘動作。

另外,文章強調檔案要精簡(300行內),按優先級排序:硬規則放最前,參考信息放最後。仲要讓 agent 自己更新知識庫,每次糾正後將教訓寫入獨立文件,慢慢累積「唔應該做」嘅記憶。最終目標係令 AI agent 更聽話,減少無謂嘅糾正時間。

  • claude.md 係操作系統唔係說明書;寫得差就會一直同 AI 打架。
  • 強制 AI 先諗再寫:要佢列出假設俾你揀,唔好直接衝。
  • 逼佢寫簡單代碼:200行搞得掂嘅事,重構到50行先算合格,唔準加功能。
  • 手術式改動:每行改動都要可追溯,唔相關嘅嘢唔準鬱。
  • 讓 agent 自己更新知識庫:每次糾正後寫入教訓,累積記憶減少重複錯誤。
整理重點

Claude.md 係操作系統,唔係說明書

好多人都輕視咗 claude.md 嘅作用,以為跑個 init 命令就夠。

呢個文件係操作系統,唔係說明書

如果你寫得爛,你同 AI 就會一直打架。

整理重點

核心規則:減少猜測同多餘動作

以下係四條實測有效嘅核心規則

先諗再動手

簡單代碼標準

手術式改動

目標驅動執行

  1. 1 強制 Claude 喺寫 code 之前將假設列曬出嚟,俾你揀。呢一條可以砍掉大量來回糾正嘅時間。
  2. 2 設定硬標準:200行搞得掂嘅事,如果重構到50行先算正確,否則必須重寫。唔準加需求之外嘅功能。
  3. 3 每一行改動必須追溯到用戶要求;如果發現咗唔相關嘅問題,報告俾你,由你決定修唔修,唔可以擅自改。
  4. 4 每個任務都要定義可驗證嘅成功標準,例如加輸入校驗就要自己寫測試用例,跑通先算完成。UI 改動可以接瀏覽器 MCP 睇截圖判斷。
整理重點

效率與安全:只寫差異、問準危險操作

除咗核心規則,仲有幾點提升效率同避免災難嘅指引:

只寫 Claude 唔知嘅工具

危險命令必須問你

用路徑作用域拆分規則

Monorepo 每個子目錄一個 claude.md

  • init 生成嘅啟動命令 Claude 已經識,唔使寫。真正要寫嘅係你用嘅特殊工具,例如 GitHub CLI、pnpm 呢啲差異點。
  • git push --force、rm -rf 呢啲不可逆操作,寫明要請求許可。唔確定就當有破壞性處理。
  • 唔好將所有指令塞一個文件,按目錄分開,每個文件第一句聲明作用域。咁樣 Claude 做前端時就唔會被 API 規則幹擾。
  • 全局文件放通用規則,子應用放自己嘅規則,避免文件太長分散注意力。
整理重點

結構與維護:排序同自我更新

項目描述要放第一段,等 Claude 建立全局理解。

項目描述放最前面

成個文件按優先級排序:硬規則放最前,參考放最後,總行數唔好超過 300 行。

另外,叫 agent 自己更新知識庫:每次你糾正咗佢嘅做法,改完 code 之後,要佢將教訓寫入一個獨立文件。

讓 agent 自己更新知識庫

呢個 idea 來自 Claude Code 作者本人,可以慢慢累積「咩唔應該做」嘅記憶,降低下次犯同樣錯誤嘅機會。

整理重點

總結:做一個精確嘅操作系統

操作系統越精確,AI 越少扯皮

AI 能做嘅嘢愈嚟愈多,但識得判斷邊條路值得行、將技術變成可用嘅嘢,呢啲先係 AI 時代真正值錢嘅能力。

圖片

claude.md 唔係說明書,而係操作系統。

喺我未意識到呢點之前,用 Claude Code 寫代碼就不停喺度同 AI 打架。

喺 Claude Code,呢個配置文件叫claude.md,其他工具叫 agents.md,個名唔重要。重要嘅係:呢個文件寫得差,你就會成日同 agent 打架。好多人以為行個 init 命令就夠——唔夠,差好遠。

下面係實測有效嘅 10 條規則,來源包括 Andrej Karpathy 嘅公開 repo 同大量實際項目經驗。

1. 強制佢先諗再鬱手

喺文件度加一句:叫 Claude 喺寫代碼之前,先將假設講清楚,如果有多種理解方式,全部列曬出嚟俾你揀。

Claude 會先問你一組問題,你嘅回答決定佢點做。佢唔再喺訓練數據度估一個「最常見嘅實現方式」然後直接衝,而係確認你想要嘅係邊種。

呢一條就可以慳返大量來回糾正嘅時間。

2. 逼佢寫簡單代碼

AI agent 天生就鍾意寫「大方案」。一個小問題佢都可以俾你搞出一大堆抽象層。呢個唔止係慢嘅問題——後面加功能、改 bug 都會俾呢啲冗餘代碼阻住。

解法係俾佢一個硬標準:如果 200 行搞得掂嘅事,可以重構到 50 行,即係話佢嘅方案由頭就錯,要重寫。

仲有一點:唔好加需求以外嘅功能,唔好「順手優化」

3. 手術式改動

我見過最多嘅伏。你叫 Claude 修一個 bug,佢順手就將隔籬嘅代碼都「改進」咗——可能係格式化,可能係刪咗佢覺得冇用嘅代碼。

問題係:嗰啲代碼可能係你特登留低第時用嘅。

規則好簡單:每一行改動都一定要追溯到用戶嘅要求。追溯唔到?唔準掂。發現咗無關嘅問題?報告俾你,由你決定整唔整。

4. 目標驅動執行

Agent 唔知「正確嘅輸出」係點樣,呢個係根本問題。

解決方法:叫 Claude 對每個任務定義可以驗證嘅成功標準。例如你叫佢加輸入驗證,佢應該自己寫測試用例,覆蓋非法輸入,然後 run 曬所有 case 先算完成。

有個伏:呢個對邏輯功能好用,但 UI 改動冇辦法靠測試驗證。呢個時候可以接一個瀏覽器 MCP(例如 Puppeteer),叫 agent 自己睇頁面截圖嚟判斷效果。

5. 只寫 Claude 唔知嘅工具

init 生成嘅文件會話俾 Claude 知點樣啟動 dev server、點樣 build。但呢啲佢訓練數據入面已經有,寫咗等於浪費行數。

真正應該寫嘅係:你裝咗邊啲佢唔知嘅工具。例如你用 GitHub CLI 而唔係原生 git 指令,例如你個項目用 pnpm 而唔係 npm。只寫呢啲差異點。

6. 叫佢自己更新知識庫

claude.md 唔係寫一次就唔鬱嘅嘢。

加一條規則:如果你糾正咗 Claude 嘅實現方式,佢改完代碼之後,仲要將今次教訓寫入一個專門嘅文件。咁樣佢會慢慢累積「乜嘢唔應該做」嘅記憶,後面犯同樣錯誤嘅機會率會低啲。

呢個思路嚟自 Claude Code 嘅作者本人。

7. 危險指令一定要問你

git push --forcegit reset --hardrm -rf、分支合併——呢啲操作係不可逆。

喺文件度明確寫:執行任何不可逆指令之前一定要請求許可。如果唔肯定一個指令有冇破壞性,默認當作有破壞性嚟處理。

8. 用路徑作用域拆開規則

唔好將所有指令塞入一個文件。俾唔同目錄建立各自嘅規則文件,第一行聲明作用域。

例如 API 相關嘅規則只喺寫 API 時加載,唔會喺寫前端組件時幹擾 Claude 嘅注意力。喺主 claude.md 度註明呢啲文件嘅位置就得。

9. Monorepo 每個子目錄一個 claude.md

全局文件放通用規則,每個子應用放自己嘅具體規則。

將所有指令堆曬喺全局文件係錯嘅——文件膨脹之後,Claude 處理當前任務時會俾無關嘅規則分散注意力。

10. 項目描述放喺文件最前

呢一條決定咗後面所有指令嘅執行效果。

將項目描述放喺 claude.md 嘅第一段:呢個應用係做乜嘅,架構係點樣,依賴咗邊啲服務,點樣運行。Claude 讀到第一段就可以建立全局理解,而唔係先睇代碼再估。

更狠嘅係排序規則:硬規則(絕對唔可以違反嘅)放最前,中等優先級嘅放中間,參考資訊放最後。成個文件控制在 300 行以內——超過呢個數,agent 嘅表現會明顯變差。

仲有一個:叫 Claude 唔止「檢查功能存在」,而係用測試、lint、類型檢查等多種手段驗證功能真係行到,確認通過咗先可以報告任務完成。


操作系統寫得越精準,AI就越少同你拗。今日打開你嘅 claude.md,刪咗所有 init 生成嘅內容,只留低佢唔知嘅嘢。

end.


AI 做到嘅嘢越來越多,零代碼編程嘅門檻越來越低。但門檻低唔等於伏少

識得認清代碼入面嘅伏、識得判斷邊條路值得行、可以將技術變成可用嘅嘢——呢啲先係 AI 時代真正值錢嘅能力。 


如果你都想往呢個方向行,歡迎訂閲我嘅 19.9 元「AI Native 實戰」服務。   
「AI Native 實戰」訂閲說明

適合邊個:
想持續瞭解 AI 工具、Claude / Codex / Agent 實戰更新嘅人

你可以得到:
1. 每星期篩一次值得睇嘅 AI 工具同更新
2. 遇到部署、揀選、使用問題可以直接問我
3. 幫你少啲踩伏,節省自己揾資料同試錯時間

價格:
體驗價 19.9 元 /年

訂閲方式:
加我微信 kbhero21 / 直接私信我
備註:AI Native

Image
主理人介紹:竇竇,普通打工人,亦係重度 AI 研究愛好者。日頭忙工作,夜晚忙搞工具、試方法、做內容

更加鍾意分享 我自己試過、踩過伏、最後覺得真係有用嘅嘢

關注我,一齊將複雜嘅 AI,變成普通人都用得上嘅日常。


圖片

claude.md 不是說明書,是操作系統。

在我沒有意識到這點之前,用 Claude Code寫代碼就是一直在跟 AI 打架。

在Claude Code,這個配置文件叫claude.md,其他工具叫 agents.md,名字不重要。重要的是:這個文件寫得爛,你就會一直和 agent 打架。很多人覺得跑個 init 命令就夠了——不夠,差得遠。

下面是實測有效的 10 條規則,來源包括 Andrej Karpathy 的公開 repo 和大量實際項目經驗。

1. 強制它先想再動手

在文件里加一句:讓 Claude 在寫代碼之前,先把假設說清楚,如果有多種理解方式,全部列出來讓你選。

Claude 會先問你一組問題,你的回答決定它怎麼做。它不再從訓練數據裏猜一個"最常見的實現方式"然後直接衝,而是確認你要的到底是哪種。

這一條就能砍掉大量來回糾正的時間。

2. 逼它寫簡單代碼

AI agent 天然喜歡寫"大方案"。一個小問題它能給你搞出一堆抽象層。這不只是慢的問題——後面加功能、改 bug 都會被這些冗餘代碼絆住。

解法是給它一個硬標準:如果 200 行能搞定的事,能重構到 50 行,那說明它的方案從頭就錯了,必須重寫。

還有一點:不要加需求之外的功能,不要"順手優化"

3. 手術式改動

我見過最多的坑。你讓 Claude 修一個 bug,它順手把旁邊的代碼也"改進"了——可能是格式化,可能是刪了它覺得沒用的代碼。

問題是:那些代碼可能是你故意留着以後用的。

規則很簡單:每一行改動都必須能追溯到用戶的要求。追溯不到?不準碰。發現了不相關的問題?報告給你,由你決定要不要修。

4. 目標驅動執行

Agent 不知道"正確的輸出"長什麼樣,這是根本問題。

解決辦法:讓 Claude 對每個任務定義可驗證的成功標準。比如你讓它加輸入校驗,它應該自己寫測試用例,覆蓋非法輸入,然後跑通所有 case 才算完。

有個坑:這對邏輯功能好使,但 UI 改動沒法靠測試驗證。這時候可以接一個瀏覽器 MCP(比如 Puppeteer),讓 agent 自己看頁面截圖來判斷效果。

5. 只寫 Claude 不知道的工具

init 生成的文件會告訴 Claude 怎麼啓動 dev server、怎麼 build。但這些它訓練數據裏已經有了,寫了等於浪費行數。

真正該寫的是:你裝了哪些它不知道的工具。比如你用 GitHub CLI 而不是原生 git 命令,比如你的項目用 pnpm 而不是 npm。只寫這些差異點。

6. 讓它自己更新知識庫

claude.md 不是寫一次就不動的東西。

加一條規則:如果你糾正了 Claude 的實現方式,它改完代碼後,還要把這次教訓寫進一個專門的文件。這樣它會慢慢積累"什麼不該做"的記憶,後面犯同樣錯誤的概率會降下來。

這個思路來自 Claude Code 的作者本人。

7. 危險命令必須問你

git push --forcegit reset --hardrm -rf、分支合併——這些操作不可逆。

在文件裏明確寫:執行任何不可逆命令之前必須請求許可。如果不確定一個命令是否有破壞性,默認當作有破壞性來處理。

8. 用路徑作用域拆分規則

別把所有指令塞進一個文件。給不同目錄建各自的規則文件,第一行聲明作用域。

比如 API 相關的規則只在寫 API 時加載,不會在寫前端組件時干擾 Claude 的注意力。在主 claude.md 裏註明這些文件的位置就行。

9. Monorepo 每個子目錄一個 claude.md

全局文件放通用規則,每個子應用放自己的具體規則。

把所有指令堆在全局文件裏是錯的——文件膨脹後,Claude 處理當前任務時會被不相關的規則分散注意力。

10. 項目描述放在文件最前面

這一條決定了後面所有指令的執行效果。

把項目描述放在 claude.md 的第一段:這個應用是幹什麼的,架構是什麼樣的,依賴了哪些服務,怎麼運行。Claude 讀到第一段就能建立全局理解,而不是先看代碼再猜。

更狠的是排序規則:硬規則(絕對不能違反的)放最前,中等優先級的放中間,參考信息放最後。整個文件控制在 300 行以內——超過這個數,agent 的表現會明顯變差。

還有一個:讓 Claude 不只是"檢查功能存在",而是用測試、lint、類型檢查等多種手段驗證功能真的能跑,確認通過了才能報告任務完成。


操作系統寫得越精確,AI就越少跟你扯皮。今天打開你的 claude.md,刪掉所有 init 生成的內容,只留它不知道的。

end.


AI 能做的事越來越多,零代碼編程的門檻越來越低。但門檻低不等於坑少

能識別代碼裏的坑、能判斷哪條路值得走、能把技術變成可用的東西—這些才是 AI 時代真正值錢的能力。 


如果你也想往這個方向走,歡迎訂閲我的 19.9 元「AI Native 實戰」服務。   
「AI Native 實戰」訂閲說明

適合誰:
想持續瞭解 AI 工具、Claude / Codex / Agent 實戰更新的人

你能得到:
1. 每週篩一遍值得看的 AI 工具和更新
2. 遇到部署、選型、使用問題可直接問我
3. 幫你少踩坑,節省自己找資料和試錯時間

價格:
體驗價 19.9 元 /年

訂閲方式:
加我微信kbhero21 / 直接私信我
備註:AI Native

Image
主理人介紹:竇竇,普通打工人,也是重度 AI 研究愛好者白天忙工作,晚上忙折騰工具、試方法、做內容

更喜歡分享 我自己試過、踩過坑、最後覺得真有用的東西

關注我,一起把複雜的 AI,過成普通人也能用上的日常。