最火的AI新名詞兒Loop，你還不知道嗎？

作者：林悦己AI出海

日期：2026年6月10日上午12:15

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Loop 係 AI 編程嘅新工作單元：你唔再手動提示 agent，而係寫 loop 嚟提示佢，再俾反饋等佢自己行

整理版摘要

呢篇文章係林悦己寫嘅，佢係一個專注 AI 出海嘅內容創作者。文章由一條引起爭議嘅推文講起：Peter Steinberger 話「你唔應該再手動提示 agent，而係設計 loop 嚟提示佢」，結果成個 X 圈都唔知 loop 係乜。作者想解釋清楚 loop 嘅真正意思，同埋點解呢個概念咁重要。佢嘅結論係：loop 唔係魔法，而係一個 cron 加上決策者嘅系統，最重要嘅係入面嘅反饋機制同可重用技能。

作者先梳理咗 loop 嘅演變：由 2022 年嘅 ReAct、2023 年嘅 AutoGPT、2025 年嘅 ralph 循環，到而家嘅多 agent 編排。Boris Cherny 嘅定義最清晰：佢唔再提示 Claude，而係寫 loop 嚟提示幾百個 agent。但關鍵係 loop 要靠反饋先至有用，否則只會產生自信錯誤。愈來愈多人關注驗證工具，例如 roborev 會自動審查每個提交。

成本問題都係重點：Loop 嘅執行會帶來巨額賬單，Uber 已經要限制每人每月 USD 1500。所以實戰中要設硬停止：最大迭代次數、無進展檢測、token 上限。最後作者話，loop 只係管道，真正嘅資產係入面嘅技能。佢期待自己嘅 loop 實戰，並邀請讀者加入 AI 出海交流羣。

結論：Loop 係你寫嘅一個小程式，負責提示 agent、讀取輸出、判斷完成與否，未完成就再提示，你由打字員變成寫循環嘅人。
方法：Loop 嘅演進由 ReAct 到 ralph 再到多 agent 編排，而家 Boris 嘅 Claude Code 令你只需要打 /loop 命令就得。
差異：唔同階段嘅 loop 有好大分別——單 agent ralph 係老套，多 agent 監督先係新嘢；loop 唔係 cron，而係 cron 加上決策者。
啟發：Loop 只同佢嘅反饋機制一樣好，冇驗證嘅 loop 只係一台燒錢嘅錯誤機器；成本重心由 token 轉移咗去 loop 管理。
可行動點：如果你要做 loop，一定要設硬停止（迭代上限、無進展檢測、預算上限），同埋將常用操作封裝成可重用技能。

值得記低

筆記

claude code /loop 斜槓命令

Boris Cherny 示範嘅上手命令：/loop 照看我所有的PR。自動修復構建問題，當評論進來時，用worktree agent修復它們。

整理重點

一條推文引爆嘅概念：loop 到底係乜？

Peter Steinberger 喺 6 月 7 號話：「每月提醒：你唔應該再手動提示編程 agent 喇。你應該設計 loop 嚟提示你嘅 agent。」結果成個 X 圈都吵翻天，睇嚇 Matthew Berman 嘅回覆：「除咗 Boris，冇人知呢係乜意思。」

Loop 就係你寫嘅一個小程式，佢負責提示 agent、讀取輸出、判斷係咪完成，未完成就再提示

Boris Cherny 喺 2024 年 9 月整咗個副項目叫 Claude Code，而家呢個項目據講佔咗 GitHub 差唔多 4% 嘅公開提交。佢話：「我唔再提示 Claude 喇。我有喺度跑嘅 loop，佢哋負責提示 Claude、決定做咩。我嘅工作係寫 loop。」

整理重點

Loop 嘅演變：由 ReAct 到多 agent 編排

Loop 呢個詞至少包含五種唔同嘅嘢，你要唔好同人講嘢甩轆。由最古老到最新嘅階段係咁樣：

1 第一階段：2022 年 ReAct 論文——模型推理、調用工具、讀結果、重複，一個模型一個循環，一個人喺度睇住。
2 第二階段：2023 年 AutoGPT——俾個目標佢，叫佢自己提示自己，結果永遠轉圈乜都唔做，令 agent 變成玩具。
3 第三階段：2025 年 ralph 循環——Geoffrey Huntley 嘅 bash 單行命令，每次迭代重置上下文到固定錨文件，唔會無限增長。
4 第四階段：2026 年春天 /goal 命令——Codex 同 Claude Code 都加入咗跑 ralph 循環直到一個小驗證模型確認完成。
5 第五階段：多 agent 編排 loop——呢個係真正新嘅嘢：循環變成工作單元，監督其他循環，併發地、按計劃地跑，有 git 支援嘅狀態同崩潰恢復。

Ralph 假設你嘅終端一直開着；2026 版本假設佢唔會

整理重點

Loop vs cron：一個有決策者嘅定時任務

有人話 loop 只不過係 cron 加咗個新品牌，但呢個講法只係講啱一半。係，調度層就係 cron，Boris 真係用 cron 嚟跑 loop。但係 cron 從來冇中間嗰部分：

Cron 跑固定腳本，Loop 跑一個模型，佢睇當前狀態、決定下一步做咩、做咗、檢查成功與否、決定係咪繼續

決定係 agent 做嘅，唔係你，亦唔係硬編碼分支。將呢啲堆埋一齊，一個 loop 調度同監督其他 loop，仲有持久嘅共享狀態，咁就做到 cron 做唔到嘅嘢。老實講：loop 唔係新魔法，而係 cron 加決策者，加上圍繞決策包裝嘅工程，令佢唔會跑下懸崖。

整理重點

成本陷阱同實戰要點：點樣防止 loop 燒錢

Loop 唔係免費㗎。Uber 喺四個月燒完年度 AI 預算後，俾每個工程師每月 USD 1500 嘅 Claude Code 同 Cursor 上限。成本已經由 token 轉移咗去 loop 管理。

「沒有護欄，你會得到無限循環同比預算高幾倍嘅賬單驚喜」

所以每個認真嘅 2026 年 loop 文章都收斂到三個硬停止：

最大迭代次數
無進展檢測
token 或美元預算上限

Gartner 話只有大約 17% 嘅組織真正部署 agent，時間線同收據之間嘅差距就係真實狀況。

整理重點

點樣開始：由斜槓命令到生產級 loop

上手只要一行。Claude Code 發佈咗 /loop 命令，Boris 嘅經典入門係：

Claude Code loop 命令 bash

/loop 照看我所有的PR。自動修復構建問題，當評論進來時，用worktree agent修復它們。

佢仲有五個技巧令 Opus 自主跑幾小時或幾日：用自動模式處理權限、用動態工作流令 Claude 編排幾百個 agent、用 /goal 或 /loop 推到完成、喺雲端跑你可以合埋 Notebook、確保 Claude 有辦法端到端自我驗證。

Loop 嘅可信度只同佢檢查自己工作嘅能力一樣強

深水區係 Steve Yegge 嘅 Gas Town，但最實用嘅教訓係：loop 只同佢嘅反饋一樣好。增長最快嘅子主題係驗證，例如 Dan Kornas 嘅 roborev 會喺後台審查每個提交並將發現反饋俾 agent。

呢個星期 AI 編程圈最火爆嘅一句話，只得一個詞，但講呢句話嘅人入面，幾乎冇人解釋得清楚佢係咩意思。

Loop困惑示意圖

我真係估唔到，一條推文可以搞到成個X圈嘈成咁。

嗰條令到所有人嘈到拆天嘅起點

Peter Steinberger 喺6月7號發咗條推，220萬瀏覽量，留言區直接打交。

佢話：

“每月提醒：你唔應該再手動提示程式 agent 㗎喇。你應該設計 loop 嚟提示你嘅 agent。”

就係咁一句嘢！

結果最搞笑嘅回覆係來自 Matthew Berman：

“除咗佢同 Boris，冇人知道呢個係咩意思。”

呢個先係真相呀！

唔係話 loop 係未來，而係一個詞衝到700萬瀏覽，下面嘅人根本唔知道自己喺度轉發緊啲咩。

我冇反白眼，因為我自己每晚就喺度跑 loop，瞓覺嘅時候佢幫我向三十個開源項目開 PR。我用咗90秒搜咗一輪，揾到15個 Reddit 帖子、21條推文，仲有一個令人有啲唔舒服嘅規律：AI 編程圈最響亮嘅概念，大多數人根本講唔清楚。

一班人喺度嗌提示工程已死。

另一班人，即係嗰啲真正喺度寫程式碼嘅人，就謹慎好多。

有個叫 Trash Panda 嘅人講得最接近實際情況：

“呢個唔係嗰種老套嘅 ralph/goal 循環。呢個可能係某種持續編排循環，監督其他線程同 agent。”

記住呢句話。

Loop 到底係咩

Boris Cherny 喺2024年9月做咗個副項目，叫 Claude Code。而家據講佔咗 GitHub 上接近4%嘅公開提交。

6月2號，佢喺 WorkOS 嘅活動上給出咗最清晰嘅定義：

“而家已經升級到下一波抽象喇。我唔再提示 Claude 喇。我有啲喺度跑緊嘅 loop，佢哋負責提示 Claude、決定做啲咩。我嘅工作係寫 loop。”

所以簡單版本係咁樣：Loop 就係你寫嘅一個細小程序，佢幫你提示編程 agent、讀取佢產生嘅嘢、判斷係咪完成，如果未完成就再提示一次。

你唔再係循環入面嗰個打字嘅人

你變咗做寫循環嘅人

模型變咗做子程序

Boris 將佢分成三個階段，將自己放喺佢嘅階梯上面係理解佢最快嘅方法。一年前佢手寫程式碼加自動補全。然後佢並行跑5到10個 Claude 對話，每個都要提示。而家佢根本唔提示喇。佢寫 loop 嚟提示 Claude，幾百個 agent 讀佢嘅 GitHub、Slack 同 Twitter，決定下一步要做咩

佢有根據：

“過去30日，我對 Claude Code 嘅100%貢獻都係 Claude Code 寫嘅。我合併咗259個 PR。”

佢11月刪咗 IDE，之後再冇開過

嗰啲嗌提示工程已死嘅人漏咗嘅細節係：佢冇話工程師過時。仍然要有人決定做啲咩、同客傾、協調團隊，佢話優秀嘅工程師比以前更加重要，工作冇消失，佢只係升咗個層次！

由寫程式碼變咗做寫嗰個寫程式碼嘅嘢

由 ReAct 到編排：一個光譜

留言區亂成一團係因為 loop 呢個詞至少藏咗五種唔同嘅嘢。

我同你列個階梯，由舊到新，咁你就唔會同人講唔到一齊喇。

第一階段係學術界嘅 while 循環。2022年嘅 ReAct 論文將佢正式化咗：模型推理、呼叫工具、讀結果、重複直到完成。一個模型，一個循環，一個人在睇住。

第二階段係2023年嘅 AutoGPT，俾佢一個目標等佢自己提示自己，結果佢出名係因為永遠轉圈乜都唔做。嗰次失敗種落咗多年嘅「agent 就係玩具」嘅印象。

第三階段就係 Trash Panda 講嘅老套：ralph 循環，Geoffrey Huntley 喺2025年7月發佈嘅。簡單到侮辱人，就係一個 bash 單行指令，將同一個提示檔案一次又一次咁灌入 agent。佢真正嘅創新係紀律：每次疊代都將上下文重置到一組固定嘅錨檔案，而唔係俾對話無限增長。Huntley 用佢做咗成個編程語言，用咗大約297美元。

第四階段將佢產品化咗：2026年春天 Codex 同 Claude Code 都發佈咗/goal 指令，跑 ralph 循環直到一個細驗證模型確認任務完成。

第五階段先係 Boris 同 Steinberger 真正指嘅嘢，呢個係真係新，唔係換個名。

四件事變咗：

循環變咗做工作單元，唔係任務。
循環開始監督其他循環，並發地、按計劃地。
排程取代咗人手啟動，所以循環跑喺基建時間上而唔係你嘅注意力上。
持久性變得明確，有 git 支援嘅狀態同崩潰恢復，因為呢啲嘢必須要喺重啟後存活。

Ralph 假設你嘅終端一路開住。2026版本假設佢唔會。

所以 Trash Panda 兩次都啱：單 agent 嘅 ralph 循環係老套，多 agent 編排循環先係新嘢。

佢唔就係一個定時任務咩？

最好嘅懷疑論只有四個字，發喺某人吹噓 loop 係未來嘅帖子下面：

「定時任務（cron）而家有咗有趣嘅新品牌。」

呢個值得一個直接嘅回答，唔可以避。因為佢講啱咗一半。

係嘅，排程層就係 cron。

Boris 真係就係用 cron 嚟跑。

Claude Code 嘅/loop 指令底層用嘅就係 cron。如果你對 loop 嘅全部定義就係「按時間跑嘅嘢」，咁係，我哋1975年就發明咗，你可以返屋企喇。

但 cron 從來冇嘅係中間嗰部分。

定時任務跑嘅係固定腳本。

Loop 跑嘅係一個模型，佢睇當前狀態、決定下一步做啲咩、做咗、檢查係咪成功、決定係咪繼續。

決定係 agent 做嘅，唔係你，亦唔係硬編碼嘅分支。將呢啲堆埋一齊，俾一個 loop 排程同監督其他 loop，俾佢哋持久嘅共享狀態，你就會有 cron 表達唔到嘅嘢。

老實嘅講法唔係 loop 係新魔法，亦唔係 loop 就係 cron，而係 loop 係 cron 加上一個決策者喺身體入面，有趣嘅工程係你圍繞嗰個決策包裹嘅所有嘢，等佢唔會跑落懸崖。

loop 實際上手到底係點樣

夠曬理論。上手只要一行。

Claude Code 發佈咗/loop，Boris 自己嘅例子就係經典入門。貼呢個然後改詞語：

   
/loop 照看我所有的PR。自動修復構建問題，當評論進來時，用worktree agent修復它們。

呢個係佢更完整嘅配方。幾日後，Boris 發咗五個令 Opus 自主跑幾個鐘或者幾日嘅技巧：

用自動模式處理權限，咁 Claude 唔會要求批准；用動態工作流程令 Claude 編排成百上千個 agent 完成任務；用/goal 或/loop 推動 Claude 一路跑到完成；喺雲端用 Claude Code 咁你可以合埋筆記本；確保 Claude 有辦法端到端自我驗證佢嘅工作。

第五條係炒作跳過但實踐者沉迷嘅：loop 嘅可信度只同佢檢查自己工作嘅能力一樣強。

呢個就係成個諗法嘅縮影。你冇寫步驟。你寫咗意圖同停止行為，loop 喺每個 tick 提示 agent。

深水區係 Steve Yegge 一月份發佈嘅 Gas Town。

但研究中最實用嘅教訓係：loop 只同佢檢查自己嘅能力一樣好。增長最快嘅子主題唔係編排，係驗證。

「你嘅編程 agent 可以跑得好快，但壞提交亦都複合得好快。」

Dan Kornas 喺度做緊 roborev，一個喺後台審查每個提交並喺上下文仲新鮮嗰陣將發現反饋俾 agent 嘅工具。

一個冇反饋嘅開放 loop 寫程式碼就係一部生成自信錯誤嘅機器。

一個寫程式碼、跑、讀結果、糾正嘅 loop 先係真正用得嘅嘢。

Loop 唔係魔法。入面嘅反饋先係。

劇情反轉：loop 而家係最貴嘅部分

研究到呢度由哲學變成咗財務問題。

對成個 agent 神話最尖鋭嘅放氣嚟自一個在職工程師：

「我今年發佈嘅每個 AI agent 都係一個 for 循環、一個 LLM 呼叫、一個圍繞 JSON 解析嘅 try/catch。唯一 agent 嘅地方係月底嘅 Anthropic 賬單。」

嗰張賬單唔係講笑。

本月收據：Uber 喺四個月燒曬年度 AI 預算之後，俾每個工程師設咗每工具每月1500美元嘅 Claude Code 同 Cursor 上限。

一旦模型幾乎免費咁寫程式碼，成本就轉移到跑佢嘅 loop 上。

「AI 編程中最貴嘅嘢唔再係寫程式碼，而係管理 agent loop。」

每個喺生產環境嘅人都驚嘅失敗模式係不停嘅 loop。

「冇護欄，你會得到無限循環同比預算高幾個數量級嘅賬單驚喜。」

呢個就係點解每個認真嘅2026年有關 loop 嘅文章都收斂到同樣三個硬停止：最大疊代次數、冇進展檢測、token 或美元預算上限。

Loop 嘅浪漫版本係：你寫 loop，一千個 agent 一晚之間起好你嘅公司。

生產版本係：你寫 loop，你大部分工作係確保佢哋停低。

Gartner 將 agent AI 放喺膨脹期望嘅頂峯，只有大約17%嘅組織真正喺度部署 agent。時間線同收據之間嘅差距先係真實狀況。

唔係 loop，係 skills

呢個係我自己嘅看法，睇咗一個禮拜之後我嘅結論。

Loop 係管道。資產係佢呼叫嘅技能。

龍蝦創始人 peter 另一個反覆出現嘅觀點同 loop 配對，而且係更持久嘅嗰一半：如果你做某件事超過一次，將佢變成自動化技能；如果你做某件事好難，之後將佢變成技能，咁下次就免費喇。

一個入面冇可重用技能嘅 loop 就係圍繞陌生人嘅 while-true。

一個呼叫一個庫嘅鋒利、測試過、命名咗嘅技能嘅 loop 係一個複合系統。真正喺度轉換嘅 Reddit 實踐者講得最好：

「好多人喺 Twitter 上反白眼，但我嘅耳朵豎起咗。」

所以「Loop 到底係咩」嘅答案唔係關於提示工程死亡嘅熱評。

係停止做循環入面嗰樣嘢。

寫一次 loop，俾佢值得呼叫嘅技能同反饋令佢可以檢查自己，設上限等佢停低，等佢喺 cron 上跑，而你決定下一步做啲咩。

Steinberger 同 Boris 從兩邊描述同一個動物。

真正知道嘅只有嗰啲已經起咗一個嘅人。好消息係，由呢個月開始，上手只需要一個斜槓指令。

研究入面嘅關鍵模式

Loop 係 cron 加上身體入面嘅決策者：模型，而唔係硬編碼分支，喺每個 tick 選擇下一個動作。

血統係真實嘅：2022年 ReAct，2023年 AutoGPT，2025年 ralph，2026年春天/goal，而家係編排 loop。單 agent ralph 係老套；多 agent 監督係新層。

Loop 只同佢嘅反饋一樣好。持續審查同驗證門係令 loop 可信嘅嘢。

昂貴嘅資源由 token 轉移到 loop 管理。設疊代上限、檢測冇進展、設美元預算。

Loop 入面可重用嘅單元係技能，唔係提示。

呼叫鋒利命名技能嘅 loop 會複合；重新推導一切嘅 loop 只係燒錢。

如果話之前，你唔識 skill 你就 out 咗，咁好快，你唔知道 loop 你都 out 㗎！

我係林悦己，最識小白出海嘅女人。

關注我，期待我嘅 loop 實戰後續

我有一個 AI 同出海交流羣，如果你有興趣，可以加我微信，備註「ai出海」，發個紅包就得！

加嘅話請備註，冇備註冇辦法通過㗎！

2025年真係經歷咗好多，由三無人員到跑通 AI 出海產品嘅0-1，10倍速增長，我所有嘅心路歷程同經驗沉澱都寫咗入我嘅日更專欄👇

如果你對徹頭徹尾轉型做「AI出海」、「AI編程產品」、「AI自媒體」有興趣，歡迎你訂閲林悦己嘅創業實驗室成為悦己嘅雲股東。

林悦己請繼續努力同加油！

這周 AI 編程圈最火的一句話，只有一個詞兒，但說這話的人裏，幾乎沒人能解釋清楚它是啥意思。

Loop困惑示意圖

我是真沒想到，一條推文能讓整個X圈吵成這樣。

那條讓所有人吵翻天的起點

Peter Steinberger 在6月7號發了條推，220萬瀏覽量，評論區直接打起來了。

他說的是：

“每月提醒：你不該再手動提示編程 agent 了。你應該設計 loop 來提示你的 agent。”

就這一句話！

結果最搞笑的回覆來自 Matthew Berman：

“除了他和 Boris，沒人知道這是啥意思。”

這才是真相啊！

不是說 loop 是未來，而是一個詞兒衝到700萬瀏覽，底下的人根本不知道自己在轉發啥。

我沒翻白眼，因為我自己每晚就在跑 loop，睡覺的時候它幫我給三十個開源項目開 PR。我花了90秒搜了一圈，找到15個 Reddit 帖子、21條推文，還有一個讓人不太舒服的規律：AI 編程圈最響亮的概念，大多數人根本說不清楚。

一羣人喊着提示工程已死。

另一羣人，就是那些真正在寫代碼的人，就謹慎多了。

有個叫 Trash Panda 的人說得最接近實際情況：

“這不是那種老掉牙的 ralph/goal 循環。這可能是某種持續編排循環，監督其他線程和 agent。”

記住這句話。

Loop 到底是啥

Boris Cherny 在2024年9月做了個副項目，叫 Claude Code。現在它據說佔了 GitHub 上接近4%的公開提交。

6月2號，他在 WorkOS 的活動上給出了最清晰的定義：

“現在已經升級到下一波抽象了。我不再提示 Claude 了。我有在跑的 loop，它們負責提示 Claude、決定做什麼。我的工作是寫 loop。”

所以簡單版本是這樣的：Loop 就是你寫的一個小程序，它幫你提示編程 agent、讀取它產出的東西、判斷是否完成，如果沒完成就再提示一次。

你不再是循環裏那個打字的人

你變成了寫循環的人

模型變成了子程序

Boris 把它分成三個階段，把自己放到他的階梯上是理解它最快的方式。一年前他手寫代碼加自動補全。然後他並行跑5到10個 Claude 會話，每個都要提示。現在他根本不提示了。他寫 loop 來提示 Claude，幾百個 agent 讀他的 GitHub、Slack 和 Twitter，決定接下來要做什麼

他有依據：

“過去30天，我對 Claude Code 的100%貢獻都是 Claude Code 寫的。我合併了259個 PR。”

他11月刪掉了 IDE，之後再沒打開過

那些喊着提示工程已死的人漏掉的細節是：他沒說工程師過時了。還是得有人決定做什麼、跟客戶聊、協調團隊，他說優秀的工程師比以前更重要，工作沒消失，它只是升了個高度！

從寫代碼變成了寫那個寫代碼的東西

從 ReAct 到編排：一個光譜

評論區亂成一團是因為 loop 這個詞至少藏了五種不同的東西。

我給你列個階梯，從老到新，這樣你就不會跟人說不到一塊去了。

第一階段是學術界的 while 循環。2022年的 ReAct 論文把它正式化了：模型推理、調用工具、讀結果、重複直到完成。一個模型，一個循環，一個人在看着。

第二階段是2023年的 AutoGPT，給它一個目標讓它自己提示自己，結果它出名是因為永遠轉圈啥也不幹。那次失敗種下了多年的“agent 就是玩具”的印象。

第三階段就是 Trash Panda 說的老掉牙：ralph 循環，Geoffrey Huntley 在2025年7月發佈的。簡單到侮辱人，就是一個 bash 單行命令，把同一個提示文件一遍遍灌進 agent。它真正的創新是紀律：每次迭代都把上下文重置到一組固定的錨文件，而不是讓對話無限增長。Huntley 用它做了一整個編程語言，花了大概297美元。

第四階段把它產品化了：2026年春天 Codex 和 Claude Code 都發布了/goal 命令，跑 ralph 循環直到一個小驗證模型確認任務完成。

第五階段才是 Boris 和 Steinberger 真正指的東西，這個是真的新，不是換個名字。

四件事變了：

循環變成了工作單元，不是任務。
循環開始監督其他循環，併發地、按計劃地。
調度取代了人工啓動，所以循環跑在基礎設施時間上而不是你的注意力上。
持久性變得明確，有 git 支持的狀態和崩潰恢復，因為這些東西必須在重啓後存活。

Ralph 假設你的終端一直開着。2026版本假設它不會。

所以 Trash Panda 兩次都對了：單 agent 的 ralph 循環是老掉牙，多 agent 編排循環才是新東西。

它不就是個定時任務嗎？

最好的懷疑論只有四個字，發在某人吹噓 loop 是未來的帖子下面：

“定時任務（cron）現在有了有趣的新品牌。”

這值得一個直接的回答，不能躲。因為它說對了一半。

是的，調度層就是 cron。

Boris 真的就是用 cron 跑的。

Claude Code 的/loop 命令底層用的就是 cron。如果你對 loop 的全部定義就是“按時間跑的東西”，那是的，我們1975年就發明了，你可以回家了。

但 cron 從來沒有的是中間那部分。

定時任務跑的是固定腳本。

Loop 跑的是一個模型，它看當前狀態、決定下一步做什麼、做了、檢查是否成功、決定是否繼續。

決定是 agent 做的，不是你，也不是硬編碼的分支。把這些堆起來，讓一個 loop 調度和監督其他 loop，給它們持久的共享狀態，你就有了 cron 表達不了的東西。

誠實的說法不是 loop 是新魔法，也不是 loop 就是 cron，而是 loop 是 cron 加上一個決策者在身體裏，有趣的工程是你圍繞那個決策包裹的所有東西，讓它不會跑下懸崖。

loop實際上手到底是什麼樣子

夠了理論。上手只要一行。

Claude Code 發佈了/loop，Boris 自己的例子就是經典入門。粘貼這個然後改名詞：

   
/loop 照看我所有的PR。自動修復構建問題，當評論進來時，用worktree agent修復它們。

這是他更完整的配方。幾天後，Boris 發了五個讓 Opus 自主跑幾小時或幾天的技巧：

用自動模式處理權限，這樣 Claude 不會要求批准；用動態工作流讓 Claude 編排成百上千個 agent 完成任務；用/goal 或/loop 推動 Claude 一直跑到完成；在雲端用 Claude Code 這樣你可以合上筆記本；確保 Claude 有辦法端到端自我驗證它的工作。

第五條是炒作跳過但實踐者痴迷的：loop 的可信度只和它檢查自己工作的能力一樣強。

這就是整個想法的縮影。你沒寫步驟。你寫了意圖和停止行為，loop 在每個 tick 提示 agent。

深水區是 Steve Yegge 一月份發佈的 Gas Town。

但研究中最實用的教訓是：loop 只和它檢查自己的能力一樣好。增長最快的子主題不是編排，是驗證。

“你的編程 agent 可以跑得很快，但壞提交也複合得很快。”

Dan Kornas 在做 roborev，一個在後台審查每個提交併在上下文還新鮮時把發現反饋給 agent 的工具。

一個沒有反饋的開放 loop 寫代碼就是一台生成自信錯誤的機器。

一個寫代碼、跑、讀結果、糾正的 loop 才是真正能用的東西。

Loop 不是魔法。裏面的反饋才是。

劇情反轉：loop 現在是最貴的部分

研究到這裏從哲學變成了財務問題。

對整個 agent 神話最尖鋭的放氣來自一個在職工程師：

“我今年發佈的每個 AI agent 都是一個 for 循環、一個 LLM 調用、一個圍繞 JSON 解析的 try/catch。唯一 agent 的地方是月底的 Anthropic 賬單。”

那賬單不是玩笑。

本月收據：Uber 在四個月燒完年度 AI 預算後，給每個工程師設了每工具每月1500美元的 Claude Code 和 Cursor 上限。

一旦模型幾乎免費地寫代碼，成本就轉移到跑它的 loop 上。

“AI 編程中最貴的東西不再是寫代碼，而是管理 agent loop。”

每個在生產環境的人都害怕的失敗模式是不停的 loop。

“沒有護欄，你會得到無限循環和比預算高几個數量級的賬單驚喜。”

這就是為什麼每個認真的2026年關於 loop 的文章都收斂到同樣三個硬停止：最大迭代次數、無進展檢測、token 或美元預算上限。

Loop 的浪漫版本是：你寫 loop，一千個 agent 一夜之間建起你的公司。

生產版本是：你寫 loop，你大部分工作是確保它們停下來。

Gartner 把 agent AI 放在膨脹期望的頂峯，只有大約17%的組織真正在部署 agent。時間線和收據之間的差距才是真實狀況。

不是 loop，是skills

這是我自己的看法，看了一週之後我的結論。

Loop 是管道。資產是它調用的技能。

龍蝦創始人 peter 另一個反覆出現的觀點跟 loop 配對，而且是更持久的那一半：如果你做某事超過一次，把它變成自動化技能；如果你做某事很難，之後把它變成技能，這樣下次就免費了。

一個裏面沒有可複用技能的 loop 就是圍繞陌生人的 while-true。

一個調用一個庫的鋒利、測試過、命名的技能的 loop 是一個複合的系統。真正在轉換的 Reddit 實踐者說得最好：

“很多人在 Twitter 上翻白眼，但我的耳朵豎起來了。”

所以“Loop 到底是啥”的答案不是關於提示工程死亡的熱評。

是停止做循環裏的那個東西。

寫一次 loop，給它值得調用的技能和反饋讓它能檢查自己，設上限讓它停下來，讓它在 cron 上跑，而你去決定接下來做什麼。

Steinberger 和 Boris 從兩邊描述同一個動物。

真正知道的只有那些已經建了一個的人。好消息是，從這個月開始，上手只要一個斜槓命令。

研究中的關鍵模式

Loop 是 cron 加上身體裏的決策者：模型，而不是硬編碼分支，在每個 tick 選擇下一個動作。

血統是真實的：2022年 ReAct，2023年 AutoGPT，2025年 ralph，2026年春天/goal，現在是編排 loop。單 agent ralph 是老掉牙；多 agent 監督是新層。

Loop 只和它的反饋一樣好。持續審查和驗證門是讓 loop 可信的東西。

昂貴的資源從 token 轉移到 loop 管理。設迭代上限、檢測無進展、設美元預算。

Loop 裏可複用的單元是技能，不是提示。

調用鋒利命名技能的 loop 會複合；重新推導一切的 loop 只是燒錢。

如果說前一陣子，你不懂skill你就out了，那麼很快，你不知道loop你也out了！

我是林悦己，最懂小白出海的女人。

關注我，期待我的loop實戰後續

我有一個AI和出海交流羣，如果你感興趣，可以加我微信，備註“ai出海”，發個紅包即可！

添加請備註，沒備註無法通過喔！

2025年真的經歷了很多，從三無人員到跑通AI出海產品的0-1，10倍速增長，我所有的心路歷程和經驗沉澱都寫進了我的日更專欄👇

如果你對徹頭徹尾轉型做”AI出海“，”AI編程產品“，”AI自媒體“感興趣，歡迎你訂閲林悦己的創業實驗室成為悦己的雲股東。

林悦己請繼續努力和加油！