最火的AI新名詞兒Loop,你還不知道嗎?
整理版優先睇
Loop 係 AI 編程嘅新工作單元:你唔再手動提示 agent,而係寫 loop 嚟提示佢,再俾反饋等佢自己行
呢篇文章係林悦己寫嘅,佢係一個專注 AI 出海嘅內容創作者。文章由一條引起爭議嘅推文講起:Peter Steinberger 話「你唔應該再手動提示 agent,而係設計 loop 嚟提示佢」,結果成個 X 圈都唔知 loop 係乜。作者想解釋清楚 loop 嘅真正意思,同埋點解呢個概念咁重要。佢嘅結論係:loop 唔係魔法,而係一個 cron 加上決策者嘅系統,最重要嘅係入面嘅反饋機制同可重用技能。
作者先梳理咗 loop 嘅演變:由 2022 年嘅 ReAct、2023 年嘅 AutoGPT、2025 年嘅 ralph 循環,到而家嘅多 agent 編排。Boris Cherny 嘅定義最清晰:佢唔再提示 Claude,而係寫 loop 嚟提示幾百個 agent。但關鍵係 loop 要靠反饋先至有用,否則只會產生自信錯誤。愈來愈多人關注驗證工具,例如 roborev 會自動審查每個提交。
成本問題都係重點:Loop 嘅執行會帶來巨額賬單,Uber 已經要限制每人每月 USD 1500。所以實戰中要設硬停止:最大迭代次數、無進展檢測、token 上限。最後作者話,loop 只係管道,真正嘅資產係入面嘅技能。佢期待自己嘅 loop 實戰,並邀請讀者加入 AI 出海交流羣。
- 結論:Loop 係你寫嘅一個小程式,負責提示 agent、讀取輸出、判斷完成與否,未完成就再提示,你由打字員變成寫循環嘅人。
- 方法:Loop 嘅演進由 ReAct 到 ralph 再到多 agent 編排,而家 Boris 嘅 Claude Code 令你只需要打 /loop 命令就得。
- 差異:唔同階段嘅 loop 有好大分別——單 agent ralph 係老套,多 agent 監督先係新嘢;loop 唔係 cron,而係 cron 加上決策者。
- 啟發:Loop 只同佢嘅反饋機制一樣好,冇驗證嘅 loop 只係一台燒錢嘅錯誤機器;成本重心由 token 轉移咗去 loop 管理。
- 可行動點:如果你要做 loop,一定要設硬停止(迭代上限、無進展檢測、預算上限),同埋將常用操作封裝成可重用技能。
claude code /loop 斜槓命令
Boris Cherny 示範嘅上手命令:/loop 照看我所有的PR。自動修復構建問題,當評論進來時,用worktree agent修復它們。
一條推文引爆嘅概念:loop 到底係乜?
Peter Steinberger 喺 6 月 7 號話:「每月提醒:你唔應該再手動提示編程 agent 喇。你應該設計 loop 嚟提示你嘅 agent。」結果成個 X 圈都吵翻天,睇嚇 Matthew Berman 嘅回覆:「除咗 Boris,冇人知呢係乜意思。」
Loop 就係你寫嘅一個小程式,佢負責提示 agent、讀取輸出、判斷係咪完成,未完成就再提示
Boris Cherny 喺 2024 年 9 月整咗個副項目叫 Claude Code,而家呢個項目據講佔咗 GitHub 差唔多 4% 嘅公開提交。佢話:「我唔再提示 Claude 喇。我有喺度跑嘅 loop,佢哋負責提示 Claude、決定做咩。我嘅工作係寫 loop。」
Loop 嘅演變:由 ReAct 到多 agent 編排
Loop 呢個詞至少包含五種唔同嘅嘢,你要唔好同人講嘢甩轆。由最古老到最新嘅階段係咁樣:
- 1 第一階段:2022 年 ReAct 論文——模型推理、調用工具、讀結果、重複,一個模型一個循環,一個人喺度睇住。
- 2 第二階段:2023 年 AutoGPT——俾個目標佢,叫佢自己提示自己,結果永遠轉圈乜都唔做,令 agent 變成玩具。
- 3 第三階段:2025 年 ralph 循環——Geoffrey Huntley 嘅 bash 單行命令,每次迭代重置上下文到固定錨文件,唔會無限增長。
- 4 第四階段:2026 年春天 /goal 命令——Codex 同 Claude Code 都加入咗跑 ralph 循環直到一個小驗證模型確認完成。
- 5 第五階段:多 agent 編排 loop——呢個係真正新嘅嘢:循環變成工作單元,監督其他循環,併發地、按計劃地跑,有 git 支援嘅狀態同崩潰恢復。
Ralph 假設你嘅終端一直開着;2026 版本假設佢唔會
Loop vs cron:一個有決策者嘅定時任務
有人話 loop 只不過係 cron 加咗個新品牌,但呢個講法只係講啱一半。係,調度層就係 cron,Boris 真係用 cron 嚟跑 loop。但係 cron 從來冇中間嗰部分:
Cron 跑固定腳本,Loop 跑一個模型,佢睇當前狀態、決定下一步做咩、做咗、檢查成功與否、決定係咪繼續
決定係 agent 做嘅,唔係你,亦唔係硬編碼分支。將呢啲堆埋一齊,一個 loop 調度同監督其他 loop,仲有持久嘅共享狀態,咁就做到 cron 做唔到嘅嘢。老實講:loop 唔係新魔法,而係 cron 加決策者,加上圍繞決策包裝嘅工程,令佢唔會跑下懸崖。
成本陷阱同實戰要點:點樣防止 loop 燒錢
Loop 唔係免費㗎。Uber 喺四個月燒完年度 AI 預算後,俾每個工程師每月 USD 1500 嘅 Claude Code 同 Cursor 上限。成本已經由 token 轉移咗去 loop 管理。
「沒有護欄,你會得到無限循環同比預算高幾倍嘅賬單驚喜」
所以每個認真嘅 2026 年 loop 文章都收斂到三個硬停止:
- 最大迭代次數
- 無進展檢測
- token 或美元預算上限
Gartner 話只有大約 17% 嘅組織真正部署 agent,時間線同收據之間嘅差距就係真實狀況。
點樣開始:由斜槓命令到生產級 loop
上手只要一行。Claude Code 發佈咗 /loop 命令,Boris 嘅經典入門係:
/loop 照看我所有的PR。自動修復構建問題,當評論進來時,用worktree agent修復它們。
佢仲有五個技巧令 Opus 自主跑幾小時或幾日:用自動模式處理權限、用動態工作流令 Claude 編排幾百個 agent、用 /goal 或 /loop 推到完成、喺雲端跑你可以合埋 Notebook、確保 Claude 有辦法端到端自我驗證。
Loop 嘅可信度只同佢檢查自己工作嘅能力一樣強
深水區係 Steve Yegge 嘅 Gas Town,但最實用嘅教訓係:loop 只同佢嘅反饋一樣好。增長最快嘅子主題係驗證,例如 Dan Kornas 嘅 roborev 會喺後台審查每個提交並將發現反饋俾 agent。
呢個星期 AI 編程圈最火爆嘅一句話,只得一個詞,但講呢句話嘅人入面,幾乎冇人解釋得清楚佢係咩意思。

我真係估唔到,一條推文可以搞到成個X圈嘈成咁。
嗰條令到所有人嘈到拆天嘅起點
Peter Steinberger 喺6月7號發咗條推,220萬瀏覽量,留言區直接打交。

佢話:
“每月提醒:你唔應該再手動提示程式 agent 㗎喇。你應該設計 loop 嚟提示你嘅 agent。”
就係咁一句嘢!
結果最搞笑嘅回覆係來自 Matthew Berman:
“除咗佢同 Boris,冇人知道呢個係咩意思。”
呢個先係真相呀!
唔係話 loop 係未來,而係一個詞衝到700萬瀏覽,下面嘅人根本唔知道自己喺度轉發緊啲咩。

我冇反白眼,因為我自己每晚就喺度跑 loop,瞓覺嘅時候佢幫我向三十個開源項目開 PR。我用咗90秒搜咗一輪,揾到15個 Reddit 帖子、21條推文,仲有一個令人有啲唔舒服嘅規律:AI 編程圈最響亮嘅概念,大多數人根本講唔清楚。
一班人喺度嗌提示工程已死。
另一班人,即係嗰啲真正喺度寫程式碼嘅人,就謹慎好多。
有個叫 Trash Panda 嘅人講得最接近實際情況:
“呢個唔係嗰種老套嘅 ralph/goal 循環。呢個可能係某種持續編排循環,監督其他線程同 agent。”
記住呢句話。
Loop 到底係咩

Boris Cherny 喺2024年9月做咗個副項目,叫 Claude Code。而家據講佔咗 GitHub 上接近4%嘅公開提交。
6月2號,佢喺 WorkOS 嘅活動上給出咗最清晰嘅定義:
“而家已經升級到下一波抽象喇。我唔再提示 Claude 喇。我有啲喺度跑緊嘅 loop,佢哋負責提示 Claude、決定做啲咩。我嘅工作係寫 loop。”
所以簡單版本係咁樣:Loop 就係你寫嘅一個細小程序,佢幫你提示編程 agent、讀取佢產生嘅嘢、判斷係咪完成,如果未完成就再提示一次。
你唔再係循環入面嗰個打字嘅人
你變咗做寫循環嘅人
模型變咗做子程序
Boris 將佢分成三個階段,將自己放喺佢嘅階梯上面係理解佢最快嘅方法。一年前佢手寫程式碼加自動補全。然後佢並行跑5到10個 Claude 對話,每個都要提示。而家佢根本唔提示喇。佢寫 loop 嚟提示 Claude,幾百個 agent 讀佢嘅 GitHub、Slack 同 Twitter,決定下一步要做咩
佢有根據:
“過去30日,我對 Claude Code 嘅100%貢獻都係 Claude Code 寫嘅。我合併咗259個 PR。”
佢11月刪咗 IDE,之後再冇開過
嗰啲嗌提示工程已死嘅人漏咗嘅細節係:佢冇話工程師過時。仍然要有人決定做啲咩、同客傾、協調團隊,佢話優秀嘅工程師比以前更加重要,工作冇消失,佢只係升咗個層次!
由寫程式碼變咗做寫嗰個寫程式碼嘅嘢
由 ReAct 到編排:一個光譜
留言區亂成一團係因為 loop 呢個詞至少藏咗五種唔同嘅嘢。
我同你列個階梯,由舊到新,咁你就唔會同人講唔到一齊喇。
第一階段係學術界嘅 while 循環。2022年嘅 ReAct 論文將佢正式化咗:模型推理、呼叫工具、讀結果、重複直到完成。一個模型,一個循環,一個人在睇住。
第二階段係2023年嘅 AutoGPT,俾佢一個目標等佢自己提示自己,結果佢出名係因為永遠轉圈乜都唔做。嗰次失敗種落咗多年嘅「agent 就係玩具」嘅印象。
第三階段就係 Trash Panda 講嘅老套:ralph 循環,Geoffrey Huntley 喺2025年7月發佈嘅。簡單到侮辱人,就係一個 bash 單行指令,將同一個提示檔案一次又一次咁灌入 agent。佢真正嘅創新係紀律:每次疊代都將上下文重置到一組固定嘅錨檔案,而唔係俾對話無限增長。Huntley 用佢做咗成個編程語言,用咗大約297美元。
第四階段將佢產品化咗:2026年春天 Codex 同 Claude Code 都發佈咗/goal 指令,跑 ralph 循環直到一個細驗證模型確認任務完成。
第五階段先係 Boris 同 Steinberger 真正指嘅嘢,呢個係真係新,唔係換個名。
四件事變咗:
循環變咗做工作單元,唔係任務。
循環開始監督其他循環,並發地、按計劃地。
排程取代咗人手啟動,所以循環跑喺基建時間上而唔係你嘅注意力上。
持久性變得明確,有 git 支援嘅狀態同崩潰恢復,因為呢啲嘢必須要喺重啟後存活。
Ralph 假設你嘅終端一路開住。2026版本假設佢唔會。
所以 Trash Panda 兩次都啱:單 agent 嘅 ralph 循環係老套,多 agent 編排循環先係新嘢。
佢唔就係一個定時任務咩?
最好嘅懷疑論只有四個字,發喺某人吹噓 loop 係未來嘅帖子下面:
「定時任務(cron)而家有咗有趣嘅新品牌。」
呢個值得一個直接嘅回答,唔可以避。因為佢講啱咗一半。
係嘅,排程層就係 cron。
Boris 真係就係用 cron 嚟跑。
Claude Code 嘅/loop 指令底層用嘅就係 cron。如果你對 loop 嘅全部定義就係「按時間跑嘅嘢」,咁係,我哋1975年就發明咗,你可以返屋企喇。
但 cron 從來冇嘅係中間嗰部分。

定時任務跑嘅係固定腳本。
Loop 跑嘅係一個模型,佢睇當前狀態、決定下一步做啲咩、做咗、檢查係咪成功、決定係咪繼續。
決定係 agent 做嘅,唔係你,亦唔係硬編碼嘅分支。將呢啲堆埋一齊,俾一個 loop 排程同監督其他 loop,俾佢哋持久嘅共享狀態,你就會有 cron 表達唔到嘅嘢。
老實嘅講法唔係 loop 係新魔法,亦唔係 loop 就係 cron,而係 loop 係 cron 加上一個決策者喺身體入面,有趣嘅工程係你圍繞嗰個決策包裹嘅所有嘢,等佢唔會跑落懸崖。
loop 實際上手到底係點樣
夠曬理論。上手只要一行。
Claude Code 發佈咗/loop,Boris 自己嘅例子就係經典入門。貼呢個然後改詞語:
呢個係佢更完整嘅配方。幾日後,Boris 發咗五個令 Opus 自主跑幾個鐘或者幾日嘅技巧:
用自動模式處理權限,咁 Claude 唔會要求批准;用動態工作流程令 Claude 編排成百上千個 agent 完成任務;用/goal 或/loop 推動 Claude 一路跑到完成;喺雲端用 Claude Code 咁你可以合埋筆記本;確保 Claude 有辦法端到端自我驗證佢嘅工作。
第五條係炒作跳過但實踐者沉迷嘅:loop 嘅可信度只同佢檢查自己工作嘅能力一樣強。
呢個就係成個諗法嘅縮影。你冇寫步驟。你寫咗意圖同停止行為,loop 喺每個 tick 提示 agent。
深水區係 Steve Yegge 一月份發佈嘅 Gas Town。
但研究中最實用嘅教訓係:loop 只同佢檢查自己嘅能力一樣好。增長最快嘅子主題唔係編排,係驗證。
「你嘅編程 agent 可以跑得好快,但壞提交亦都複合得好快。」
Dan Kornas 喺度做緊 roborev,一個喺後台審查每個提交並喺上下文仲新鮮嗰陣將發現反饋俾 agent 嘅工具。
一個冇反饋嘅開放 loop 寫程式碼就係一部生成自信錯誤嘅機器。
一個寫程式碼、跑、讀結果、糾正嘅 loop 先係真正用得嘅嘢。
Loop 唔係魔法。入面嘅反饋先係。
劇情反轉:loop 而家係最貴嘅部分
研究到呢度由哲學變成咗財務問題。
對成個 agent 神話最尖鋭嘅放氣嚟自一個在職工程師:
「我今年發佈嘅每個 AI agent 都係一個 for 循環、一個 LLM 呼叫、一個圍繞 JSON 解析嘅 try/catch。唯一 agent 嘅地方係月底嘅 Anthropic 賬單。」
嗰張賬單唔係講笑。
本月收據:Uber 喺四個月燒曬年度 AI 預算之後,俾每個工程師設咗每工具每月1500美元嘅 Claude Code 同 Cursor 上限。
一旦模型幾乎免費咁寫程式碼,成本就轉移到跑佢嘅 loop 上。
「AI 編程中最貴嘅嘢唔再係寫程式碼,而係管理 agent loop。」
每個喺生產環境嘅人都驚嘅失敗模式係不停嘅 loop。
「冇護欄,你會得到無限循環同比預算高幾個數量級嘅賬單驚喜。」
呢個就係點解每個認真嘅2026年有關 loop 嘅文章都收斂到同樣三個硬停止:最大疊代次數、冇進展檢測、token 或美元預算上限。
Loop 嘅浪漫版本係:你寫 loop,一千個 agent 一晚之間起好你嘅公司。
生產版本係:你寫 loop,你大部分工作係確保佢哋停低。
Gartner 將 agent AI 放喺膨脹期望嘅頂峯,只有大約17%嘅組織真正喺度部署 agent。時間線同收據之間嘅差距先係真實狀況。
唔係 loop,係 skills

呢個係我自己嘅看法,睇咗一個禮拜之後我嘅結論。
Loop 係管道。資產係佢呼叫嘅技能。
龍蝦創始人 peter 另一個反覆出現嘅觀點同 loop 配對,而且係更持久嘅嗰一半:如果你做某件事超過一次,將佢變成自動化技能;如果你做某件事好難,之後將佢變成技能,咁下次就免費喇。
一個入面冇可重用技能嘅 loop 就係圍繞陌生人嘅 while-true。
一個呼叫一個庫嘅鋒利、測試過、命名咗嘅技能嘅 loop 係一個複合系統。真正喺度轉換嘅 Reddit 實踐者講得最好:
「好多人喺 Twitter 上反白眼,但我嘅耳朵豎起咗。」
所以「Loop 到底係咩」嘅答案唔係關於提示工程死亡嘅熱評。
係停止做循環入面嗰樣嘢。
寫一次 loop,俾佢值得呼叫嘅技能同反饋令佢可以檢查自己,設上限等佢停低,等佢喺 cron 上跑,而你決定下一步做啲咩。
Steinberger 同 Boris 從兩邊描述同一個動物。
真正知道嘅只有嗰啲已經起咗一個嘅人。好消息係,由呢個月開始,上手只需要一個斜槓指令。
研究入面嘅關鍵模式
Loop 係 cron 加上身體入面嘅決策者:模型,而唔係硬編碼分支,喺每個 tick 選擇下一個動作。
血統係真實嘅:2022年 ReAct,2023年 AutoGPT,2025年 ralph,2026年春天/goal,而家係編排 loop。單 agent ralph 係老套;多 agent 監督係新層。
Loop 只同佢嘅反饋一樣好。持續審查同驗證門係令 loop 可信嘅嘢。
昂貴嘅資源由 token 轉移到 loop 管理。設疊代上限、檢測冇進展、設美元預算。
Loop 入面可重用嘅單元係技能,唔係提示。
呼叫鋒利命名技能嘅 loop 會複合;重新推導一切嘅 loop 只係燒錢。
如果話之前,你唔識 skill 你就 out 咗,咁好快,你唔知道 loop 你都 out 㗎!
我係林悦己,最識小白出海嘅女人。
關注我,期待我嘅 loop 實戰後續
我有一個 AI 同出海交流羣,如果你有興趣,可以加我微信,備註「ai出海」,發個紅包就得!
加嘅話請備註,冇備註冇辦法通過㗎!

2025年真係經歷咗好多,由三無人員到跑通 AI 出海產品嘅0-1,10倍速增長,我所有嘅心路歷程同經驗沉澱都寫咗入我嘅日更專欄👇

如果你對徹頭徹尾轉型做「AI出海」、「AI編程產品」、「AI自媒體」有興趣,歡迎你訂閲林悦己嘅創業實驗室成為悦己嘅雲股東。
林悦己請繼續努力同加油!
這周 AI 編程圈最火的一句話,只有一個詞兒,但說這話的人裏,幾乎沒人能解釋清楚它是啥意思。

我是真沒想到,一條推文能讓整個X圈吵成這樣。
那條讓所有人吵翻天的起點
Peter Steinberger 在6月7號發了條推,220萬瀏覽量,評論區直接打起來了。

他說的是:
“每月提醒:你不該再手動提示編程 agent 了。你應該設計 loop 來提示你的 agent。”
就這一句話!
結果最搞笑的回覆來自 Matthew Berman:
“除了他和 Boris,沒人知道這是啥意思。”
這才是真相啊!
不是說 loop 是未來,而是一個詞兒衝到700萬瀏覽,底下的人根本不知道自己在轉發啥。

我沒翻白眼,因為我自己每晚就在跑 loop,睡覺的時候它幫我給三十個開源項目開 PR。我花了90秒搜了一圈,找到15個 Reddit 帖子、21條推文,還有一個讓人不太舒服的規律:AI 編程圈最響亮的概念,大多數人根本說不清楚。
一羣人喊着提示工程已死。
另一羣人,就是那些真正在寫代碼的人,就謹慎多了。
有個叫 Trash Panda 的人說得最接近實際情況:
“這不是那種老掉牙的 ralph/goal 循環。這可能是某種持續編排循環,監督其他線程和 agent。”
記住這句話。
Loop 到底是啥

Boris Cherny 在2024年9月做了個副項目,叫 Claude Code。現在它據說佔了 GitHub 上接近4%的公開提交。
6月2號,他在 WorkOS 的活動上給出了最清晰的定義:
“現在已經升級到下一波抽象了。我不再提示 Claude 了。我有在跑的 loop,它們負責提示 Claude、決定做什麼。我的工作是寫 loop。”
所以簡單版本是這樣的:Loop 就是你寫的一個小程序,它幫你提示編程 agent、讀取它產出的東西、判斷是否完成,如果沒完成就再提示一次。
你不再是循環裏那個打字的人
你變成了寫循環的人
模型變成了子程序
Boris 把它分成三個階段,把自己放到他的階梯上是理解它最快的方式。一年前他手寫代碼加自動補全。然後他並行跑5到10個 Claude 會話,每個都要提示。現在他根本不提示了。他寫 loop 來提示 Claude,幾百個 agent 讀他的 GitHub、Slack 和 Twitter,決定接下來要做什麼
他有依據:
“過去30天,我對 Claude Code 的100%貢獻都是 Claude Code 寫的。我合併了259個 PR。”
他11月刪掉了 IDE,之後再沒打開過
那些喊着提示工程已死的人漏掉的細節是:他沒說工程師過時了。還是得有人決定做什麼、跟客戶聊、協調團隊,他說優秀的工程師比以前更重要,工作沒消失,它只是升了個高度!
從寫代碼變成了寫那個寫代碼的東西
從 ReAct 到編排:一個光譜
評論區亂成一團是因為 loop 這個詞至少藏了五種不同的東西。
我給你列個階梯,從老到新,這樣你就不會跟人說不到一塊去了。
第一階段是學術界的 while 循環。2022年的 ReAct 論文把它正式化了:模型推理、調用工具、讀結果、重複直到完成。一個模型,一個循環,一個人在看着。
第二階段是2023年的 AutoGPT,給它一個目標讓它自己提示自己,結果它出名是因為永遠轉圈啥也不幹。那次失敗種下了多年的“agent 就是玩具”的印象。
第三階段就是 Trash Panda 說的老掉牙:ralph 循環,Geoffrey Huntley 在2025年7月發佈的。簡單到侮辱人,就是一個 bash 單行命令,把同一個提示文件一遍遍灌進 agent。它真正的創新是紀律:每次迭代都把上下文重置到一組固定的錨文件,而不是讓對話無限增長。Huntley 用它做了一整個編程語言,花了大概297美元。
第四階段把它產品化了:2026年春天 Codex 和 Claude Code 都發布了/goal 命令,跑 ralph 循環直到一個小驗證模型確認任務完成。
第五階段才是 Boris 和 Steinberger 真正指的東西,這個是真的新,不是換個名字。
四件事變了:
循環變成了工作單元,不是任務。
循環開始監督其他循環,併發地、按計劃地。
調度取代了人工啓動,所以循環跑在基礎設施時間上而不是你的注意力上。
持久性變得明確,有 git 支持的狀態和崩潰恢復,因為這些東西必須在重啓後存活。
Ralph 假設你的終端一直開着。2026版本假設它不會。
所以 Trash Panda 兩次都對了:單 agent 的 ralph 循環是老掉牙,多 agent 編排循環才是新東西。
它不就是個定時任務嗎?
最好的懷疑論只有四個字,發在某人吹噓 loop 是未來的帖子下面:
“定時任務(cron)現在有了有趣的新品牌。”
這值得一個直接的回答,不能躲。因為它說對了一半。
是的,調度層就是 cron。
Boris 真的就是用 cron 跑的。
Claude Code 的/loop 命令底層用的就是 cron。如果你對 loop 的全部定義就是“按時間跑的東西”,那是的,我們1975年就發明了,你可以回家了。
但 cron 從來沒有的是中間那部分。

定時任務跑的是固定腳本。
Loop 跑的是一個模型,它看當前狀態、決定下一步做什麼、做了、檢查是否成功、決定是否繼續。
決定是 agent 做的,不是你,也不是硬編碼的分支。把這些堆起來,讓一個 loop 調度和監督其他 loop,給它們持久的共享狀態,你就有了 cron 表達不了的東西。
誠實的說法不是 loop 是新魔法,也不是 loop 就是 cron,而是 loop 是 cron 加上一個決策者在身體裏,有趣的工程是你圍繞那個決策包裹的所有東西,讓它不會跑下懸崖。
loop實際上手到底是什麼樣子
夠了理論。上手只要一行。
Claude Code 發佈了/loop,Boris 自己的例子就是經典入門。粘貼這個然後改名詞:
這是他更完整的配方。幾天後,Boris 發了五個讓 Opus 自主跑幾小時或幾天的技巧:
用自動模式處理權限,這樣 Claude 不會要求批准;用動態工作流讓 Claude 編排成百上千個 agent 完成任務;用/goal 或/loop 推動 Claude 一直跑到完成;在雲端用 Claude Code 這樣你可以合上筆記本;確保 Claude 有辦法端到端自我驗證它的工作。
第五條是炒作跳過但實踐者痴迷的:loop 的可信度只和它檢查自己工作的能力一樣強。
這就是整個想法的縮影。你沒寫步驟。你寫了意圖和停止行為,loop 在每個 tick 提示 agent。
深水區是 Steve Yegge 一月份發佈的 Gas Town。
但研究中最實用的教訓是:loop 只和它檢查自己的能力一樣好。增長最快的子主題不是編排,是驗證。
“你的編程 agent 可以跑得很快,但壞提交也複合得很快。”
Dan Kornas 在做 roborev,一個在後台審查每個提交併在上下文還新鮮時把發現反饋給 agent 的工具。
一個沒有反饋的開放 loop 寫代碼就是一台生成自信錯誤的機器。
一個寫代碼、跑、讀結果、糾正的 loop 才是真正能用的東西。
Loop 不是魔法。裏面的反饋才是。
劇情反轉:loop 現在是最貴的部分
研究到這裏從哲學變成了財務問題。
對整個 agent 神話最尖鋭的放氣來自一個在職工程師:
“我今年發佈的每個 AI agent 都是一個 for 循環、一個 LLM 調用、一個圍繞 JSON 解析的 try/catch。唯一 agent 的地方是月底的 Anthropic 賬單。”
那賬單不是玩笑。
本月收據:Uber 在四個月燒完年度 AI 預算後,給每個工程師設了每工具每月1500美元的 Claude Code 和 Cursor 上限。
一旦模型幾乎免費地寫代碼,成本就轉移到跑它的 loop 上。
“AI 編程中最貴的東西不再是寫代碼,而是管理 agent loop。”
每個在生產環境的人都害怕的失敗模式是不停的 loop。
“沒有護欄,你會得到無限循環和比預算高几個數量級的賬單驚喜。”
這就是為什麼每個認真的2026年關於 loop 的文章都收斂到同樣三個硬停止:最大迭代次數、無進展檢測、token 或美元預算上限。
Loop 的浪漫版本是:你寫 loop,一千個 agent 一夜之間建起你的公司。
生產版本是:你寫 loop,你大部分工作是確保它們停下來。
Gartner 把 agent AI 放在膨脹期望的頂峯,只有大約17%的組織真正在部署 agent。時間線和收據之間的差距才是真實狀況。
不是 loop,是skills

這是我自己的看法,看了一週之後我的結論。
Loop 是管道。資產是它調用的技能。
龍蝦創始人 peter 另一個反覆出現的觀點跟 loop 配對,而且是更持久的那一半:如果你做某事超過一次,把它變成自動化技能;如果你做某事很難,之後把它變成技能,這樣下次就免費了。
一個裏面沒有可複用技能的 loop 就是圍繞陌生人的 while-true。
一個調用一個庫的鋒利、測試過、命名的技能的 loop 是一個複合的系統。真正在轉換的 Reddit 實踐者說得最好:
“很多人在 Twitter 上翻白眼,但我的耳朵豎起來了。”
所以“Loop 到底是啥”的答案不是關於提示工程死亡的熱評。
是停止做循環裏的那個東西。
寫一次 loop,給它值得調用的技能和反饋讓它能檢查自己,設上限讓它停下來,讓它在 cron 上跑,而你去決定接下來做什麼。
Steinberger 和 Boris 從兩邊描述同一個動物。
真正知道的只有那些已經建了一個的人。好消息是,從這個月開始,上手只要一個斜槓命令。
研究中的關鍵模式
Loop 是 cron 加上身體裏的決策者:模型,而不是硬編碼分支,在每個 tick 選擇下一個動作。
血統是真實的:2022年 ReAct,2023年 AutoGPT,2025年 ralph,2026年春天/goal,現在是編排 loop。單 agent ralph 是老掉牙;多 agent 監督是新層。
Loop 只和它的反饋一樣好。持續審查和驗證門是讓 loop 可信的東西。
昂貴的資源從 token 轉移到 loop 管理。設迭代上限、檢測無進展、設美元預算。
Loop 裏可複用的單元是技能,不是提示。
調用鋒利命名技能的 loop 會複合;重新推導一切的 loop 只是燒錢。
如果說前一陣子,你不懂skill你就out了,那麼很快,你不知道loop你也out了!
我是林悦己,最懂小白出海的女人。
關注我,期待我的loop實戰後續
我有一個AI和出海交流羣,如果你感興趣,可以加我微信,備註“ai出海”,發個紅包即可!
添加請備註,沒備註無法通過喔!

2025年真的經歷了很多,從三無人員到跑通AI出海產品的0-1,10倍速增長,我所有的心路歷程和經驗沉澱都寫進了我的日更專欄👇

如果你對徹頭徹尾轉型做”AI出海“,”AI編程產品“,”AI自媒體“感興趣,歡迎你訂閲林悦己的創業實驗室成為悦己的雲股東。
林悦己請繼續努力和加油!