為什麼 AI Agent 反而更喜歡 kubectl-style CLI？

作者：小魚今天沒卡殼

日期：2026年4月28日下午2:14

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

kubectl-style CLI 對 AI Agent 更友好，因為佢將「開放式作文題」變成「有限選項選擇題」，降低出錯率同上下文成本。

整理版摘要

呢篇文章係一個產品人嘅視角，探討緊 AI Agent 圈子入面 MCP 同 CLI 嘅爭論。作者發現，雖然 MCP 號稱標準化，但實際落地好多問題：schema 太大、模型揀錯工具、調試困難。反而 kubectl-style CLI 呢種設計，令 Agent 更容易用，因為佢將能力邊界清楚限制喺一組有限動詞同參數入面。

作者解釋咗點解 LLM 更鍾意結構化輸入：LLM 本身係概率補全機器，開放式接口令佢哋有「接口幻覺」，而有限選項就係佢哋嘅強項。kubectl-style 嘅核心唔係命令行，而係統一動詞管理資源、顯式 scope、聲明式文件同穩定輸出，呢啲設計令 Agent 可以臨場探索，唔使死記硬背。作者仲提出咗五個具體原因，包括將猜測變選擇、--help 作為運行時探索接口、漸進式暴露慳 token、高風險動作更易治理，同埋 -dry-run 解決確定性焦慮。

最後，作者總結咗邊啲產品適合 kubectl-style（有穩定資源模型、清晰生命週期嘅平台），邊啲唔適合（探索式、分析式任務），並畀咗一條四階段改造路線圖。結論係：AI 冇消滅結構化，而係將結構化從人類負擔變成產品義務。

kubectl-style CLI 將開放式 API 嘅「作文題」變成「選擇題」，Agent 只需要喺有限動詞同參數入面揀，準確率高好多。
--help 係 Agent 嘅運行時能力發現接口，Agent 可以逐層探索命令樹，唔使預先背熟文檔。
漸進式暴露節省上下文成本：第一層得 200 token，第二層 300 token，比起一次過塞幾千行 Swagger 平好多。
乾執行（--dry-run）同冪等設計令 Agent 可以安全試錯，減少「確定性焦慮」。
產品人應該先抽象資源模型同生命週期，再用翻譯層將自然語言意圖轉成 kubectl-style 命令，逐步建立可治理嘅控制面。

整理重點

LLM 嘅認知機制：佢最鍾意結構化飼料

LLM 本質上唔係一個理解世界嘅系統，而係一個基於概率嘅模式補全機器。當你畀佢開放式自然語言接口，佢要面對嘅係無限嘅解空間，好易產生「接口幻覺」。kubectl-style CLI 嘅本質，係畀咗一份極其有限嘅能力菜單畀模型。

Function Calling 之所以成功，就係因為模型係「揀」動作而唔係「寫」動作。

Agent 需要嘅唔係自由發揮嘅舞台，而係有選項嘅考卷。kubectl-style 將「作文題」變成「選擇題」，呢個先係核心。

整理重點

咩叫 kubectl-style？統一動詞 + 顯式範圍 + 聲明式文件

kubectl-style 唔單止係命令行，而係一套設計哲學：用統一動詞管理唔同資源，用顯式 scope 指定環境，用聲明式文件表達想要嘅狀態，用穩定輸出支援二次處理。

kubectl-style 命令示例 bash

lakectl get all -w growth
lakectl apply -f pipeline.yaml -w growth --context stg
lakectl run sparksql daily_report -w growth
lakectl history pipeline user_profile_sync -w growth
lakectl logs instance 12345
lakectl context use prod
lakectl auth login

動詞係穩定嘅：get, apply, run, history, logs, delete, context, auth

整理重點

點解 kubectl-style 對 Agent 特別好友？五個關鍵原因

1 --help 係運行時能力發現接口，Agent 可以逐層睇：lakectl --help → lakectl apply --help → lakectl context --help，自我導航。
2 漸進式暴露慳 token：第一層得 200 token，第二層加 300 token，比起一次過塞成千個 API 平好多，而且避免「Lost in the Middle」。
3 高風險動作更易治理：dry-run、冪等、顯式 context、可審計，Agent 喺有護欄嘅路上做事。
4 -dry-run 解決確定性焦慮：Agent 可以先知後行，睇曬影響面先真係執行。

呢啲設計令 Agent 唔再依賴「記憶」，而係依賴「發現」。用戶可以唔識命令，但產品必須有可探索嘅命令結構。

整理重點

邊啲產品適合？產品人嘅改造路線圖

kubectl-style 最適合有穩定資源模型、清晰生命週期、跨環境操作頻繁、寫操作需要強約束嘅產品，例如數據平台、雲資源平台、DevOps 平台。如果產品核心係探索式、分析式任務，就唔應該強行用 CLI 做主路徑。

階段一：抽象「資源模型」同「生命週期」，盤點對象同標準動作，產出內部詞彙表。
階段二：喺現有 API 前面加翻譯層，將自然語言翻譯成 kubectl-style 命令。
階段三：確保每個命令有結構化 --help、支援 -dry-run 同 -o json、顯式 context/workspace。
階段四：Agent 入口將自然語言意圖翻譯成 CLI，用戶無感知，底層獲得治理。

如果你最近關注 AI Agent 和工具的圈子，應該會看到一個挺熱鬧的爭論。

一邊是 MCP 的擁躉，覺得未來的 Agent 交互就該走標準化協議這條路——通過結構化 schema 暴露能力，Agent 按需調用，看起來很美。

另一邊則越來越唱反調，認為 MCP 在實際落地中暴露了太多問題：schema 太龐大、上下文成本不可控、模型在數十個工具裏"大海撈針"選不對、調試起來像在黑盒子裏摸魚。有人已經開始明確結論：與其在 MCP 的複雜度裏掙扎，不如回到 CLI。

我一開始對 CLI 的理解挺樸素的——不就是一個 command line 嘛，用戶敲一串命令，底層封裝了幾個 API 調用，Agent 也要去學習各種各樣的命令怎麼組裝。這跟"Agent Friendly"有什麼關係？

但最近深入看了我們團隊設計的 CLI solution，再把它跟 Agent 的實際行為模式放在一起比對，我有了一些新的思考。

這篇文章想聊的，不是"CLI 比 MCP 好"這種站隊式的結論。而是想回答一個更具體的問題：

什麼樣的 CLI 才真正適合 Agent？為什麼 kubectl-style 這種特定的設計模式，會比普通 CLI 更適合？

這篇文章更多是一個產品人角度的理解和判斷，不涉及具體的技術實現細節。

對 Agent 來說，最友好的系統，不一定是最像"人類對話"的系統；很多時候，反而是最"結構化、可探索、可約束"的系統。

一、LLM 為什麼更愛吃"結構化飼料"

要理解為什麼 Agent 偏愛 kubectl-style，我們先來看大語言模型的"認知機制"。

LLM 本質上不是一個"理解世界"的系統，而是一個"基於概率的模式補全機器"。當你給它開放式自然語言接口時，它面臨的是一個幾乎無限的解空間——"用戶這句話到底想讓我調用哪個能力？參數該怎麼填？"

這會讓模型產生"接口幻覺"，就像人面對一家沒有菜單的餐廳，只能憑感覺點菜，很容易點錯。

而 kubectl-style CLI 的本質，是給模型提供了一份極其有限的、樹狀的能力菜單。比如：

# lakectl 是CLItool的名稱
lakectl --help       →  發現只有 8 個動詞
lakectl apply --help  →  發現只有 5 個參數

這恰好命中了 LLM 的強項：在有限選項中做選擇，遠比在開放空間中做生成要準確得多。Function Calling 之所以成為當前 Agent 的主流交互範式，核心原理就在於此——模型不是"寫"出一個動作，而是"選"出一個動作，再"填"幾個參數。

Agent 需要的不是自由發揮的舞台，而是有選項的考卷。kubectl-style CLI 的優勢，恰恰在於它把"作文題"變成了"選擇題"。

舉個例子："停掉那個 pipeline"的兩個實現

想象你要讓 Agent 幫你"把 growth workspace的 pipeline 停掉"。

如果是開放式 API 文檔，Agent 可能會在幾百個 API 裏徘徊：是調用 stopPipeline？pauseJob？updateStatus？還是發一個 POST 請求到 /v1/workflows/{id}/terminate？每個 API 的參數格式還不一樣，有的要傳 body，有的要傳 query string。Agent 的"腦子"（上下文窗口）很快就會被這些不確定性佔滿，最終很容易選錯。

但如果是一套 kubectl-style CLI，Agent 會先查 lakectl --help，發現動詞列表裏只有 delete、stop、apply 等有限選項。再查 lakectl stop --help，發現參數明確要求 -w growth 和 pipeline 名稱。這時候 Agent 的選擇空間被壓縮到了一個很小的集合，出錯的概率呈指數級下降。

對產品來說，這意味着什麼？

同樣的模型能力，接結構化更好的 CLI，準確率會顯著提升；而接混亂的 API，哪怕用更強的模型，也救不回來。

這不是"技術選型偏好"，這是"概率數學"決定的結果。

二、什麼叫 kubectl-style？

如果把很多企業產品比作一個辦公室，那麼：

普通 GUI 像前台：直觀，但很多動作要點來點去
聊天式 Agent 像秘書：你說目標，它幫你翻譯
kubectl-style CLI 更像標準控制枱：每個按鈕、每條通道、每個動作都有統一命名和固定入口

比如一個CLI tool 一些命令，它會長這樣：

lakectl get all -w growth
lakectl apply -f pipeline.yaml -w growth --context stg
lakectl run sparksql daily_report -w growth
lakectl history pipeline user_profile_sync -w growth
lakectl logs instance 12345
lakectl context use prod
lakectl auth login

你不用逐條理解這些命令。只要看出一個規律就行：

動詞是穩定的，對象是明確的，範圍是顯式的。

這就是 kubectl-style 的價值。

常見動詞會反覆出現：

get：查看
apply：創建或更新
run：執行
history：查歷史
logs：看日誌
delete：刪除
context：切環境
auth：認證

這套語法對人類專家很好用，對 Agent 更好用。它的核心不是"命令行"這三個字，而是它背後的設計哲學：

用統一動詞管理不同資源
用顯式 scope 指定環境、空間、對象
用聲明式文件表達"我想要什麼狀態"
用穩定輸出支持腳本、自動化和 Agent 二次處理

換句話說，kubectl-style CLI 本質上是一套"標準化控制面"。

三、為什麼它對 Agent 特別友好？

1. 因為它把"猜測"變成了"選擇"

Agent 最怕什麼？

不是不會寫代碼，而是面對一個動作時，不知道系統真正允許它做什麼。

而 kubectl-style CLI 會把能力邊界寫得很清楚。

例如根命令的幫助信息，通常就會直接告訴你：

有哪些通用動詞
支持哪些資源類型
典型 workflow 是什麼
全局 flag 有哪些，比如環境、輸出格式、是否跳過緩存

也就是說，Agent 不需要預先背下整個產品手冊。它可以臨場探索。

這很重要。因為它意味着：

Agent 使用這個產品，不再依賴"記憶"，而依賴"發現"。

這和讓一個新同事進公司後，先去看操作手冊，再做事，是一個道理。

2. 因為 `-help` 本身就是一個"可運行時探索"的說明書

這是很多人容易忽略、但其實最關鍵的一點。

我們平時看 --help，覺得只是"幫助文檔"。但從 Agent 視角看，--help 不是文檔，而是：

運行時的能力發現接口。

比如，用戶對 Agent 說：

"幫我把 growth workspace的 pipeline 部署到 staging 環境。"

如果 Agent 以前沒見過這個工具，它並不一定要靠預訓練知識猜。它可以一步步探索：

第一步：先看根幫助

lakectl --help

它會看到大致結構：

有 get / apply / run / history / logs / context / auth
有全局參數 -context、o json 之類
還會看到典型工作流示例

於是它知道：這不是一個"全靠自然語言猜"的系統，而是一個結構化命令樹。

第二步：看 apply 的幫助

lakectl apply --help

它會繼續發現：

需要 f <file>
可以 -context stg
可以指定 w growth
有 -dry-run
有 -force
支持多環境部署
支持 YAML 聲明式配置

這時候，Agent 已經基本知道怎麼做這件事了。

第三步：如果涉及環境或登錄，再看子命令幫助

lakectl context --help
lakectl auth --help

它會知道：

怎麼切環境
怎麼確認當前上下文
怎麼處理認證

注意，這個過程非常像一個合格的新人同事：

先看目錄，再看細則，再做動作。

所以，--help 對 Agent 的意義，不只是"解釋命令"，而是讓 Agent 可以自我導航整套控制面。

這也是為什麼我認為：

用戶不再必須記住命令，但產品仍然必須有可探索的命令結構。

3. 因為它天然支持"漸進式暴露"，上下文成本更低

很多人會覺得，既然 MCP 可以把能力都結構化暴露出來，那不是更適合 Agent 嗎？

不一定。

問題不在於"結構化"，而在於一次性暴露多少結構。

一個寬而大的工具面，常常意味着模型一上來就要面對大量 schema、大量對象、大量工具選擇。這會有明顯的上下文成本。

而 kubectl-style CLI 往往更"省"：

根幫助先暴露一級目錄
需要哪個分支，再進入哪個子命令
幫助文本按需讀取
命令執行結果也按需返回

這就像我們在大眾點評裏面定位到一個商場，用戶體驗上不是一股腦把幾百家門店一個個羅列給你，而是會餐飲、服飾、娛樂等等進行分類，你進入到一個具體的分類後再進一步查看更細一層的分類。

對 Agent 也是一樣。不是信息越多越好，而是路徑越清楚越好。

這裏可以從成本角度再理解。

當前主流大模型是按 token收費的。Agent 調用工具時，通常需要把工具的完整描述塞進對話上下文裏。如果一個產品一次性把 200 個 API、每個 API 帶 20 個參數的描述都塞給模型，光是"介紹自己能幹什麼"就要消耗幾萬 token。

kubectl-style CLI 的"漸進式暴露"相當於一種按需加載的上下文策略：

第一層 lakectl --help：可能只有 200 個 token，告訴 Agent"我有 8 個動詞"
第二層 lakectl apply --help：再加 300 個 token，告訴 Agent"apply 需要 -f 和 --context"
執行時 lakectl apply ... -o json：返回結果可能只有 100 個 token

對比之下，如果是一個傳統的 Swagger 文檔，動輒幾千行 JSON，一次性塞進上下文，成本可能是前者的 10 倍以上。而且 LLM 有個"Lost in the Middle"現象——上下文太長時，模型會忽略中間部分的信息。

想象你走進一家商場。開放式 API 文檔像"一進門就塞給你一本 500 頁的商户名錄"；kubectl-style CLI 像"電梯口只有一塊樓層導視牌，每層再細分"。對 Agent 來說，前者不僅"看不過來"，而且"看得很貴"——每多看一頁，老闆就要多付一筆 token 錢。

做 Agent Friendly 產品，不只是技術選型，也是成本選型。 kubectl-style CLI 的"漸進式暴露"，本質上是一種"上下文預算管理"——幫你的客戶在 AI 算力上省錢。

4. 因為它對"高風險動作"更容易治理

這是產品人很該關心的一點。

AI 不是隻能"會不會用"，還要考慮：

會不會誤操作
出事後能不能回溯
權限邊界清不清楚
審計能不能看懂
同樣動作能不能穩定重放

kubectl-style CLI 在這裏有天然優勢。

比如一個典型的 apply，通常會具備這些特徵：

同一份 YAML 可以反覆執行，結果可預期
可以先 -dry-run 預演
真正執行前可以要求確認
可以顯式指定 -context prod
可以顯式指定 w growth
可以通過 o json 輸出機器可讀結果

這意味着什麼？

Agent 不是"想怎麼做就怎麼做"，而是在一條有護欄的路上做事。

這比"開放式自然語言直接寫系統狀態"要穩得多。

對外部產品尤其如此。因為一旦涉及生產環境、計費資源、數據權限、刪除動作，產品的第一責任不是"聰明"，而是"可靠"。

5. Agent 的"確定性焦慮"：為什麼 `-dry-run` 比"聰明"更重要

這裏可以更進一步，觸及當前 AI Agent 領域最痛的一個點：Agent 不知道自己錯了，或者知道自己可能錯，但不知道怎麼驗證。

人類操作生產系統時，有一種天然的"確定性焦慮"：我點下這個按鈕，到底會發生什麼？Agent 也有這種焦慮，而且更嚴重——因為它是替別人做事，沒有有"體感"。如果一個 Agent 直接調用一個會改狀態的 API，它無法像人類一樣通過 UI 反饋（比如按鈕變色、彈窗提示）來確認自己的動作。

kubectl-style CLI 的設計哲學中，有一些細節恰好治癒了 Agent 的確定性焦慮：

-dry-run：讓 Agent 可以"先知後行"，在執行前拿到完整的 diff 或影響面
o json：輸出結構化結果，讓 Agent 可以程序化地解析"成功了嗎？影響了哪些對象？"而不是去猜一段自然語言返回的含義
冪等性設計：同一份 YAML 多次 apply，結果一致。這讓 Agent 可以"安全重試"——如果一次沒成功，不用怕重複執行會搞亂狀態
context 顯式切換：Agent 不會"不小心連到生產環境"，因為環境切換是一個顯式動作，不是隱式上下文

案例：Agent 第一次操作失敗

Agent 執行 lakectl apply -f pipeline.yaml --context prod，但因為網絡抖動失敗了。如果這是一個傳統 REST API，Agent 需要擔心：上次到底執行到一半了嗎？會不會有髒數據？要不要查狀態？怎麼查？

但 kubectl-style 的設計下，Agent 可以直接重試同一個命令。因為 apply 是聲明式的——系統會保證最終狀態與 YAML 一致。如果已經部分應用了，重試會補齊剩餘；如果沒應用，重試會從頭執行。結果都是可預期的。

Agent 會用 CLI，不等於 CLI 可以替代一切

的確Agent 能通過 --help 學會 CLI。這確實把"用戶不會命令行"的門檻大大降低了。

但這隻解決了一層問題：使用門檻。

它沒有自動解決更深的問題，比如：

用戶根本不知道自己要找哪個對象
需要跨很多 workspace 找資產
要結合日誌、文檔、owner、歷史變更一起判斷
任務本質上是"探索"和"歸因"，而不是"執行"

換句話說：

kubectl-style CLI 擅長 control plane； 但 discovery plane，往往不是它最強的地方。

舉個例子：

Agent 處理線上故障的完整故事

Discovery：用戶說"核心報表昨晚沒更新，怎麼回事？" Agent 先用 MCP 查詢 catalog，知道核心報表依賴 user_profile_sync 這個 pipeline；再用語義檢索查日誌系統，發現它依賴的 upstream job 在 staging 環境失敗了
Control：Agent 要重跑這個 job。它不能隨意寫一個 curl 請求，而是調用 lakectl run user_profile_sync --context stg --dry-run，先看預演結果；確認無誤後，再執行真正的 lakectl run
Governance：整個操作過程被 CLI 的審計日誌完整記錄，包括誰觸發的（Agent ID）、用了什麼參數、在哪個 context、結果如何

簡單來說，發現階段需要更語義化的工具； 執行階段用更確定性的工具。

什麼樣的產品，特別適合做 kubectl-style？

如果你也是產品人，可以用一個很簡單的判斷法。很適合 kubectl-style 的產品，通常有這些特徵：

有穩定資源模型 比如 job、pipeline、dataset、service、policy、workflow、template、instance
有清晰生命週期 比如 create、get、update、delete、run、release、history、logs
跨環境、跨租户、跨空間操作頻繁 比如 dev/stg/prod，team-a/team-b，project/workspace/account
寫操作需要強約束和審計 比如生產發佈、配置變更、權限變更、回灌、重跑、恢復
適合聲明式表達期望狀態 比如 YAML、JSON、配置模板，而不是純一次性臨時對話
存在高頻、可重複、標準化流程 這時非常適合讓 Agent 在 CLI 之上再包一層 skill 或工作流

典型適配產品包括：數據平台，雲資源管理平台，DevOps / CI/CD 平台，工作流編排平台，權限、治理、審計類平台

什麼樣的產品，不應該強行做成 kubectl-style 主路徑？

但如果一個產品的核心價值主要來自下面這些能力，那 kubectl-style 就不該是主角：

用戶不知道對象是什麼，主要在"找"
問題依賴大量語義理解，而不是標準動作
上下文分散在文檔、日誌、聊天、工單、代碼等多個系統
需求是探索式、分析式、啓發式，而不是執行式
每次任務形態都很不一樣，難以收斂成穩定動詞

例如：企業知識搜索，故障歸因與關聯分析，複雜問答式數據發現，跨系統調查類助手

這些更適合 MCP、catalog、語義檢索或 hybrid 方案。

從"人能用"到"Agent 能用"：PM 的漸進式改造路線圖

上面講了"為什麼"和"什麼時候"，對於絕大部分產品人來說，大家面對的不是白紙一張的新產品，而是已經有一堆 GUI 和 API 的老產品。這裏我讓AI總結了一份改造路線圖。

階段一：抽象出"資源模型"和"生命週期"（不用改 UI，先統一思想）

盤點產品裏所有的"對象"：是 job？是 pipeline？是 dataset？
盤點對這些對象的"標準動作"：能不能收斂到 get/apply/run/delete/logs 這幾個動詞？
這個階段產出一份內部詞彙表，不涉及代碼改動

階段二：在現有 API 之上包一層"Agent 網關"

不用推翻現有 REST API，而是在前面加一個翻譯層
這個翻譯層把自然語言意圖翻譯成 kubectl-style 命令，再映射到後端 API
好處是：GUI 不動，API 不動，但 Agent 已經有一個穩定的控制面可以用了

階段三：把"可探索性"做出來

確保每一個命令都有結構化的 -help 輸出
確保關鍵命令支持 -dry-run 和 o json
確保 context、workspace 這類 scope 參數是顯式的

階段四：在 Agent 入口層做"自然語言到 CLI"的翻譯

用戶還是可以用自然語言跟 Agent 說話
Agent 內部先把意圖翻譯成 kubectl-style 命令，再執行
這樣用戶無感知，但底層獲得了所有 CLI 的治理優

寫到最後

很多人以為 AI 會讓結構化系統失去意義。其實更可能發生的是：

AI 把"人必須記住結構"這件事拿掉了， 但把"產品必須提供結構"這件事，變得更重要了。

用戶可以不懂命令。 Agent 可以替他看 --help、讀文檔、拼參數。但產品自己，仍然需要有：

清楚的對象模型
穩定的動作語義
可發現的幫助體系
可治理的執行邊界

而這，正是 kubectl-style CLI 最擅長的地方。

AI 沒有消滅結構化，而是把"結構化"從人類的負擔，變成了產品的義務。
在 GUI 時代，產品結構化的成本由用戶承擔——用戶必須學習菜單、理解模型、記住操作流程。在 Agent 時代，這個成本被轉移了：用戶可以說自然語言，但產品必須把內部能力結構化成 Agent 能發現、能選擇、能驗證的軌道。kubectl-style CLI 之所以重新發光，正是因為它恰好提供了一種低成本、高確定性、可漸進探索的結構化方案。
對於產品人來說，這意味着一個新的設計範式正在形成：
過去的產品設計問的是："用戶怎麼操作最順手？"
未來的產品設計還要問："Agent 怎麼操作最不容易出錯、最可審計、最省錢？"

LLM 嘅認知機制：佢最鍾意結構化飼料

咩叫 kubectl-style？統一動詞 + 顯式範圍 + 聲明式文件

點解 kubectl-style 對 Agent 特別好友？五個關鍵原因

邊啲產品適合？產品人嘅改造路線圖

一、LLM 為什麼更愛吃"結構化飼料"

舉個例子："停掉那個 pipeline"的兩個實現

二、什麼叫 kubectl-style？

三、為什麼它對 Agent 特別友好？

1. 因為它把"猜測"變成了"選擇"

2. 因為 -help 本身就是一個"可運行時探索"的說明書

3. 因為它天然支持"漸進式暴露"，上下文成本更低

4. 因為它對"高風險動作"更容易治理

5. Agent 的"確定性焦慮"：為什麼 -dry-run 比"聰明"更重要

Agent 會用 CLI，不等於 CLI 可以替代一切

什麼樣的產品，特別適合做 kubectl-style？

什麼樣的產品，不應該強行做成 kubectl-style 主路徑？

從"人能用"到"Agent 能用"：PM 的漸進式改造路線圖

階段一：抽象出"資源模型"和"生命週期"（不用改 UI，先統一思想）

階段二：在現有 API 之上包一層"Agent 網關"

階段三：把"可探索性"做出來

階段四：在 Agent 入口層做"自然語言到 CLI"的翻譯

寫到最後

2. 因為 `-help` 本身就是一個"可運行時探索"的說明書

5. Agent 的"確定性焦慮"：為什麼 `-dry-run` 比"聰明"更重要