Claude Code、Codex 的正確用法,是 Goal-Driven
整理版優先睇
AI Coding 嘅真正革命:持久執行能力,人類由寫 Code 改為定義目標
呢篇文章係作者對 2026 年 AI Coding 工具(尤其係 Claude Code 同 Codex)嘅深度分析。作者指出大部分人對 AI Coding 嘅理解仲停留喺「自動補全」、「幫手寫函數」呢啲輔助角色,但其實真正嘅革命係呢啲工具開始擁有持續執行能力,唔再係「你問一句、佢答一句」嘅被動模式。
作者認為呢個轉變會根本改變軟件開發嘅結構:人類唔再主導編程嘅每個步驟,而係轉為定義目標同判據,再俾 AI 自主循環執行。文章強調「Goal-Driven」先係正確用法,並詳細解釋點解 Terminal 成為主戰場、無需確認模式點樣成為主流。
整體結論係:軟件工程正由「人類寫 Code」演進為「人類定義目標、AI 執行目標」,人類核心能力需要轉向定義問題、設計 feedback loop 同構建自動化系統。
- 傳統 AI Coding 只係高級輸入法,因為佢只能被動響應,真正低效嘅係找問題、跑測試、修錯誤呢啲重複勞動
- Claude Code 同 Codex 嘅質變在於持久執行能力:AI 可以自動閲讀、修改、測試、修復,直到條件滿足,形成自主循環
- 正確用法係 Goal-Driven:人類只需定義目標、定義可驗證判據、俾執行環境,然後交俾 Agent 無限循環
- Terminal 先係 Agent 嘅主戰場,因為需要 shell、文件、git、test runner 等權限,IDE 正演化成 Agent Runtime
- 無需確認模式(--dangerously-skip-permissions)係自主循環嘅關鍵,配合 disposable environment 可以安全實現真正 autonomous loop
傳統 AI Coding 嘅致命缺陷
大多數人對 AI Coding 嘅理解仲停留喺自動補全、幫手寫函數、生成 CRUD 呢啲層面,本質上係「人類主導編程,AI 只係輔助工具」。呢種模式有一個致命問題:AI 只能響應,成條執行鏈路都依賴人類。
- 1 人類打開文件、決定改邊度、執行命令、運行測試、修復報錯、繼續下一步
- 2 AI 由頭到尾都只係一個高級輸入法,所以用咗幾年都仲係「好似提升效率,但冇質變」
- 3 真正低效嘅從來唔係寫 Code 本身,而係 找問題、跑測試、修錯誤、retry、context switching 呢啲重複勞動
持久執行能力:真正嘅質變
Claude Code 同 Codex 最大嘅變化係:佢哋終於可以自己循環。例如你可以直接行 claude --dangerously-skip-permissions 或者 codex --full-auto,然後話俾佢知:「唔好停,直到所有 unit test 全部通過。」
- 1 自動閲讀項目同搜索代碼,分析依賴關係
- 2 自動執行 shell 命令、修改文件、運行測試
- 3 自動修復錯誤並 retry,直到 criteria 滿足
Goal-Driven:唯一正確用法
作者反覆強調:Claude Code、Codex 嘅唯一正確用法就係 Goal-Driven。人類真正需要做嘅其實只有三件事。
- 1 定義 Goal:例如實現功能、修復 Bug、完成 PR、通過全部測試、提高 benchmark,目標必須明確
- 2 定義 Criteria:例如 unit test 全通過、lint 全通過、e2e pass、benchmark 達標,因為 AI 唔知咩叫完成,你要俾一個可驗證嘅 objective function
- 3 俾執行環境:例如 Terminal、文件系統權限、git 權限、Docker、Dev Container、sandbox repo,然後交俾 Agent 無限循環
Terminal 重新成為核心
好多人以為 AI Coding 嘅未來喺 IDE,但其實 Terminal 先係 Agent 嘅真正主戰場。因為真正強大嘅 Agent 一定要有 shell、文件、git、package manager、test runner 權限同長時間運行能力。
- 1 高級用戶嘅工作流開始變成:VS Code + Terminal + Docker + Dev Container + Git Worktree + Claude/Codex Full Auto
- 2 IDE 正從編輯器演化成 Agent Runtime,而 Terminal 提供咗最直接嘅執行環境
無需確認模式:自主循環嘅關鍵
見到 claude --dangerously-skip-permissions 或者 codex --dangerously-bypass-approvals-and-sandbox 呢啲選項,好多人會覺得太危險。但實際上,呢個正正係 Agent 化不可避免嘅一步。
所以而家真正高階嘅玩法係用 disposable environment:Docker、sandbox、VM、worktree,然後直接用 full auto 模式俾 Agent 自己循環。軟件工程正從「Human writes code」變成「Human defines objective, Agent executes objective」。
大多數人對 AI Coding 的理解,其實還停留在:
• 自動補全 • 幫你寫函數 • 幫你生成 CRUD • 幫你解釋報錯
本質上:
還是“人類主導編程”,AI 只是輔助工具。
但進入 2026 年之後:
Claude Code、Codex 這一代工具,真正革命性的地方,從來不是“更聰明的代碼補全”。
而是:
AI 開始第一次真正擁有了持續執行能力(Persistent Execution)。
這件事情,比大部分人想象得更重要。
過去的 AI Coding,為什麼一直不夠爽
因為傳統 Copilot 模式有一個致命問題:
它只能響應。
你問一句,它答一句。
你點一下,它動一下。
整個執行鏈路始終依賴人類:
• 人類打開文件 • 人類決定改哪裏 • 人類執行命令 • 人類運行測試 • 人類修復報錯 • 人類繼續下一步
AI 從頭到尾都只是:
一個“高級輸入法”。
這也是為什麼很多人用了幾年 AI Coding,最後感受依然是:
“好像提升了效率,但沒有質變。”
因為真正低效的,從來不是“寫代碼”本身。
而是:
• 找問題 • 跑測試 • 修錯誤 • retry • 重複勞動 • context switching
這些東西。
真正的質變:AI 開始擁有“循環”
Claude Code 和 Codex 最大的變化,其實是:
它們終於可以自己循環了。
例如你現在可以直接:
claude --dangerously-skip-permissions或者:
codex --full-auto甚至:
codex --dangerously-bypass-approvals-and-sandbox然後告訴它一句:
“不要停,直到所有 unit test 全部通過。”
接下來發生的事情,會和過去完全不同。
AI 會開始:
• 自動閲讀項目 • 自動搜索代碼 • 自動分析依賴 • 自動執行 shell • 自動修改文件 • 自動運行測試 • 自動修復錯誤 • 自動 retry • 自動繼續循環
直到 criteria 滿足。
這時候它已經不是:
“AI 幫你寫代碼”
而是:
“AI 開始替你完成任務”。
這兩者的差距,非常大。
Goal-Driven,才是 AI Agent 的真正形態
所以我為什麼反覆強調:
Claude Code、Codex 的唯一正確用法,就是:
Goal-Driven
Goal-Driven
Goal-Driven
Codex CLI 新增 /goal:OpenAI 把 Ralph Loop 做進官方了
人類真正需要做的,其實只有三件事:
1. 定義 Goal(目標)
例如:
• 實現一個功能 • 修復一個 bug • 完成一個 PR • 通過全部測試 • 提高 benchmark
目標必須明確。
2. 定義 Criteria(判據)
例如:
• unit test 全通過 • lint 全通過 • e2e pass • benchmark 達標 • snapshot 一致
因為:
AI 不知道什麼叫“完成”。
你必須給它一個可驗證的 objective function。
3. 給它執行環境
例如:
• Terminal • 文件系統權限 • git 權限 • Docker • Dev Container • sandbox repo
然後:
剩下的交給 Agent 無限循環。
這其實已經非常接近:
• Reinforcement Learning • Control Theory • Convex Optimization
裏的經典思想。
為什麼 Terminal 正在重新變成核心
很多人以為:
AI Coding 的未來在 IDE。
其實未必。
現在越來越明顯的一件事是:
Terminal 才是 Agent 的真正主戰場。
因為真正強大的 Agent,一定需要:
• shell 權限 • 文件權限 • git 權限 • package manager 權限 • test runner 權限 • 長時間運行能力
所以現在大量高級用戶的工作流開始變成:
• VS Code • Terminal • Docker • Dev Container • Git Worktree • Claude/Codex Full Auto
本質上:
IDE 正在從“編輯器”演化成“Agent Runtime”。
為什麼“無需確認”會成為主流
很多人第一次看到:
claude --dangerously-skip-permissions或者:
codex --dangerously-bypass-approvals-and-sandbox會覺得:
“太危險了。”
但實際上:
這恰恰是 Agent 化不可避免的一步。
因為如果 AI 每一步都要問你:
• 能不能執行命令? • 能不能修改文件? • 能不能運行測試?
那麼它永遠無法形成真正的 autonomous loop。
它會退化回:
“高級聊天機器人”。
所以現在真正的高階玩法,基本都是:
• disposable environment • Docker • sandbox • VM • worktree
然後直接:
claude --dangerously-skip-permissions或者:
codex --full-auto讓 Agent 自己循環。
軟件工程正在發生根本變化
過去的軟件開發模式是:
Human writes code
現在開始慢慢變成:
Human defines objective
Agent executes objective
這不是一句口號。
而是整個軟件工程結構正在變化。
未來真正重要的能力,可能不再是:
• 手寫代碼速度 • API 熟練度 • 背框架
而是:
• 定義目標 • 設計判據 • 構建 feedback loop • 構建 agent workflow • 構建 autonomous system
因為:
當 AI 能持續執行後,人類最大的價值,就不再是“敲代碼”,而是“定義正確的問題”。
