Claude Code、Codex 的正確用法，是 Goal-Driven

作者：瓜皮程序

日期：2026年5月7日上午12:06

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

AI Coding 嘅真正革命：持久執行能力，人類由寫 Code 改為定義目標

整理版摘要

呢篇文章係作者對 2026 年 AI Coding 工具（尤其係 Claude Code 同 Codex）嘅深度分析。作者指出大部分人對 AI Coding 嘅理解仲停留喺「自動補全」、「幫手寫函數」呢啲輔助角色，但其實真正嘅革命係呢啲工具開始擁有持續執行能力，唔再係「你問一句、佢答一句」嘅被動模式。

作者認為呢個轉變會根本改變軟件開發嘅結構：人類唔再主導編程嘅每個步驟，而係轉為定義目標同判據，再俾 AI 自主循環執行。文章強調「Goal-Driven」先係正確用法，並詳細解釋點解 Terminal 成為主戰場、無需確認模式點樣成為主流。

整體結論係：軟件工程正由「人類寫 Code」演進為「人類定義目標、AI 執行目標」，人類核心能力需要轉向定義問題、設計 feedback loop 同構建自動化系統。

傳統 AI Coding 只係高級輸入法，因為佢只能被動響應，真正低效嘅係找問題、跑測試、修錯誤呢啲重複勞動
Claude Code 同 Codex 嘅質變在於持久執行能力：AI 可以自動閲讀、修改、測試、修復，直到條件滿足，形成自主循環
正確用法係 Goal-Driven：人類只需定義目標、定義可驗證判據、俾執行環境，然後交俾 Agent 無限循環
Terminal 先係 Agent 嘅主戰場，因為需要 shell、文件、git、test runner 等權限，IDE 正演化成 Agent Runtime
無需確認模式（--dangerously-skip-permissions）係自主循環嘅關鍵，配合 disposable environment 可以安全實現真正 autonomous loop

整理重點

傳統 AI Coding 嘅致命缺陷

大多數人對 AI Coding 嘅理解仲停留喺自動補全、幫手寫函數、生成 CRUD 呢啲層面，本質上係「人類主導編程，AI 只係輔助工具」。呢種模式有一個致命問題：AI 只能響應，成條執行鏈路都依賴人類。

1 人類打開文件、決定改邊度、執行命令、運行測試、修復報錯、繼續下一步
2 AI 由頭到尾都只係一個高級輸入法，所以用咗幾年都仲係「好似提升效率，但冇質變」
3 真正低效嘅從來唔係寫 Code 本身，而係找問題、跑測試、修錯誤、retry、context switching 呢啲重複勞動

整理重點

持久執行能力：真正嘅質變

Claude Code 同 Codex 最大嘅變化係：佢哋終於可以自己循環。例如你可以直接行 claude --dangerously-skip-permissions 或者 codex --full-auto，然後話俾佢知：「唔好停，直到所有 unit test 全部通過。」

1 自動閲讀項目同搜索代碼，分析依賴關係
2 自動執行 shell 命令、修改文件、運行測試
3 自動修復錯誤並 retry，直到 criteria 滿足

整理重點

Goal-Driven：唯一正確用法

作者反覆強調：Claude Code、Codex 嘅唯一正確用法就係 Goal-Driven。人類真正需要做嘅其實只有三件事。

1 定義 Goal：例如實現功能、修復 Bug、完成 PR、通過全部測試、提高 benchmark，目標必須明確
2 定義 Criteria：例如 unit test 全通過、lint 全通過、e2e pass、benchmark 達標，因為 AI 唔知咩叫完成，你要俾一個可驗證嘅 objective function
3 俾執行環境：例如 Terminal、文件系統權限、git 權限、Docker、Dev Container、sandbox repo，然後交俾 Agent 無限循環

整理重點

Terminal 重新成為核心

好多人以為 AI Coding 嘅未來喺 IDE，但其實 Terminal 先係 Agent 嘅真正主戰場。因為真正強大嘅 Agent 一定要有 shell、文件、git、package manager、test runner 權限同長時間運行能力。

1 高級用戶嘅工作流開始變成：VS Code + Terminal + Docker + Dev Container + Git Worktree + Claude/Codex Full Auto
2 IDE 正從編輯器演化成 Agent Runtime，而 Terminal 提供咗最直接嘅執行環境

整理重點

無需確認模式：自主循環嘅關鍵

見到 claude --dangerously-skip-permissions 或者 codex --dangerously-bypass-approvals-and-sandbox 呢啲選項，好多人會覺得太危險。但實際上，呢個正正係 Agent 化不可避免嘅一步。

所以而家真正高階嘅玩法係用 disposable environment：Docker、sandbox、VM、worktree，然後直接用 full auto 模式俾 Agent 自己循環。軟件工程正從「Human writes code」變成「Human defines objective, Agent executes objective」。

大多數人對 AI Coding 的理解，其實還停留在：

• 自動補全
• 幫你寫函數
• 幫你生成 CRUD
• 幫你解釋報錯

本質上：

還是“人類主導編程”，AI 只是輔助工具。

但進入 2026 年之後：

Claude Code、Codex 這一代工具，真正革命性的地方，從來不是“更聰明的代碼補全”。

而是：

AI 開始第一次真正擁有了持續執行能力（Persistent Execution）。

這件事情，比大部分人想象得更重要。

過去的 AI Coding，為什麼一直不夠爽

因為傳統 Copilot 模式有一個致命問題：

它只能響應。

你問一句，它答一句。

你點一下，它動一下。

整個執行鏈路始終依賴人類：

• 人類打開文件
• 人類決定改哪裏
• 人類執行命令
• 人類運行測試
• 人類修復報錯
• 人類繼續下一步

AI 從頭到尾都只是：

一個“高級輸入法”。

這也是為什麼很多人用了幾年 AI Coding，最後感受依然是：

“好像提升了效率，但沒有質變。”

因為真正低效的，從來不是“寫代碼”本身。

而是：

• 找問題
• 跑測試
• 修錯誤
• retry
• 重複勞動
• context switching

這些東西。

真正的質變：AI 開始擁有“循環”

Claude Code 和 Codex 最大的變化，其實是：

它們終於可以自己循環了。

例如你現在可以直接：

claude --dangerously-skip-permissions

或者：

codex --full-auto

甚至：

codex --dangerously-bypass-approvals-and-sandbox

然後告訴它一句：

“不要停，直到所有 unit test 全部通過。”

接下來發生的事情，會和過去完全不同。

AI 會開始：

• 自動閲讀項目
• 自動搜索代碼
• 自動分析依賴
• 自動執行 shell
• 自動修改文件
• 自動運行測試
• 自動修復錯誤
• 自動 retry
• 自動繼續循環

直到 criteria 滿足。

這時候它已經不是：

“AI 幫你寫代碼”

而是：

“AI 開始替你完成任務”。

這兩者的差距，非常大。

Goal-Driven，才是 AI Agent 的真正形態

所以我為什麼反覆強調：

Claude Code、Codex 的唯一正確用法，就是：

Goal-Driven

Codex CLI 新增 /goal：OpenAI 把 Ralph Loop 做進官方了

人類真正需要做的，其實只有三件事：

1. 定義 Goal（目標）

例如：

• 實現一個功能
• 修復一個 bug
• 完成一個 PR
• 通過全部測試
• 提高 benchmark

目標必須明確。

2. 定義 Criteria（判據）

例如：

• unit test 全通過
• lint 全通過
• e2e pass
• benchmark 達標
• snapshot 一致

因為：

AI 不知道什麼叫“完成”。

你必須給它一個可驗證的 objective function。

3. 給它執行環境

例如：

• Terminal
• 文件系統權限
• git 權限
• Docker
• Dev Container
• sandbox repo

然後：

剩下的交給 Agent 無限循環。

這其實已經非常接近：

• Reinforcement Learning
• Control Theory
• Convex Optimization

裏的經典思想。

為什麼 Terminal 正在重新變成核心

很多人以為：

AI Coding 的未來在 IDE。

其實未必。

現在越來越明顯的一件事是：

Terminal 才是 Agent 的真正主戰場。

因為真正強大的 Agent，一定需要：

• shell 權限
• 文件權限
• git 權限
• package manager 權限
• test runner 權限
• 長時間運行能力

所以現在大量高級用戶的工作流開始變成：

• VS Code
• Terminal
• Docker
• Dev Container
• Git Worktree
• Claude/Codex Full Auto

本質上：

IDE 正在從“編輯器”演化成“Agent Runtime”。

為什麼“無需確認”會成為主流

很多人第一次看到：

claude --dangerously-skip-permissions

或者：

codex --dangerously-bypass-approvals-and-sandbox

會覺得：

“太危險了。”

但實際上：

這恰恰是 Agent 化不可避免的一步。

因為如果 AI 每一步都要問你：

• 能不能執行命令？
• 能不能修改文件？
• 能不能運行測試？

那麼它永遠無法形成真正的 autonomous loop。

它會退化回：

“高級聊天機器人”。

所以現在真正的高階玩法，基本都是：

• disposable environment
• Docker
• sandbox
• VM
• worktree

然後直接：

claude --dangerously-skip-permissions

或者：

codex --full-auto

讓 Agent 自己循環。

軟件工程正在發生根本變化

過去的軟件開發模式是：

Human writes code

現在開始慢慢變成：

Human defines objective
Agent executes objective

這不是一句口號。

而是整個軟件工程結構正在變化。

未來真正重要的能力，可能不再是：

• 手寫代碼速度
• API 熟練度
• 背框架

而是：

• 定義目標
• 設計判據
• 構建 feedback loop
• 構建 agent workflow
• 構建 autonomous system

因為：

當 AI 能持續執行後，人類最大的價值，就不再是“敲代碼”，而是“定義正確的問題”。