Claude Code、Codex 的正確用法,是 Goal-Driven

作者:瓜皮程序
日期:2026年5月7日 上午12:06
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

AI Coding 嘅真正革命:持久執行能力,人類由寫 Code 改為定義目標

整理版摘要

呢篇文章係作者對 2026 年 AI Coding 工具(尤其係 Claude Code 同 Codex)嘅深度分析。作者指出大部分人對 AI Coding 嘅理解仲停留喺「自動補全」、「幫手寫函數」呢啲輔助角色,但其實真正嘅革命係呢啲工具開始擁有持續執行能力,唔再係「你問一句、佢答一句」嘅被動模式。

作者認為呢個轉變會根本改變軟件開發嘅結構:人類唔再主導編程嘅每個步驟,而係轉為定義目標同判據,再俾 AI 自主循環執行。文章強調「Goal-Driven」先係正確用法,並詳細解釋點解 Terminal 成為主戰場、無需確認模式點樣成為主流。

整體結論係:軟件工程正由「人類寫 Code」演進為「人類定義目標、AI 執行目標」,人類核心能力需要轉向定義問題、設計 feedback loop 同構建自動化系統。

  • 傳統 AI Coding 只係高級輸入法,因為佢只能被動響應,真正低效嘅係找問題、跑測試、修錯誤呢啲重複勞動
  • Claude CodeCodex 嘅質變在於持久執行能力:AI 可以自動閲讀、修改、測試、修復,直到條件滿足,形成自主循環
  • 正確用法係 Goal-Driven:人類只需定義目標、定義可驗證判據、俾執行環境,然後交俾 Agent 無限循環
  • Terminal 先係 Agent 嘅主戰場,因為需要 shell、文件、git、test runner 等權限,IDE 正演化成 Agent Runtime
  • 無需確認模式(--dangerously-skip-permissions)係自主循環嘅關鍵,配合 disposable environment 可以安全實現真正 autonomous loop
整理重點

傳統 AI Coding 嘅致命缺陷

大多數人對 AI Coding 嘅理解仲停留喺自動補全、幫手寫函數、生成 CRUD 呢啲層面,本質上係「人類主導編程,AI 只係輔助工具」。呢種模式有一個致命問題:AI 只能響應,成條執行鏈路都依賴人類。

  1. 1 人類打開文件、決定改邊度、執行命令、運行測試、修復報錯、繼續下一步
  2. 2 AI 由頭到尾都只係一個高級輸入法,所以用咗幾年都仲係「好似提升效率,但冇質變
  3. 3 真正低效嘅從來唔係寫 Code 本身,而係 找問題、跑測試、修錯誤、retry、context switching 呢啲重複勞動
整理重點

持久執行能力:真正嘅質變

Claude CodeCodex 最大嘅變化係:佢哋終於可以自己循環。例如你可以直接行 claude --dangerously-skip-permissions 或者 codex --full-auto,然後話俾佢知:「唔好停,直到所有 unit test 全部通過。

  1. 1 自動閲讀項目同搜索代碼,分析依賴關係
  2. 2 自動執行 shell 命令、修改文件、運行測試
  3. 3 自動修復錯誤並 retry,直到 criteria 滿足
整理重點

Goal-Driven:唯一正確用法

作者反覆強調Claude CodeCodex 嘅唯一正確用法就係 Goal-Driven。人類真正需要做嘅其實只有三件事

  1. 1 定義 Goal:例如實現功能、修復 Bug、完成 PR、通過全部測試、提高 benchmark,目標必須明確
  2. 2 定義 Criteria:例如 unit test 全通過、lint 全通過、e2e pass、benchmark 達標,因為 AI 唔知咩叫完成,你要俾一個可驗證嘅 objective function
  3. 3 俾執行環境:例如 Terminal、文件系統權限、git 權限、DockerDev Container、sandbox repo,然後交俾 Agent 無限循環
整理重點

Terminal 重新成為核心

好多人以為 AI Coding 嘅未來喺 IDE,但其實 Terminal 先係 Agent 嘅真正主戰場。因為真正強大嘅 Agent 一定要有 shell、文件、git、package manager、test runner 權限同長時間運行能力。

  1. 1 高級用戶嘅工作流開始變成:VS Code + Terminal + Docker + Dev Container + Git Worktree + Claude/Codex Full Auto
  2. 2 IDE 正從編輯器演化成 Agent Runtime,而 Terminal 提供咗最直接嘅執行環境
整理重點

無需確認模式:自主循環嘅關鍵

見到 claude --dangerously-skip-permissions 或者 codex --dangerously-bypass-approvals-and-sandbox 呢啲選項,好多人會覺得太危險。但實際上,呢個正正係 Agent 化不可避免嘅一步。

所以而家真正高階嘅玩法係用 disposable environment:Docker、sandbox、VM、worktree,然後直接用 full auto 模式俾 Agent 自己循環。軟件工程正從「Human writes code」變成「Human defines objective, Agent executes objective」。

 


大多數人對 AI Coding 的理解,其實還停留在:

  • • 自動補全
  • • 幫你寫函數
  • • 幫你生成 CRUD
  • • 幫你解釋報錯

本質上:

還是“人類主導編程”,AI 只是輔助工具。

但進入 2026 年之後:

Claude Code、Codex 這一代工具,真正革命性的地方,從來不是“更聰明的代碼補全”。

而是:

AI 開始第一次真正擁有了持續執行能力(Persistent Execution)。

這件事情,比大部分人想象得更重要。


過去的 AI Coding,為什麼一直不夠爽

因為傳統 Copilot 模式有一個致命問題:

它只能響應。

你問一句,它答一句。

你點一下,它動一下。

整個執行鏈路始終依賴人類:

  • • 人類打開文件
  • • 人類決定改哪裏
  • • 人類執行命令
  • • 人類運行測試
  • • 人類修復報錯
  • • 人類繼續下一步

AI 從頭到尾都只是:

一個“高級輸入法”。

這也是為什麼很多人用了幾年 AI Coding,最後感受依然是:

“好像提升了效率,但沒有質變。”

因為真正低效的,從來不是“寫代碼”本身。

而是:

  • • 找問題
  • • 跑測試
  • • 修錯誤
  • • retry
  • • 重複勞動
  • • context switching

這些東西。


真正的質變:AI 開始擁有“循環”

Claude Code 和 Codex 最大的變化,其實是:

它們終於可以自己循環了。

例如你現在可以直接:

claude --dangerously-skip-permissions

或者:

codex --full-auto

甚至:

codex --dangerously-bypass-approvals-and-sandbox

然後告訴它一句:

“不要停,直到所有 unit test 全部通過。”

接下來發生的事情,會和過去完全不同。

AI 會開始:

  • • 自動閲讀項目
  • • 自動搜索代碼
  • • 自動分析依賴
  • • 自動執行 shell
  • • 自動修改文件
  • • 自動運行測試
  • • 自動修復錯誤
  • • 自動 retry
  • • 自動繼續循環

直到 criteria 滿足。

這時候它已經不是:

“AI 幫你寫代碼”

而是:

“AI 開始替你完成任務”。

這兩者的差距,非常大。


Goal-Driven,才是 AI Agent 的真正形態

所以我為什麼反覆強調:

Claude Code、Codex 的唯一正確用法,就是:

Goal-Driven

Goal-Driven

Goal-Driven

Codex CLI 新增 /goal:OpenAI 把 Ralph Loop 做進官方了

人類真正需要做的,其實只有三件事:

1. 定義 Goal(目標)

例如:

  • • 實現一個功能
  • • 修復一個 bug
  • • 完成一個 PR
  • • 通過全部測試
  • • 提高 benchmark

目標必須明確。


2. 定義 Criteria(判據)

例如:

  • • unit test 全通過
  • • lint 全通過
  • • e2e pass
  • • benchmark 達標
  • • snapshot 一致

因為:

AI 不知道什麼叫“完成”。

你必須給它一個可驗證的 objective function。


3. 給它執行環境

例如:

  • • Terminal
  • • 文件系統權限
  • • git 權限
  • • Docker
  • • Dev Container
  • • sandbox repo

然後:

剩下的交給 Agent 無限循環。

這其實已經非常接近:

  • • Reinforcement Learning
  • • Control Theory
  • • Convex Optimization

裏的經典思想。


為什麼 Terminal 正在重新變成核心

很多人以為:

AI Coding 的未來在 IDE。

其實未必。

現在越來越明顯的一件事是:

Terminal 才是 Agent 的真正主戰場。

因為真正強大的 Agent,一定需要:

  • • shell 權限
  • • 文件權限
  • • git 權限
  • • package manager 權限
  • • test runner 權限
  • • 長時間運行能力

所以現在大量高級用戶的工作流開始變成:

  • • VS Code
  • • Terminal
  • • Docker
  • • Dev Container
  • • Git Worktree
  • • Claude/Codex Full Auto

本質上:

IDE 正在從“編輯器”演化成“Agent Runtime”。


為什麼“無需確認”會成為主流

很多人第一次看到:

claude --dangerously-skip-permissions

或者:

codex --dangerously-bypass-approvals-and-sandbox

會覺得:

“太危險了。”

但實際上:

這恰恰是 Agent 化不可避免的一步。

因為如果 AI 每一步都要問你:

  • • 能不能執行命令?
  • • 能不能修改文件?
  • • 能不能運行測試?

那麼它永遠無法形成真正的 autonomous loop。

它會退化回:

“高級聊天機器人”。

所以現在真正的高階玩法,基本都是:

  • • disposable environment
  • • Docker
  • • sandbox
  • • VM
  • • worktree

然後直接:

claude --dangerously-skip-permissions

或者:

codex --full-auto

讓 Agent 自己循環。


軟件工程正在發生根本變化

過去的軟件開發模式是:

Human writes code

現在開始慢慢變成:

Human defines objective
Agent executes objective

這不是一句口號。

而是整個軟件工程結構正在變化。

未來真正重要的能力,可能不再是:

  • • 手寫代碼速度
  • • API 熟練度
  • • 背框架

而是:

  • • 定義目標
  • • 設計判據
  • • 構建 feedback loop
  • • 構建 agent workflow
  • • 構建 autonomous system

因為:

當 AI 能持續執行後,人類最大的價值,就不再是“敲代碼”,而是“定義正確的問題”。

 

圖片