/Workflows 還是 /goal?這是你當 AI 老闆的第一個判斷

作者:縱所周知101
日期:2026年6月3日 上午7:03
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

判斷任務用 Workflows 定 Goal,關鍵係「點樣做」清唔清楚,同埋有冇一條機器驗到嘅停止線。

整理版摘要

呢篇文章出自一位實戰 AI 工具嘅開發者,佢用自己俾 Claude 卡住嘅經驗,引出 Claude Code 嘅兩個模式:workflows(流程驅動)同 goal(目標驅動)。作者想解決嘅問題係:大部分人當呢兩個係功能嚟學,但學完都唔識揀——因為缺嘅唔係說明書,而係一個判斷:手頭個活,究竟歸邊個模式。

整體結論好清晰:揀 workflows 定 goal,分界線唔係難易,而係確定性。你清楚「點樣做」(流程已知),就用 workflows;你只清楚「做成點」(終點已知但路要試),就用 goal。另外仲有個關鍵:goal 嘅停止線必須要客觀可驗證,否則放手唔叫信任,叫甩鍋。

文章仲提供咗一張決策圖,幫你判斷每種情況:流程已知且要並行 -> workflows;流程已知單線就夠 -> 普通對話;終點清楚且可驗 -> goal;兩樣都唔清楚 -> 自己落場摸一輪先。作者仲用大量具體例子講解邊啲活適合邊個模式,最後提醒長文創作呢類「滿意」驗唔到嘅活,千祈唔好用 goal。

  • Workflows 係寫劇本,適合流程已知、要並行或聚合結果嘅任務;Goal 係派任務,適合終點清楚但路徑要試錯、而且有客觀停止線嘅任務。
  • 揀邊個模式嘅分界線係「確定性」而唔係難易:簡單但路徑要試嘅活(例如修測試)用 goal,複雜但步驟明確嘅活(例如掃全庫 bug)用 workflows。
  • Goal 最大嘅坑係停止線驗唔到:例如「寫到滿意為止」呢條線機器判唔到,會搞到無限自改。相反,「測試全綠」呢啲就可驗,適合放手。
  • 長文創作呢類「滿意」驗唔到嘅活,正確做法係用 workflows 分派段落寫作,由你合稿定奪,而唔係交俾 goal 自改。
  • 今日最小行動:揀一個「終點清楚、但懶得逐輪盯」嘅活(例如清 Issue 隊列),用 /goal 命令試一次,俾 AI 自己撞線。
結構示例

內容結構

內容結構 text
一個活來了                              │              ┌───────────────┴───────────────┐              ▼                                ▼     「怎麼幹」你清楚嗎?              只清楚「幹成啥樣」?      (流程/步驟已知)                 (終點已知 · 路徑要試錯)              │                                │              ▼                                ▼     還要 並行/聚合/重複跑?           有「可機器驗收」的停止線?          │         │                     │           │         是         否                    是          否          │         │                     │           │          ▼         ▼                     ▼           ▼    ⚙️ WORKFLOWS  單輪直接幹          🎯 GOAL      ❌ 先別自動化    寫劇本·N個     (普通對話           給停止線·     驗收線都沒有,    agent並行      就夠了)            自己跑到撞線   自動化=災難
整理重點

Workflows 同 Goal:兩種員工思維

Workflows 係你寫劇本,提前定死每一步:邊個 agent 做咩、並行定串行、結果點傳——agent 只係演員,導演係你。Goal 係你派任務,只俾目標同一條驗收線,然後走開;Claude 自己一輪輪幹,每輪有 Haiku 幫手睇嚇撞線未,撞咗就交返俾你。

呢個區別,就係管理學入面流程驅動同目標驅動嘅分別。流程驅動管得死,但新活試錯嗰陣你根本寫唔出 SOP;目標驅動放得開,但前提係條驗收線要客觀可驗。多數人衰喺呢度:以為「放手俾 AI 自主」係更高級,但自主唔係更高級,係更危險——你冇一條機器驗到嘅停止線,放手就等於甩鍋。

Workflows 係寫劇本,Goal 係派任務

條驗收線要客觀可驗

整理重點

一句判據加一張決策圖

將上面套用落日常判斷,一句話:你清楚「點樣做」,用 workflows;你只清楚「做成點」、路要試出來,用 goal。分界線唔係難易,係確定性。

例如「將 test/auth 嘅測試修到全綠」聽落簡單,但路徑要試,而且「綠唔綠」機器一秒驗到,所以最啱用 goal。相反,「掃曬成個 codebase 揾 memory leak」聽落粗糙,但一個對話裝唔曬,要用 workflows 派幾十個 agent 分頭掃再彙總。複雜度係假分界線,確定性先係真。

複雜度係假分界線,確定性先係真

  1. 1 如果流程已知,仲要並行、聚合、重複跑 -> workflows,寫劇本派多個 agent
  2. 2 如果流程已知,但單線順住做就得 -> 普通對話就夠,唔使寫腳本
  3. 3 如果只清楚終點,而且有可機器驗證嘅停止線 -> goal,俾條線自己撞
  4. 4 如果兩樣都唔清楚(唔知點做又冇驗收線)-> 先唔好自動化,自己落場摸一輪,摸到其中一樣先
整理重點

我手頭嘅活係咁樣分

作者將日常任務分類示範,等我哋更容易代入。以下係用 workflows 嘅例子。

  • 掃全庫 bug 或安全隱患:一個對話裝唔曬,要 fan-out 幾十個 agent 分頭掃再彙總
  • 批量遷移 500 個檔案轉 API:每個檔案用一個 agent 並行改,各自驗證
  • 多源調研交叉驗證:派 5 個 agent 從 5 個角度查,互相質疑投票
  • 競品橫評:每個 agent 盯一個產品,同一套維度打分,最後並排出表
  • 大規模翻譯、批量改圖、整理幾百份散資料:量大、獨立、可拆開同時做

呢啲活嘅共同點:要唔係一個上下文裝唔曬,要唔係想要多個獨立視角,再將結果編程處理(投票、聚合、對比)。呢啲就係寫劇本嘅命。

Workflows 門檻係「流程已知,而且值得拆俾一隊人同時幹

至於用 goal 嘅活,包括:修到測試全綠 + lint 乾淨、照設計文檔實現到驗收標準打勾、清空一個 label 嘅 issue 隊列、重構大檔案拆到每個 <200 行、照 checklist 配環境到全部通過。呢啲活嘅終點清清楚楚,中間點行就邊行邊睇。

Goal 嘅活終點清楚,中間行路要試

作者仲提醒兩個常見陷阱:寫 5000 字長文千祈唔好用 goal,因為「滿意」驗唔到,應該反過來用 workflows 分段落寫,你合稿;相反,修測試呢類簡單活就唔好寫 workflow,否則腳本難維護。

整理重點

今日就可以上手

Goal 功能已經穩定(v2.1.139 之後),一行命令就開:/goal all tests in test/auth pass and the lint step is clean。完成條件最多 4000 字元,想兜底可以加 or stop after 20 turns。中途 /goal 睇狀態,/goal clear 停。

Workflows 仲係 research preview(v2.1.154 之後,要喺 /config 手動開,限付費計劃)。最簡單觸發係喺對話直接講「workflow」呢個字,或者用 /effort ultracode,Claude 會自己寫編排腳本。想偷懶就用內置 /deep-research,佢本身就係一個 workflow。

/goal 加完成條件,最多 4000 字元

Workflows 仲要手動開,限付費

最小動作:今日就揀一個「終點清楚、懶得逐輪盯」嘅活,用 /goal 試一次。清 Issue 隊列或者修測試都得。一條命令,行開飲杯咖啡,間中瞄一眼就得。

整理重點

講到尾,呢個係帶人功夫

Workflows 同 goal,你真係要學嘅唔係點敲 command,而係換一對帶 AI 員工嘅老闆眼,去睇手頭每一個活:我心中有冇 SOP?有,寫劇本派隊人並行做;冇,但終點清楚又驗到,俾條線佢自己撞;兩樣都冇,就自己落場摸一輪先。

呢個係帶人功夫,唔係用工具功夫

我叫 Claude 幫我諗呢篇文章嘅選題。佢卡咗喺度。

佢糾結緊一件事:「幫我諗選題」呢個任務,佢自己到底應該點做——係寫一個 workflow 腳本,派出五六個分身並行搜資料、各自諗一個版本再投票揀最好;定係用 goal,俾自己定個「諗出 3 個掂嘅選題就停」嘅目標,一輪輪死磕到撞線。

反過來問我:「呢個你想我點樣分?」呢篇文章唔使寫喇。佢卡住嘅地方,就係答案。

Claude Code 最近呢兩個模式,workflows 同 goal,幾乎個個都當成兩個新功能嚟學:呢個點樣調,嗰個點樣開。學完都係唔識用。因為你缺嘅唔係說明書,而係一個判斷——手上呢個任務,到底歸邊個。

呢件事講到底,同「兩個功能」冇關係。係你做老細嘅功力。

圖片

01你係帶緊兩種員工

先講返人話。

workflows,係你寫劇本。 你預先將每一步定死:先派 3 個 agent 分頭掃 codebase 嘅三個模塊,掃完匯總俾第 4 個去重,再分俾 5 個各自驗證一條……邊個喺第幾步做乜、並行定串行、結果點樣傳,全部喺你 script 裏面寫好。agent 只係演員,跟住走位演出。導演係你。

goal,係你派任務。 你唔寫劇本,淨係俾一個目標加一條驗收線:「將 test/auth 目錄下面嘅測試全部整到綠,順便 lint 清乾淨。」然後你行開。Claude 自己一輪輪做,每做完一輪,有個細 model(預設 Haiku,跑得快)幫佢睇一眼:「撞線未?」未撞,自己開下一輪繼續做;撞咗,停,將任務交返俾你。

睇到未,呢個就係管理學入面最老嗰兩套嘢。

寫劇本,係流程驅動。我唔理你聰唔聰明,你跟住 SOP 行,每一步可控、可覆盤、可重跑。流水線就係咁樣管人㗎。

派任務,係目標驅動。我唔理你點樣做,只要結果達標。OKR 就係咁樣管人㗎——俾你一個目標,幾條結果線,路你自己揾。

仲有個分別藏喺收尾度。goal 撞咗線,會主動將任務交返你手上——佢知道自己幾時叫做做完。workflow 跑完,結果靜靜咁躺喺 script 變量裏面,要你自己去攞、去驗。一個會同你交接,一個等你嚟收。

你帶過人就知,呢兩套各有各嘅死穴。流程驅動管得死,但新任務、要試錯嘅任務,你根本寫唔出 SOP——你自己都唔知第三步要做乜,點樣俾人寫。目標驅動放得開,但有個要命嘅前提:嗰條驗收線,要能夠客觀咁驗。

大多數人就衰喺呢度。

大家預設「放手指 AI 自己衝向目標」係更高級、更加似未來嘅玩法。自主唔係更高級,係更危險。 goal 最大嘅陷阱唔係 AI 唔夠聰明,係你俾嗰條線根本驗唔到——你寫「將呢篇文章改到滿意為止」,Haiku 用乜嘢判「滿意」?佢判唔到,於是係咁一係早早收工話「我覺得得咗」,一係陪你無限改落去。冇可驗收嘅停止線,放手唔叫信任,叫卸膊。

呢個分別。「等 AI 自主」聽落似係授權,但好多時你只係唔想自己定義乜嘢叫「做完」。真正嘅授權係先將驗收線劃死先放手——線越清楚,你越敢放開手;線越模糊,你越要睇實。

越係重要、不可逆轉嘅任務,越唔可以貪方便卸俾目標。應該寫劇本,就乖乖哋寫劇本。

全文概要圖

02一句說話嘅判斷標準,加埋一張圖

將上面嗰套翻譯成你下次開口就用得嘅判斷,就一句話:

你清楚「點做」,用 workflows;你只清楚「做成點樣」、條路要試出嚟,用 goal。

再強調一次,分界線唔係「難易」。呢個係最易揀錯嘅地方。

「將 test/auth 嘅測試整到全綠」——聽落幾簡單,一句說話嘅事。但佢最應該用 goal。因為你根本唔知要改幾多輪、邊個 file 先會死,條路係試出嚟嘅;而「綠冇綠」機器一秒就驗到。簡單嘅任務,最應該放開手。

「掃一次成個 codebase,將所有疑似 memory leak 嘅地方挖出嚟」——聽落粗,似個體力活。但佢必須用 workflows。因為一個對話裝唔曬成個 codebase,你要派幾十個 agent 分頭掃、再匯總去重,呢套編排要你寫 script 鎖死。粗重嘢,偏偏要寫劇本。

複雜度係個假分界線。真正嘅分界線係確定性。 你心裏面嗰張判斷圖,其實係咁樣:

                          一個活來了
                              │
              ┌───────────────┴───────────────┐
              ▼                                ▼
     「怎麼幹」你清楚嗎?              只清楚「幹成啥樣」?
      (流程/步驟已知)                 (終點已知 · 路徑要試錯)
              │                                │
              ▼                                ▼
     還要 並行/聚合/重複跑?           有「可機器驗收」的停止線?
          │         │                     │           │
         是         否                    是          否
          │         │                     │           │
          ▼         ▼                     ▼           ▼
    ⚙️ WORKFLOWS  單輪直接幹          🎯 GOAL      ❌ 先別自動化
    寫劇本·N個     (普通對話           給停止線·     驗收線都沒有,
    agent並行      就夠了)            自己跑到撞線   自動化=災難

先睇左邊呢一刀。就算你清楚點做,都唔好咁急寫 workflow——仲要再問一句:呢個任務要唔要並行、要唔要將多個結果攞嚟聚合?一條線順住落嚟就做得完嘅,普通對話就夠,寫 script 純屬殺雞用牛刀。workflows 真正嘅門檻唔係「流程已知」,係「流程已知,而且值得拆俾一隊人同時做」。

再睇右下角嗰一格——❌ 住先唔好自動化。呢格先係成張圖最值錢嘅地方。你又唔清楚點做,又冇一條驗得到嘅停止線,呢個時候唔好咁急上用 goal,更加唔好寫 workflow。你應該自己先落場做一輪,將「點做」或者「驗收線」先摸出一個,再返嚟睇呢張圖。

知識卡片 A

03我手上嘅任務,係咁樣分嘅

淨係講判斷標準好空。我將一個一人公司日常會遇到嘅任務,逐個分類俾你睇。呢啲,我交俾 workflows(寫好劇本,派一隊人):

  • 掃成個 codebase 揾 bug、揾安全漏洞。 一個對話裝唔落幾萬行 code,必須 fan-out,幾十個 agent 分頭掃,結果匯總去重。天生嘅劇本任務。
  • 批量遷移,例如 500 個 file 從舊 API 換到新 API。 每個 file 一個 agent,並行改、各自驗,互唔影響。你想要嘅就係 throughput。
  • 多個來源調研、交叉驗證。 同一個問題,派 5 個 agent 從 5 個角度查,再等佢哋互相質疑、投票。Claude Code 內置嘅 /deep-research 就係咁樣做㗎。
  • 競品橫向比較。 5 個產品,5 個 agent 各自睇一個,同一套維度打分,最後並排出表。
  • 同一個方案俾 5 個 agent 各自起一個版本再揀最好嗰個。 一個頭腦諗三次,不如五個頭腦各自諗一次,你嚟揀。
  • 大規模翻譯、批量改圖、整理幾百份散亂資料。 量大、彼此獨立、可以拆開同時做——並行吞吐嘅典型。

呢啲任務嘅共通點:一係一個 context 裝唔落,一係你想要多個獨立視角、仲想將結果攞嚟程式處理(投票、聚合、對比)。呢啲就係寫劇本嘅命。

呢啲,我交俾 goal(俾條線,等佢自己撞):

  • 整到測試全綠 + lint 乾淨。 經典中嘅經典。終點機器可以驗,路要試錯。
  • 跟住一份設計文檔實現,直到所有驗收標準都打勾。 你將驗收標準列清楚,佢一輪輪咁逼近。
  • 清空一個 label 下面嘅 issue 隊列。 「將 label:chore 嘅 issue 全部處理曬。」做一個少一個,停止條件天然清晰。
  • 重構一個大 file,拆到每個 module 都細過某個行數。 「拆到每個文件 < 200 行。」呢條線,可量化、可驗。
  • 跟住一份 checklist 將環境set到全部通過。 每一項可以打勾,打完即停。

呢啲任務嘅共通點:終點清清楚楚、仲可以被機器或明確規則驗,但中間點樣走要邊做邊睇。呢啲就係俾目標嘅命。

最後講個揀錯嘅陷阱——唔好問我點知,燒咗半日 token 換返嚟㗎:

寫一篇 5000 字嘅深度長文,你係咪好想直接打 /goal 把這篇寫到我滿意為止

千祈唔好。「滿意」呢條線,機器驗唔到,連你自己第二日返轉頭睇都未必算數。結果就係佢寫完一版問你得唔得,你話再改改,佢改完再問,你又話差啲意思……無限自改嘅死循環,token 燒曬,文章都係嗰篇文章。

長文呢類任務,正確嘅拆法掉轉:你嚟做導演,寫個 workflow,派 agent 分頭寫唔同段落、查唔同資料,最後你合稿決定。驗收權揸喺你手上,而唔係卸俾一個驗唔到嘅「滿意」。

掉轉嘅陷阱一樣會害人。一個「整到測試全綠」嘅任務,你硬係要寫個 workflow 拆成五步編排——結果 script 比測試本身仲難維護。終點清楚、機器可以驗嘅任務,寫劇本就係幫自己加戲。兩個方向都會跌,嗰張圖記實就唔會。

知識卡片 B

04今日就可以上手

goal,邊個都用得,已經穩定咗(v2.1.139 之後嘅版本就有)。一行 command:

/goal all tests in test/auth pass and the lint step is clean

完成條件最多可以寫 4000 個字符。怕佢跑飛,加一句兜底:or stop after 20 turns(最多做 20 輪就停)。中途想睇佢做到邊度,打 /goal 睇狀態;想叫停,/goal clear

workflows,要講句實話——佢仲係 research preview(要 v2.1.154 之後嘅版本,仲要自己去 /config 入面手動開,目前限付費計劃)。呢個功能我都仲係試用階段,唔係吹俾你聽個個而家就可以抄。開咗之後最簡單嘅觸發:說話入面直接帶上「workflow」呢個詞,或者將檔位轉到 /effort ultracode,Claude 會自己判斷、自己寫編排 script。想偷懶先體驗一下,直接用內置嘅 /deep-research 你的問題,嗰個本身就係一個現成嘅 workflow。

仲有個容易混淆嘅:goal 同 /loop 唔好搞錯。goal 係「上一輪做完馬上接下一輪,撞線先停」,睇嘅係結果;/loop 係「按時間間隔觸發」,睇嘅係時鐘,適合嗰種定期望一眼嘅任務(例如每 5 分鐘睇下部署好未)。一個睇結果,一個睇時間。

最細動作:今日就拎 goal 試一個你手上「終點清楚、就係懶得一輪輪咁睇」嘅任務。清一個 issue 隊列,或者修一個測試。一條 command,行開飲杯咖啡——唔好行得太耐,間中返嚟睇一眼,AI 呢樣嘢你明嘅。

知識卡片 C

05說到底

workflows 同 goal,你真正要學嘅唔係呢兩個 command 點樣打。

係你要換上一對帶 AI 員工嘅老細嘅眼睛,睇你手上每一個任務:呢個任務我心裏面有冇 SOP?有,寫劇本,派一隊人並行做。冇、但終點清楚仲驗得到,俾條線等佢自己撞。兩樣都冇,就唔好咁急自動化,自己先落場摸一輪。

幾時寫劇本,幾時俾目標——呢個係帶人嘅功力,唔係用工具嘅功力。工具日日變,呢個判斷唔變。

周知 · 我哋一齊同 AI 覺醒超級個體

我讓 Claude 幫我想這篇文章的選題。它卡住了。

它在糾結一件事:「幫我想選題」這個活,它自己到底該怎麼幹——是寫一個 workflow 腳本,派出去五六個分身並行搜資料、各想一版再投票擇優;還是用 goal,給自己定個"想出 3 個能打的選題就停"的目標,一輪一輪死磕到撞線。

反過來問我:"這個你想讓我怎麼分?"這篇文章不用寫了。它卡住的地方,就是答案。

Claude Code 最近這倆模式,workflows 和 goal,幾乎所有人都當成兩個新功能在學:這個怎麼調,那個怎麼開。學完還是不會用。因為你缺的不是說明書,是一個判斷——手裏這個活,到底歸誰。

這事說到底,跟"兩個功能"沒關係。是你當老闆的功夫。

圖片

01你是在帶兩種員工

先把這倆說成人話。

workflows,是你寫劇本。 你提前把每一步定死:先派 3 個 agent 分頭掃代碼庫的三個模塊,掃完彙總給第 4 個去重,再分給 5 個各自驗證一條……誰在第幾步幹什麼、並行還是串行、結果怎麼傳,全在你腳本里寫好。agent 只是演員,照着走位演。導演是你。

goal,是你派任務。 你不寫劇本,只給一個目標加一條驗收線:"把 test/auth 目錄下的測試全修綠,順便 lint 清乾淨。"然後你走開。Claude 自己一輪一輪幹,每幹完一輪,有個小模型(默認 Haiku,跑得快)替它瞄一眼:"撞線沒?"沒撞,自己開下一輪接着幹;撞了,停,把活交回給你。

看出來沒有,這就是管理學裏那兩套最老的東西。

寫劇本,是流程驅動。我不管你聰不聰明,你按 SOP 走,每一步可控、可覆盤、可重跑。流水線就是這麼管人的。

派任務,是目標驅動。我不管你怎麼幹,只要結果達標。OKR 就是這麼管人的——給你一個目標,幾條結果線,路你自己找。

還有個差別藏在收尾上。goal 撞了線,會主動把活交回你手裏——它知道自己什麼時候算幹完。workflow 跑完,結果靜靜躺在腳本變量裏,得你自己去取、去驗。一個會跟你交接,一個等你來收。

你帶過人就知道,這兩套各有各的命門。流程驅動管得死,可新活、要試錯的活,你根本寫不出 SOP——你自己都不知道第三步該幹嘛,怎麼給人寫。目標驅動放得開,但有個要命的前提:那條驗收線,得能被客觀地驗。

大多數人就栽在這。

大家默認"放手讓 AI 自己奔向目標"是更高級、更像未來的玩法。自主不是更高級,是更危險。 goal 最大的坑不是 AI 不夠聰明,是你給的那條線根本驗不了——你寫"把這篇文章改到滿意為止",Haiku 拿什麼判"滿意"?它判不了,於是要麼早早收工說"我覺得行了",要麼陪你無限改下去。沒有可驗收的停止線,放手不叫信任,叫甩鍋。

這個區別。"讓 AI 自主"聽着像在授權,可很多時候你只是不想自己定義什麼叫"做完"。真正的授權是先把驗收線劃死再放手——線越清楚,你越敢撒手;線越模糊,你越得盯着。

越是重要、不可逆的活,越不能圖省事甩給目標。該寫劇本,就老老實實寫劇本。

全文概要圖

02一句話判據,外加一張圖

把上面那套翻譯成你下次張口就能用的判斷,就一句話:。

你清楚"怎麼幹",用 workflows;你只清楚"幹成啥樣"、路得試出來,用 goal。

再強調一遍,分界線不是"難易"。這是最容易選錯的地方。

"把 test/auth 的測試修到全綠"——聽着多簡單,一句話的事。可它最該用 goal。因為你壓根不知道要改幾輪、哪個文件先崩,路是試出來的;而"綠沒綠"機器一秒就能驗。簡單的活,最該放手。

"掃一遍整個代碼庫,把所有疑似內存泄漏的地方挖出來"——聽着糙,像個體力活。可它必須用 workflows。因為一個對話裝不下整個代碼庫,你得派幾十個 agent 分頭掃、再彙總去重,這套編排得你寫腳本鎖死。糙活,偏偏得寫劇本。

複雜度是個假分界線。真正的分界線是確定性。 你心裏那張判斷圖,其實長這樣:

                          一個活來了
                              │
              ┌───────────────┴───────────────┐
              ▼                                ▼
     「怎麼幹」你清楚嗎?              只清楚「幹成啥樣」?
      (流程/步驟已知)                 (終點已知 · 路徑要試錯)
              │                                │
              ▼                                ▼
     還要 並行/聚合/重複跑?           有「可機器驗收」的停止線?
          │         │                     │           │
         是         否                    是          否
          │         │                     │           │
          ▼         ▼                     ▼           ▼
    ⚙️ WORKFLOWS  單輪直接幹          🎯 GOAL      ❌ 先別自動化
    寫劇本·N個     (普通對話           給停止線·     驗收線都沒有,
    agent並行      就夠了)            自己跑到撞線   自動化=災難

先看左邊這一刀。哪怕你清楚怎麼幹,也別急着寫 workflow——還得再問一句:這活要不要並行、要不要把多個結果拿來聚合?一條線順下來就能幹完的,普通對話就夠了,寫腳本純屬殺雞用牛刀。workflows 真正的門檻不是"流程已知",是"流程已知,而且值得拆給一隊人同時幹"。

再看右下角那一格——❌ 先別自動化。這格才是整張圖最值錢的地方。你既不清楚怎麼幹、又沒有一條驗得了的停止線,這時候別急着上 goal,更別寫 workflow。你該自己先下場幹一輪,把"怎麼幹"或者"驗收線"先摸出來一個,再回來看這張圖。

知識卡片 A

03我手裏的活,是這麼分的

光講判據空。我把一個一人公司日常會碰到的活,挨個分診給你看。這些,我交給 workflows(寫好劇本,派一隊人):

  • 掃全庫找 bug、找安全隱患。 一個對話裝不下幾萬行代碼,必須 fan-out,幾十個 agent 分頭掃,結果彙總去重。天生的劇本活。
  • 批量遷移,比如 500 個文件從舊 API 換到新 API。 每個文件一個 agent,並行改、各自驗,互不打架。你要的就是吞吐量。
  • 多源調研、交叉驗證。 同一個問題,派 5 個 agent 從 5 個角度查,再讓它們互相質疑、投票。Claude Code 內置的 /deep-research 就是這麼幹的。
  • 競品橫評。 5 個產品,5 個 agent 各盯一個,同一套維度打分,最後並排出表。
  • 同一個方案讓 5 個 agent 各起一版再擇優。 一個腦子想三遍,不如五個腦子各想一遍,你來挑。
  • 大規模翻譯、批量改圖、整理幾百份散資料。 量大、彼此獨立、能拆開同時幹——並行吞吐的典型。

這些活的共同點:要麼一個上下文裝不下,要麼你想要多個獨立視角、還想把結果拿來編程處理(投票、聚合、對比)。這是寫劇本的命。

這些,我交給 goal(給條線,讓它自己撞):

  • 修到測試全綠 + lint 乾淨。 經典中的經典。終點機器能驗,路要試錯。
  • 照一份設計文檔實現,直到所有驗收標準都打勾。 你把驗收標準列清楚,它一輪輪逼近。
  • 清空一個標籤下的 issue 隊列。 "把 label:chore 的 issue 全處理完。" 幹一個少一個,停止條件天然清晰。
  • 重構一個大文件,拆到每個模塊都小於某個行數。 "拆到每個文件 < 200 行。" 這條線,可量化、可驗。
  • 照一份 checklist 把環境配到全部通過。 每一項能勾,勾完即停。

這些活的共同點:終點清清楚楚、還能被機器或明確規則驗,但中間怎麼走得邊幹邊看。這是給目標的命。

最後說個選錯的坑——別問我怎麼知道的,燒掉小半天 token 換來的:

寫一篇 5000 字的深度長文,你是不是很想直接敲 /goal 把這篇寫到我滿意為止

千萬別。"滿意"這條線,機器驗不了,連你自己第二天回頭看都未必算數。結果就是它寫完一版問你行不行,你說再改改,它改完再問,你又說差點意思……無限自改的死循環,token 燒穿,文章還是那個文章。

長文這種活,正確的拆法反過來:你來當導演,寫個 workflow,派 agent 分頭寫不同段落、查不同資料,最後你合稿定奪。驗收權攥在你手裏,而不是甩給一個驗不了的"滿意"。

反過來的坑也照樣栽人。一個"修到測試全綠"的活,你非要寫個 workflow 拆成五步編排——結果腳本比測試本身還難維護。終點清楚、機器能驗的活,寫劇本就是給自己加戲。兩個方向都會摔,那張圖記牢就不會。

知識卡片 B

04今天就能上手

goal,誰都能用,已經穩了(v2.1.139 往後的版本就有)。一行命令:

/goal all tests in test/auth pass and the lint step is clean

完成條件最多能寫 4000 字符。怕它跑飛,加一句兜底:or stop after 20 turns(最多幹 20 輪就停)。中途想看它幹到哪了,敲 /goal 看狀態;想喊停,/goal clear

workflows,得說句實話——它還是 research preview(要 v2.1.154 往後的版本,還得自己去 /config 裏手動打開,目前限付費計劃)。這功能我也在嚐鮮階段,不是吹給你聽人人現在就能抄。開了之後最省事的觸發:話裏直接帶上 "workflow" 這個詞,或者把檔位切到 /effort ultracode,Claude 會自己判斷、自己寫編排腳本。想偷懶先體驗一把,直接用內置的 /deep-research 你的問題,那本身就是一個現成的 workflow。

還有個容易混的:goal 和 /loop 別搞錯。goal 是"上一輪幹完馬上接下一輪,撞線才停",盯的是結果;/loop 是"按時間間隔觸發",盯的是時鐘,適合那種定期查一眼的活(比如每 5 分鐘看看部署好了沒)。一個盯結果,一個盯時間。

最小動作:今天就拿 goal 試一個你手上"終點清楚、就是懶得一輪輪盯"的活。清個 issue 隊列,或者修個測試。一條命令,走開喝杯咖啡——別走太久,偶爾回來瞄一眼,AI 這東西你懂的。

知識卡片 C

05說到底

workflows 和 goal,你真要學的不是這倆命令怎麼敲。

是你得換上一雙帶 AI 員工的老闆的眼睛,看你手裏每一個活:這活我心裏有沒有 SOP?有,寫劇本,派一隊人並行幹。沒有、但終點清楚還驗得了,給條線讓它自己撞。兩樣都沒有,那就別急着自動化,自己先下場摸一輪。

什麼時候寫劇本,什麼時候給目標——這是帶人的功夫,不是用工具的功夫。工具天天變,這個判斷不變。

周知 · 我們一起和 AI 覺醒超級個體