Claude最新發布的Dynamic Workflows - 五個行業成功案例

作者：發總玩AI

日期：2026年6月3日下午2:43

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

Claude Dynamic Workflows 實戰：5個非程式員都用得嘅真實成功案例，AI自己組隊互相挑刺

整理版摘要

2026年5月，Anthropic為Claude Code推出咗一個新功能叫dynamic workflow（動態工作流）。呢篇文唔講技術細節，focus喺5個非程式員都用得上嘅真實場景。作者係整理網上產品消息同工程師分享，目的係話畀大家知呢個功能點樣實際應用，唔係廣告。

簡單講，dynamic workflow讓AI現場寫一段「派工腳本」，自己拉幾十到上百個AI分身出嚟，每個專注做一件事，彼此互相挑刺，最後只將核對過嘅結論丟返畀你。5個案例包括：撕方案（多agent從唔同角度審查同一份方案）、覆盤銷量（多證據源並行排查+假說反駁）、篩簡歷（兩兩比較排序+複審）、事實核查（每條claim派一個agent獨立查證）、客服工單處理（隔離不可信內容分層處理）。

呢啲案例唔係獨立招式，背後有6個通用編排模式，Claude會按任務自動組合。整體結論係呢個功能唔只係技術人嘅玩具，任何需要多角度分析、排序、複審或安全處理外部輸入嘅工作，都可以套用類似流程。文章本身都係用dynamic workflow寫成，確保每個數字同引用都經過交叉核對。

結論：Dynamic Workflows透過AI自動組隊、並行處理同互相挑刺，大幅提升多視角分析同答案可靠性，避免單一AI嘅上下文遺漏同偏見。
方法：五個案例展示具體派工模式，例如「撕方案」用多agent獨立審查同一方案唔同角度（投資人、客戶、競品），「覆盤銷量」用多證據源並行排查加假說反駁。
差異：同傳統單一AI對話窗口唔同，呢個功能現場產生派工腳本，拆出幾十到上百個分身，每個只睇一件事，最後合併結論，顯著提升準確度。
啟發：任何需要多角度審查、排序、複審、事實核查或安全處理外部輸入嘅場景（如商業計劃、簡歷篩選、客服工單），都可以參考文章中嘅模板。
可行動點：讀者可以根據文章提供嘅案例架構，直接應用喺自己工作，例如用「撕方案」模式審查自己寫嘅計劃書，或用「隔離模式」處理用戶輸入。

整理重點

動態工作流係咩？點樣運作？

2026年5月，Anthropic為Claude Code推出咗一個新功能叫

dynamic workflow（動態工作流）

。呢篇文唔講技術細節，focus喺5個非程式員都用得上嘅真實場景。

簡單講，dynamic workflow讓AI現場寫一段

派工腳本

，自己拉幾十到上百個AI分身出嚟，每個只睇一件事，彼此互相挑刺，最後只將核對過嘅結論丟返畀你。以前一個AI卡喺一個對話窗口做所有事，上下文一長就漏嘢；呢個新機制分散任務，大幅提升準確度。

整理重點

五個真實成功案例

第一個案例係

撕方案

：寫商業計劃書時，自己睇自己永遠係好嘅，但dynamic workflow派3個agent同時由唔同角度挑刺。

投資人agent

、

客戶agent

同

競品agent

各自獨立審查，最後彙總。

投資人agent：只睇市場規模、TAM、增長曲線
客戶agent：只睇痛點、解決方案匹配度、有冇替代品
競品agent：只睇護城河、同質化風險、時間窗口
最後一個彙總agent將三份吐槽合併，畀出具體到段落嘅改寫建議

點解有效？單一AI睇方案好易被「業務一句話總結」帶跑，強行拆角色等於強行覆蓋多視角。

第二個案例係

覆盤銷量

：想搞清楚「3月銷量點解跌」，workflow派4個獨立agent，每個只睇一個證據源。

渠道agent

、

價格agent

、

季節agent

同

競品agent

各自跑出一組假說，丟入

假說池

，然後另一組agent反駁，直到剩下互相矛盾唔落嘅就係真根因。

渠道agent：分渠道銷量/流量/轉化
價格agent：價格變動/競品價/促銷節奏
季節agent：歷史同期/同比/節假日
競品agent：競品新品/營銷動作/用戶口碑

呢套模式適用所有「出問題但唔知邊度出問題」嘅覆盤，例如用戶流失、轉化率下跌等。

第三個案例係

篩80份簡歷

：HR一次收到80份簡歷，workflow拆成兩階段。首先用

兩兩比較

排出順序，然後前10名進行

複審

。

階段1：排序。唔打分數，改打兩兩比較（「A同B邊個更適合backend」），多輪滾動錦標賽排出順序。
階段2：複審。前10名每份再派一個fresh上下文嘅agent複審，互相質疑結論。

呢套適用任何按主觀維度排序大量條目嘅場景，例如客服工單按嚴重程度排、產品需求按ROI排。

第四個案例係

畀稿子挑事實錯

：一篇文有幾十個數字、引用同論斷，workflow先派

claim提取agent

將稿拆成可獨立核對嘅claims，然後每條claim派一個agent獨立去核，並行進行。結論分三檔：

通過

（標綠）、

標可疑

（標黃並附質疑）、

反駁

（標紅並附反例）。最後畀出一份逐條帶證據嘅報告。

呢套流程適用學生查論文引用、律師核合同條款數字、研究員核研報數據等。

第五個案例係

處理客服工單堆

：用戶工單可能藏有prompt injection，workflow用quarantine模式解決。

不可信區

嘅agent只准讀原文、唔準調工具，輸出結構化摘要；

可信區

嘅agent只睇摘要，可以調工具操作，確保安全。

不可信區：讀工單原文嘅agent只准讀，唔準調工具，工作係分類同去重，輸出結構化摘要
可信區：處理agent只睇摘要，睇唔到原文，可以調工具操作，確保安全

呢套隔離思路通用於所有「AI要處理外部輸入並執行操作」嘅場景，例如評論審核、郵件分類、爬蟲數據入庫。

整理重點

背後通用模式同啟發

上面5個案例唔係孤立招式，背後係6個通用積木模式——Claude會按任務自動組合，唔使你記。

六個模式包括：

fan-out + synthesize

（拆畀多agent並行→合併）、

generate + filter + adversarial verify

（腦暴假說→篩→反駁）、

tournament + adversarial verify

（兩兩錦標賽→複審反駁）、

classify-and-act + loop until done

（分類→路由→持續跑）等。

最後一提：呢篇文本身都係用類似dynamic workflow嘅流程寫成——派咗幾路agent分別去抓Anthropic官方博客、工程師X帖、實測筆記同行業稿，然後對每個數字、每條引用做咗交叉核對。多源對得上先寫入嚟，對唔上就標出或砍掉。確保資訊可靠。

2026年5月底，Anthropic畀Claude Code加咗個新功能，叫dynamic workflow。呢篇文章唔講佢嘅技術細節，只講5個非程式員都用得着嘅真實情況。

俾AI自己組個小隊互相捉錯處、再將核對過嘅答案俾返你——呢件事Claude Code 5月底上咗線。

它叫 dynamic workflow（動態工作流程）。簡單講：以前一個AI被困喺一個對話視窗做曬所有嘢，上下文一長就開始漏前面、半路話「差不多了」。呢次新功能令AI 即場寫一段「派工腳本」，自己拉幾十到上百個AI分身出嚟，每個淨係睇一件事、互相捉錯處，最後只係將核對過嘅結論俾返你。

中央「派工台」係新機制；周圍5個係本文要拆嘅真實成功案例。

淨係聽「幾百個agent並行做嘢」好易當廣告睇過就算。呢篇揀咗 5個唔使寫程式都用得着嘅情況，每個都有具體點樣派、點解咁派、背後係邊種通用編排模式。

一、撕方案：叫3個agent各自捉錯處

寫過商業計劃書嘅人都知，自己睇自己個方案永遠係好嘅。揾朋友睇？朋友顧住面都唔會講真話。

dynamic workflow嘅做法係派 3個agent同時「撕」，每個只准由一個角度提問題：

• 投資人agent：淨係睇市場規模、TAM、增長曲線
• 客戶agent：淨係睇痛點、解決方案匹配度、有冇替代品
• 競品agent：淨係睇護城河、同質化風險、時間窗口

每個agent都收到完整方案，但被限制淨係可以由自己呢個角度提問題。最後一個彙總agent將三份批評合併，俾一份具體到段落嘅修改建議。

3個agent由3個角度獨立審查同一份方案

同一份方案分派俾3個角度獨立嘅agent，最後彙總。

點解有效：單一個AI睇方案會被「業務一句話總結」帶偏（「呢個係做SaaS嘅」→ 佢就只會諗SaaS方向嘅問題）。強行拆角色 = 強行覆蓋多角度。

二、檢討銷量：唔同agent睇唔同證據

撕方案係叫多個agent睇同一份嘢嘅唔同方面；下一招反過來——叫多個agent睇完全唔同嘅證據來源。

舉個例：你想搞清楚「3月銷量點解跌咗」——呢種問題一個人諗爆頭都只能睇一兩條線索。

workflow派 4個獨立agent，每個淨係睇一個證據來源：

• 渠道agent：分渠道銷量 / 流量 / 轉化
• 價格agent：價格變動 / 競品價 / 促銷節奏
• 季節agent：歷史同期 / 同比 / 節假日
• 競品agent：競品新品 / 營銷動作 / 用戶口碑

每個agent各自跑出一組假設，掉入一個「假設池」。然後另一組agent專門反駁呢啲假設——直到剩低幾個互相矛盾唔落嚟，嗰個就係真正嘅根因。

4路證據並行排查，假設池互相反駁

多線索並行 + 假設反駁 = 唔會陷入「我首先諗到嘅就係答案」。

呢套適用所有「出咗問題唔知邊度出問題」嘅檢討：銷量、用戶流失、轉化率跌、活動效果差，套同一個模板。

三、篩80份履歷：排序 + 複審兩階段

舉個例：HR一次收到80份履歷，一份一份睇 + 打分 ≈ 冇可能客觀——前20份嘅標準同後60份唔一樣，攰就放水。

workflow拆成兩階段：

階段1·排序。唔打絕對分（「呢份8分嗰份7分」），改打兩兩比較（「A同B邊個更適合backend」），多輪滾動錦標賽排出順序。兩兩比較比絕對打分穩定。

階段2·複審。前10名每份再派一個 fresh上下文（全新嘅對話視窗，唔帶前面任何記憶）嘅agent複審，互相質疑結論。排錯代價高嘅位置最嚴格。

排序 → 複審兩階段流水線

80份排序用兩兩比較，Top 10必須複審。

呢套亦適用任何「按主觀維度排序大量條目」嘅情況：客服工單按嚴重程度排、產品需求按ROI排、待辦事項按價值排。

四、畀稿捉事實錯：每條claim派一個agent

寫完一篇稿，假設裏面有幾十個數字 + 引用 + 論斷。靠人逐條核對要一日。

workflow嘅做法係先派一個 claim提取agent，將篇稿拆成可獨立核對嘅幾十條；然後每條claim派一個agent獨立去核，並行做。

每條claim派一個agent獨立查證

claim提取 + 並行核對，每條結論分「通過 / 標可疑 / 反駁」三檔。

最後俾你嘅唔係「睇過」，而係一份逐條帶證據嘅報告——通過嘅標綠、可疑嘅標黃並附質疑、反駁嘅標紅並附反例。

呢套唔止畀寫作者用——學生查論文引用、律師核合同條款數字、研究員核研報數據，全部係同一個流程。

呢個用法亦係本文嘅「元收尾」——呢篇文章本身就用類似流程查過，文末會詳細講。

五、處理客服工單堆：隔離不可信內容

客服工單呢種情況有個隱藏嘅安全陷阱：用戶發嚟嘅工單文字裏面可能藏住prompt injection（精心構造嘅說話技巧，可以令AI「忘記規矩、跟用戶指令嚟」）。

workflow用 quarantine（隔離）模式解決：

• 不可信區：讀工單原文嘅agent 只准讀、唔準用任何工具。佢嘅工作得兩樣——分類、去重。輸出一個結構化摘要（「呢個係退款類、屬於已知問題X、用戶情緒激動」）。
• 可信區可信區：處理agent淨係睇上面份摘要，睇唔到原文。佢可以用工具（退款、畀券、回覆模板），但因為睇嘅係被消毒過嘅結構化數據，injection攻擊唔到佢。

隔離不可信內容，可信agent淨係睇摘要唔睇原文

讀原文嘅agent冇權限，有權限嘅agent唔讀原文 = 安全分層。

呢套思路通用——任何「AI要處理外部輸入並執行操作」嘅情況都應該咁拆：評論審核、電郵分類、爬蟲數據入庫、用戶反饋處理。

六、5個案例背後嘅6個通用模式

上面5個案例唔係獨立招式，背後係6個通用積木——Claude自己會按任務組合，唔使你記。

6個編排模式速查

6個積木 = 上面5個案例嘅全部組合方式。

簡單對照（中文解釋喺括號內）：

• 撕方案 = fan-out + synthesize（拆俾多個agent並行 → 合併）
• 檢討銷量 = generate + filter + adversarial verify（腦暴假設 → 篩選 → 反駁）
• 篩簡歷 = tournament + adversarial verify（兩兩錦標賽 → 複審反駁）
• 捉事實錯 = fan-out + synthesize（拆claim → 並行核 → 分檔輸出）
• 客服工單 = classify-and-act + loop until done（分類 → 路由 → 持續跑）

收尾：呢篇文章就係用Dynamic Workflows寫嘅

呢篇文章本身亦係用類似dynamic workflow嘅流程查出來嘅。

派咗幾路agent分別去：

• 攞Anthropic官方博客嘅產品公告
• 攞Claude Code工程師Thariq Shihipar喺X上嘅長帖
• 攞findskill.ai嘅實測筆記（包含真實用戶token消耗數據）
• 攞InfoQ行業稿（包含Reddit一線用戶反饋）

然後對每個數字、每條引用、每個產品規則都做了交叉核對——多個來源對得上先寫入嚟，對唔上就標出來或者刪走。

— 完 —

2026 年 5 月底，Anthropic 給 Claude Code 上了一個新能力，叫 dynamic workflow。這篇文章不講它的技術細節，只講 5 個非程序員也用得上的真實場景。

讓 AI 自己拉一支小隊互相挑刺、再把核對過的答案給你——這件事 Claude Code 5 月底上線了。

它叫 dynamic workflow（動態工作流）。簡單說：以前一個 AI 卡在一個對話窗口裏幹所有事，上下文一長就開始漏前面、半路宣佈"差不多了"。這次新能力讓 AI 現場寫一段"派工腳本"，自己拉幾十到上百個 AI 分身出來，每個只看一件事、彼此互相挑刺，最後只把核對過的結論丟回給你。

中央"派工台"是新機制；周圍 5 個是本文要拆的真實成功案例。

光聽"幾百個 agent 並行幹活"很容易當廣告划走。這篇挑了 5 個不寫代碼也用得上的場景，每個都有具體怎麼派、為什麼這麼派、背後是哪種通用編排模式。

一、撕方案：讓 3 個 agent 各挑各的刺

寫過商業計劃書的都知道，自己看自己的方案永遠是好的。找朋友看？朋友顧及面子也說不出真話。

dynamic workflow 的做法是派 3 個 agent 同時撕，每個只允許從一個角度提問題：

• 投資人 agent：只看市場規模、TAM、增長曲線
• 客戶 agent：只看痛點、解決方案匹配度、有沒有替代品
• 競品 agent：只看護城河、同質化風險、時間窗口

每個 agent 都拿到完整方案，但被限定只能從自己這個角度提問題。最後一個彙總 agent 把三份吐槽合併，給一份具體到段落的改寫建議。

3 個 agent 從 3 個角度獨立審查同一份方案

同一份方案分發給 3 個角度獨立的 agent，最後彙總。

為什麼有效：單個 AI 看方案會被"業務一句話總結"帶跑（"這是做 SaaS 的"→ 它就只想 SaaS 方向的問題）。強行拆角色 = 強行覆蓋多視角。

二、覆盤銷量：不同 agent 看不同證據

撕方案是讓多個 agent 看同一份東西的不同側面；下一招反過來——讓多個 agent 看完全不同的證據源。

舉個例子：你想搞清楚"3 月銷量為什麼掉了"——這種問題一個人想破頭也只能看一兩條線索。

workflow 派 4 個獨立 agent，每個只看一個證據源：

• 渠道 agent：分渠道銷量 / 流量 / 轉化
• 價格 agent：價格變動 / 競品價 / 促銷節奏
• 季節 agent：歷史同期 / 同比 / 節假日
• 競品 agent：競品新品 / 營銷動作 / 用戶口碑

每個 agent 各自跑出一組假說，丟進一個"假說池"。然後另一組 agent 專門反駁這些假說——直到剩下的幾個互相矛盾不下來，那個就是真根因。

4 路證據並行排查，假說池互相反駁

多線索並行 + 假說反駁 = 不會陷入"我先想到的就是答案"。

這套適用所有"出問題了不知道哪兒出問題"的覆盤：銷量、用戶流失、轉化率掉、活動效果差，套同一個模板。

三、篩 80 份簡歷：排序 + 複審兩階段

舉個例子：HR 一次收到 80 份簡歷，一個一個看 + 打分 ≈ 不可能客觀——前 20 份的標準跟後 60 份不一樣，疲了就放水。

workflow 拆成兩階段：

階段 1·排序。不打絕對分（"這份 8 分那份 7 分"），改打兩兩比較（"A 和 B 哪個更適合 backend"），多輪滾動錦標賽排出順序。兩兩比較比絕對打分穩。

階段 2·複審。前 10 名每份再派一個 fresh 上下文（全新的對話窗口，不帶前面任何記憶）的 agent 複審，互相質疑結論。排錯代價高的位置最嚴格。

排序 → 複審兩階段流水線

80 份排序用兩兩比較，Top 10 必須複審。

這套也適用任何"按主觀維度排序大量條目"的場景：客服工單按嚴重程度排、產品需求按 ROI 排、待辦按價值排。

四、給稿子挑事實錯：每條 claim 派一個 agent

寫完一篇稿子，假設裏面有幾十個數字 + 引用 + 論斷。靠人逐條核對要一天。

workflow 的做法是先派一個 claim 提取 agent，把稿子拆成可獨立核對的幾十條；然後每條 claim 派一個 agent 獨立去核，並行幹。

每條 claim 派一個 agent 獨立查證

claim 提取 + 並行核對，每條結論分"通過 / 標可疑 / 反駁"三檔。

最後給你的不是"看過了"，是一份逐條帶證據的報告——通過的標綠、可疑的標黃並附質疑、反駁的標紅並附反例。

這套不只給寫作者用——學生查論文引用、律師核合同條款數字、研究員核研報數據，全是同一個流程。

這個用法也是本文的"元收尾"——這篇文章本身就是用類似流程查過的，文末展開說。

五、處理客服工單堆：隔離不可信內容

客服工單這種場景有個隱藏的安全坑：用戶發來的工單文字裏可能藏着 prompt injection（精心構造的話術，能讓 AI "忘掉規矩、按用戶指令來"）。

workflow 用 quarantine（隔離）模式解決：

• 不可信區：讀工單原文的 agent 只允許讀、不許調任何工具。它的工作只有兩件——分類、去重。輸出一份結構化摘要（"這是退款類、屬於已知問題 X、用戶情緒激動"）。
• 可信區：處理 agent 只看上面那份摘要，看不到原文。它能調工具（退款、發券、回覆模板），但因為讀的是被消毒過的結構化數據，injection 攻擊不到它。

隔離不可信內容，可信 agent 只看摘要不看原文

讀原文的 agent 沒權限，有權限的 agent 不讀原文 = 安全分層。

這套思路通用——任何"AI 要處理外部輸入並執行操作"的場景都該這麼拆：評論審核、郵件分類、爬蟲數據入庫、用戶反饋處理。

六、5 個案例背後的 6 個通用模式

上面 5 個案例不是孤立的招式，背後是 6 個通用積木——Claude 自己會按任務組合，不用你記。

6 個編排模式速查

6 個積木 = 上面 5 個案例的全部組合方式。

簡單對照（中文解釋括號內）：

• 撕方案 = fan-out + synthesize（拆給多 agent 並行 → 合併）
• 覆盤銷量 = generate + filter + adversarial verify（腦暴假說 → 篩 → 反駁）
• 篩簡歷 = tournament + adversarial verify（兩兩錦標賽 → 複審反駁）
• 挑事實錯 = fan-out + synthesize（拆 claim → 並行核 → 分檔輸出）
• 客服工單 = classify-and-act + loop until done（分類 → 路由 → 持續跑）

收尾：這篇文章就是用Dynamic Workflows寫的

這篇文章本身也是用類似 dynamic workflow 的流程查出來的。

派了幾路 agent 分別去：

• 抓 Anthropic 官方博客的產品公告
• 抓 Claude Code 工程師 Thariq Shihipar 在 X 上的長帖
• 抓 findskill.ai 的實測筆記（含真實用戶 token 消耗數據）
• 抓 InfoQ 行業稿（含 Reddit 一線用戶反饋）

然後對每個數字、每條引用、每個產品規則都做了交叉核對——多源對得上才寫進來，對不上的標出來或砍掉。

— 完 —