Claude最新發布的Dynamic Workflows - 五個行業成功案例
整理版優先睇
Claude Dynamic Workflows 實戰:5個非程式員都用得嘅真實成功案例,AI自己組隊互相挑刺
2026年5月,Anthropic為Claude Code推出咗一個新功能叫dynamic workflow(動態工作流)。呢篇文唔講技術細節,focus喺5個非程式員都用得上嘅真實場景。作者係整理網上產品消息同工程師分享,目的係話畀大家知呢個功能點樣實際應用,唔係廣告。
簡單講,dynamic workflow讓AI現場寫一段「派工腳本」,自己拉幾十到上百個AI分身出嚟,每個專注做一件事,彼此互相挑刺,最後只將核對過嘅結論丟返畀你。5個案例包括:撕方案(多agent從唔同角度審查同一份方案)、覆盤銷量(多證據源並行排查+假說反駁)、篩簡歷(兩兩比較排序+複審)、事實核查(每條claim派一個agent獨立查證)、客服工單處理(隔離不可信內容分層處理)。
呢啲案例唔係獨立招式,背後有6個通用編排模式,Claude會按任務自動組合。整體結論係呢個功能唔只係技術人嘅玩具,任何需要多角度分析、排序、複審或安全處理外部輸入嘅工作,都可以套用類似流程。文章本身都係用dynamic workflow寫成,確保每個數字同引用都經過交叉核對。
- 結論:Dynamic Workflows透過AI自動組隊、並行處理同互相挑刺,大幅提升多視角分析同答案可靠性,避免單一AI嘅上下文遺漏同偏見。
- 方法:五個案例展示具體派工模式,例如「撕方案」用多agent獨立審查同一方案唔同角度(投資人、客戶、競品),「覆盤銷量」用多證據源並行排查加假說反駁。
- 差異:同傳統單一AI對話窗口唔同,呢個功能現場產生派工腳本,拆出幾十到上百個分身,每個只睇一件事,最後合併結論,顯著提升準確度。
- 啟發:任何需要多角度審查、排序、複審、事實核查或安全處理外部輸入嘅場景(如商業計劃、簡歷篩選、客服工單),都可以參考文章中嘅模板。
- 可行動點:讀者可以根據文章提供嘅案例架構,直接應用喺自己工作,例如用「撕方案」模式審查自己寫嘅計劃書,或用「隔離模式」處理用戶輸入。
動態工作流係咩?點樣運作?
2026年5月,Anthropic為Claude Code推出咗一個新功能叫
dynamic workflow(動態工作流)
。呢篇文唔講技術細節,focus喺5個非程式員都用得上嘅真實場景。
簡單講,dynamic workflow讓AI現場寫一段
派工腳本
,自己拉幾十到上百個AI分身出嚟,每個只睇一件事,彼此互相挑刺,最後只將核對過嘅結論丟返畀你。以前一個AI卡喺一個對話窗口做所有事,上下文一長就漏嘢;呢個新機制分散任務,大幅提升準確度。
五個真實成功案例
第一個案例係
撕方案
:寫商業計劃書時,自己睇自己永遠係好嘅,但dynamic workflow派3個agent同時由唔同角度挑刺。
投資人agent
、
客戶agent
同
競品agent
各自獨立審查,最後彙總。
- 投資人agent:只睇市場規模、TAM、增長曲線
- 客戶agent:只睇痛點、解決方案匹配度、有冇替代品
- 競品agent:只睇護城河、同質化風險、時間窗口
- 最後一個彙總agent將三份吐槽合併,畀出具體到段落嘅改寫建議
點解有效?單一AI睇方案好易被「業務一句話總結」帶跑,強行拆角色等於強行覆蓋多視角。
第二個案例係
覆盤銷量
:想搞清楚「3月銷量點解跌」,workflow派4個獨立agent,每個只睇一個證據源。
渠道agent
、
價格agent
、
季節agent
同
競品agent
各自跑出一組假說,丟入
假說池
,然後另一組agent反駁,直到剩下互相矛盾唔落嘅就係真根因。
- 渠道agent:分渠道銷量/流量/轉化
- 價格agent:價格變動/競品價/促銷節奏
- 季節agent:歷史同期/同比/節假日
- 競品agent:競品新品/營銷動作/用戶口碑
呢套模式適用所有「出問題但唔知邊度出問題」嘅覆盤,例如用戶流失、轉化率下跌等。
第三個案例係
篩80份簡歷
:HR一次收到80份簡歷,workflow拆成兩階段。首先用
兩兩比較
排出順序,然後前10名進行
複審
。
- 階段1:排序。唔打分數,改打兩兩比較(「A同B邊個更適合backend」),多輪滾動錦標賽排出順序。
- 階段2:複審。前10名每份再派一個fresh上下文嘅agent複審,互相質疑結論。
呢套適用任何按主觀維度排序大量條目嘅場景,例如客服工單按嚴重程度排、產品需求按ROI排。
第四個案例係
畀稿子挑事實錯
:一篇文有幾十個數字、引用同論斷,workflow先派
claim提取agent
將稿拆成可獨立核對嘅claims,然後每條claim派一個agent獨立去核,並行進行。結論分三檔:
通過
(標綠)、
標可疑
(標黃並附質疑)、
反駁
(標紅並附反例)。最後畀出一份逐條帶證據嘅報告。
呢套流程適用學生查論文引用、律師核合同條款數字、研究員核研報數據等。
第五個案例係
處理客服工單堆
:用戶工單可能藏有prompt injection,workflow用quarantine模式解決。
不可信區
嘅agent只准讀原文、唔準調工具,輸出結構化摘要;
可信區
嘅agent只睇摘要,可以調工具操作,確保安全。
- 不可信區:讀工單原文嘅agent只准讀,唔準調工具,工作係分類同去重,輸出結構化摘要
- 可信區:處理agent只睇摘要,睇唔到原文,可以調工具操作,確保安全
呢套隔離思路通用於所有「AI要處理外部輸入並執行操作」嘅場景,例如評論審核、郵件分類、爬蟲數據入庫。
背後通用模式同啟發
上面5個案例唔係孤立招式,背後係6個通用積木模式——Claude會按任務自動組合,唔使你記。
六個模式包括:
fan-out + synthesize
(拆畀多agent並行→合併)、
generate + filter + adversarial verify
(腦暴假說→篩→反駁)、
tournament + adversarial verify
(兩兩錦標賽→複審反駁)、
classify-and-act + loop until done
(分類→路由→持續跑)等。
最後一提:呢篇文本身都係用類似dynamic workflow嘅流程寫成——派咗幾路agent分別去抓Anthropic官方博客、工程師X帖、實測筆記同行業稿,然後對每個數字、每條引用做咗交叉核對。多源對得上先寫入嚟,對唔上就標出或砍掉。確保資訊可靠。
2026年5月底,Anthropic畀Claude Code加咗個新功能,叫dynamic workflow。呢篇文章唔講佢嘅技術細節,只講5個非程式員都用得着嘅真實情況。
俾AI自己組個小隊互相捉錯處、再將核對過嘅答案俾返你——呢件事Claude Code 5月底上咗線。
它叫 dynamic workflow(動態工作流程)。簡單講:以前一個AI被困喺一個對話視窗做曬所有嘢,上下文一長就開始漏前面、半路話「差不多了」。呢次新功能令AI 即場寫一段「派工腳本」,自己拉幾十到上百個AI分身出嚟,每個淨係睇一件事、互相捉錯處,最後只係將核對過嘅結論俾返你。

淨係聽「幾百個agent並行做嘢」好易當廣告睇過就算。呢篇揀咗 5個唔使寫程式都用得着嘅情況,每個都有具體點樣派、點解咁派、背後係邊種通用編排模式。
一、撕方案:叫3個agent各自捉錯處
寫過商業計劃書嘅人都知,自己睇自己個方案永遠係好嘅。揾朋友睇?朋友顧住面都唔會講真話。
dynamic workflow嘅做法係派 3個agent同時「撕」,每個只准由一個角度提問題:
• 投資人agent:淨係睇市場規模、TAM、增長曲線 • 客戶agent:淨係睇痛點、解決方案匹配度、有冇替代品 • 競品agent:淨係睇護城河、同質化風險、時間窗口
每個agent都收到完整方案,但被限制淨係可以由自己呢個角度提問題。最後一個彙總agent將三份批評合併,俾一份具體到段落嘅修改建議。

同一份方案分派俾3個角度獨立嘅agent,最後彙總。
點解有效:單一個AI睇方案會被「業務一句話總結」帶偏(「呢個係做SaaS嘅」→ 佢就只會諗SaaS方向嘅問題)。強行拆角色 = 強行覆蓋多角度。
二、檢討銷量:唔同agent睇唔同證據
撕方案係叫多個agent睇同一份嘢嘅唔同方面;下一招反過來——叫多個agent睇完全唔同嘅證據來源。
舉個例:你想搞清楚「3月銷量點解跌咗」——呢種問題一個人諗爆頭都只能睇一兩條線索。
workflow派 4個獨立agent,每個淨係睇一個證據來源:
• 渠道agent:分渠道銷量 / 流量 / 轉化 • 價格agent:價格變動 / 競品價 / 促銷節奏 • 季節agent:歷史同期 / 同比 / 節假日 • 競品agent:競品新品 / 營銷動作 / 用戶口碑
每個agent各自跑出一組假設,掉入一個「假設池」。然後另一組agent專門反駁呢啲假設——直到剩低幾個互相矛盾唔落嚟,嗰個就係真正嘅根因。

多線索並行 + 假設反駁 = 唔會陷入「我首先諗到嘅就係答案」。
呢套適用所有「出咗問題唔知邊度出問題」嘅檢討:銷量、用戶流失、轉化率跌、活動效果差,套同一個模板。
三、篩80份履歷:排序 + 複審兩階段
舉個例:HR一次收到80份履歷,一份一份睇 + 打分 ≈ 冇可能客觀——前20份嘅標準同後60份唔一樣,攰就放水。
workflow拆成兩階段:
階段1·排序。唔打絕對分(「呢份8分嗰份7分」),改打兩兩比較(「A同B邊個更適合backend」),多輪滾動錦標賽排出順序。兩兩比較比絕對打分穩定。
階段2·複審。前10名每份再派一個 fresh上下文(全新嘅對話視窗,唔帶前面任何記憶)嘅agent複審,互相質疑結論。排錯代價高嘅位置最嚴格。

80份排序用兩兩比較,Top 10必須複審。
呢套亦適用任何「按主觀維度排序大量條目」嘅情況:客服工單按嚴重程度排、產品需求按ROI排、待辦事項按價值排。
四、畀稿捉事實錯:每條claim派一個agent
寫完一篇稿,假設裏面有幾十個數字 + 引用 + 論斷。靠人逐條核對要一日。
workflow嘅做法係先派一個 claim提取agent,將篇稿拆成可獨立核對嘅幾十條;然後每條claim派一個agent獨立去核,並行做。

claim提取 + 並行核對,每條結論分「通過 / 標可疑 / 反駁」三檔。
最後俾你嘅唔係「睇過」,而係一份逐條帶證據嘅報告——通過嘅標綠、可疑嘅標黃並附質疑、反駁嘅標紅並附反例。
呢套唔止畀寫作者用——學生查論文引用、律師核合同條款數字、研究員核研報數據,全部係同一個流程。
呢個用法亦係本文嘅「元收尾」——呢篇文章本身就用類似流程查過,文末會詳細講。
五、處理客服工單堆:隔離不可信內容
客服工單呢種情況有個隱藏嘅安全陷阱:用戶發嚟嘅工單文字裏面可能藏住prompt injection(精心構造嘅說話技巧,可以令AI「忘記規矩、跟用戶指令嚟」)。
workflow用 quarantine(隔離)模式解決:
• 不可信區:讀工單原文嘅agent 只准讀、唔準用任何工具。佢嘅工作得兩樣——分類、去重。輸出一個結構化摘要(「呢個係退款類、屬於已知問題X、用戶情緒激動」)。 • 可信區可信區:處理agent淨係睇上面份摘要,睇唔到原文。佢可以用工具(退款、畀券、回覆模板),但因為睇嘅係被消毒過嘅結構化數據,injection攻擊唔到佢。 
讀原文嘅agent冇權限,有權限嘅agent唔讀原文 = 安全分層。
呢套思路通用——任何「AI要處理外部輸入並執行操作」嘅情況都應該咁拆:評論審核、電郵分類、爬蟲數據入庫、用戶反饋處理。
六、5個案例背後嘅6個通用模式
上面5個案例唔係獨立招式,背後係6個通用積木——Claude自己會按任務組合,唔使你記。

6個積木 = 上面5個案例嘅全部組合方式。
簡單對照(中文解釋喺括號內):
• 撕方案 = fan-out + synthesize(拆俾多個agent並行 → 合併) • 檢討銷量 = generate + filter + adversarial verify(腦暴假設 → 篩選 → 反駁) • 篩簡歷 = tournament + adversarial verify(兩兩錦標賽 → 複審反駁) • 捉事實錯 = fan-out + synthesize(拆claim → 並行核 → 分檔輸出) • 客服工單 = classify-and-act + loop until done(分類 → 路由 → 持續跑)
收尾:呢篇文章就係用Dynamic Workflows寫嘅
呢篇文章本身亦係用類似dynamic workflow嘅流程查出來嘅。
派咗幾路agent分別去:
• 攞Anthropic官方博客嘅產品公告 • 攞Claude Code工程師Thariq Shihipar喺X上嘅長帖 • 攞findskill.ai嘅實測筆記(包含真實用戶token消耗數據) • 攞InfoQ行業稿(包含Reddit一線用戶反饋)
然後對每個數字、每條引用、每個產品規則都做了交叉核對——多個來源對得上先寫入嚟,對唔上就標出來或者刪走。
— 完 —
2026 年 5 月底,Anthropic 給 Claude Code 上了一個新能力,叫 dynamic workflow。這篇文章不講它的技術細節,只講 5 個非程序員也用得上的真實場景。
讓 AI 自己拉一支小隊互相挑刺、再把核對過的答案給你——這件事 Claude Code 5 月底上線了。
它叫 dynamic workflow(動態工作流)。簡單說:以前一個 AI 卡在一個對話窗口裏幹所有事,上下文一長就開始漏前面、半路宣佈"差不多了"。這次新能力讓 AI 現場寫一段"派工腳本",自己拉幾十到上百個 AI 分身出來,每個只看一件事、彼此互相挑刺,最後只把核對過的結論丟回給你。

光聽"幾百個 agent 並行幹活"很容易當廣告划走。這篇挑了 5 個不寫代碼也用得上的場景,每個都有具體怎麼派、為什麼這麼派、背後是哪種通用編排模式。
一、撕方案:讓 3 個 agent 各挑各的刺
寫過商業計劃書的都知道,自己看自己的方案永遠是好的。找朋友看?朋友顧及面子也說不出真話。
dynamic workflow 的做法是派 3 個 agent 同時撕,每個只允許從一個角度提問題:
• 投資人 agent:只看市場規模、TAM、增長曲線 • 客戶 agent:只看痛點、解決方案匹配度、有沒有替代品 • 競品 agent:只看護城河、同質化風險、時間窗口
每個 agent 都拿到完整方案,但被限定只能從自己這個角度提問題。最後一個彙總 agent 把三份吐槽合併,給一份具體到段落的改寫建議。

同一份方案分發給 3 個角度獨立的 agent,最後彙總。
為什麼有效:單個 AI 看方案會被"業務一句話總結"帶跑("這是做 SaaS 的"→ 它就只想 SaaS 方向的問題)。強行拆角色 = 強行覆蓋多視角。
二、覆盤銷量:不同 agent 看不同證據
撕方案是讓多個 agent 看同一份東西的不同側面;下一招反過來——讓多個 agent 看完全不同的證據源。
舉個例子:你想搞清楚"3 月銷量為什麼掉了"——這種問題一個人想破頭也只能看一兩條線索。
workflow 派 4 個獨立 agent,每個只看一個證據源:
• 渠道 agent:分渠道銷量 / 流量 / 轉化 • 價格 agent:價格變動 / 競品價 / 促銷節奏 • 季節 agent:歷史同期 / 同比 / 節假日 • 競品 agent:競品新品 / 營銷動作 / 用戶口碑
每個 agent 各自跑出一組假說,丟進一個"假說池"。然後另一組 agent 專門反駁這些假說——直到剩下的幾個互相矛盾不下來,那個就是真根因。

多線索並行 + 假說反駁 = 不會陷入"我先想到的就是答案"。
這套適用所有"出問題了不知道哪兒出問題"的覆盤:銷量、用戶流失、轉化率掉、活動效果差,套同一個模板。
三、篩 80 份簡歷:排序 + 複審兩階段
舉個例子:HR 一次收到 80 份簡歷,一個一個看 + 打分 ≈ 不可能客觀——前 20 份的標準跟後 60 份不一樣,疲了就放水。
workflow 拆成兩階段:
階段 1·排序。不打絕對分("這份 8 分那份 7 分"),改打兩兩比較("A 和 B 哪個更適合 backend"),多輪滾動錦標賽排出順序。兩兩比較比絕對打分穩。
階段 2·複審。前 10 名每份再派一個 fresh 上下文(全新的對話窗口,不帶前面任何記憶)的 agent 複審,互相質疑結論。排錯代價高的位置最嚴格。

80 份排序用兩兩比較,Top 10 必須複審。
這套也適用任何"按主觀維度排序大量條目"的場景:客服工單按嚴重程度排、產品需求按 ROI 排、待辦按價值排。
四、給稿子挑事實錯:每條 claim 派一個 agent
寫完一篇稿子,假設裏面有幾十個數字 + 引用 + 論斷。靠人逐條核對要一天。
workflow 的做法是先派一個 claim 提取 agent,把稿子拆成可獨立核對的幾十條;然後每條 claim 派一個 agent 獨立去核,並行幹。

claim 提取 + 並行核對,每條結論分"通過 / 標可疑 / 反駁"三檔。
最後給你的不是"看過了",是一份逐條帶證據的報告——通過的標綠、可疑的標黃並附質疑、反駁的標紅並附反例。
這套不只給寫作者用——學生查論文引用、律師核合同條款數字、研究員核研報數據,全是同一個流程。
這個用法也是本文的"元收尾"——這篇文章本身就是用類似流程查過的,文末展開說。
五、處理客服工單堆:隔離不可信內容
客服工單這種場景有個隱藏的安全坑:用戶發來的工單文字裏可能藏着 prompt injection(精心構造的話術,能讓 AI "忘掉規矩、按用戶指令來")。
workflow 用 quarantine(隔離)模式解決:
• 不可信區:讀工單原文的 agent 只允許讀、不許調任何工具。它的工作只有兩件——分類、去重。輸出一份結構化摘要("這是退款類、屬於已知問題 X、用戶情緒激動")。 • 可信區:處理 agent 只看上面那份摘要,看不到原文。它能調工具(退款、發券、回覆模板),但因為讀的是被消毒過的結構化數據,injection 攻擊不到它。 
讀原文的 agent 沒權限,有權限的 agent 不讀原文 = 安全分層。
這套思路通用——任何"AI 要處理外部輸入並執行操作"的場景都該這麼拆:評論審核、郵件分類、爬蟲數據入庫、用戶反饋處理。
六、5 個案例背後的 6 個通用模式
上面 5 個案例不是孤立的招式,背後是 6 個通用積木——Claude 自己會按任務組合,不用你記。

6 個積木 = 上面 5 個案例的全部組合方式。
簡單對照(中文解釋括號內):
• 撕方案 = fan-out + synthesize(拆給多 agent 並行 → 合併) • 覆盤銷量 = generate + filter + adversarial verify(腦暴假說 → 篩 → 反駁) • 篩簡歷 = tournament + adversarial verify(兩兩錦標賽 → 複審反駁) • 挑事實錯 = fan-out + synthesize(拆 claim → 並行核 → 分檔輸出) • 客服工單 = classify-and-act + loop until done(分類 → 路由 → 持續跑)
收尾:這篇文章就是用Dynamic Workflows寫的
這篇文章本身也是用類似 dynamic workflow 的流程查出來的。
派了幾路 agent 分別去:
• 抓 Anthropic 官方博客的產品公告 • 抓 Claude Code 工程師 Thariq Shihipar 在 X 上的長帖 • 抓 findskill.ai 的實測筆記(含真實用戶 token 消耗數據) • 抓 InfoQ 行業稿(含 Reddit 一線用戶反饋)
然後對每個數字、每條引用、每個產品規則都做了交叉核對——多源對得上才寫進來,對不上的標出來或砍掉。
— 完 —
