編程、寫作、AI 短劇,Opus 4.8 的 effort 怎麼選

作者:廢才俱樂部Club
日期:2026年5月29日 下午3:42
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Claude 唔係愈高 effort 愈好,按場景配檔先係慳錢又有效嘅關鍵。

整理版摘要

我一直以嚟用 Claude 都習慣將推理檔位拉到最高嘅 max,覺得咁樣模型最強。由 3.7 用到 4.6 都冇問題,但去到 4.7 用嚟寫作嘅時候,發現文筆好差,乾、僵、冇靈氣。最初以為係模型退化,後尾先發現原來係自己一直用錯檔位——max 根本唔係為文筆設計,而係為強對齊、強校驗、強邏輯。叫一個專門「較真」嘅檔去做需要鬆弛同靈氣嘅創作,梗係出事。

推理檔位其實係調同一模型嘅「投入度」,即係佢肯為件事花幾多力氣去諗、去查、去主動做嘢。低檔唔係閹割,係有啲活根本唔需要咁認真。Anthropic 最新嘅 Opus 4.8 將檔位重新校準過,默認由 max 變咗 high,medium 比以前多諗咗,xhigh 明顯多咗。呢個改變令我認真研究每個檔位嘅用途。

最後得出結論:高檔唔係更聰明,係更捨得花力氣。失敗代價高、上下文長、需要反覆驗證嘅任務(例如跨文件 debug、AI 短劇規劃)先用 high 或以上;相反,短而明確、需要鬆弛靈氣嘅任務(例如寫小說、初稿發散)就用 medium 或 low。作者仲提醒,創作上温度參數 temperature 先係控制發散嘅,但而家已經要用提示詞代替。總結一句:按場景配檔,唔好一個 max 開到黑。

  • 結論:推理檔位調整投入度,唔係模型強弱,要根據任務性質選擇。
  • 方法:判斷標準係失敗代價、上下文長度、需要反覆驗證嘅程度;代碼用 high/xhigh,寫作用 medium,AI 短劇規劃用 high/max。
  • 差異:寫作同 AI 短劇雖然都係創作,但寫作要靈氣(低檔),短劇要一致性(高檔),所以檔位選擇相反。
  • 啟發:作者反思自己一直開 max 係用錯地方,喺寫作上反而幫倒忙,提醒唔好盲目信最高檔。
  • 可行動點:整理一個按場景嘅檔位對照表,實踐按場景配檔,節省 tokens。
整理重點

從 max 開到黑,到按場景配檔

我一直以嚟用 Claude 都習慣將推理檔位拉到最高嘅 max,覺得咁樣模型最強。由 3.7 用到 4.6 都冇問題,但去到 4.7 用嚟寫作嘅時候,發現文筆好差,乾、僵、冇靈氣。

最初以為係模型退化,後尾先發現原來係自己一直用錯檔位——max 根本唔係為文筆設計,而係為強對齊、強校驗、強邏輯。叫一個專門「較真」嘅檔去做需要鬆弛同靈氣嘅創作,梗係出事。

max 根本唔係為文筆設計

強對齊、強校驗、強邏輯

推理檔位其實係調投入度,唔係模型強弱

整理重點

寫 code 要較真,高檔先肯動手

寫代碼時,小修小補、改明確嘅小函數、解釋報錯,用 medium 就夠,圖快。日常開發、寫普通功能、局部重構,我用 high,呢個都係 4.8 嘅默認檔,質量、速度、成本最平衡。

真係要往上走,係碰到跨文件 bug、測試一直掛、接口遷移呢類活,我會上 xhigh。官方建議都係咁,寫代碼同高自主任務直接從 xhigh 起步。xhigh 有用,關鍵唔係想得更深,係肯唔肯動手——檔位低時傾向少調工具、少跑命令,高檔先肯去翻文件、跑測試、比較實現、查邊界情況。

關鍵唔係想得更深,係肯唔肯動手

質量成日就藏喺呢個來回裏:讀一遍、跑一下、睇結果、改假設、再跑一遍

  • medium:小修小補、明確函數、解釋報錯
  • high:日常開發、普通功能、局部重構(4.8默認)
  • xhigh:跨文件bug、測試一直掛、接口遷移
  • max:最後複核,極難bug或影響大嘅改動
  • ultracode:全倉遷移、整個代碼庫審計,開agent並行
整理重點

寫作要靈氣,短劇要一致——同一創作,兩種檔位

寫作方面,我食過最大嘅虧就係全程開 max。結果文字過度規整、過度安全,冇鮮活感。你要嘅意外同口語毛刺,高檔會幫你抹平。所以而家初稿同發散用 medium,等佢唔好咁端着。

文字會變得過度規整、過度安全

真正決定文字好壞嘅唔係檔位,係你餵畀佢嘅提示詞

但 AI 短劇/漫劇規劃就啱啱相反。分鏡要連貫、服化道提示詞要精確,命門係一致性同精確,唔係靈氣。呢啲恰恰係高檔擅長嘅強對齊、強校驗。所以我做短劇規劃反而願意開 high 甚至 max,等佢幫我對齊幾十個鏡頭嘅設定、摳提示詞、挑前後矛盾。

命門係一致性同精確,唔係靈氣

強對齊、強校驗、前後一致

整理重點

一句話決定用邊檔,同埋最終反思

總括嚟講,我而家嘅判斷標準好簡單:一件事,失敗代價越高、要讀嘅上下文越長、需要反覆驗證嘅地方越多、越要靠佢主動去查去跑,就越往 high、xhigh、max 呢邊走;反過來,越短、越明確、越係批量重複、越要鬆弛同靈氣,就越往 medium、low 呢邊走。

失敗代價越高、上下文越長、需要反覆驗證嘅地方越多,就越要高檔

我一直默認 max 唔算錯,係用錯地方。喺代碼複核、AI 短劇規劃呢啲要較真嘅活上,max 仲係我最信任嘅檔;但喺寫小說、推文呢啲要活氣嘅活上,佢一直幫倒忙,我卻怪模型文筆差。呢次 4.8,我打算認真按場景去配檔,而唔係一個 max 開到黑。

按場景配檔,唔好一個 max 開到黑

用咗 Claude 呢一年幾,我淨係得一個習慣,推理可以推到幾高就推到幾高。自從有咗 max 呢個檔之後,更加係雷打唔鬱,一路開住。

邏輯好簡單,推理能力校到最高,個模型咪最強囉。所以無論寫 code、寫小說,定係幫 AI 做分鏡,我都將個檔校到最盡,而且深信唔疑。呢個信念由 3.7 嗰陣一路用到 4.6,差唔多冇出過錯。

直到 4.7。

嗰排用佢寫嘢,成日覺得文筆好差,乾、硬、冇靈氣。我第一反應係模型退化咗。後來先慢慢醒覺,可能唔關模型事,係我一直冇搞清一件事,max 呢個檔,根本唔係為文筆而設計嘅。

佢係為咗強對齊、強校驗、強檢查、強邏輯而設計嘅。

我叫一個專門負責「認真」嘅檔,去做一件需要放鬆同靈氣嘅嘢,佢梗係唔順啦。呢個唔怪佢,係我用錯咗。

真正令我將呢件事徹底搞清楚嘅,係今日凌晨 Opus 4.8 發佈、我上手測試嗰陣。

Anthropic 將 4.8 講成而家最強嘅正式模型,主打長時間嘅 agentic 編程、更穩定嘅長上下文、仲有應該用工具嘅時候唔好漏咗。我嘅第一反應仲係老習慣,隻手就向 max 伸。但今次我多咗停一停,認真去睇佢嘅推理檔位到底點樣分,由低到高排落來係呢幾級。

圖片

呢張圖你睇一眼就記得啦,lowmediumhighxhigh,再加最高嘅 max。但佢淨係話俾你知有呢幾檔,冇話俾你知每一檔到底調緊啲乜,更加冇話俾你知手上呢個 job 應該揀邊一檔。呢個先係真正令人頭痛嘅地方,亦都係我呢篇想幫你搞清楚嘅。

推理檔調嘅唔係模型,係「投入度」

佢調嘅唔係模型,係同一個模型上面,你叫佢為呢件事花幾多力氣。力氣花喺三個地方,諗得有幾深、查得有幾嚴、同埋佢有幾願意主動鬱手,例如自己去揾資料、行工具、反覆驗證。檔位越高,呢三樣俾得越足。

我以前最大嘅誤會,係將低檔當成縮水版。一路覺得低檔就係為咗慳錢,開到高嘅點解要開低嘅。呢個想法係錯嘅。低檔唔係閹割,係有啲 job 根本唔需要咁認真,你逼佢認真,佢反而將簡單嘢諗複雜,兜遠路,又慢又貴。我兜咗好耐先諗通一句話,高檔唔係更聰明,係更肯花力氣;job 如果唔需要呢份力氣,硬係校高反而幫倒忙。

呢度仲要順便分清楚三樣成日俾人搞亂嘅嘢。由 low 到 max 呢幾檔,係同一個模型嘅投入度,max 係其中最高嗰檔,一個回合入面將一件事諗到最透。

仲有一個叫 ultracode 嘅,成日俾人當成比 max 仲要高嘅檔,其實佢根本唔係推理檔,係 Claude Code 入面嘅一個會話模式,底層用緊 xhigh,額外叫 Claude 自己去編排一批 agent 並行做嘢,嗰個係另一個維度嘅事,等陣再單獨講。

另一個要知道嘅變化,4.8 將呢幾檔重新校準過咗。官方嘅講法係,medium 比以前諗得更多,high 稍微少咗啲,xhigh 明顯更多。意思係如果你由 4.6、4.7 一路用過來,靠舊感覺揀檔,而家多數唔啱喇。仲有個細節令我當時呆咗一呆,4.8 預設掛嘅係 high,唔係 max。我自己一路預設 max,原來連官方都冇將 max 當成預設。

寫 code 同做產品:唔好喺應該認真嘅地方慳

先講 code 呢塊,亦都係我而家分得最清楚嘅地方。

小修小補,改個明確嘅小 function、解釋一個 error,medium 就夠,貪快。日常開發、寫個普通功能、做啲局部重構,我用 high,呢個都係 4.8 嘅預設檔,質量、速度、成本最平衡嘅一檔。真係要再上,係遇到跨 file 嘅 bug、測試一直 fail、或者接口遷移呢種 job,我會上 xhigh。官方建議都係咁,寫 code 同嗰啲高自主嘅任務,直接由 xhigh 開始,唔好由 high 開始。

xhigh 對呢種 job 有用,關鍵唔係佢諗得更深,係佢願唔願意鬱手。檔位低嘅時候,佢傾向少啲 call 工具、少啲行指令,你一問佢就直接答。檔位高咗,佢先肯去將相關文件睇一次,將測試行一次,將幾種實現比較一下,將邊界情況查一查。寫 code 呢行,質量好多時就藏係呢個來回入面,讀一次、行一次、睇結果、改假設、再行一次。你將檔校低,佢就懶得行呢個來回,睇落答得好快,坑全部埋咗係你冇叫佢檢查嘅地方。

做產品都係同一個道理。我寫 code 之前習慣先將 PRD 諗清楚,要咩功能、交互點樣行、邊界喺邊,都諗明先鬱手。呢種將你容易漏咗嘅地方幫你諗齊嘅 job,本身就要 high 或以上,佢先會主動幫你補返啲你諗唔到嘅嘢。

max 喺 code 入面,我而家只係拎佢嚟做最後一道複核。極難嘅 bug,或者一個改動牽連好大、錯咗代價好高,我會叫 max 專門再睇一次揀邏輯漏洞。但佢真係唔適合做日常檔,官方自己都提醒,max 容易諗太多、兜遠路,收益仲遞減。4.8 喺呢點有個我幾在意嘅改進,佢比以前少咗將自己寫嘅、其實有問題嘅 code 當成搞掂咗矇混過去,更願意主動講呢 part 我冇把握。檔位開得高,等於俾咗佢更多空間去做呢種自我檢查。

至於全倉遷移、整個 codebase audit、幾百個 file 一齊改呢種,先輪到 ultracode 出場。佢唔係將一個問題答得更認真,係直接開一批 agent 並行去做,分頭理解、修改、驗證,再互相檢查、彙總,規模可以去到幾十上百個。呢個係將一個人嘅 job 拆成一個臨時小組嘅 job,代價係更慢、更燒 token,日常小修小補用佢純粹浪費。

文章/劇本創作:我食過最大嘅虧

寫作就完全係另一回事,亦都係我開頭講嗰個坑嘅正主。

劇本、小說、公眾號推文,我以前係全程 max 嘅,結果就係越寫越覺得文字硬。諗明之後先知道,文章/劇本創作恰恰係少數幾個推理唔係越高越好嘅場景。檔位校高,佢會特別想將結構、邏輯、受眾、每一處伏筆都論證到位,呢個對嚴謹係好事,對文采係災難。文字會變得過度規整、過度安全,邊度都揀唔出錯,就係唔生動。你想要嗰啲意外,嗰啲口語入面嘅毛刺,佢喺高檔下反而會一點一點幫你磨平。

所以而家要靈氣嘅 job,初稿同發散我用 medium,等佢唔好咁拘謹。講到尾,真正決定文字好壞嘅唔係檔位,係你餵俾佢嘅嘢。俾佢風格 sample、俾佢節奏、俾佢口吻、話佢知咩唔準寫,比你把檔位校到最高有用得多。仲要講清楚一個成日誤會嘅點。真正管文字發散程度嗰個參數叫 temperature,佢一路都係得 call API 嗰陣先可以 set,平時你喺 client 入面用根本掂唔到呢個掣;由 4.7 開始,連 API 都唔收佢嘅非默認值喇,4.8 都一樣,官方直接叫你用 prompt 嚟控制。所以喺創作上,推理檔從來就唔係嗰個調發散嘅掣,唔好指望校高佢,文字就會生猛。

文章/劇本創作入面都唔係冇應該用高檔嘅地方。長篇嘅前後一致、人物動機唔崩、幾萬字入面埋嘅伏筆唔斷線,呢種偏結構嘅 job,high 甚至 xhigh 係有用嘅。我而家大約係咁分,寫得放、要靈氣嘅時候用低檔,梳結構、查一致性、揀邏輯硬傷嘅時候轉高檔。同一篇嘢,唔同階段用唔同檔,呢個係我以前完全冇諗過嘅用法。

AI 短劇/漫劇規劃:同寫作剛好相反

同文章/劇本創作剛好相反嘅,係我做 AI 短劇/漫劇規劃嘅時候。

做 AI 短劇/漫劇,我要規劃分鏡、寫 prompt、仲要管服化道呢啲嘅 prompt。呢啲 job 表面睇都係創作,但佢嘅命門係一致性同精確,唔係靈氣。分鏡要連貫,呢個鏡到下個鏡要接得住。服化道嘅 prompt,同一個角色由頭到尾嘅髮型、衫、質感唔可以飄。每一條 prompt 嘅措辭都要精確,差一個詞,出嚟嘅畫面就會走樣。

呢個恰恰係高檔擅長嘅,強對齊、強校驗、前後一致。同樣係創作,文章/劇本創作我避開 max,AI 短劇/漫劇規劃我反而願意校高啲,等佢幫我將幾十個鏡頭嘅設定對齊,將每條 prompt 摳精確,將我自己冇發現嘅前後矛盾揀出嚟。

呢兩塊擺埋一齊,我先算真正諗明開頭嗰件事。檔位揀得啱唔啱,本身就已經係一個變數,同模型強唔強係兩回事。我一直信嗰句校到最盡就最強,錯就錯在將一個變數當成常數。

錢同速度,都要計埋入去

除咗做唔做得好,推理檔仲順便改幾樣嘢,簡單講下。

最直接嘅係錢同速度。檔越高,佢諗得越多、行得越多,思考同輸出嘅 token 全部升,錢跟住升,速度亦都慢落嚟。低檔快,仲更慳你嘅調用額度。批量嘅、重複嘅、簡單嘅 job 掛住高檔,基本上就係白燒錢。輸出嘅詳略都跟住變,高檔鍾意寫得長、寫得周全、周圍俾你加提醒,低檔乾脆利落。你淨係要個標題、要段摘要,俾佢 max,佢可以交一篇小作文返嚟。

一句話判斷標準,同一張速查表

兜咗咁大個圈,我自己嘅判斷標準,其實縮成咗一句話。一件事,失敗嘅代價越高、要讀嘅上下文越長、需要反覆驗證嘅地方越多、越要靠佢主動去查去行,就越向 high、xhigh、max 呢邊行;反過來,越短、越明確、越是批量重複、越要鬆弛同靈氣,就越向 medium、low 呢邊行。

我一直預設嘅 max 唔算錯,係用錯咗地方。佢喺 code 複核、喺 AI 短劇/漫劇規劃呢種要認真嘅 job 上面,到今日仲係我最信任嘅檔。但係喺寫小說、寫推文呢種要生氣嘅 job 上面,佢一路喺度幫倒忙,我卻怪咗模型咁耐,話佢文筆差。

呢次 4.8,我打算第一次認真咁按場景去配檔,而唔係一個 max 用到盡。下面呢張表係我自己整理嘅一份對照。可能仲有確認嘅空間,但係整體框架都仲可以參考。

圖片

開 max 開到而家,我總算學識咗,希望之後可以慳返啲 token。

用 Claude 這一年多,我只有一個習慣,推理能拉多高就拉多高。打從有了 max 這檔起,更是雷打不動,一直開着。

邏輯特別簡單,推理能力調到最高,模型不就最強嗎。所以不管寫代碼、寫小說,還是給 AI 做分鏡,我都把檔位頂到頭,而且深信不疑。這個信仰從 3.7 那會兒一路用到 4.6,幾乎沒出過錯。

直到 4.7。

那陣子拿它寫東西,總覺得文筆很拉,幹、僵、沒靈氣。我第一反應是模型退化了。後來才慢慢回過味來,可能不怪模型,是我一直沒搞明白一件事,max 這個檔,根本就不是為文筆設計的。

它是為強對齊、強校驗、強檢查、強邏輯設計的。

我讓一個專門負責“較真”的檔,去幹一件需要鬆弛和靈氣的活,它當然彆扭。這不怪它,是我用錯了。

真正讓我把這件事徹底捋清楚的,是今天凌晨 Opus 4.8 發佈、我上手測試那會兒。

Anthropic 把 4.8 說成現在最強的正式模型,主打長時間的 agentic 編程、更穩的長上下文、還有該調工具的時候別漏掉。我的第一反應還是老習慣,手就往 max 上伸。但這次我多停了一下,認真去看它的推理檔位到底怎麼分,從低到高排下來是這麼幾級。

圖片

這張圖你掃一眼就記住了,lowmediumhighxhigh,再加最高的 max。可它只告訴你有這麼幾檔,不告訴你每一檔到底在調什麼,更不告訴你手上這個活兒該挑哪一檔。這才是真正讓人犯難的地方,也是我這篇想替你捋清楚的。

推理檔調的不是模型,是“投入度”

它調的不是模型,是同一個模型上,你讓它為這件事花多少力氣。力氣花在三個地方,想得有多深,查得有多嚴,還有它有多願意主動動手,比如自己去翻資料、跑工具、反覆驗證。檔位越高,這三樣給得越足。

我以前最大的誤會,是把低檔當成了縮水版。一直覺得低檔就是為了省錢,能開高的幹嘛開低的。這個想法是錯的。低檔不是閹割,是有些活兒根本不需要那麼較真,你非讓它較真,它反而把簡單事想複雜,繞遠路,又慢又貴。我繞了好久才想通一句話,高檔不是更聰明,是更捨得花力氣;活兒要是不需要這份力氣,硬拉高反而幫倒忙。

這裏還得順手分清楚三樣老被搞混的東西。從 low 到 max 這幾檔,是同一個模型的投入度,max 是其中最高那檔,一個回合裏把一件事想到最透。

還有一個叫 ultracode 的,經常被當成比 max 還高的檔,其實它壓根不是推理檔,是 Claude Code 裏的一個會話模式,底層用的是 xhigh,額外讓 Claude 自己去編排一批 agent 並行幹活,那是另一個維度的事,待會兒單說。

另一個得知道的變化,4.8 把這幾檔重新校準過了。官方的說法是,medium 比以前想得更多,high 略微少一點,xhigh 明顯更多。意思是你要是從 4.6、4.7 一路用過來,憑老感覺選檔,現在多半不準了。還有個細節讓我當時愣了一下,4.8 默認掛的是 high,不是 max。我自己一直默認 max,原來連官方都沒把 max 當默認。

寫代碼和做產品:別在該較真的地方省

先說代碼這塊,也是我現在分得最清楚的地方。

小修小補,改個明確的小函數、解釋個報錯,medium 就夠了,圖快。日常開發、寫個普通功能、做點局部重構,我用 high,這也是 4.8 的默認檔,質量、速度、成本最平衡的一檔。真要往上走,是碰到跨文件的 bug、測試一直掛、或者接口遷移這種活兒,我會上 xhigh。官方建議也是這樣,寫代碼和那種高自主的任務,直接從 xhigh 起步,別從 high 起。

xhigh 對這種活兒有用,關鍵不在它想得更深,在它願不願意動手。檔位低的時候,它傾向於少調工具、少跑命令,你一問它就直接答了。檔位高了,它才肯去把相關文件翻一遍,把測試跑一跑,把幾種實現比一比,把邊界情況查一查。寫代碼這行,質量經常就藏在這個來回裏,讀一遍、跑一下、看結果、改假設、再跑一遍。你把檔壓低,它就懶得走這個來回,看着答得飛快,坑全埋在你沒讓它檢查的地方。

做產品也是一個道理。我寫代碼之前習慣先把 PRD 想清楚,要什麼功能、交互怎麼走、邊界在哪,都想明白再動手。這種把你容易漏掉的地方替你想全的活兒,本身就得 high 往上,它才會主動幫你補上那些你沒想到的。

max 在代碼裏,我現在只拿它當最後一道複核。極難的 bug,或者一個改動牽連面特別大、錯了代價很高,我會讓 max 專門再過一遍挑邏輯漏洞。但它真不適合做日常檔,官方自己都提醒,max 容易想太多、繞遠路,收益還遞減。4.8 在這點上有個我挺在意的改進,它比前代更少把自己寫的、其實有毛病的代碼當成搞定了矇混過去,更願意主動說這塊我沒把握。檔位開得高,等於給了它更多空間去做這種自我檢查。

至於全倉遷移、整個代碼庫審計、幾百個文件一起改這種,才輪到 ultracode 出場。它不是把一個問題答得更認真,是直接開一批 agent 並行去幹,分頭理解、修改、驗證,再互相檢查、彙總,體量能到幾十上百個。這是把一個人的活拆成一個臨時小組的活,代價是更慢、更燒 token,日常小修小補用它純屬浪費。

文章/劇本創作:我吃過的最大的虧

寫作就完全是另一回事了,也是我開頭說那個坑的正主。

劇本、小說、公眾號推文,我以前是全程 max 的,結果就是越寫越覺得文字僵。想明白之後才知道,文章/劇本創作恰恰是少數幾個推理不是越高越好的場景。檔位拉高,它會特別想把結構、邏輯、受眾、每一處伏筆都論證到位,這對嚴謹是好事,對文采是災難。文字會變得過度規整、過度安全,哪兒都挑不出錯,就是不鮮活。你要的那點意外,那點口語裏的毛刺,它在高檔下反而會一點點幫你抹平。

所以現在要靈氣的活,初稿和發散我用 medium,讓它別那麼端着。說到底,真正決定文字好壞的不是檔位,是你餵給它的東西。給它風格樣例、給它節奏、給它口吻、告訴它什麼不許寫,比你把檔位拉滿管用得多。還得說清一個常被誤會的點。真正管文字發散程度的那個參數叫 temperature,它一直只能在調 API 的時候設,平時你在客戶端裏用根本碰不到這個旋鈕;從 4.7 起,連 API 都不收它的非默認值了,4.8 也一樣,官方直接讓你用提示詞來控制。所以在創作上,推理檔從來就不是那個調發散的鈕,別指望把它擰高,文字就能活。

文章/劇本創作裏也不是沒有該用高檔的地方。長篇的前後一致、人物動機不崩、幾萬字裏埋的伏筆不掉線,這種偏結構的活,high 甚至 xhigh 是有用的。我現在大概是這麼分的,寫得野、要靈氣的時候用低檔,梳結構、查一致性、挑邏輯硬傷的時候換高檔。同一篇東西,不同階段用不同檔,這是我以前壓根沒想過的用法。

AI 短劇/漫劇規劃:跟寫作正好反過來

跟文章/劇本創作正好反過來的,是我做 AI 短劇/漫劇規劃的時候。

做 AI 短劇/漫劇,我要規劃分鏡、寫提示詞、還要管服化道這些的提示詞。這些活兒表面看也是創作,可它的命門是一致性和精確,不是靈氣。分鏡得連貫,這一鏡到下一鏡得接得住。服化道的提示詞,同一個角色從頭到尾的髮型、衣服、質感不能飄。每一條提示詞的措辭都得精確,差一個詞,出來的畫面就跑偏。

這恰恰是高檔擅長的,強對齊、強校驗、前後一致。同樣是創作,文章/劇本創作我躲着 max,AI 短劇/漫劇規劃我反而願意往高了開,讓它幫我把幾十個鏡頭的設定對齊,把每條提示詞摳精確,把我自己沒發現的前後矛盾挑出來。

這兩塊擺在一起,我才算真正想明白開頭那件事。檔位選得對不對,本身就是一個變量,跟模型強不強是兩碼事。我一直信的那句拉滿就最強,錯就錯在把一個變量當成了常量。

錢和速度,也得算進去

除了幹不幹得好,推理檔還順帶改幾樣東西,簡單說一下。

最直接的是錢和速度。檔越高,它想得越多、跑得越多,思考和輸出的 token 全漲,錢跟着漲,速度也慢下來。低檔快,還更省你的調用額度。批量的、重複的、簡單的活兒掛着高檔,基本就是白燒錢。輸出的詳略也跟着變,高檔愛寫得長、寫得周全、處處給你加提醒,低檔乾脆利落。你就要個標題、要段摘要,給它 max,它能給你交一篇小作文回來。

一句話判斷標準,和一張速查表

繞了這麼大一圈,我自己的判斷標準,其實縮成了一句話。一件事,失敗的代價越高、要讀的上下文越長、需要反覆驗證的地方越多、越得靠它主動去查去跑,就越往 high、xhigh、max 這邊走;反過來,越短、越明確、越是批量重複、越要鬆弛和靈氣,就越往 medium、low 這邊走。

我一直默認的 max 不算錯,是用錯了地方。它在代碼複核、在 AI 短劇/漫劇規劃這種要較真的活兒上,到今天還是我最信任的檔。可在寫小說、寫推文這種要活氣的活兒上,它一直在幫倒忙,我卻怪了模型這麼久,說它文筆差。

這回 4.8,我打算第一次認真地按場景去配檔,而不是一個 max 開到黑。下面這張表是我自己理的一份對照。可能還有確認的空間,但是整體框架還是可以參考的。

圖片

開 max 開到現在,我總算學會了,希望之後可以節省點 Tokens。