替你們試過了,OiiOii真能幫普通人做出電影來!

作者:花叔
日期:2026年5月28日 上午7:03
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

OiiOii用7個AI Agent幫普通人做出完整動畫,核心係將電影工業工作流搬入AI視頻工具

整理版摘要

呢篇文章係一個資深影迷(睇過2000幾部戲)對AI動畫創作工具OiiOii嘅實測分享。作者從B站up主LKs嘅影片公式「成片質量 = 相機參數 × (拍攝人變量 + 相機易用性) × (環境因子 + 天氣因子)」講起,指出AI視頻領域同樣存在呢個問題:模型能力快速拉平,但成品質素差距依然好大,關鍵在於領域知識同工作流。作者帶住一個簡單嘅故事意念,用OiiOii完整生成咗一段4分鐘嘅動畫短片,全程冇寫過一句英文提示詞。佢發現OiiOii唔係單純提供一個更強嘅模型,而係用7個專業化AI Agent(編劇、角色設計師、場景設計師、分鏡師、動畫師、音效工程師、藝術總監)組成虛擬團隊,同時拉高咗易用性、領域知識、分鏡質素同角色一致性。

作者認為OiiOii核心價值在於「分鏡」——佢哋將電影工業嘅分鏡流程變成自動化Agent,用戶可以一句話啟動整條流水線,亦可以透過自由畫布模式逐個分鏡精細控制,甚至拆開每個鏡頭嘅關鍵幀逐格修改。呢種做法令到創作門檻大幅降低,同時保留咗專業控制空間。作者仲嘗試用OiiOii復刻B站爆款「地牢酒館」系列,成功做出街霸角色版,證明工具可以快速模仿風格。

整體結論係OiiOii係第一個認真將電影工業分工邏輯搬入AI視頻嘅產品——佢俾你嘅唔係一個工具,而係一個團隊,你嘅位置係導演。AI視頻工具正從「賣原始算力」走向「賣完整服務」,而呢個方向係正確嘅。

  • OiiOii用7個AI Agent(編劇、角色設計、場景設計、分鏡師、動畫師、音效師、藝術總監)組成虛擬動畫團隊,一句話即可生成完整動畫,免去手寫提示詞。
  • 自動化分鏡係核心差異:分鏡師Agent將故事拆成多個專業鏡頭(含鏡頭語言、運鏡、光影),確保敍事節奏同角色一致性。
  • 自由畫布模式支援全自動、半自動(投餵參考圖)同手搓三種操作,適合復刻爆款風格或精細調整每個分鏡。
  • 關鍵幀拆解功能將每個鏡頭嘅黑盒打開,用戶可以逐幀修改,控制顆粒度達幀級別,減少重做成本。
  • 啟發:AI視頻工具正演進成「完整服務」——未來競爭唔係模型強弱,而係AI員工嘅專業度;普通人有好故事就可以透過呢類工具做出高質短片。
值得記低
連結

OiiOii官網

免費試用,註冊送積分,每日登錄都有免費額度。

整理重點

AI視頻嘅「人變量」先係瓶頸

B站up主LKs提過一個公式:成片質量 = 相機參數 × (拍攝人變量 + 相機易用性) × (環境因子 + 天氣因子)。作者覺得呢條式套落AI視頻領域一樣 work。而家Seedance 2.0、Kling 3.0、Veo 3.1呢啲模型越嚟越勁,但大家用同一模型做出嚟嘅片質素可以差好遠。

真正制約生產力嘅瓶頸又回到咗人身上

所以作者自己拆咗一個AI視頻質量公式:M(模型能力) × (S(創作技能) + U(易用性)) × (D(分鏡質素) + C(角色一致性))。多數AI工具只係俾個強勁模型你,然後將S、D、C全部摔俾你搞,等於俾部頂級相機但唔教你點影相。

整理重點

OiiOii嘅破局:7個AI員工同時拉高四個變量

OiiOii嘅做法係用7個專業化AI Agent組成虛擬動畫團隊:編劇、角色設計師、場景設計師、分鏡師、動畫師、音效工程師、藝術總監。你只需要一句話,成條流水線就自動行。

  • 編劇Agent:根據一句話生成完整劇本,有人物弧光同故事衝突
  • 角色設計師:生成角色主圖同三視圖,鎖定外觀避免變臉
  • 場景設計師:搭建多角度場景,確保跨鏡頭一致
  • 分鏡師:拆出專業分鏡,附鏡頭語言、運鏡方向、光影氛圍
  • 動畫師:用Seedance 2.0逐個分鏡生成視頻
  • 音效工程師:用Suno配背景音樂,自動匹配敍事節奏
  • 藝術總監:合成最終視頻,下載720p或1080p

呢個設計令到S、U、D、C四個變量同時被拉高——甚至你嘅S(創作技能)接近零都冇問題,Agent幫你補返。

整理重點

分鏡三板斧:自動化、自由畫布、關鍵幀控制

OiiOii最強嘅地方係分鏡能力。第一板斧係「自動化分鏡」:你唔使寫英文提示詞,編劇Agent寫劇本,分鏡Agent拆鏡頭,全部自動。第二板斧係「自由畫布模式」:每個分鏡嘅提示詞拆成畫面描述、角色動作、鏡頭運動、氛圍光影幾個模塊,你可以改其中一欄,或者直接手搓。

Agent將底牌全部露曬出嚟

第三板斧係「關鍵幀拆解」:每個鏡頭其實係由多張關鍵幀構成,你可以展開佢,對任意一張關鍵幀單獨修改。

控制顆粒度由鏡頭變成幀

呢個功能仲慳錢——如果唔滿意某段,唔使重做成個鏡頭,只改嗰一小段就得。

  1. 1 全自動模式:一句話出片,適合新手快試
  2. 2 半自動模式:投餵參考圖,指定風格,Agent輔助生成
  3. 3 手搓模式:自己寫提示詞,完全控制每個細節

作者用呢個功能成功復刻咗B站爆款「地牢酒館」系列,將酒館客人換成街霸角色,效果幾好,全程冇手寫英文提示詞。

整理重點

AI影片工具嘅未來:從賣算力到賣完整服務

作者認為OiiOii冇喺模型上做出獨家優勢,但佢用7個專業AI Agent同時拉高U、D、C,仲幫你補S,呢個係模型能力拉唔鬱之後最聰明嘅破局方式。AI影片工具正經歷同雲計算一樣嘅演進路徑——從賣原始算力走向賣完整服務。SeedanceKling呢啲模型似IaaS,OiiOii似PaaS甚至SaaS,成套生產線開箱即用。

OiiOii唔係一個AI影片工具,佢會係第一個AI影片公司

當然OiiOii唔係萬能:做真人短劇、精確舞蹈動作控制、跨集保持角色一致呢啲場景暫時未係最擅長。但如果你做單集動畫、MV、品牌宣傳片、故事短片,特別係有好故事但唔想花時間手搓提示詞,OiiOii嘅分鏡能力確實幫到手。

作者最後講咗句感性嘅話:佢大學時有個電影夢,17年嚟一直由入門到放棄,但而家終於可以喺週末用半個鐘,叫OiiOii嘅7個AI員工幫佢做出一段表達想法嘅嘢——呢件事本身好浪漫。

前兩日見到B站百大UP主LKs出咗條Pocket 4P評測片,講咗個好有趣嘅問題,叫做:買咗博主同款設備,點解拍出嚟仲係唔靚。

佢俾咗一條公式:

成片質量 = 相機參數(P) × (拍攝人變量(S) + 相機易用性(U)) × (環境因子(E) + 天氣因子(W))

LKs公式

意思係:相機參數再好,最終乘嘅係你嘅技術同相機嘅易用性。設備只係乘數,人先係被乘數。同一部機喺唔同人手裏,出嚟嘅嘢可以差天共地。

我睇完之後好有感觸,因為AI影片領域正在發生完全一樣嘅事。

字節嘅Seedance 2.0、快手嘅Kling 3.0、Google嘅Veo 3.1,模型一個比一個勁。以前好威嘅Sora,而家都冇乜人討論。但你打開B站睇下,用同一個模型整出嚟嘅片,質素差距大到離譜。有人整到好似電影片段,有人整到好似PowerPoint加咗動效。

其實同用所有AI工具差唔多,當AI將基本生成能力磨平之後,真正嘅差異體現喺領域知識上。例如所有人都用AI Coding去做產品,但係做乜嘢產品,或者知一個好產品點樣產生嘅人,會執行得更好。而AI影片方面,真正識動畫同電影工作流程、有相應審美嘅人先會做出更好嘅作品。

所以,成日會發現,當大家用嘅模型都一樣,真正限制生產力嘅瓶頸又返到人身上。

而今次,體驗咗兩日oiioii之後,我又產生咗啲唔同嘅想法。先睇一個成品。我只係輸入咗一個劇情嘅諗法,OiiOii幫我整咗條4分幾鐘嘅短片:

呢個係點樣由一句話變成一條完整動畫?跟住慢慢講。

一個AI影片嘅質量公式

我自己拆咗一個AI影片嘅質量公式:

AI視頻質量公式

M(模型能力)呢個變量,2026年已經快速拉平。大家都可以用Seedance 2.0,都可以用Kling 3.0,畫面質素嘅差距喺度縮細。

真正拉開差距嘅,係S、U、D、C呢四個變量。

而呢四個變量,啱啱就係大多數AI影片工具唔理嘅地方。佢哋俾一個好勁嘅模型(M拉滿),然後將S、D、C全部拋俾你。等於俾你一部頂級相機,但拍攝技術、構圖、揾光全部靠你自己。

我喺豆瓣標記睇過嘅影視劇超過2000部。自己從來冇拍過嘢,但片睇得多,對一啲導演嘅工作方式印象好深。

例如希區柯克,佢出名要將每一個鏡頭都畫成詳細嘅分鏡稿先開拍。佢到咗片場成日覺得悶。因為喺佢睇嚟,電影喺畫分鏡嘅時候就已經拍完,剩下嘅只係執行。

分鏡決定嘅唔係畫面好唔好睇,而係故事點樣講、節奏點樣走。 佢控制住觀眾嘅情緒走向。呢個就係公式裏面D呢個變量嘅份量。

直到我用咗OiiOii,我覺得終於有一個AI影片工具認真對待呢件事。

OiiOii:一句話請7個AI員工

OiiOii係一個AI動畫創作工具,舊年底內測嘅時候10萬人排隊,今年4月正式上線,據報道已經有超過20萬創作者用緊。

佢同其他AI影片工具最大嘅分別在於,佢做嘅唔係一個5-10秒嘅單鏡頭。佢由一句話開始,幫你做出一條1分鐘以上嘅敍事動畫。

點樣做到?OiiOii搞咗一個7人虛擬動畫團隊。每一個都係一個專業化嘅AI Agent,各司其職:

OiiOii虛擬動畫團隊

回到公式:OiiOii做嘅嘢,係用7個AI員工將S、U、D、C四個變量同時拉高。 你嘅創作能力唔夠?編劇同分鏡師幫你。你唔識保持一致性?角色設計師同藝術總監幫你。工具唔好用?一句話就可以啟動成條生產線。

呢套打法比單純將工具整得更易用要狠得多。其他工具係要你少做啲嘢,OiiOii係直接幫你做曬。

實測:一句話到成片嘅完整流程

講到呢度可能有點抽象,直接睇我嘅實測。

我俾OiiOii輸入咗一句話:「一對戀人喺星空下嘅天文館裏面起舞,周圍嘅場景好似走入咗一幅油畫,色彩夢幻,充滿唔真實嘅浪漫感。」

輸入需求

呢句話嘅靈感係《La La Land》裏面兩個場景嘅混合。一個係Mia同Sebastian喺洛杉磯天文館裏面懸浮起舞嗰段星空。另一個係片尾兩人在酒吧重逢之後,腦海裏面想像嗰段「如果當初我哋一齊」嘅幻想片段,視覺上好似直接走入咗一幅畫。我想用呢兩個畫面嘅意境做底色,睇下OiiOii能唔能夠延展出一個點樣嘅新故事。

然後就發生咗一件幾得意嘅事。

下面拆開講每一步。

藝術總監接單,編劇寫劇本

輸入咗嗰句話之後,藝術總監先接單,提取咗核心元素:星空天文館、起舞嘅戀人、油畫質感、夢幻浪漫。然後編劇Agent自動生成咗一個完整故事。

兩個角色: 陸星河(28歲天體物理研究員,理性主義者)同林夢影(26歲,感性嘅藝術靈魂)。故事發生喺一個即將關閉嘅天文館裏面,講嘅係理性同感性嘅碰撞同和解。

我只係講咗一句說話,佢就俾我寫咗一個有人物弧光嘅完整劇本。

劇本生成

角色設計師鎖定外觀

角色設計師根據劇本為兩個角色生成咗主圖同三視圖概念圖。呢一步嘅意義係鎖定角色外觀,確保後面19個分鏡裏面角色唔會變樣。

角色設計

場景設計師搭建4個場景

場景設計師搭建咗4個場景,每個場景都有多角度視圖:

  • 星語天文館主放映廳(常規態)
  • 天文館設備維修室
  • 天文館生鏽天台
  • 夢幻油畫星空大廳(極光態)

多角度視圖嘅意義同角色三視圖一樣:確保唔同鏡頭裏面同一個場景睇起嚟一致。

場景設計

分鏡師拆出19個專業分鏡

然後係重頭戲。分鏡師將成個故事拆成19個分鏡。

每個分鏡都有專業嘅鏡頭語言:medium shot、wide shot、close-up、Dutch angle、俯拍,運鏡方向、氛圍光影全部寫好。分鏡師仲俾咗監修思路,例如喺高潮段落特意增加咗天象儀啟動時「機械咆哮」同「光影狂歡」嘅細節銜接,避免角色喺流動光影中產生空間瞬移嘅感覺。

分鏡圖片

生成影片 + 音效 + 合成

分鏡確認之後,動畫師開始逐個分鏡生成影片。用嘅係Seedance 2.0模型,Pro模式,可以揀720p或480p。

分鏡視頻

影片生成完之後,音效工程師用Suno生成咗背景音樂,自動匹配敍事節奏。

生成音效

最後藝術總監將所有素材合成為最終影片,可以下載720p或1080p高清版。

合成視頻

全流程總覽

由一句話到成片,成個工作流程係咁樣:

總覽

對照公式睇下呢個過程:

OiiOii對照公式

我嘅S幾乎係零,但D同C都被Agent拉到我自己寫要花成日嘅水平。

分鏡三板斧:想做得更好,工具唔會阻你

上面係全自動模式嘅效果。但OiiOii真正令我覺得有趣嘅,係佢喺自動化之外仲保留咗精確控制嘅能力。

第一板斧:自動化分鏡,唔使周圍揾提示詞喇

用過AI影片工具嘅人都知,最痛苦嘅唔係等生成,而係寫提示詞。一條30秒嘅片拆成6個鏡頭,每個鏡頭寫一段詳細嘅英文提示詞,齋呢步就要磨一兩個鐘。

OiiOii嘅做法係:你唔使寫。編劇Agent寫劇本,分鏡師Agent拆鏡頭寫提示詞,全自動。

按我理解,其實係因為OiiOii對呢啲影視製作工作流程中唔同角色嘅技能,以及各類AI模型嘅能力有充足嘅領域認知,所以佢哋將呢個變成一個類似skill嘅嘢,植入咗喺影片創作嘅工作流程入面。

第二板斧:自由畫布模式,由參考圖到成片嘅可控玩法

自動分鏡夠曬省心,但如果你心裏面已經有一個具體嘅視覺參考呢?例如想復刻某個B站爆款嘅風格。

呢個就係自由畫布模式嘅價值。撳入任何一個分鏡,你會見到分段式嘅提示詞,清楚分成畫面描述、角色動作、鏡頭運動、氛圍光影幾個模組。Agent將底牌全部攤出嚟。覺得角色表情唔啱?改表情嗰欄。覺得鏡頭太遠?改鏡頭運動嗰欄。

畫布模式支援三種操作方式:

  • 全自動:完全交給Agent,你只負責審片
  • 半自動:俾一張圖,話俾Agent知你想要乜
  • 手搓:自己寫提示詞,完全手動控制

AI影片工具最實際嘅應用場景之一,就係復刻爆款。我決定用OiiOii試下呢件事。

揀咗B站最近最Hit嘅「地牢酒館」系列——第一視角入地牢小酒館,每集嚟一個奇怪生物飲酒,互動又奇怪又好笑。單集543萬播放、32萬讚,係2026年AI影片賽道最值得研究嘅爆款樣本之一。

地牢酒館原視頻

我做咗一個改編:將酒館裏面嘅客人換成街頭霸王嘅角色,睇下OiiOii能唔能夠保留原作風格嘅基礎上,做出新故事。

首先要揀情緒關鍵詞。OiiOii俾咗衝突、浪漫、恐怖、搞笑、慾望幾個選項,每個都對應唔同嘅敍事路徑。地牢酒館嘅精髓係荒誕反應,所以我揀咗「搞笑」。

情緒選擇

然後遇到咗一個小插曲。直接輸入「街頭霸王角色嚟酒館」會被版權檢測攔截。我轉成原創設定描述(紅頭巾武術家、巨型摔角手、綠皮叢林戰士呢類),就過咗。其實呢樣係好事,原創設定比直接借用IP更適合做長期內容。

跟住角色設計師為5個角色都做咗主圖加三視圖,每個角色之間風格統一,但形象有明顯差異。

角色設計

分鏡師拆咗5個鏡頭,每個角色一段互動。提示詞嘅精細程度令我有啲驚訝,精確到0-2秒、2-4秒、4-7秒嘅動作分解,連「金幣跌落枱嘅反彈路徑」呢啲細節都有寫。

分鏡與畫布

影片生成階段,5個分鏡並行渲染,大約5-6分鐘全部出曬。最後合成嘅影片比我預想中好,第一視角嘅代入感同原作好似,角色互動亦有荒誕喜劇嘅感覺。

成個過程冇手寫過一個英文提示詞。我只係做咗三樣嘢:寫一段中文故事描述、揀情緒關鍵詞、改咗幾句被版權攔截嘅描述。剩下嘅全部係Agent做。

第三板斧:將影片生成嘅黑盒展開

呢個功能係我覺得OiiOii分鏡能力最強嘅地方,亦係99%嘅用戶冇留意到。

傳統AI影片工具嘅體驗係:你寫一段提示詞,幾分鐘後吐出一條5秒嘅片。中間發生咗乜嘢、畫面點樣由開頭變到結尾、想改某一格點改,你都唔知。由提示詞直接到影片,係一個黑盒。

OiiOii將呢個黑盒拆開咗。

每個鏡頭其實係由多張關鍵格構成嘅。 你可以對成個鏡頭做整體調整——改提示詞、換模型、換畫布比例,令成段畫面跟住變。

分鏡整體調整

亦可以展開佢,對鏡頭裏面任意一張關鍵格單獨修改。

分鏡單幀修改

影片節奏嘅每一個變化——動作嘅起勢同完成、鏡頭嘅推近同拉遠、情緒嘅轉折——都係由呢啲關鍵格嘅差異決定。可以調每一格,就代表你可以掌握影片嘅每一秒。

反過來都得,由現有嘅分鏡裏面任意揀幾個,組合成一段新影片。

你對影片嘅控制精細度,由成個鏡頭變成一格一格。 唔滿意唔使重新做成個鏡頭,只改唔滿意嗰一小段就得。

呢個背後仲有一個成日俾人忽略嘅好處:省錢。 AI影片模型而家真係幾貴,一個高清鏡頭生成成本幾蚊到十幾蚊不等,60秒嘅敍事動畫閒閒地幾十蚊起。如果跟傳統工具嘅做法,一個唔滿意就重新做成個鏡頭,廢鏡頭嘅錢夠你再做半套片。分鏡令創作過程專業嘅同時,亦令執行節奏同最終成本變得可控——呢個其實係普通人可以持續用AI做影片嘅前提。

用公式嘅語言講:畫布模式同鏡頭拆分,令有能力嘅創作者可以主動拉高S同D呢兩個變量。 全自動已經俾咗一個唔錯嘅底線,想做得更好,工具亦唔會阻你條路。

回到公式

AI影片成片質量 = M × (S + U) × (D + C)

OiiOii冇喺M(模型)上做到獨家優勢,Seedance 2.0其他工具都可以用。但佢用7個專業化嘅AI Agent,同時拉高咗U、D、C三個變量,仲幫你補咗S。呢個係M拉唔鬱之後,最聰明嘅破局方式。

我有一個判斷:AI影片工具正在經歷同雲端運算一樣嘅演進路徑——由「賣原始算力」走向「賣完整服務」。 Seedance、Kling、Veo呢啲模型好似雲端運算早期嘅IaaS,俾你一部虛擬機,剩下全靠你;OiiOii呢種係PaaS甚至SaaS,成條生產線開箱即用。呢條路行得通嘅話,OiiOii唔會係一個AI影片工具,佢會係第一個AI影片公司。

講真,OiiOii唔係萬能。如果你要做真人短劇、需要精確嘅舞蹈動作控制,或者做系列動畫需要跨集保持角色一致,目前可能仲未係佢最擅長嘅場景。

但如果你想做單集動畫、MV、品牌宣傳片、故事短片,特別係你有好故事但唔想花大量時間手搓提示詞,OiiOii嘅分鏡能力確實可以幫你慳返好多工夫,同時令成片質素上一個台階。

150幾種風格可以揀,由日漫到3D Pixar風格到真人風格都有。接入咗滿血版Seedance 2.0之後,畫面質素亦確實比以前好咗好多。

作為一個睇咗2000幾部電影嘅人,我一直覺得AI影片工具缺嘅唔係畫面質素,而係對創作流程嘅尊重。電影工業花咗一百年建立嘅分工體系,由編劇到分鏡師到攝影到剪接,每個環節都有專業嘅人做專業嘅事。

OiiOii可能係第一個認真將呢套邏輯搬入AI影片嘅產品。佢俾你嘅唔係一個萬能工具,而係一個團隊。你嘅位置係導演。

呢個方向我覺得係啱嘅。由而家開始,做影片比嘅唔係邊個手裏嘅模型更勁,而係邊個請得起更專業嘅AI員工。

最後講啲私人嘢。我大學時一直有個隱隱嘅電影夢,睇完《安妮荷爾》之後仲認真買過一本《認識電影》。

認識電影

17年過去咗,我讀呢本書嘅狀態一直係由入門到放棄,我可能都係拍唔出嗰啲嘢。但我而家至少可以喺週末花半個鐘,叫OiiOii嘅7個AI員工幫我做一段能夠幫我表達諗法嘅嘢。

呢件事本身,我覺得幾浪漫。

傳送門:www.oiioii.tv

而家註冊唔使邀請碼,註冊就送積分,每日登入都有得拎。有興趣嘅可以自己試下,實際體驗下分鏡功能,會比睇文章更直觀。


前兩天看到B站百大up主LKs發了一期Pocket 4P評測的視頻,談了一個非常有趣的問題,叫做:買了博主同款設備,為什麼拍的還是不好看。

他給出了一個公式:

成片質量 = 相機參數(P) × (拍攝人變量(S) + 相機易用性(U)) × (環境因子(E) + 天氣因子(W))

LKs公式

意思是:相機參數再好,最終乘以的是你的技術和相機的易用性。設備只是乘數,人才是被乘數。同樣設備到了不同人手裏,出來的東西天差地別。

我看完之後蠻有感觸的,因為AI視頻領域正在發生完全一樣的事。

字節的Seedance 2.0、快手的Kling 3.0、谷歌的Veo 3.1,模型一個比一個強。曾經封神的Sora,現在都沒什麼人討論了。但你打開B站看看,用同樣模型做出來的視頻,質量差距大得離譜。有人做出來像電影片段,有人做出來像PPT配了動效。

其實和使用所有AI工具類似,當AI把基本的生成能力磨平之後,真正差異體現在領域知識上。比如所有人都能用AI Coding去做產品,但是做什麼產品,或者說知道一個好產品如何產生的人會能把這件事執行得更好。而以AI視頻來說,真正懂動畫和電影領域工作流,具備相應審美的人才能做出更好的作品。

所以,你常常會發現,當大家用的模型都一致了,真正制約生產力的瓶頸又回到了人身上。

而這次,在體驗了兩天的oiioii之後,我又產生了些不同的想法。先看一個成品。我只輸入了一個劇情的想法,OiiOii幫我做出來的4分多鐘的短片:

這是怎麼從一句話變成一部完整動畫的?接下來慢慢說。

一個AI視頻的質量公式

我自己拆了一個AI視頻的質量公式:

AI視頻質量公式

M(模型能力)這個變量,2026年已經在快速拉平。大家都能用Seedance 2.0,都能用Kling 3.0,畫面質量的差距在縮小。

真正拉開差距的,是S、U、D、C這四個變量。

而這四個變量,恰好就是大多數AI視頻工具不管的地方。它們給你一個強大的模型(M拉滿),然後把S、D、C全部甩給你。相當於給你一台頂配相機,但拍攝技術、構圖、找光全靠你自己。

我在豆瓣標記看過的影視劇超過2000部。自己從來沒拍過東西,但片子看多了,對一些導演的工作方式印象很深。

比如希區柯克,他出了名的要把每一個鏡頭都畫成詳細的分鏡稿才開拍。他到了片場經常覺得無聊。因為在他看來,電影在畫分鏡的時候就已經拍完了,剩下的只是執行。

分鏡決定的不是畫面好不好看,而是故事怎麼講、節奏怎麼走。 它掌控着觀眾的情緒走向。這就是公式裏D這個變量的份量。

直到我用了OiiOii,我覺得終於有一個AI視頻工具認真對待這件事了。

OiiOii:一句話僱7個AI員工

OiiOii是一個AI動畫創作工具,去年底內測的時候10萬人排隊,今年4月正式上線,據報道已有超過20萬創作者在用。

它跟其他AI視頻工具最大的區別在於,它做的不是一個5-10秒的單鏡頭。它從一句話開始,幫你做出一整部1分鐘以上的敍事動畫。

怎麼做到的?OiiOii搞了一個7人虛擬動畫團隊。每個人都是一個專業化的AI Agent,各司其職:

OiiOii虛擬動畫團隊

回到公式:OiiOii做的事情,是用7個AI員工把S、U、D、C四個變量同時拉高。 你的創作能力不夠?編劇和分鏡師幫你。你不會保持一致性?角色設計師和藝術總監幫你。工具不好用?一句話就能啓動整條流水線。

這套打法比單純把工具做得更易用要狠得多。別的工具是讓你少幹一點活,OiiOii是直接幫你幹完。

實測:一句話到成片的完整流程

說到這裏可能有點抽象,直接看我的實測。

我給OiiOii輸入了一句話:「一對戀人在星空下的天文館裏起舞,周圍的場景像走進了一幅油畫,色彩夢幻,充滿不真實的浪漫感。」

輸入需求

這句話的靈感是《La La Land》裏兩個場景的混合。一個是Mia和Sebastian在洛杉磯天文館裏懸浮起舞的那段星空。另一個是片尾兩人在酒吧重逢後,腦海裏想象的那段「如果當初我們在一起」的幻想片段,視覺上像直接走進了一幅畫。我想用這兩個畫面的意境做底色,看OiiOii能延展出一個什麼樣的新故事。

然後就發生了一件蠻有意思的事。

下面拆開說每一步。

藝術總監接單,編劇寫劇本

輸入那句話之後,藝術總監先接單,提取了核心要素:星空天文館、起舞的戀人、油畫質感、夢幻浪漫。然後編劇Agent自動生成了一個完整故事。

兩個角色: 陸星河(28歲天體物理研究員,理性主義者)和林夢影(26歲,感性的藝術靈魂)。故事發生在一個即將閉館的天文館裏,講的是理性與感性的碰撞和和解。

我只說了一句話,它給我寫了一個有人物弧光的完整劇本。

劇本生成

角色設計師鎖定外觀

角色設計師根據劇本為兩個角色生成了主圖和三視圖概念圖。這一步的意義是鎖定角色外觀,確保後面19個分鏡裏角色不會變臉。

角色設計

場景設計師搭建4個場景

場景設計師搭建了4個場景,每個場景都有多角度視圖:

  • 星語天文館主放映廳(常規態)
  • 天文館設備維修室
  • 天文館生鏽天台
  • 夢幻油畫星空大廳(極光態)

多角度視圖的意義和角色三視圖一樣:保證不同鏡頭裏同一個場景看起來是一致的。

場景設計

分鏡師拆出19個專業分鏡

然後是重頭戲。分鏡師把整個故事拆成了19個分鏡。

每個分鏡都有專業的鏡頭語言:medium shot、wide shot、close-up、Dutch angle、俯拍,運鏡方向、氛圍光影全部寫好了。分鏡師還給了監修思路,比如在高潮段落特意增加了天象儀啓動時「機械咆哮」與「光影狂歡」的細節銜接,避免角色在流動光影中產生空間瞬移感。

分鏡圖片

生成視頻 + 音效 + 合成

分鏡確認後,動畫師開始逐個分鏡生成視頻。用的是Seedance 2.0模型,Pro模式,可以選720p或480p。

分鏡視頻

視頻生成完之後,音效工程師用Suno生成了背景音樂,自動匹配敍事節奏。

生成音效

最後藝術總監把所有素材合成為最終視頻,可以下載720p或1080p高清版。

合成視頻

全流程總覽

從一句話到成片,整個工作流長這樣:

總覽

對照公式看一下這個過程:

OiiOii對照公式

我的S幾乎為零,但D和C都被Agent拉到了我自己寫要花一整天的水平。

分鏡三板斧:想做得更好,工具不擋路

上面是全自動模式的效果。但OiiOii真正讓我覺得有意思的,是它在自動化之外還保留了精確控制的能力。

第一板斧:自動化分鏡,不用再四處扒提示詞了

用過AI視頻工具的人都知道,最痛苦的不是等生成,是寫提示詞。一個30秒的視頻拆成6個鏡頭,每個鏡頭寫一段詳細的英文提示詞,光這一步就得磨一兩個小時。

OiiOii的做法是:你不用寫。編劇Agent寫劇本,分鏡師Agent拆鏡頭寫提示詞,全自動。

按我的理解,其實是因為OiiOii對這些影視製作工作流中不同角色的技能以及各類AI模型的能力有充足的領域認知,所以,他們把這變成了一個類似skill的東西,植入在了視頻創作的工作流中。

第二板斧:自由畫布模式,從參考圖到成片的可控玩法

自動分鏡夠省心,但如果你心裏已經有了一個具體的視覺參考呢?比如想復刻某個B站爆款的風格。

這就是自由畫布模式的價值。點開任意一個分鏡,你會看到分段式的提示詞,清楚地分成畫面描述、角色動作、鏡頭運動、氛圍光影幾個模塊。Agent把底牌全露出來了。覺得角色表情不對?改表情那一欄。覺得鏡頭太遠?改鏡頭運動那一欄。

畫布模式支持三種操作方式:

  • 全自動:完全交給Agent,你只管審片
  • 半自動:投餵一張圖,告訴Agent你想要什麼
  • 手搓:自己寫提示詞,完全手動控制

AI視頻工具最實際的應用場景之一,就是復刻爆款。我決定拿OiiOii測一下這件事。

挑的是B站最近最火的「地牢酒館」系列——第一視角進入地牢小酒館,每集來一個奇怪生物喝酒,互動詭異又好笑。單集543萬播放、32萬點贊,是2026年AI視頻賽道最值得研究的爆款樣本之一。

地牢酒館原視頻

我做了一個改編:把酒館裏的客人換成街頭霸王裏的角色,看OiiOii能不能在保留原作風格的基礎上,做出新的故事。

先要選情緒關鍵詞。OiiOii給了衝突、浪漫、恐怖、搞笑、慾望幾個選項,每個都對應不同的敍事路徑。地牢酒館的精髓是荒誕反應,所以我選了「搞笑」。

情緒選擇

然後遇到了一個小插曲。直接輸入「街頭霸王角色來酒館」會被版權檢測攔截。我換成原創設定描述(紅頭巾武術家、巨型摔角手、綠皮叢林戰士這類),就過了。這其實是好事,原創設定比直接借用IP更適合做長期內容。

接下來角色設計師給5個角色都做了主圖+三視圖,每個角色之間風格統一,但形象有明顯差異。

角色設計

分鏡師拆了5個鏡頭,每個角色一段互動。提示詞的顆粒度讓我有點驚訝,精確到0-2秒、2-4秒、4-7秒的動作分解,連「金幣掉桌上的反彈路徑」這種細節都寫了。

分鏡與畫布

視頻生成階段,5個分鏡並行渲染,差不多5-6分鐘全部出來。最後合成的視頻比我預想的好,第一視角的代入感和原作很像,角色互動也有荒誕喜劇的感覺。

整個過程沒有手寫一個英文提示詞。我只做了三件事:寫一段中文故事描述、選情緒關鍵詞、改了幾句被版權攔截的描述。剩下的全是Agent在做。

第三板斧:把視頻生成的黑盒展開

這個功能是我覺得OiiOii分鏡能力最強的地方,也是99%的用戶沒注意到的。

傳統AI視頻工具的體驗是:你寫一段提示詞,幾分鐘後吐出一個5秒的視頻。中間發生了什麼、畫面怎麼從開頭變到結尾、想改某一幀怎麼改,你都不知道。從提示詞直接到視頻,是個黑盒。

OiiOii把這個黑盒拆開了。

每個鏡頭其實是由多張關鍵幀構成的。 你可以對整個鏡頭做整體調整——改提示詞、換模型、換畫布比例,讓整段畫面跟着變。

分鏡整體調整

也可以展開它,對鏡頭裏任意一張關鍵幀單獨修改。

分鏡單幀修改

視頻節奏的每一個變化——動作的起勢和完成、鏡頭的推近和拉遠、情緒的轉折——都是由這些關鍵幀的差異決定的。能調每一幀,就意味着你能掌握視頻的每一秒。

反過來也行,從已有的分鏡裏任意勾選幾個,組合成一段新的視頻。

你對視頻的控制顆粒度,從一整個鏡頭變成了一幀一幀。 不滿意不用重來整個鏡頭,只改不滿意的那一小段。

這背後還有一個常被忽略的好處:省錢。 AI視頻模型現在真挺貴的,一個高清鏡頭生成成本幾塊到十幾塊不等,60秒的敍事動畫動輒幾十塊起步。如果按傳統工具的方式,一個不滿意就重做整個鏡頭,廢鏡頭的錢夠你再做半部片子。分鏡讓創作過程專業的同時,也讓執行節奏和最終成本變得可控——這其實是普通人能持續用AI做視頻的前提。

用公式的語言說:畫布模式和鏡頭拆分,讓有能力的創作者可以主動拉高S和D這兩個變量。 全自動已經給了一個不錯的底線,想做得更好,工具也不會擋你的路。

回到公式

AI視頻成片質量 = M × (S + U) × (D + C)

OiiOii沒有在M(模型)上做出獨家優勢,Seedance 2.0別的工具也能用。但它用7個專業化的AI Agent,同時拉高了U、D、C三個變量,還幫你補了S。這是M拉不動了之後,最聰明的破局方式。

我有一個判斷:AI視頻工具正在經歷和雲計算一樣的演進路徑——從「賣原始算力」走向「賣完整服務」。 Seedance、Kling、Veo這些模型像是雲計算早期的IaaS,給你一台虛擬機,剩下全靠你;OiiOii這種是PaaS甚至SaaS,整套生產線開箱即用。這條路走通的話,OiiOii不會是一個AI視頻工具,它會是第一個AI視頻公司。

說實話,OiiOii不是萬能的。如果你要做真人短劇、需要精確的舞蹈動作控制,或者做系列番劇需要跨集保持角色一致,目前可能還不是它最擅長的場景。

但如果你想做單集動畫、MV、品牌宣傳片、故事短片,特別是你有好故事但不想花大量時間手搓提示詞,OiiOii的分鏡能力確實能幫你省掉很多工作,同時讓成片質量上一個台階。

150+種風格可以選,從日漫到3D皮克斯風到真人風格都有。接入了滿血版Seedance 2.0之後,畫面質量也確實比之前好了不少。

作為一個看了2000多部電影的人,我一直覺得AI視頻工具缺的不是畫面質量,而是對創作流程的尊重。電影工業花了一百年建立起來的分工體系,從編劇到分鏡師到攝影到剪輯,每個環節都有專業的人在做專業的事。

OiiOii可能是第一個認真把這套邏輯搬到AI視頻裏的產品。它給你的不是一個萬能工具,是一個團隊。你的位置是導演。

這個方向我覺得是對的。從今往後,做視頻拼的不是誰手裏的模型更強,是誰僱得起更專業的AI員工。

最後說點私人的。我大學時一直有個隱隱的電影夢,看完《安妮霍爾》之後還認真買過一本《認識電影》。

認識電影

17年過去了,我讀這本書的狀態一直是從入門到放棄,我可能還是拍不出那種東西。但我現在至少可以在週末花半小時,讓OiiOii的7個AI員工幫我做出一段能幫助我表達想法的東西。

這件事本身,我覺得挺浪漫的。

傳送門:www.oiioii.tv

目前註冊不需要邀請碼了,註冊就送積分,每天登錄也能領。感興趣的可以自己試試,實際體驗一下分鏡功能,會比看文章更直觀。