替你們試過了，OiiOii真能幫普通人做出電影來！

作者：花叔

日期：2026年5月28日上午7:03

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

OiiOii用7個AI Agent幫普通人做出完整動畫，核心係將電影工業工作流搬入AI視頻工具

整理版摘要

呢篇文章係一個資深影迷（睇過2000幾部戲）對AI動畫創作工具OiiOii嘅實測分享。作者從B站up主LKs嘅影片公式「成片質量 = 相機參數 × (拍攝人變量 + 相機易用性) × (環境因子 + 天氣因子)」講起，指出AI視頻領域同樣存在呢個問題：模型能力快速拉平，但成品質素差距依然好大，關鍵在於領域知識同工作流。作者帶住一個簡單嘅故事意念，用OiiOii完整生成咗一段4分鐘嘅動畫短片，全程冇寫過一句英文提示詞。佢發現OiiOii唔係單純提供一個更強嘅模型，而係用7個專業化AI Agent（編劇、角色設計師、場景設計師、分鏡師、動畫師、音效工程師、藝術總監）組成虛擬團隊，同時拉高咗易用性、領域知識、分鏡質素同角色一致性。

作者認為OiiOii嘅核心價值在於「分鏡」——佢哋將電影工業嘅分鏡流程變成自動化Agent，用戶可以一句話啟動整條流水線，亦可以透過自由畫布模式逐個分鏡精細控制，甚至拆開每個鏡頭嘅關鍵幀逐格修改。呢種做法令到創作門檻大幅降低，同時保留咗專業控制空間。作者仲嘗試用OiiOii復刻B站爆款「地牢酒館」系列，成功做出街霸角色版，證明工具可以快速模仿風格。

整體結論係：OiiOii係第一個認真將電影工業分工邏輯搬入AI視頻嘅產品——佢俾你嘅唔係一個工具，而係一個團隊，你嘅位置係導演。AI視頻工具正從「賣原始算力」走向「賣完整服務」，而呢個方向係正確嘅。

OiiOii用7個AI Agent（編劇、角色設計、場景設計、分鏡師、動畫師、音效師、藝術總監）組成虛擬動畫團隊，一句話即可生成完整動畫，免去手寫提示詞。
自動化分鏡係核心差異：分鏡師Agent將故事拆成多個專業鏡頭（含鏡頭語言、運鏡、光影），確保敍事節奏同角色一致性。
自由畫布模式支援全自動、半自動（投餵參考圖）同手搓三種操作，適合復刻爆款風格或精細調整每個分鏡。
關鍵幀拆解功能將每個鏡頭嘅黑盒打開，用戶可以逐幀修改，控制顆粒度達幀級別，減少重做成本。
啟發：AI視頻工具正演進成「完整服務」——未來競爭唔係模型強弱，而係AI員工嘅專業度；普通人有好故事就可以透過呢類工具做出高質短片。

值得記低

連結

OiiOii官網

免費試用，註冊送積分，每日登錄都有免費額度。

整理重點

AI視頻嘅「人變量」先係瓶頸

B站up主LKs提過一個公式：成片質量 = 相機參數 × (拍攝人變量 + 相機易用性) × (環境因子 + 天氣因子)。作者覺得呢條式套落AI視頻領域一樣 work。而家Seedance 2.0、Kling 3.0、Veo 3.1呢啲模型越嚟越勁，但大家用同一模型做出嚟嘅片質素可以差好遠。

真正制約生產力嘅瓶頸又回到咗人身上

所以作者自己拆咗一個AI視頻質量公式：M（模型能力） × (S（創作技能） + U（易用性）) × (D（分鏡質素） + C（角色一致性）)。多數AI工具只係俾個強勁模型你，然後將S、D、C全部摔俾你搞，等於俾部頂級相機但唔教你點影相。

整理重點

OiiOii嘅破局：7個AI員工同時拉高四個變量

OiiOii嘅做法係用7個專業化AI Agent組成虛擬動畫團隊：編劇、角色設計師、場景設計師、分鏡師、動畫師、音效工程師、藝術總監。你只需要一句話，成條流水線就自動行。

編劇Agent：根據一句話生成完整劇本，有人物弧光同故事衝突
角色設計師：生成角色主圖同三視圖，鎖定外觀避免變臉
場景設計師：搭建多角度場景，確保跨鏡頭一致
分鏡師：拆出專業分鏡，附鏡頭語言、運鏡方向、光影氛圍
動畫師：用Seedance 2.0逐個分鏡生成視頻
音效工程師：用Suno配背景音樂，自動匹配敍事節奏
藝術總監：合成最終視頻，下載720p或1080p

呢個設計令到S、U、D、C四個變量同時被拉高——甚至你嘅S（創作技能）接近零都冇問題，Agent幫你補返。

整理重點

分鏡三板斧：自動化、自由畫布、關鍵幀控制

OiiOii最強嘅地方係分鏡能力。第一板斧係「自動化分鏡」：你唔使寫英文提示詞，編劇Agent寫劇本，分鏡Agent拆鏡頭，全部自動。第二板斧係「自由畫布模式」：每個分鏡嘅提示詞拆成畫面描述、角色動作、鏡頭運動、氛圍光影幾個模塊，你可以改其中一欄，或者直接手搓。

Agent將底牌全部露曬出嚟

第三板斧係「關鍵幀拆解」：每個鏡頭其實係由多張關鍵幀構成，你可以展開佢，對任意一張關鍵幀單獨修改。

控制顆粒度由鏡頭變成幀

呢個功能仲慳錢——如果唔滿意某段，唔使重做成個鏡頭，只改嗰一小段就得。

1 全自動模式：一句話出片，適合新手快試
2 半自動模式：投餵參考圖，指定風格，Agent輔助生成
3 手搓模式：自己寫提示詞，完全控制每個細節

作者用呢個功能成功復刻咗B站爆款「地牢酒館」系列，將酒館客人換成街霸角色，效果幾好，全程冇手寫英文提示詞。

整理重點

AI影片工具嘅未來：從賣算力到賣完整服務

作者認為OiiOii冇喺模型上做出獨家優勢，但佢用7個專業AI Agent同時拉高U、D、C，仲幫你補S，呢個係模型能力拉唔鬱之後最聰明嘅破局方式。AI影片工具正經歷同雲計算一樣嘅演進路徑——從賣原始算力走向賣完整服務。Seedance、Kling呢啲模型似IaaS，OiiOii似PaaS甚至SaaS，成套生產線開箱即用。

OiiOii唔係一個AI影片工具，佢會係第一個AI影片公司

當然OiiOii唔係萬能：做真人短劇、精確舞蹈動作控制、跨集保持角色一致呢啲場景暫時未係最擅長。但如果你做單集動畫、MV、品牌宣傳片、故事短片，特別係有好故事但唔想花時間手搓提示詞，OiiOii嘅分鏡能力確實幫到手。

作者最後講咗句感性嘅話：佢大學時有個電影夢，17年嚟一直由入門到放棄，但而家終於可以喺週末用半個鐘，叫OiiOii嘅7個AI員工幫佢做出一段表達想法嘅嘢——呢件事本身好浪漫。

前兩日見到B站百大UP主LKs出咗條Pocket 4P評測片，講咗個好有趣嘅問題，叫做：買咗博主同款設備，點解拍出嚟仲係唔靚。

佢俾咗一條公式：

成片質量 = 相機參數(P) × (拍攝人變量(S) + 相機易用性(U)) × (環境因子(E) + 天氣因子(W))

意思係：相機參數再好，最終乘嘅係你嘅技術同相機嘅易用性。設備只係乘數，人先係被乘數。同一部機喺唔同人手裏，出嚟嘅嘢可以差天共地。

我睇完之後好有感觸，因為AI影片領域正在發生完全一樣嘅事。

字節嘅Seedance 2.0、快手嘅Kling 3.0、Google嘅Veo 3.1，模型一個比一個勁。以前好威嘅Sora，而家都冇乜人討論。但你打開B站睇下，用同一個模型整出嚟嘅片，質素差距大到離譜。有人整到好似電影片段，有人整到好似PowerPoint加咗動效。

其實同用所有AI工具差唔多，當AI將基本生成能力磨平之後，真正嘅差異體現喺領域知識上。例如所有人都用AI Coding去做產品，但係做乜嘢產品，或者知一個好產品點樣產生嘅人，會執行得更好。而AI影片方面，真正識動畫同電影工作流程、有相應審美嘅人先會做出更好嘅作品。

所以，成日會發現，當大家用嘅模型都一樣，真正限制生產力嘅瓶頸又返到人身上。

而今次，體驗咗兩日oiioii之後，我又產生咗啲唔同嘅想法。先睇一個成品。我只係輸入咗一個劇情嘅諗法，OiiOii幫我整咗條4分幾鐘嘅短片：

呢個係點樣由一句話變成一條完整動畫？跟住慢慢講。

一個AI影片嘅質量公式

我自己拆咗一個AI影片嘅質量公式：

M（模型能力）呢個變量，2026年已經快速拉平。大家都可以用Seedance 2.0，都可以用Kling 3.0，畫面質素嘅差距喺度縮細。

真正拉開差距嘅，係S、U、D、C呢四個變量。

而呢四個變量，啱啱就係大多數AI影片工具唔理嘅地方。佢哋俾一個好勁嘅模型（M拉滿），然後將S、D、C全部拋俾你。等於俾你一部頂級相機，但拍攝技術、構圖、揾光全部靠你自己。

我喺豆瓣標記睇過嘅影視劇超過2000部。自己從來冇拍過嘢，但片睇得多，對一啲導演嘅工作方式印象好深。

例如希區柯克，佢出名要將每一個鏡頭都畫成詳細嘅分鏡稿先開拍。佢到咗片場成日覺得悶。因為喺佢睇嚟，電影喺畫分鏡嘅時候就已經拍完，剩下嘅只係執行。

分鏡決定嘅唔係畫面好唔好睇，而係故事點樣講、節奏點樣走。 佢控制住觀眾嘅情緒走向。呢個就係公式裏面D呢個變量嘅份量。

直到我用咗OiiOii，我覺得終於有一個AI影片工具認真對待呢件事。

OiiOii：一句話請7個AI員工

OiiOii係一個AI動畫創作工具，舊年底內測嘅時候10萬人排隊，今年4月正式上線，據報道已經有超過20萬創作者用緊。

佢同其他AI影片工具最大嘅分別在於，佢做嘅唔係一個5-10秒嘅單鏡頭。佢由一句話開始，幫你做出一條1分鐘以上嘅敍事動畫。

點樣做到？OiiOii搞咗一個7人虛擬動畫團隊。每一個都係一個專業化嘅AI Agent，各司其職：

回到公式：OiiOii做嘅嘢，係用7個AI員工將S、U、D、C四個變量同時拉高。 你嘅創作能力唔夠？編劇同分鏡師幫你。你唔識保持一致性？角色設計師同藝術總監幫你。工具唔好用？一句話就可以啟動成條生產線。

呢套打法比單純將工具整得更易用要狠得多。其他工具係要你少做啲嘢，OiiOii係直接幫你做曬。

實測：一句話到成片嘅完整流程

講到呢度可能有點抽象，直接睇我嘅實測。

我俾OiiOii輸入咗一句話：「一對戀人喺星空下嘅天文館裏面起舞，周圍嘅場景好似走入咗一幅油畫，色彩夢幻，充滿唔真實嘅浪漫感。」

呢句話嘅靈感係《La La Land》裏面兩個場景嘅混合。一個係Mia同Sebastian喺洛杉磯天文館裏面懸浮起舞嗰段星空。另一個係片尾兩人在酒吧重逢之後，腦海裏面想像嗰段「如果當初我哋一齊」嘅幻想片段，視覺上好似直接走入咗一幅畫。我想用呢兩個畫面嘅意境做底色，睇下OiiOii能唔能夠延展出一個點樣嘅新故事。

然後就發生咗一件幾得意嘅事。

下面拆開講每一步。

藝術總監接單，編劇寫劇本

輸入咗嗰句話之後，藝術總監先接單，提取咗核心元素：星空天文館、起舞嘅戀人、油畫質感、夢幻浪漫。然後編劇Agent自動生成咗一個完整故事。

兩個角色： 陸星河（28歲天體物理研究員，理性主義者）同林夢影（26歲，感性嘅藝術靈魂）。故事發生喺一個即將關閉嘅天文館裏面，講嘅係理性同感性嘅碰撞同和解。

我只係講咗一句說話，佢就俾我寫咗一個有人物弧光嘅完整劇本。

角色設計師鎖定外觀

角色設計師根據劇本為兩個角色生成咗主圖同三視圖概念圖。呢一步嘅意義係鎖定角色外觀，確保後面19個分鏡裏面角色唔會變樣。

場景設計師搭建4個場景

場景設計師搭建咗4個場景，每個場景都有多角度視圖：

星語天文館主放映廳（常規態）
天文館設備維修室
天文館生鏽天台
夢幻油畫星空大廳（極光態）

多角度視圖嘅意義同角色三視圖一樣：確保唔同鏡頭裏面同一個場景睇起嚟一致。

分鏡師拆出19個專業分鏡

然後係重頭戲。分鏡師將成個故事拆成19個分鏡。

每個分鏡都有專業嘅鏡頭語言：medium shot、wide shot、close-up、Dutch angle、俯拍，運鏡方向、氛圍光影全部寫好。分鏡師仲俾咗監修思路，例如喺高潮段落特意增加咗天象儀啟動時「機械咆哮」同「光影狂歡」嘅細節銜接，避免角色喺流動光影中產生空間瞬移嘅感覺。

生成影片 + 音效 + 合成

分鏡確認之後，動畫師開始逐個分鏡生成影片。用嘅係Seedance 2.0模型，Pro模式，可以揀720p或480p。

影片生成完之後，音效工程師用Suno生成咗背景音樂，自動匹配敍事節奏。

最後藝術總監將所有素材合成為最終影片，可以下載720p或1080p高清版。

全流程總覽

由一句話到成片，成個工作流程係咁樣：

對照公式睇下呢個過程：

我嘅S幾乎係零，但D同C都被Agent拉到我自己寫要花成日嘅水平。

分鏡三板斧：想做得更好，工具唔會阻你

上面係全自動模式嘅效果。但OiiOii真正令我覺得有趣嘅，係佢喺自動化之外仲保留咗精確控制嘅能力。

第一板斧：自動化分鏡，唔使周圍揾提示詞喇

用過AI影片工具嘅人都知，最痛苦嘅唔係等生成，而係寫提示詞。一條30秒嘅片拆成6個鏡頭，每個鏡頭寫一段詳細嘅英文提示詞，齋呢步就要磨一兩個鐘。

OiiOii嘅做法係：你唔使寫。編劇Agent寫劇本，分鏡師Agent拆鏡頭寫提示詞，全自動。

按我理解，其實係因為OiiOii對呢啲影視製作工作流程中唔同角色嘅技能，以及各類AI模型嘅能力有充足嘅領域認知，所以佢哋將呢個變成一個類似skill嘅嘢，植入咗喺影片創作嘅工作流程入面。

第二板斧：自由畫布模式，由參考圖到成片嘅可控玩法

自動分鏡夠曬省心，但如果你心裏面已經有一個具體嘅視覺參考呢？例如想復刻某個B站爆款嘅風格。

呢個就係自由畫布模式嘅價值。撳入任何一個分鏡，你會見到分段式嘅提示詞，清楚分成畫面描述、角色動作、鏡頭運動、氛圍光影幾個模組。Agent將底牌全部攤出嚟。覺得角色表情唔啱？改表情嗰欄。覺得鏡頭太遠？改鏡頭運動嗰欄。

畫布模式支援三種操作方式：

全自動：完全交給Agent，你只負責審片
半自動：俾一張圖，話俾Agent知你想要乜
手搓：自己寫提示詞，完全手動控制

AI影片工具最實際嘅應用場景之一，就係復刻爆款。我決定用OiiOii試下呢件事。

揀咗B站最近最Hit嘅「地牢酒館」系列——第一視角入地牢小酒館，每集嚟一個奇怪生物飲酒，互動又奇怪又好笑。單集543萬播放、32萬讚，係2026年AI影片賽道最值得研究嘅爆款樣本之一。

我做咗一個改編：將酒館裏面嘅客人換成街頭霸王嘅角色，睇下OiiOii能唔能夠保留原作風格嘅基礎上，做出新故事。

首先要揀情緒關鍵詞。OiiOii俾咗衝突、浪漫、恐怖、搞笑、慾望幾個選項，每個都對應唔同嘅敍事路徑。地牢酒館嘅精髓係荒誕反應，所以我揀咗「搞笑」。

然後遇到咗一個小插曲。直接輸入「街頭霸王角色嚟酒館」會被版權檢測攔截。我轉成原創設定描述（紅頭巾武術家、巨型摔角手、綠皮叢林戰士呢類），就過咗。其實呢樣係好事，原創設定比直接借用IP更適合做長期內容。

跟住角色設計師為5個角色都做咗主圖加三視圖，每個角色之間風格統一，但形象有明顯差異。

分鏡師拆咗5個鏡頭，每個角色一段互動。提示詞嘅精細程度令我有啲驚訝，精確到0-2秒、2-4秒、4-7秒嘅動作分解，連「金幣跌落枱嘅反彈路徑」呢啲細節都有寫。

影片生成階段，5個分鏡並行渲染，大約5-6分鐘全部出曬。最後合成嘅影片比我預想中好，第一視角嘅代入感同原作好似，角色互動亦有荒誕喜劇嘅感覺。

成個過程冇手寫過一個英文提示詞。我只係做咗三樣嘢：寫一段中文故事描述、揀情緒關鍵詞、改咗幾句被版權攔截嘅描述。剩下嘅全部係Agent做。

第三板斧：將影片生成嘅黑盒展開

呢個功能係我覺得OiiOii分鏡能力最強嘅地方，亦係99%嘅用戶冇留意到。

傳統AI影片工具嘅體驗係：你寫一段提示詞，幾分鐘後吐出一條5秒嘅片。中間發生咗乜嘢、畫面點樣由開頭變到結尾、想改某一格點改，你都唔知。由提示詞直接到影片，係一個黑盒。

OiiOii將呢個黑盒拆開咗。

每個鏡頭其實係由多張關鍵格構成嘅。 你可以對成個鏡頭做整體調整——改提示詞、換模型、換畫布比例，令成段畫面跟住變。

亦可以展開佢，對鏡頭裏面任意一張關鍵格單獨修改。

影片節奏嘅每一個變化——動作嘅起勢同完成、鏡頭嘅推近同拉遠、情緒嘅轉折——都係由呢啲關鍵格嘅差異決定。可以調每一格，就代表你可以掌握影片嘅每一秒。

反過來都得，由現有嘅分鏡裏面任意揀幾個，組合成一段新影片。

你對影片嘅控制精細度，由成個鏡頭變成一格一格。 唔滿意唔使重新做成個鏡頭，只改唔滿意嗰一小段就得。

呢個背後仲有一個成日俾人忽略嘅好處：省錢。 AI影片模型而家真係幾貴，一個高清鏡頭生成成本幾蚊到十幾蚊不等，60秒嘅敍事動畫閒閒地幾十蚊起。如果跟傳統工具嘅做法，一個唔滿意就重新做成個鏡頭，廢鏡頭嘅錢夠你再做半套片。分鏡令創作過程專業嘅同時，亦令執行節奏同最終成本變得可控——呢個其實係普通人可以持續用AI做影片嘅前提。

用公式嘅語言講：畫布模式同鏡頭拆分，令有能力嘅創作者可以主動拉高S同D呢兩個變量。 全自動已經俾咗一個唔錯嘅底線，想做得更好，工具亦唔會阻你條路。

回到公式

AI影片成片質量 = M × (S + U) × (D + C)

OiiOii冇喺M（模型）上做到獨家優勢，Seedance 2.0其他工具都可以用。但佢用7個專業化嘅AI Agent，同時拉高咗U、D、C三個變量，仲幫你補咗S。呢個係M拉唔鬱之後，最聰明嘅破局方式。

我有一個判斷：AI影片工具正在經歷同雲端運算一樣嘅演進路徑——由「賣原始算力」走向「賣完整服務」。 Seedance、Kling、Veo呢啲模型好似雲端運算早期嘅IaaS，俾你一部虛擬機，剩下全靠你；OiiOii呢種係PaaS甚至SaaS，成條生產線開箱即用。呢條路行得通嘅話，OiiOii唔會係一個AI影片工具，佢會係第一個AI影片公司。

講真，OiiOii唔係萬能。如果你要做真人短劇、需要精確嘅舞蹈動作控制，或者做系列動畫需要跨集保持角色一致，目前可能仲未係佢最擅長嘅場景。

但如果你想做單集動畫、MV、品牌宣傳片、故事短片，特別係你有好故事但唔想花大量時間手搓提示詞，OiiOii嘅分鏡能力確實可以幫你慳返好多工夫，同時令成片質素上一個台階。

150幾種風格可以揀，由日漫到3D Pixar風格到真人風格都有。接入咗滿血版Seedance 2.0之後，畫面質素亦確實比以前好咗好多。

作為一個睇咗2000幾部電影嘅人，我一直覺得AI影片工具缺嘅唔係畫面質素，而係對創作流程嘅尊重。電影工業花咗一百年建立嘅分工體系，由編劇到分鏡師到攝影到剪接，每個環節都有專業嘅人做專業嘅事。

OiiOii可能係第一個認真將呢套邏輯搬入AI影片嘅產品。佢俾你嘅唔係一個萬能工具，而係一個團隊。你嘅位置係導演。

呢個方向我覺得係啱嘅。由而家開始，做影片比嘅唔係邊個手裏嘅模型更勁，而係邊個請得起更專業嘅AI員工。

最後講啲私人嘢。我大學時一直有個隱隱嘅電影夢，睇完《安妮荷爾》之後仲認真買過一本《認識電影》。

17年過去咗，我讀呢本書嘅狀態一直係由入門到放棄，我可能都係拍唔出嗰啲嘢。但我而家至少可以喺週末花半個鐘，叫OiiOii嘅7個AI員工幫我做一段能夠幫我表達諗法嘅嘢。

呢件事本身，我覺得幾浪漫。

傳送門：www.oiioii.tv

而家註冊唔使邀請碼，註冊就送積分，每日登入都有得拎。有興趣嘅可以自己試下，實際體驗下分鏡功能，會比睇文章更直觀。

前兩天看到B站百大up主LKs發了一期Pocket 4P評測的視頻，談了一個非常有趣的問題，叫做：買了博主同款設備，為什麼拍的還是不好看。

他給出了一個公式：

成片質量 = 相機參數(P) × (拍攝人變量(S) + 相機易用性(U)) × (環境因子(E) + 天氣因子(W))

意思是：相機參數再好，最終乘以的是你的技術和相機的易用性。設備只是乘數，人才是被乘數。同樣設備到了不同人手裏，出來的東西天差地別。

我看完之後蠻有感觸的，因為AI視頻領域正在發生完全一樣的事。

字節的Seedance 2.0、快手的Kling 3.0、谷歌的Veo 3.1，模型一個比一個強。曾經封神的Sora，現在都沒什麼人討論了。但你打開B站看看，用同樣模型做出來的視頻，質量差距大得離譜。有人做出來像電影片段，有人做出來像PPT配了動效。

其實和使用所有AI工具類似，當AI把基本的生成能力磨平之後，真正差異體現在領域知識上。比如所有人都能用AI Coding去做產品，但是做什麼產品，或者說知道一個好產品如何產生的人會能把這件事執行得更好。而以AI視頻來說，真正懂動畫和電影領域工作流，具備相應審美的人才能做出更好的作品。

所以，你常常會發現，當大家用的模型都一致了，真正制約生產力的瓶頸又回到了人身上。

而這次，在體驗了兩天的oiioii之後，我又產生了些不同的想法。先看一個成品。我只輸入了一個劇情的想法，OiiOii幫我做出來的4分多鐘的短片：

這是怎麼從一句話變成一部完整動畫的？接下來慢慢說。

一個AI視頻的質量公式

我自己拆了一個AI視頻的質量公式：

M（模型能力）這個變量，2026年已經在快速拉平。大家都能用Seedance 2.0，都能用Kling 3.0，畫面質量的差距在縮小。

真正拉開差距的，是S、U、D、C這四個變量。

而這四個變量，恰好就是大多數AI視頻工具不管的地方。它們給你一個強大的模型（M拉滿），然後把S、D、C全部甩給你。相當於給你一台頂配相機，但拍攝技術、構圖、找光全靠你自己。

我在豆瓣標記看過的影視劇超過2000部。自己從來沒拍過東西，但片子看多了，對一些導演的工作方式印象很深。

比如希區柯克，他出了名的要把每一個鏡頭都畫成詳細的分鏡稿才開拍。他到了片場經常覺得無聊。因為在他看來，電影在畫分鏡的時候就已經拍完了，剩下的只是執行。

分鏡決定的不是畫面好不好看，而是故事怎麼講、節奏怎麼走。 它掌控着觀眾的情緒走向。這就是公式裏D這個變量的份量。

直到我用了OiiOii，我覺得終於有一個AI視頻工具認真對待這件事了。

OiiOii：一句話僱7個AI員工

OiiOii是一個AI動畫創作工具，去年底內測的時候10萬人排隊，今年4月正式上線，據報道已有超過20萬創作者在用。

它跟其他AI視頻工具最大的區別在於，它做的不是一個5-10秒的單鏡頭。它從一句話開始，幫你做出一整部1分鐘以上的敍事動畫。

怎麼做到的？OiiOii搞了一個7人虛擬動畫團隊。每個人都是一個專業化的AI Agent，各司其職：

回到公式：OiiOii做的事情，是用7個AI員工把S、U、D、C四個變量同時拉高。 你的創作能力不夠？編劇和分鏡師幫你。你不會保持一致性？角色設計師和藝術總監幫你。工具不好用？一句話就能啓動整條流水線。

這套打法比單純把工具做得更易用要狠得多。別的工具是讓你少幹一點活，OiiOii是直接幫你幹完。

實測：一句話到成片的完整流程

說到這裏可能有點抽象，直接看我的實測。

我給OiiOii輸入了一句話：「一對戀人在星空下的天文館裏起舞，周圍的場景像走進了一幅油畫，色彩夢幻，充滿不真實的浪漫感。」

這句話的靈感是《La La Land》裏兩個場景的混合。一個是Mia和Sebastian在洛杉磯天文館裏懸浮起舞的那段星空。另一個是片尾兩人在酒吧重逢後，腦海裏想象的那段「如果當初我們在一起」的幻想片段，視覺上像直接走進了一幅畫。我想用這兩個畫面的意境做底色，看OiiOii能延展出一個什麼樣的新故事。

然後就發生了一件蠻有意思的事。

下面拆開說每一步。

藝術總監接單，編劇寫劇本

輸入那句話之後，藝術總監先接單，提取了核心要素：星空天文館、起舞的戀人、油畫質感、夢幻浪漫。然後編劇Agent自動生成了一個完整故事。

兩個角色： 陸星河（28歲天體物理研究員，理性主義者）和林夢影（26歲，感性的藝術靈魂）。故事發生在一個即將閉館的天文館裏，講的是理性與感性的碰撞和和解。

我只說了一句話，它給我寫了一個有人物弧光的完整劇本。

角色設計師鎖定外觀

角色設計師根據劇本為兩個角色生成了主圖和三視圖概念圖。這一步的意義是鎖定角色外觀，確保後面19個分鏡裏角色不會變臉。

場景設計師搭建4個場景

場景設計師搭建了4個場景，每個場景都有多角度視圖：

星語天文館主放映廳（常規態）
天文館設備維修室
天文館生鏽天台
夢幻油畫星空大廳（極光態）

多角度視圖的意義和角色三視圖一樣：保證不同鏡頭裏同一個場景看起來是一致的。

分鏡師拆出19個專業分鏡

然後是重頭戲。分鏡師把整個故事拆成了19個分鏡。

每個分鏡都有專業的鏡頭語言：medium shot、wide shot、close-up、Dutch angle、俯拍，運鏡方向、氛圍光影全部寫好了。分鏡師還給了監修思路，比如在高潮段落特意增加了天象儀啓動時「機械咆哮」與「光影狂歡」的細節銜接，避免角色在流動光影中產生空間瞬移感。

生成視頻 + 音效 + 合成

分鏡確認後，動畫師開始逐個分鏡生成視頻。用的是Seedance 2.0模型，Pro模式，可以選720p或480p。

視頻生成完之後，音效工程師用Suno生成了背景音樂，自動匹配敍事節奏。

最後藝術總監把所有素材合成為最終視頻，可以下載720p或1080p高清版。

全流程總覽

從一句話到成片，整個工作流長這樣：

對照公式看一下這個過程：

我的S幾乎為零，但D和C都被Agent拉到了我自己寫要花一整天的水平。

分鏡三板斧：想做得更好，工具不擋路

上面是全自動模式的效果。但OiiOii真正讓我覺得有意思的，是它在自動化之外還保留了精確控制的能力。

第一板斧：自動化分鏡，不用再四處扒提示詞了

用過AI視頻工具的人都知道，最痛苦的不是等生成，是寫提示詞。一個30秒的視頻拆成6個鏡頭，每個鏡頭寫一段詳細的英文提示詞，光這一步就得磨一兩個小時。

OiiOii的做法是：你不用寫。編劇Agent寫劇本，分鏡師Agent拆鏡頭寫提示詞，全自動。

按我的理解，其實是因為OiiOii對這些影視製作工作流中不同角色的技能以及各類AI模型的能力有充足的領域認知，所以，他們把這變成了一個類似skill的東西，植入在了視頻創作的工作流中。

第二板斧：自由畫布模式，從參考圖到成片的可控玩法

自動分鏡夠省心，但如果你心裏已經有了一個具體的視覺參考呢？比如想復刻某個B站爆款的風格。

這就是自由畫布模式的價值。點開任意一個分鏡，你會看到分段式的提示詞，清楚地分成畫面描述、角色動作、鏡頭運動、氛圍光影幾個模塊。Agent把底牌全露出來了。覺得角色表情不對？改表情那一欄。覺得鏡頭太遠？改鏡頭運動那一欄。

畫布模式支持三種操作方式：

全自動：完全交給Agent，你只管審片
半自動：投餵一張圖，告訴Agent你想要什麼
手搓：自己寫提示詞，完全手動控制

AI視頻工具最實際的應用場景之一，就是復刻爆款。我決定拿OiiOii測一下這件事。

挑的是B站最近最火的「地牢酒館」系列——第一視角進入地牢小酒館，每集來一個奇怪生物喝酒，互動詭異又好笑。單集543萬播放、32萬點贊，是2026年AI視頻賽道最值得研究的爆款樣本之一。

我做了一個改編：把酒館裏的客人換成街頭霸王裏的角色，看OiiOii能不能在保留原作風格的基礎上，做出新的故事。

先要選情緒關鍵詞。OiiOii給了衝突、浪漫、恐怖、搞笑、慾望幾個選項，每個都對應不同的敍事路徑。地牢酒館的精髓是荒誕反應，所以我選了「搞笑」。

然後遇到了一個小插曲。直接輸入「街頭霸王角色來酒館」會被版權檢測攔截。我換成原創設定描述（紅頭巾武術家、巨型摔角手、綠皮叢林戰士這類），就過了。這其實是好事，原創設定比直接借用IP更適合做長期內容。

接下來角色設計師給5個角色都做了主圖+三視圖，每個角色之間風格統一，但形象有明顯差異。

分鏡師拆了5個鏡頭，每個角色一段互動。提示詞的顆粒度讓我有點驚訝，精確到0-2秒、2-4秒、4-7秒的動作分解，連「金幣掉桌上的反彈路徑」這種細節都寫了。

視頻生成階段，5個分鏡並行渲染，差不多5-6分鐘全部出來。最後合成的視頻比我預想的好，第一視角的代入感和原作很像，角色互動也有荒誕喜劇的感覺。

整個過程沒有手寫一個英文提示詞。我只做了三件事：寫一段中文故事描述、選情緒關鍵詞、改了幾句被版權攔截的描述。剩下的全是Agent在做。

第三板斧：把視頻生成的黑盒展開

這個功能是我覺得OiiOii分鏡能力最強的地方，也是99%的用戶沒注意到的。

傳統AI視頻工具的體驗是：你寫一段提示詞，幾分鐘後吐出一個5秒的視頻。中間發生了什麼、畫面怎麼從開頭變到結尾、想改某一幀怎麼改，你都不知道。從提示詞直接到視頻，是個黑盒。

OiiOii把這個黑盒拆開了。

每個鏡頭其實是由多張關鍵幀構成的。 你可以對整個鏡頭做整體調整——改提示詞、換模型、換畫布比例，讓整段畫面跟着變。

也可以展開它，對鏡頭裏任意一張關鍵幀單獨修改。

視頻節奏的每一個變化——動作的起勢和完成、鏡頭的推近和拉遠、情緒的轉折——都是由這些關鍵幀的差異決定的。能調每一幀，就意味着你能掌握視頻的每一秒。

反過來也行，從已有的分鏡裏任意勾選幾個，組合成一段新的視頻。

你對視頻的控制顆粒度，從一整個鏡頭變成了一幀一幀。 不滿意不用重來整個鏡頭，只改不滿意的那一小段。

這背後還有一個常被忽略的好處：省錢。 AI視頻模型現在真挺貴的，一個高清鏡頭生成成本幾塊到十幾塊不等，60秒的敍事動畫動輒幾十塊起步。如果按傳統工具的方式，一個不滿意就重做整個鏡頭，廢鏡頭的錢夠你再做半部片子。分鏡讓創作過程專業的同時，也讓執行節奏和最終成本變得可控——這其實是普通人能持續用AI做視頻的前提。

用公式的語言說：畫布模式和鏡頭拆分，讓有能力的創作者可以主動拉高S和D這兩個變量。 全自動已經給了一個不錯的底線，想做得更好，工具也不會擋你的路。

回到公式

AI視頻成片質量 = M × (S + U) × (D + C)

OiiOii沒有在M（模型）上做出獨家優勢，Seedance 2.0別的工具也能用。但它用7個專業化的AI Agent，同時拉高了U、D、C三個變量，還幫你補了S。這是M拉不動了之後，最聰明的破局方式。

我有一個判斷：AI視頻工具正在經歷和雲計算一樣的演進路徑——從「賣原始算力」走向「賣完整服務」。 Seedance、Kling、Veo這些模型像是雲計算早期的IaaS，給你一台虛擬機，剩下全靠你；OiiOii這種是PaaS甚至SaaS，整套生產線開箱即用。這條路走通的話，OiiOii不會是一個AI視頻工具，它會是第一個AI視頻公司。

說實話，OiiOii不是萬能的。如果你要做真人短劇、需要精確的舞蹈動作控制，或者做系列番劇需要跨集保持角色一致，目前可能還不是它最擅長的場景。

但如果你想做單集動畫、MV、品牌宣傳片、故事短片，特別是你有好故事但不想花大量時間手搓提示詞，OiiOii的分鏡能力確實能幫你省掉很多工作，同時讓成片質量上一個台階。

150+種風格可以選，從日漫到3D皮克斯風到真人風格都有。接入了滿血版Seedance 2.0之後，畫面質量也確實比之前好了不少。

作為一個看了2000多部電影的人，我一直覺得AI視頻工具缺的不是畫面質量，而是對創作流程的尊重。電影工業花了一百年建立起來的分工體系，從編劇到分鏡師到攝影到剪輯，每個環節都有專業的人在做專業的事。

OiiOii可能是第一個認真把這套邏輯搬到AI視頻裏的產品。它給你的不是一個萬能工具，是一個團隊。你的位置是導演。

這個方向我覺得是對的。從今往後，做視頻拼的不是誰手裏的模型更強，是誰僱得起更專業的AI員工。

最後說點私人的。我大學時一直有個隱隱的電影夢，看完《安妮霍爾》之後還認真買過一本《認識電影》。

17年過去了，我讀這本書的狀態一直是從入門到放棄，我可能還是拍不出那種東西。但我現在至少可以在週末花半小時，讓OiiOii的7個AI員工幫我做出一段能幫助我表達想法的東西。

這件事本身，我覺得挺浪漫的。

傳送門：www.oiioii.tv

目前註冊不需要邀請碼了，註冊就送積分，每天登錄也能領。感興趣的可以自己試試，實際體驗一下分鏡功能，會比看文章更直觀。