替你們試過了,OiiOii真能幫普通人做出電影來!
整理版優先睇
OiiOii用7個AI Agent幫普通人做出完整動畫,核心係將電影工業工作流搬入AI視頻工具
呢篇文章係一個資深影迷(睇過2000幾部戲)對AI動畫創作工具OiiOii嘅實測分享。作者從B站up主LKs嘅影片公式「成片質量 = 相機參數 × (拍攝人變量 + 相機易用性) × (環境因子 + 天氣因子)」講起,指出AI視頻領域同樣存在呢個問題:模型能力快速拉平,但成品質素差距依然好大,關鍵在於領域知識同工作流。作者帶住一個簡單嘅故事意念,用OiiOii完整生成咗一段4分鐘嘅動畫短片,全程冇寫過一句英文提示詞。佢發現OiiOii唔係單純提供一個更強嘅模型,而係用7個專業化AI Agent(編劇、角色設計師、場景設計師、分鏡師、動畫師、音效工程師、藝術總監)組成虛擬團隊,同時拉高咗易用性、領域知識、分鏡質素同角色一致性。
作者認為OiiOii嘅核心價值在於「分鏡」——佢哋將電影工業嘅分鏡流程變成自動化Agent,用戶可以一句話啟動整條流水線,亦可以透過自由畫布模式逐個分鏡精細控制,甚至拆開每個鏡頭嘅關鍵幀逐格修改。呢種做法令到創作門檻大幅降低,同時保留咗專業控制空間。作者仲嘗試用OiiOii復刻B站爆款「地牢酒館」系列,成功做出街霸角色版,證明工具可以快速模仿風格。
整體結論係:OiiOii係第一個認真將電影工業分工邏輯搬入AI視頻嘅產品——佢俾你嘅唔係一個工具,而係一個團隊,你嘅位置係導演。AI視頻工具正從「賣原始算力」走向「賣完整服務」,而呢個方向係正確嘅。
- OiiOii用7個AI Agent(編劇、角色設計、場景設計、分鏡師、動畫師、音效師、藝術總監)組成虛擬動畫團隊,一句話即可生成完整動畫,免去手寫提示詞。
- 自動化分鏡係核心差異:分鏡師Agent將故事拆成多個專業鏡頭(含鏡頭語言、運鏡、光影),確保敍事節奏同角色一致性。
- 自由畫布模式支援全自動、半自動(投餵參考圖)同手搓三種操作,適合復刻爆款風格或精細調整每個分鏡。
- 關鍵幀拆解功能將每個鏡頭嘅黑盒打開,用戶可以逐幀修改,控制顆粒度達幀級別,減少重做成本。
- 啟發:AI視頻工具正演進成「完整服務」——未來競爭唔係模型強弱,而係AI員工嘅專業度;普通人有好故事就可以透過呢類工具做出高質短片。
OiiOii官網
免費試用,註冊送積分,每日登錄都有免費額度。
AI視頻嘅「人變量」先係瓶頸
B站up主LKs提過一個公式:成片質量 = 相機參數 × (拍攝人變量 + 相機易用性) × (環境因子 + 天氣因子)。作者覺得呢條式套落AI視頻領域一樣 work。而家Seedance 2.0、Kling 3.0、Veo 3.1呢啲模型越嚟越勁,但大家用同一模型做出嚟嘅片質素可以差好遠。
真正制約生產力嘅瓶頸又回到咗人身上
所以作者自己拆咗一個AI視頻質量公式:M(模型能力) × (S(創作技能) + U(易用性)) × (D(分鏡質素) + C(角色一致性))。多數AI工具只係俾個強勁模型你,然後將S、D、C全部摔俾你搞,等於俾部頂級相機但唔教你點影相。
OiiOii嘅破局:7個AI員工同時拉高四個變量
OiiOii嘅做法係用7個專業化AI Agent組成虛擬動畫團隊:編劇、角色設計師、場景設計師、分鏡師、動畫師、音效工程師、藝術總監。你只需要一句話,成條流水線就自動行。
- 編劇Agent:根據一句話生成完整劇本,有人物弧光同故事衝突
- 角色設計師:生成角色主圖同三視圖,鎖定外觀避免變臉
- 場景設計師:搭建多角度場景,確保跨鏡頭一致
- 分鏡師:拆出專業分鏡,附鏡頭語言、運鏡方向、光影氛圍
- 動畫師:用Seedance 2.0逐個分鏡生成視頻
- 音效工程師:用Suno配背景音樂,自動匹配敍事節奏
- 藝術總監:合成最終視頻,下載720p或1080p
呢個設計令到S、U、D、C四個變量同時被拉高——甚至你嘅S(創作技能)接近零都冇問題,Agent幫你補返。
分鏡三板斧:自動化、自由畫布、關鍵幀控制
OiiOii最強嘅地方係分鏡能力。第一板斧係「自動化分鏡」:你唔使寫英文提示詞,編劇Agent寫劇本,分鏡Agent拆鏡頭,全部自動。第二板斧係「自由畫布模式」:每個分鏡嘅提示詞拆成畫面描述、角色動作、鏡頭運動、氛圍光影幾個模塊,你可以改其中一欄,或者直接手搓。
Agent將底牌全部露曬出嚟
第三板斧係「關鍵幀拆解」:每個鏡頭其實係由多張關鍵幀構成,你可以展開佢,對任意一張關鍵幀單獨修改。
控制顆粒度由鏡頭變成幀
呢個功能仲慳錢——如果唔滿意某段,唔使重做成個鏡頭,只改嗰一小段就得。
- 1 全自動模式:一句話出片,適合新手快試
- 2 半自動模式:投餵參考圖,指定風格,Agent輔助生成
- 3 手搓模式:自己寫提示詞,完全控制每個細節
作者用呢個功能成功復刻咗B站爆款「地牢酒館」系列,將酒館客人換成街霸角色,效果幾好,全程冇手寫英文提示詞。
AI影片工具嘅未來:從賣算力到賣完整服務
作者認為OiiOii冇喺模型上做出獨家優勢,但佢用7個專業AI Agent同時拉高U、D、C,仲幫你補S,呢個係模型能力拉唔鬱之後最聰明嘅破局方式。AI影片工具正經歷同雲計算一樣嘅演進路徑——從賣原始算力走向賣完整服務。Seedance、Kling呢啲模型似IaaS,OiiOii似PaaS甚至SaaS,成套生產線開箱即用。
OiiOii唔係一個AI影片工具,佢會係第一個AI影片公司
當然OiiOii唔係萬能:做真人短劇、精確舞蹈動作控制、跨集保持角色一致呢啲場景暫時未係最擅長。但如果你做單集動畫、MV、品牌宣傳片、故事短片,特別係有好故事但唔想花時間手搓提示詞,OiiOii嘅分鏡能力確實幫到手。
作者最後講咗句感性嘅話:佢大學時有個電影夢,17年嚟一直由入門到放棄,但而家終於可以喺週末用半個鐘,叫OiiOii嘅7個AI員工幫佢做出一段表達想法嘅嘢——呢件事本身好浪漫。
前兩日見到B站百大UP主LKs出咗條Pocket 4P評測片,講咗個好有趣嘅問題,叫做:買咗博主同款設備,點解拍出嚟仲係唔靚。
佢俾咗一條公式:
成片質量 = 相機參數(P) × (拍攝人變量(S) + 相機易用性(U)) × (環境因子(E) + 天氣因子(W))

意思係:相機參數再好,最終乘嘅係你嘅技術同相機嘅易用性。設備只係乘數,人先係被乘數。同一部機喺唔同人手裏,出嚟嘅嘢可以差天共地。
我睇完之後好有感觸,因為AI影片領域正在發生完全一樣嘅事。
字節嘅Seedance 2.0、快手嘅Kling 3.0、Google嘅Veo 3.1,模型一個比一個勁。以前好威嘅Sora,而家都冇乜人討論。但你打開B站睇下,用同一個模型整出嚟嘅片,質素差距大到離譜。有人整到好似電影片段,有人整到好似PowerPoint加咗動效。
其實同用所有AI工具差唔多,當AI將基本生成能力磨平之後,真正嘅差異體現喺領域知識上。例如所有人都用AI Coding去做產品,但係做乜嘢產品,或者知一個好產品點樣產生嘅人,會執行得更好。而AI影片方面,真正識動畫同電影工作流程、有相應審美嘅人先會做出更好嘅作品。
所以,成日會發現,當大家用嘅模型都一樣,真正限制生產力嘅瓶頸又返到人身上。
而今次,體驗咗兩日oiioii之後,我又產生咗啲唔同嘅想法。先睇一個成品。我只係輸入咗一個劇情嘅諗法,OiiOii幫我整咗條4分幾鐘嘅短片:
呢個係點樣由一句話變成一條完整動畫?跟住慢慢講。
一個AI影片嘅質量公式
我自己拆咗一個AI影片嘅質量公式:

M(模型能力)呢個變量,2026年已經快速拉平。大家都可以用Seedance 2.0,都可以用Kling 3.0,畫面質素嘅差距喺度縮細。
真正拉開差距嘅,係S、U、D、C呢四個變量。
而呢四個變量,啱啱就係大多數AI影片工具唔理嘅地方。佢哋俾一個好勁嘅模型(M拉滿),然後將S、D、C全部拋俾你。等於俾你一部頂級相機,但拍攝技術、構圖、揾光全部靠你自己。
我喺豆瓣標記睇過嘅影視劇超過2000部。自己從來冇拍過嘢,但片睇得多,對一啲導演嘅工作方式印象好深。
例如希區柯克,佢出名要將每一個鏡頭都畫成詳細嘅分鏡稿先開拍。佢到咗片場成日覺得悶。因為喺佢睇嚟,電影喺畫分鏡嘅時候就已經拍完,剩下嘅只係執行。
分鏡決定嘅唔係畫面好唔好睇,而係故事點樣講、節奏點樣走。 佢控制住觀眾嘅情緒走向。呢個就係公式裏面D呢個變量嘅份量。
直到我用咗OiiOii,我覺得終於有一個AI影片工具認真對待呢件事。
OiiOii:一句話請7個AI員工
OiiOii係一個AI動畫創作工具,舊年底內測嘅時候10萬人排隊,今年4月正式上線,據報道已經有超過20萬創作者用緊。
佢同其他AI影片工具最大嘅分別在於,佢做嘅唔係一個5-10秒嘅單鏡頭。佢由一句話開始,幫你做出一條1分鐘以上嘅敍事動畫。
點樣做到?OiiOii搞咗一個7人虛擬動畫團隊。每一個都係一個專業化嘅AI Agent,各司其職:

回到公式:OiiOii做嘅嘢,係用7個AI員工將S、U、D、C四個變量同時拉高。 你嘅創作能力唔夠?編劇同分鏡師幫你。你唔識保持一致性?角色設計師同藝術總監幫你。工具唔好用?一句話就可以啟動成條生產線。
呢套打法比單純將工具整得更易用要狠得多。其他工具係要你少做啲嘢,OiiOii係直接幫你做曬。
實測:一句話到成片嘅完整流程
講到呢度可能有點抽象,直接睇我嘅實測。
我俾OiiOii輸入咗一句話:「一對戀人喺星空下嘅天文館裏面起舞,周圍嘅場景好似走入咗一幅油畫,色彩夢幻,充滿唔真實嘅浪漫感。」

呢句話嘅靈感係《La La Land》裏面兩個場景嘅混合。一個係Mia同Sebastian喺洛杉磯天文館裏面懸浮起舞嗰段星空。另一個係片尾兩人在酒吧重逢之後,腦海裏面想像嗰段「如果當初我哋一齊」嘅幻想片段,視覺上好似直接走入咗一幅畫。我想用呢兩個畫面嘅意境做底色,睇下OiiOii能唔能夠延展出一個點樣嘅新故事。
然後就發生咗一件幾得意嘅事。
下面拆開講每一步。
藝術總監接單,編劇寫劇本
輸入咗嗰句話之後,藝術總監先接單,提取咗核心元素:星空天文館、起舞嘅戀人、油畫質感、夢幻浪漫。然後編劇Agent自動生成咗一個完整故事。
兩個角色: 陸星河(28歲天體物理研究員,理性主義者)同林夢影(26歲,感性嘅藝術靈魂)。故事發生喺一個即將關閉嘅天文館裏面,講嘅係理性同感性嘅碰撞同和解。
我只係講咗一句說話,佢就俾我寫咗一個有人物弧光嘅完整劇本。

角色設計師鎖定外觀
角色設計師根據劇本為兩個角色生成咗主圖同三視圖概念圖。呢一步嘅意義係鎖定角色外觀,確保後面19個分鏡裏面角色唔會變樣。

場景設計師搭建4個場景
場景設計師搭建咗4個場景,每個場景都有多角度視圖:
星語天文館主放映廳(常規態) 天文館設備維修室 天文館生鏽天台 夢幻油畫星空大廳(極光態)
多角度視圖嘅意義同角色三視圖一樣:確保唔同鏡頭裏面同一個場景睇起嚟一致。

分鏡師拆出19個專業分鏡
然後係重頭戲。分鏡師將成個故事拆成19個分鏡。
每個分鏡都有專業嘅鏡頭語言:medium shot、wide shot、close-up、Dutch angle、俯拍,運鏡方向、氛圍光影全部寫好。分鏡師仲俾咗監修思路,例如喺高潮段落特意增加咗天象儀啟動時「機械咆哮」同「光影狂歡」嘅細節銜接,避免角色喺流動光影中產生空間瞬移嘅感覺。

生成影片 + 音效 + 合成
分鏡確認之後,動畫師開始逐個分鏡生成影片。用嘅係Seedance 2.0模型,Pro模式,可以揀720p或480p。

影片生成完之後,音效工程師用Suno生成咗背景音樂,自動匹配敍事節奏。

最後藝術總監將所有素材合成為最終影片,可以下載720p或1080p高清版。

全流程總覽
由一句話到成片,成個工作流程係咁樣:

對照公式睇下呢個過程:

我嘅S幾乎係零,但D同C都被Agent拉到我自己寫要花成日嘅水平。
分鏡三板斧:想做得更好,工具唔會阻你
上面係全自動模式嘅效果。但OiiOii真正令我覺得有趣嘅,係佢喺自動化之外仲保留咗精確控制嘅能力。
第一板斧:自動化分鏡,唔使周圍揾提示詞喇
用過AI影片工具嘅人都知,最痛苦嘅唔係等生成,而係寫提示詞。一條30秒嘅片拆成6個鏡頭,每個鏡頭寫一段詳細嘅英文提示詞,齋呢步就要磨一兩個鐘。
OiiOii嘅做法係:你唔使寫。編劇Agent寫劇本,分鏡師Agent拆鏡頭寫提示詞,全自動。
按我理解,其實係因為OiiOii對呢啲影視製作工作流程中唔同角色嘅技能,以及各類AI模型嘅能力有充足嘅領域認知,所以佢哋將呢個變成一個類似skill嘅嘢,植入咗喺影片創作嘅工作流程入面。
第二板斧:自由畫布模式,由參考圖到成片嘅可控玩法
自動分鏡夠曬省心,但如果你心裏面已經有一個具體嘅視覺參考呢?例如想復刻某個B站爆款嘅風格。
呢個就係自由畫布模式嘅價值。撳入任何一個分鏡,你會見到分段式嘅提示詞,清楚分成畫面描述、角色動作、鏡頭運動、氛圍光影幾個模組。Agent將底牌全部攤出嚟。覺得角色表情唔啱?改表情嗰欄。覺得鏡頭太遠?改鏡頭運動嗰欄。
畫布模式支援三種操作方式:
全自動:完全交給Agent,你只負責審片 半自動:俾一張圖,話俾Agent知你想要乜 手搓:自己寫提示詞,完全手動控制
AI影片工具最實際嘅應用場景之一,就係復刻爆款。我決定用OiiOii試下呢件事。
揀咗B站最近最Hit嘅「地牢酒館」系列——第一視角入地牢小酒館,每集嚟一個奇怪生物飲酒,互動又奇怪又好笑。單集543萬播放、32萬讚,係2026年AI影片賽道最值得研究嘅爆款樣本之一。

我做咗一個改編:將酒館裏面嘅客人換成街頭霸王嘅角色,睇下OiiOii能唔能夠保留原作風格嘅基礎上,做出新故事。
首先要揀情緒關鍵詞。OiiOii俾咗衝突、浪漫、恐怖、搞笑、慾望幾個選項,每個都對應唔同嘅敍事路徑。地牢酒館嘅精髓係荒誕反應,所以我揀咗「搞笑」。

然後遇到咗一個小插曲。直接輸入「街頭霸王角色嚟酒館」會被版權檢測攔截。我轉成原創設定描述(紅頭巾武術家、巨型摔角手、綠皮叢林戰士呢類),就過咗。其實呢樣係好事,原創設定比直接借用IP更適合做長期內容。
跟住角色設計師為5個角色都做咗主圖加三視圖,每個角色之間風格統一,但形象有明顯差異。

分鏡師拆咗5個鏡頭,每個角色一段互動。提示詞嘅精細程度令我有啲驚訝,精確到0-2秒、2-4秒、4-7秒嘅動作分解,連「金幣跌落枱嘅反彈路徑」呢啲細節都有寫。

影片生成階段,5個分鏡並行渲染,大約5-6分鐘全部出曬。最後合成嘅影片比我預想中好,第一視角嘅代入感同原作好似,角色互動亦有荒誕喜劇嘅感覺。
成個過程冇手寫過一個英文提示詞。我只係做咗三樣嘢:寫一段中文故事描述、揀情緒關鍵詞、改咗幾句被版權攔截嘅描述。剩下嘅全部係Agent做。
第三板斧:將影片生成嘅黑盒展開
呢個功能係我覺得OiiOii分鏡能力最強嘅地方,亦係99%嘅用戶冇留意到。
傳統AI影片工具嘅體驗係:你寫一段提示詞,幾分鐘後吐出一條5秒嘅片。中間發生咗乜嘢、畫面點樣由開頭變到結尾、想改某一格點改,你都唔知。由提示詞直接到影片,係一個黑盒。
OiiOii將呢個黑盒拆開咗。
每個鏡頭其實係由多張關鍵格構成嘅。 你可以對成個鏡頭做整體調整——改提示詞、換模型、換畫布比例,令成段畫面跟住變。

亦可以展開佢,對鏡頭裏面任意一張關鍵格單獨修改。

影片節奏嘅每一個變化——動作嘅起勢同完成、鏡頭嘅推近同拉遠、情緒嘅轉折——都係由呢啲關鍵格嘅差異決定。可以調每一格,就代表你可以掌握影片嘅每一秒。
反過來都得,由現有嘅分鏡裏面任意揀幾個,組合成一段新影片。
你對影片嘅控制精細度,由成個鏡頭變成一格一格。 唔滿意唔使重新做成個鏡頭,只改唔滿意嗰一小段就得。
呢個背後仲有一個成日俾人忽略嘅好處:省錢。 AI影片模型而家真係幾貴,一個高清鏡頭生成成本幾蚊到十幾蚊不等,60秒嘅敍事動畫閒閒地幾十蚊起。如果跟傳統工具嘅做法,一個唔滿意就重新做成個鏡頭,廢鏡頭嘅錢夠你再做半套片。分鏡令創作過程專業嘅同時,亦令執行節奏同最終成本變得可控——呢個其實係普通人可以持續用AI做影片嘅前提。
用公式嘅語言講:畫布模式同鏡頭拆分,令有能力嘅創作者可以主動拉高S同D呢兩個變量。 全自動已經俾咗一個唔錯嘅底線,想做得更好,工具亦唔會阻你條路。
回到公式
AI影片成片質量 = M × (S + U) × (D + C)
OiiOii冇喺M(模型)上做到獨家優勢,Seedance 2.0其他工具都可以用。但佢用7個專業化嘅AI Agent,同時拉高咗U、D、C三個變量,仲幫你補咗S。呢個係M拉唔鬱之後,最聰明嘅破局方式。
我有一個判斷:AI影片工具正在經歷同雲端運算一樣嘅演進路徑——由「賣原始算力」走向「賣完整服務」。 Seedance、Kling、Veo呢啲模型好似雲端運算早期嘅IaaS,俾你一部虛擬機,剩下全靠你;OiiOii呢種係PaaS甚至SaaS,成條生產線開箱即用。呢條路行得通嘅話,OiiOii唔會係一個AI影片工具,佢會係第一個AI影片公司。
講真,OiiOii唔係萬能。如果你要做真人短劇、需要精確嘅舞蹈動作控制,或者做系列動畫需要跨集保持角色一致,目前可能仲未係佢最擅長嘅場景。
但如果你想做單集動畫、MV、品牌宣傳片、故事短片,特別係你有好故事但唔想花大量時間手搓提示詞,OiiOii嘅分鏡能力確實可以幫你慳返好多工夫,同時令成片質素上一個台階。
150幾種風格可以揀,由日漫到3D Pixar風格到真人風格都有。接入咗滿血版Seedance 2.0之後,畫面質素亦確實比以前好咗好多。
作為一個睇咗2000幾部電影嘅人,我一直覺得AI影片工具缺嘅唔係畫面質素,而係對創作流程嘅尊重。電影工業花咗一百年建立嘅分工體系,由編劇到分鏡師到攝影到剪接,每個環節都有專業嘅人做專業嘅事。
OiiOii可能係第一個認真將呢套邏輯搬入AI影片嘅產品。佢俾你嘅唔係一個萬能工具,而係一個團隊。你嘅位置係導演。
呢個方向我覺得係啱嘅。由而家開始,做影片比嘅唔係邊個手裏嘅模型更勁,而係邊個請得起更專業嘅AI員工。
最後講啲私人嘢。我大學時一直有個隱隱嘅電影夢,睇完《安妮荷爾》之後仲認真買過一本《認識電影》。

17年過去咗,我讀呢本書嘅狀態一直係由入門到放棄,我可能都係拍唔出嗰啲嘢。但我而家至少可以喺週末花半個鐘,叫OiiOii嘅7個AI員工幫我做一段能夠幫我表達諗法嘅嘢。
呢件事本身,我覺得幾浪漫。
傳送門:www.oiioii.tv
而家註冊唔使邀請碼,註冊就送積分,每日登入都有得拎。有興趣嘅可以自己試下,實際體驗下分鏡功能,會比睇文章更直觀。
前兩天看到B站百大up主LKs發了一期Pocket 4P評測的視頻,談了一個非常有趣的問題,叫做:買了博主同款設備,為什麼拍的還是不好看。
他給出了一個公式:
成片質量 = 相機參數(P) × (拍攝人變量(S) + 相機易用性(U)) × (環境因子(E) + 天氣因子(W))

意思是:相機參數再好,最終乘以的是你的技術和相機的易用性。設備只是乘數,人才是被乘數。同樣設備到了不同人手裏,出來的東西天差地別。
我看完之後蠻有感觸的,因為AI視頻領域正在發生完全一樣的事。
字節的Seedance 2.0、快手的Kling 3.0、谷歌的Veo 3.1,模型一個比一個強。曾經封神的Sora,現在都沒什麼人討論了。但你打開B站看看,用同樣模型做出來的視頻,質量差距大得離譜。有人做出來像電影片段,有人做出來像PPT配了動效。
其實和使用所有AI工具類似,當AI把基本的生成能力磨平之後,真正差異體現在領域知識上。比如所有人都能用AI Coding去做產品,但是做什麼產品,或者說知道一個好產品如何產生的人會能把這件事執行得更好。而以AI視頻來說,真正懂動畫和電影領域工作流,具備相應審美的人才能做出更好的作品。
所以,你常常會發現,當大家用的模型都一致了,真正制約生產力的瓶頸又回到了人身上。
而這次,在體驗了兩天的oiioii之後,我又產生了些不同的想法。先看一個成品。我只輸入了一個劇情的想法,OiiOii幫我做出來的4分多鐘的短片:
這是怎麼從一句話變成一部完整動畫的?接下來慢慢說。
一個AI視頻的質量公式
我自己拆了一個AI視頻的質量公式:

M(模型能力)這個變量,2026年已經在快速拉平。大家都能用Seedance 2.0,都能用Kling 3.0,畫面質量的差距在縮小。
真正拉開差距的,是S、U、D、C這四個變量。
而這四個變量,恰好就是大多數AI視頻工具不管的地方。它們給你一個強大的模型(M拉滿),然後把S、D、C全部甩給你。相當於給你一台頂配相機,但拍攝技術、構圖、找光全靠你自己。
我在豆瓣標記看過的影視劇超過2000部。自己從來沒拍過東西,但片子看多了,對一些導演的工作方式印象很深。
比如希區柯克,他出了名的要把每一個鏡頭都畫成詳細的分鏡稿才開拍。他到了片場經常覺得無聊。因為在他看來,電影在畫分鏡的時候就已經拍完了,剩下的只是執行。
分鏡決定的不是畫面好不好看,而是故事怎麼講、節奏怎麼走。 它掌控着觀眾的情緒走向。這就是公式裏D這個變量的份量。
直到我用了OiiOii,我覺得終於有一個AI視頻工具認真對待這件事了。
OiiOii:一句話僱7個AI員工
OiiOii是一個AI動畫創作工具,去年底內測的時候10萬人排隊,今年4月正式上線,據報道已有超過20萬創作者在用。
它跟其他AI視頻工具最大的區別在於,它做的不是一個5-10秒的單鏡頭。它從一句話開始,幫你做出一整部1分鐘以上的敍事動畫。
怎麼做到的?OiiOii搞了一個7人虛擬動畫團隊。每個人都是一個專業化的AI Agent,各司其職:

回到公式:OiiOii做的事情,是用7個AI員工把S、U、D、C四個變量同時拉高。 你的創作能力不夠?編劇和分鏡師幫你。你不會保持一致性?角色設計師和藝術總監幫你。工具不好用?一句話就能啓動整條流水線。
這套打法比單純把工具做得更易用要狠得多。別的工具是讓你少幹一點活,OiiOii是直接幫你幹完。
實測:一句話到成片的完整流程
說到這裏可能有點抽象,直接看我的實測。
我給OiiOii輸入了一句話:「一對戀人在星空下的天文館裏起舞,周圍的場景像走進了一幅油畫,色彩夢幻,充滿不真實的浪漫感。」

這句話的靈感是《La La Land》裏兩個場景的混合。一個是Mia和Sebastian在洛杉磯天文館裏懸浮起舞的那段星空。另一個是片尾兩人在酒吧重逢後,腦海裏想象的那段「如果當初我們在一起」的幻想片段,視覺上像直接走進了一幅畫。我想用這兩個畫面的意境做底色,看OiiOii能延展出一個什麼樣的新故事。
然後就發生了一件蠻有意思的事。
下面拆開說每一步。
藝術總監接單,編劇寫劇本
輸入那句話之後,藝術總監先接單,提取了核心要素:星空天文館、起舞的戀人、油畫質感、夢幻浪漫。然後編劇Agent自動生成了一個完整故事。
兩個角色: 陸星河(28歲天體物理研究員,理性主義者)和林夢影(26歲,感性的藝術靈魂)。故事發生在一個即將閉館的天文館裏,講的是理性與感性的碰撞和和解。
我只說了一句話,它給我寫了一個有人物弧光的完整劇本。

角色設計師鎖定外觀
角色設計師根據劇本為兩個角色生成了主圖和三視圖概念圖。這一步的意義是鎖定角色外觀,確保後面19個分鏡裏角色不會變臉。

場景設計師搭建4個場景
場景設計師搭建了4個場景,每個場景都有多角度視圖:
星語天文館主放映廳(常規態) 天文館設備維修室 天文館生鏽天台 夢幻油畫星空大廳(極光態)
多角度視圖的意義和角色三視圖一樣:保證不同鏡頭裏同一個場景看起來是一致的。

分鏡師拆出19個專業分鏡
然後是重頭戲。分鏡師把整個故事拆成了19個分鏡。
每個分鏡都有專業的鏡頭語言:medium shot、wide shot、close-up、Dutch angle、俯拍,運鏡方向、氛圍光影全部寫好了。分鏡師還給了監修思路,比如在高潮段落特意增加了天象儀啓動時「機械咆哮」與「光影狂歡」的細節銜接,避免角色在流動光影中產生空間瞬移感。

生成視頻 + 音效 + 合成
分鏡確認後,動畫師開始逐個分鏡生成視頻。用的是Seedance 2.0模型,Pro模式,可以選720p或480p。

視頻生成完之後,音效工程師用Suno生成了背景音樂,自動匹配敍事節奏。

最後藝術總監把所有素材合成為最終視頻,可以下載720p或1080p高清版。

全流程總覽
從一句話到成片,整個工作流長這樣:

對照公式看一下這個過程:

我的S幾乎為零,但D和C都被Agent拉到了我自己寫要花一整天的水平。
分鏡三板斧:想做得更好,工具不擋路
上面是全自動模式的效果。但OiiOii真正讓我覺得有意思的,是它在自動化之外還保留了精確控制的能力。
第一板斧:自動化分鏡,不用再四處扒提示詞了
用過AI視頻工具的人都知道,最痛苦的不是等生成,是寫提示詞。一個30秒的視頻拆成6個鏡頭,每個鏡頭寫一段詳細的英文提示詞,光這一步就得磨一兩個小時。
OiiOii的做法是:你不用寫。編劇Agent寫劇本,分鏡師Agent拆鏡頭寫提示詞,全自動。
按我的理解,其實是因為OiiOii對這些影視製作工作流中不同角色的技能以及各類AI模型的能力有充足的領域認知,所以,他們把這變成了一個類似skill的東西,植入在了視頻創作的工作流中。
第二板斧:自由畫布模式,從參考圖到成片的可控玩法
自動分鏡夠省心,但如果你心裏已經有了一個具體的視覺參考呢?比如想復刻某個B站爆款的風格。
這就是自由畫布模式的價值。點開任意一個分鏡,你會看到分段式的提示詞,清楚地分成畫面描述、角色動作、鏡頭運動、氛圍光影幾個模塊。Agent把底牌全露出來了。覺得角色表情不對?改表情那一欄。覺得鏡頭太遠?改鏡頭運動那一欄。
畫布模式支持三種操作方式:
全自動:完全交給Agent,你只管審片 半自動:投餵一張圖,告訴Agent你想要什麼 手搓:自己寫提示詞,完全手動控制
AI視頻工具最實際的應用場景之一,就是復刻爆款。我決定拿OiiOii測一下這件事。
挑的是B站最近最火的「地牢酒館」系列——第一視角進入地牢小酒館,每集來一個奇怪生物喝酒,互動詭異又好笑。單集543萬播放、32萬點贊,是2026年AI視頻賽道最值得研究的爆款樣本之一。

我做了一個改編:把酒館裏的客人換成街頭霸王裏的角色,看OiiOii能不能在保留原作風格的基礎上,做出新的故事。
先要選情緒關鍵詞。OiiOii給了衝突、浪漫、恐怖、搞笑、慾望幾個選項,每個都對應不同的敍事路徑。地牢酒館的精髓是荒誕反應,所以我選了「搞笑」。

然後遇到了一個小插曲。直接輸入「街頭霸王角色來酒館」會被版權檢測攔截。我換成原創設定描述(紅頭巾武術家、巨型摔角手、綠皮叢林戰士這類),就過了。這其實是好事,原創設定比直接借用IP更適合做長期內容。
接下來角色設計師給5個角色都做了主圖+三視圖,每個角色之間風格統一,但形象有明顯差異。

分鏡師拆了5個鏡頭,每個角色一段互動。提示詞的顆粒度讓我有點驚訝,精確到0-2秒、2-4秒、4-7秒的動作分解,連「金幣掉桌上的反彈路徑」這種細節都寫了。

視頻生成階段,5個分鏡並行渲染,差不多5-6分鐘全部出來。最後合成的視頻比我預想的好,第一視角的代入感和原作很像,角色互動也有荒誕喜劇的感覺。
整個過程沒有手寫一個英文提示詞。我只做了三件事:寫一段中文故事描述、選情緒關鍵詞、改了幾句被版權攔截的描述。剩下的全是Agent在做。
第三板斧:把視頻生成的黑盒展開
這個功能是我覺得OiiOii分鏡能力最強的地方,也是99%的用戶沒注意到的。
傳統AI視頻工具的體驗是:你寫一段提示詞,幾分鐘後吐出一個5秒的視頻。中間發生了什麼、畫面怎麼從開頭變到結尾、想改某一幀怎麼改,你都不知道。從提示詞直接到視頻,是個黑盒。
OiiOii把這個黑盒拆開了。
每個鏡頭其實是由多張關鍵幀構成的。 你可以對整個鏡頭做整體調整——改提示詞、換模型、換畫布比例,讓整段畫面跟着變。

也可以展開它,對鏡頭裏任意一張關鍵幀單獨修改。

視頻節奏的每一個變化——動作的起勢和完成、鏡頭的推近和拉遠、情緒的轉折——都是由這些關鍵幀的差異決定的。能調每一幀,就意味着你能掌握視頻的每一秒。
反過來也行,從已有的分鏡裏任意勾選幾個,組合成一段新的視頻。
你對視頻的控制顆粒度,從一整個鏡頭變成了一幀一幀。 不滿意不用重來整個鏡頭,只改不滿意的那一小段。
這背後還有一個常被忽略的好處:省錢。 AI視頻模型現在真挺貴的,一個高清鏡頭生成成本幾塊到十幾塊不等,60秒的敍事動畫動輒幾十塊起步。如果按傳統工具的方式,一個不滿意就重做整個鏡頭,廢鏡頭的錢夠你再做半部片子。分鏡讓創作過程專業的同時,也讓執行節奏和最終成本變得可控——這其實是普通人能持續用AI做視頻的前提。
用公式的語言說:畫布模式和鏡頭拆分,讓有能力的創作者可以主動拉高S和D這兩個變量。 全自動已經給了一個不錯的底線,想做得更好,工具也不會擋你的路。
回到公式
AI視頻成片質量 = M × (S + U) × (D + C)
OiiOii沒有在M(模型)上做出獨家優勢,Seedance 2.0別的工具也能用。但它用7個專業化的AI Agent,同時拉高了U、D、C三個變量,還幫你補了S。這是M拉不動了之後,最聰明的破局方式。
我有一個判斷:AI視頻工具正在經歷和雲計算一樣的演進路徑——從「賣原始算力」走向「賣完整服務」。 Seedance、Kling、Veo這些模型像是雲計算早期的IaaS,給你一台虛擬機,剩下全靠你;OiiOii這種是PaaS甚至SaaS,整套生產線開箱即用。這條路走通的話,OiiOii不會是一個AI視頻工具,它會是第一個AI視頻公司。
說實話,OiiOii不是萬能的。如果你要做真人短劇、需要精確的舞蹈動作控制,或者做系列番劇需要跨集保持角色一致,目前可能還不是它最擅長的場景。
但如果你想做單集動畫、MV、品牌宣傳片、故事短片,特別是你有好故事但不想花大量時間手搓提示詞,OiiOii的分鏡能力確實能幫你省掉很多工作,同時讓成片質量上一個台階。
150+種風格可以選,從日漫到3D皮克斯風到真人風格都有。接入了滿血版Seedance 2.0之後,畫面質量也確實比之前好了不少。
作為一個看了2000多部電影的人,我一直覺得AI視頻工具缺的不是畫面質量,而是對創作流程的尊重。電影工業花了一百年建立起來的分工體系,從編劇到分鏡師到攝影到剪輯,每個環節都有專業的人在做專業的事。
OiiOii可能是第一個認真把這套邏輯搬到AI視頻裏的產品。它給你的不是一個萬能工具,是一個團隊。你的位置是導演。
這個方向我覺得是對的。從今往後,做視頻拼的不是誰手裏的模型更強,是誰僱得起更專業的AI員工。
最後說點私人的。我大學時一直有個隱隱的電影夢,看完《安妮霍爾》之後還認真買過一本《認識電影》。

17年過去了,我讀這本書的狀態一直是從入門到放棄,我可能還是拍不出那種東西。但我現在至少可以在週末花半小時,讓OiiOii的7個AI員工幫我做出一段能幫助我表達想法的東西。
這件事本身,我覺得挺浪漫的。
傳送門:www.oiioii.tv
目前註冊不需要邀請碼了,註冊就送積分,每天登錄也能領。感興趣的可以自己試試,實際體驗一下分鏡功能,會比看文章更直觀。