337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

當(dāng)業(yè)界熱議Seedance的“導(dǎo)演感”時(shí),Vidu已登頂全球第一

0
分享至



解析Vidu Q3:AI視頻生成下半場(chǎng),拼的是“可交付”。

作者|王藝

編輯|王博

凌晨一點(diǎn),剪輯時(shí)間線(xiàn)還在往右延長(zhǎng)。屏幕里的人物說(shuō)著臺(tái)詞,嘴型卻像慢了半拍;下一鏡切到側(cè)臉,五官又變了一點(diǎn);再往后,動(dòng)作流暢了,但情緒不連貫——像是同一個(gè)演員在不同片場(chǎng)、不同天氣里拍出來(lái)的素材,被硬拼成了一條“故事”。

這是AI視頻創(chuàng)作者雪佬BOT(下文簡(jiǎn)稱(chēng)“雪佬”)在創(chuàng)作中遇到的真實(shí)問(wèn)題。2023年,他進(jìn)入AIGC視頻領(lǐng)域,創(chuàng)作出了《無(wú)盡之境》《等待安娜》等作品。

事實(shí)上,過(guò)去一年,AI 視頻模型在“效果”維度的進(jìn)步已經(jīng)非常明顯。以近期爆火的 Seedance 2.0 為例,其在單鏡頭表現(xiàn)力、情緒張力和畫(huà)面完成度上的提升,讓不少創(chuàng)作者第一次感受到“AI 視頻終于好看了”。但在真實(shí)創(chuàng)作中,雪佬發(fā)現(xiàn),效果的突破,并沒(méi)有自動(dòng)解決制作層面的核心難題

和他一樣遇到類(lèi)似問(wèn)題的,還有知名AI漫劇《749密檔:滇西石像生》的創(chuàng)作者幻夢(mèng)。

“一部劇的時(shí)長(zhǎng)是60-120分鐘,每分鐘需要三四十個(gè)鏡頭;一段AI生成的素材是5-10秒,每個(gè)鏡頭最多也就用3-5秒。這也就意味著,AI短劇是由很多個(gè)AI生成的片段拼接而成的,素材與素材之間的的人物、道具、場(chǎng)景必須是連貫的。”幻夢(mèng)說(shuō),“但是現(xiàn)在AI最大的問(wèn)題是,一張圖生成一個(gè)視頻,每張圖相互是獨(dú)立的,生成的視頻中人物、道具、場(chǎng)景是割裂的,沒(méi)有相關(guān)性。”

雪佬和幻夢(mèng)的困境,反映了當(dāng)下AI生成視頻最大的痛點(diǎn):一致性差。

在大語(yǔ)言模型和多模態(tài)模型發(fā)展到“能看、能聽(tīng)、能說(shuō)”的今天,創(chuàng)意和鏡頭點(diǎn)子幾乎不再稀缺:你可以在十分鐘里寫(xiě)完一個(gè)世界觀(guān),半小時(shí)里生成一套角色設(shè)定,幾個(gè)小時(shí)里堆出一堆“看起來(lái)很像電影”的片段。

但真正困住創(chuàng)作者的,往往不是靈感,而是反復(fù)消耗時(shí)間與預(yù)算都很難穩(wěn)定解決的硬問(wèn)題:人物與場(chǎng)景一致性、聲畫(huà)同步與口型、鏡頭節(jié)奏與多機(jī)位連貫性。最終導(dǎo)向的是“能不能交付”

也正因?yàn)檫@些硬問(wèn)題,導(dǎo)致了AI視頻在“供給側(cè)”層出不窮,在“需求側(cè)”卻出現(xiàn)一種分化——能爆的很多,能持續(xù)賺錢(qián)的并不多。

率先跑出來(lái)的內(nèi)容形態(tài)之一,是AI漫劇:它有明確的更新頻率、清晰的分發(fā)渠道,也有更接近流水線(xiàn)的回款邏輯。巨量引擎數(shù)據(jù)顯示,2025年上半年漫劇的供給量以83%的復(fù)合增長(zhǎng)率擴(kuò)容,播放量、點(diǎn)贊量分別實(shí)現(xiàn)92%、105%的復(fù)合增長(zhǎng)。

近期各種AI視頻生成模型都在不斷迭代,在和一些創(chuàng)作者交流后,我們發(fā)現(xiàn)在AI漫劇、短劇領(lǐng)域,生數(shù)科技最近發(fā)布的Vidu Q3已被創(chuàng)作者廣泛應(yīng)用。

可以說(shuō)Vidu Q3是“為劇而生”:它通過(guò)一次生成把畫(huà)面與聲音合到一起,把時(shí)長(zhǎng)推到可直接應(yīng)用的段落粒度(16秒),還可實(shí)現(xiàn)多人多語(yǔ)種對(duì)話(huà);自動(dòng)根據(jù)畫(huà)面內(nèi)容自由切換運(yùn)鏡,解決了畫(huà)面文字“鬼畫(huà)符”的問(wèn)題的同時(shí),保持了較高的一致性。

在國(guó)際權(quán)威AI基準(zhǔn)測(cè)試機(jī)構(gòu)Artificial Analysis 最新公布的文生視頻模型榜單中,Vidu Q3排名全球第一,超越馬斯克xAI Grok,Runway Gen-4.5 ,Google Veo3.1和 OpenAI Sora 2等一眾廠(chǎng)商。


Text to Video Leaderboard,圖源:Artificial Analysis

當(dāng) Seedance 2.0 在效果層面持續(xù)出圈、刷新創(chuàng)作者對(duì)“好看”的預(yù)期,Vidu Q3 則在權(quán)威評(píng)測(cè)與真實(shí)生產(chǎn)中,給出了另一種答案:如何把 AI 視頻從“素材生成”,推進(jìn)到“可交付的敘事內(nèi)容單元”。

「甲子光年」認(rèn)為,這種并行出現(xiàn)的“雙重領(lǐng)先”并非偶然,而是一個(gè)清晰信號(hào)——中國(guó) AI 視頻大模型,正在效果上限與交付能力兩條路徑上同時(shí)進(jìn)入全球第一梯隊(duì)

1.聲畫(huà)同出、更長(zhǎng)時(shí)長(zhǎng)、更高可控

如果只按功能表看,每家視頻生成模型都有一串“更清晰、更穩(wěn)定、更真實(shí)”的表述。但站在生產(chǎn)的視角,視頻生成模型的評(píng)判核心只有四個(gè)指標(biāo):可用率、返工率、交付周期、協(xié)作分工

Vidu Q3 的賣(mài)點(diǎn),恰恰是圍繞這四個(gè)指標(biāo)展開(kāi)。

在過(guò)去的AI短劇、漫劇生產(chǎn)里,“畫(huà)面生成”與“聲音系統(tǒng)”往往是割裂的:畫(huà)面先做出來(lái),再真人配音,再對(duì)口型,再補(bǔ)音效與氛圍。任何一個(gè)鏡頭有問(wèn)題需要重抽,整條鏈路跟著返工。

Vidu Q3的核心敘事之一,是強(qiáng)調(diào)聲畫(huà)同出、口型同步和多人對(duì)話(huà),讓“配音+對(duì)口型+補(bǔ)音效”從必選項(xiàng)變成可選項(xiàng),顯著降低了返工的連鎖反應(yīng)。

例如,輸入一張女生站在橋上的照片和以下提示詞“The girl introduces the bridge behind her:The bridge behind me is called Happiness Bridge.Tourists come here every day, lining up to take pictures.”



Vidu Q3生成的視頻不僅實(shí)現(xiàn)了口型與聲音的精準(zhǔn)同步,人物面部肌肉的運(yùn)動(dòng)細(xì)節(jié)也高度真實(shí),情緒表達(dá)飽滿(mǎn)而自然。

在AI視頻生成領(lǐng)域,有相當(dāng)多的模型在單人對(duì)話(huà)領(lǐng)域已經(jīng)做得比較成熟,但一旦涉及多人對(duì)話(huà)場(chǎng)景,問(wèn)題就來(lái)了——

  • 首先是音頻綁定混亂:兩段音頻輸入時(shí),AI經(jīng)常讓所有人一起動(dòng)嘴,像“合唱團(tuán)”而非對(duì)話(huà);
  • 其次是指令跟隨失效:生成的視頻可能忽略文本提示,比如“A點(diǎn)頭,B搖頭”;
  • 最后是長(zhǎng)視頻易崩壞:現(xiàn)有技術(shù)只能生成幾秒片段,無(wú)法支持電影或者直播等實(shí)際應(yīng)用。

Vidu Q3很好地解決了上述問(wèn)題。不僅在多人對(duì)話(huà)方面實(shí)現(xiàn)了口型和指令跟隨的一致,而且還支持中、英、日三種語(yǔ)言,極大拓寬了視頻生成的內(nèi)容維度。

提示詞:Him:“Are we just killing time?”

Her:“Maybe. But at least we’re doing it together.”

提示詞:

My mother used to say, give your whole heart to what you do. Work with focus. Laugh without holding back.

And meet every meal with the gratitude you’d feel at a last feast.

Vidu Q3完美生成了交談的視頻,不僅聲音、口型匹配精準(zhǔn),而且人物動(dòng)作、形態(tài)也很自然。

再比如,基于同一張圖片輸入,要求 Vidu Q3 分別以中文、英文和日文生成小男孩說(shuō)“我希望長(zhǎng)大后,成為一個(gè)非常厲害的人”的視頻。最終生成的多語(yǔ)言版本中,口型與語(yǔ)音高度匹配,發(fā)音自然、地道。



提示詞:圖中的男孩用中文說(shuō):我希望長(zhǎng)大后,成為一個(gè)非常厲害的人。無(wú)bgm配音;

提示詞:圖中的男孩用英文說(shuō):I hope that when I grow up, I will become a truly remarkable person. 無(wú)bgm配音;

提示詞:圖中的男孩用日語(yǔ)說(shuō):大人になったら、とてもすごい人になりたいです。無(wú)bgm配音。

盡管聲畫(huà)同出和多人對(duì)話(huà)解決了AI生成視頻單鏡頭反復(fù)修改的大問(wèn)題,但是對(duì)內(nèi)容工業(yè)而言,最稀缺的不是“一個(gè)鏡頭”,而是一個(gè)能承載情緒推進(jìn)的段落單元。

幻夢(mèng)告訴「甲子光年」,在Vidu Q3出來(lái)之前,AI視頻生成模型出來(lái)的東西大概是5-10秒,不能叫做“一個(gè)視頻”,更多是“視頻素材”:“現(xiàn)在生成視頻基本上是以一張圖片為基礎(chǔ),去讓這張圖片動(dòng)起來(lái)形成的視頻,生成的每段素材不連貫、很割裂。”

而Q3的視頻生成長(zhǎng)度,達(dá)到了16秒,這不僅是全球首個(gè)支持16秒音視頻直出的模型,而且至少把單位從“碎片”往“段落”推了一步。

“Vidu Q3能實(shí)現(xiàn)10-16s視頻素材,一次出好幾個(gè)連貫的鏡頭,雖然現(xiàn)在主要是文生視頻和圖生視頻,但是我估計(jì)多參功能出來(lái)之后就會(huì)更完善,跟Sora 2比較像,能大幅提高制作效率。”幻夢(mèng)說(shuō)。

Vidu Q3單次生成16秒長(zhǎng)度的視頻可以讓內(nèi)容能進(jìn)入剪輯邏輯——時(shí)間更長(zhǎng),意味著即使中間有崩壞畫(huà)面,也更有空間通過(guò)剪輯規(guī)避,并保留可用段落。

“生成視頻時(shí)間長(zhǎng)的話(huà),即使中間有一些崩壞的畫(huà)面,也可以剪輯掉;另外,片段時(shí)間越長(zhǎng),表現(xiàn)出來(lái)的東西越多。如果你寫(xiě)一個(gè)非常復(fù)雜的提示詞,5秒的片段肯定是表現(xiàn)不出來(lái)你想要的畫(huà)面的。”雪佬說(shuō)。

我們也嘗試將一張“街霸游戲”圖片輸入給Vidu Q3,Q3為我們生成了長(zhǎng)達(dá)16秒的媲美游戲CG動(dòng)畫(huà)的視頻。



輸入圖片和提示詞:超高速打斗,特效光效亂飛,兩個(gè)格斗家高速對(duì)打,拳拳到肉,飛檐走壁,快到產(chǎn)生殘影

此外,AI視頻最容易“露餡”的地方,是鏡頭之間:生成的畫(huà)面鏡頭較為單一、切鏡邏輯不成立、景別變化不服務(wù)敘事、人物關(guān)系在鏡頭切換時(shí)斷裂,更多還是通過(guò)后期人工進(jìn)行剪輯拼接。

Vidu Q3把“鏡頭控制/切鏡”放到重要位置,核心訴求是讓模型輸出更接近“可直接應(yīng)用的鏡頭組”,可以根據(jù)劇情自動(dòng)生成匹配的分鏡,讓畫(huà)面更引人入勝。雪佬告訴「甲子光年」,他之前的創(chuàng)作習(xí)慣是用Gemini寫(xiě)好提示詞后,通過(guò)Nano Banana生成首尾幀圖片,然后把圖片喂給視頻生成模型,這樣才能生成一個(gè)連貫的鏡頭。但是Vidu Q3出來(lái)之后,他省略了這一步,簡(jiǎn)單地輸入提示詞或者上傳一張圖片,Vidu就能輸出包含遠(yuǎn)、中、近景的、鏡頭切換自然、敘事連貫的鏡頭。

“說(shuō)實(shí)話(huà),之前谷歌推出Veo 3的時(shí)候,我離開(kāi)過(guò)Vidu一段時(shí)間,但是Vidu Q3推出后,我又回來(lái)了,因?yàn)槲冶容^喜歡做真人和寫(xiě)實(shí)的短片,我感覺(jué)Vidu Q3的生成的視頻人物演技非常逼真,臺(tái)詞比較自然,還有就是他的鏡頭,運(yùn)鏡和切鏡控制地非常好。還有就是Vidu Q3對(duì)提示存的遵循度很高,你寫(xiě)什么提示詞它都能表現(xiàn)出來(lái),有時(shí)候出來(lái)的效果比你的預(yù)期還高。”雪佬說(shuō)。

幻夢(mèng)也表示,Vidu Q3的大動(dòng)態(tài)是目前所有模型里做的最好的:“不僅動(dòng)作表現(xiàn)是最好的,而且真人效果和風(fēng)格也是最好的。”

這種高水平的運(yùn)鏡控制能力,其實(shí)得益于Vidu一直以來(lái)領(lǐng)先的“參考生圖”技術(shù)。

「甲子光年」推測(cè),Vidu Q3在模型訓(xùn)練中很可能深度內(nèi)化了影視語(yǔ)言,把“鏡頭內(nèi)調(diào)度”和“匹配剪輯”理解的足夠深,在生成之初,就為視頻片段規(guī)劃了一條連貫的視覺(jué)敘事路徑。這意味著,那些曾經(jīng)需要昂貴設(shè)備和專(zhuān)業(yè)團(tuán)隊(duì)才能實(shí)現(xiàn)的鏡頭語(yǔ)言,現(xiàn)在可能只需一段精準(zhǔn)的文字描述。

2.從單鏡頭到“一鏡到底”,Vidu Q3“為劇而生”

講“模型能力”,容易落入?yún)?shù)的堆砌;講“工作流”,才能看清它解決了哪些硬問(wèn)題。

AI漫劇生產(chǎn)的流程,大致可以分為“劇本創(chuàng)作—文生圖—圖生視頻—剪輯”四步。創(chuàng)作者會(huì)先確定漫劇的主題、核心情節(jié)和故事框架,借助AI工具生成劇本大綱后,再將劇本內(nèi)容轉(zhuǎn)化為具體的鏡頭語(yǔ)言,利用AI繪圖工具生成角色、場(chǎng)景和每個(gè)鏡頭的靜態(tài)畫(huà)面,然后再通過(guò)AI視頻生成工具轉(zhuǎn)化為動(dòng)態(tài)視頻,最后進(jìn)行剪輯。

而“AI漫劇”作為市場(chǎng)上流通的內(nèi)容形態(tài)之一,其落點(diǎn)最終還是商業(yè)化,還是需要考慮變現(xiàn)問(wèn)題。

醬油文化是《代管截教,忽悠出了一堆圣人》《魅魔叛主》《玩具店賣(mài)機(jī)甲我震驚全世界》等漫劇的出品方,其創(chuàng)始人黃浩南在去年11月的閱文漫劇大講堂《好故事,動(dòng)起來(lái)》活動(dòng)中,把AI漫劇的商業(yè)化拆成了三條路徑:投流原生/自然流量平臺(tái)分賬

“首先最直觀(guān)的收入就是投流,通過(guò)買(mǎi)流量,用戶(hù)過(guò)來(lái)充值,通過(guò)廣告模式變現(xiàn);第二種是原生模式,包括全渠道的自然流量模式,我的劇放上去給大家看,有人付錢(qián),有人不付錢(qián),不付錢(qián)的不用管,我們就看付錢(qián)的有多少人;第三種跟長(zhǎng)視頻合作,類(lèi)似于B站,把劇放給他們,進(jìn)行分賬;再后面,還有出海等模式。”黃浩南說(shuō)。

有行業(yè)專(zhuān)家表示,和所有的互聯(lián)網(wǎng)內(nèi)容形態(tài)一樣,AI漫劇也會(huì)經(jīng)歷產(chǎn)能井噴、內(nèi)容精品化和IP化階段。現(xiàn)階段由于市場(chǎng)需求太大,AI漫劇還以產(chǎn)量為主,誰(shuí)做的產(chǎn)量大誰(shuí)就是王者,而未來(lái),AI漫劇一定會(huì)轉(zhuǎn)入“內(nèi)容精品化”和“IP”化的競(jìng)爭(zhēng)。

而想要在這場(chǎng)競(jìng)爭(zhēng)中勝出,關(guān)鍵在于“有沒(méi)有一個(gè)好的故事”,這也就對(duì)模型的敘事連貫性提出了較高的要求。

“AI技術(shù)的核心是畫(huà)質(zhì)變得更好,讓觀(guān)眾越來(lái)越喜歡看它,而且弱化AI感,更真實(shí)。在技術(shù)方面提升之后,我個(gè)人認(rèn)為故事才是排第一的。Vidu這一點(diǎn)就做得非常棒,我們80%以上的作品是Vidu做的。黃浩南說(shuō)。

幻夢(mèng)也認(rèn)可了“故事”的價(jià)值。他表示,隨著AI短劇市場(chǎng)的不斷擴(kuò)大,對(duì)模型的“連續(xù)敘事”能力提出了越來(lái)越高的要求。以他那部抖音播放量4000萬(wàn)+、一度登上紅果榜單前三的漫劇《749密檔:滇西石像生》為例,他認(rèn)為內(nèi)容和劇情是吸引用戶(hù)觀(guān)看的關(guān)鍵。而在此部劇的制作中,Vidu做出了相當(dāng)大的貢獻(xiàn)。“這個(gè)劇的前半段基本上是用Vidu 2.0做的,后半段60%-70%是用Vidu Q1做的。”幻夢(mèng)說(shuō)。

而除了“敘事連貫性”,AI漫劇作為一種內(nèi)容工業(yè)產(chǎn)品,“是否能穩(wěn)定交付”也很重要。

一部AI漫劇制作完成后,就進(jìn)入了分發(fā)環(huán)節(jié)。具體的分發(fā)節(jié)奏是:先在流量平臺(tái)投流“洗一遍”,通常兩天洗完;洗量階段是付費(fèi)的,洗完轉(zhuǎn)免費(fèi);7天后,進(jìn)入各大平臺(tái)分發(fā),這是驗(yàn)證AI漫劇商業(yè)化效果的階段——B站能實(shí)現(xiàn)一周內(nèi)變現(xiàn),騰訊視頻則更長(zhǎng),周期能到兩個(gè)月。

當(dāng)一門(mén)生意的時(shí)間軸被梳理地如此清晰,模型的角色也就隨之改變:它必須服務(wù)于這條生產(chǎn)線(xiàn)的時(shí)間軸,而不是服務(wù)于發(fā)布會(huì)的demo。

這也是為什么“ARR”“當(dāng)月收入”這樣的指標(biāo)會(huì)進(jìn)入行業(yè)敘事的原因——商業(yè)化的壓力,正強(qiáng)迫所有人把問(wèn)題從“能不能生成”轉(zhuǎn)向“能不能規(guī)模化生產(chǎn)”。

快手最近披露,可靈AI在2025年12月當(dāng)月收入突破2000萬(wàn)美元、ARR達(dá)2.4億美元;英國(guó)初創(chuàng)公司Synthesia也憑借AI生成的虛擬視頻,獲得了博世、默克和SAP等大客戶(hù)的青睞,并在2025年4月實(shí)現(xiàn)了超過(guò)1億美元的ARR。

ARR并不只是一個(gè)收入數(shù)字,而是衡量SaaS廠(chǎng)商收入質(zhì)量與長(zhǎng)期健康度的核心指標(biāo),這一點(diǎn)與高度依賴(lài)項(xiàng)目制、一次性收入的模式有著本質(zhì)區(qū)別。

放在AI賽道來(lái)看,ARR的意義被進(jìn)一步放大:

它反映的不是“有沒(méi)有人試用”,而是是否存在真實(shí)、可持續(xù)的付費(fèi)需求,以及產(chǎn)品是否已經(jīng)進(jìn)入用戶(hù)的長(zhǎng)期工作流。從這一維度看,AI視頻是國(guó)內(nèi)少數(shù)已經(jīng)跑通付費(fèi)邏輯的AI應(yīng)用方向之一。

做 AI 視頻最容易陷入的誤區(qū)是:盯著某一次生成的驚艷畫(huà)面,然后把它當(dāng)成“能力證明”。但內(nèi)容產(chǎn)業(yè)最終拼的是復(fù)購(gòu):觀(guān)眾愿不愿意追、平臺(tái)敢不敢持續(xù)投。因此,一個(gè)很現(xiàn)實(shí)的判斷是:2026年的AI視頻爆款,未必更像真人劇,但一定更像內(nèi)容產(chǎn)品。更強(qiáng)的系列化、更明確的題材策略、更工程化的制作流程、更可衡量的商業(yè)邏輯,會(huì)成為新的門(mén)檻。從能生成到能交付,拼的不只是模型,而是可復(fù)用的生產(chǎn)流程、穩(wěn)定的品控體系和能跑通的商業(yè)閉環(huán)。

相較仍以算力消耗和試點(diǎn)合作為主的大語(yǔ)言模型,AI 視頻已經(jīng)出現(xiàn)了規(guī)模化、持續(xù)性的付費(fèi)使用行為,驗(yàn)證了賽道本身的商業(yè)健康度與可持續(xù)發(fā)展?jié)摿Α?/p>

雪佬對(duì)「甲子光年」表示,他現(xiàn)在最看重的就是模型對(duì)商單或短內(nèi)容的穩(wěn)定交付能力,而Vidu Q3的聲畫(huà)同出、長(zhǎng)視頻生成、更加仿真的人物形象生成能力等幫助他極大縮短了交付時(shí)間、提升了交付能力。

“我前兩天接了一個(gè)商單,是給《三體》做宣傳片,成片出來(lái)之后發(fā)到創(chuàng)作者群里,有人說(shuō)感覺(jué)就跟真人拍的一樣,人物表演和情緒遞進(jìn)都非常自然,沒(méi)有一點(diǎn)AI的味道了。”雪佬說(shuō)。

3.市場(chǎng)很卷,但各有千秋

過(guò)去這一年多,AI 視頻生成領(lǐng)域可以說(shuō)是神仙打架、遍地開(kāi)花。

Fortune Business Insights數(shù)據(jù)顯示,2025年全球人工智能視頻生成器市場(chǎng)規(guī)模為7.168億美元。預(yù)計(jì)該市場(chǎng)將從2026年的8.47億美元增長(zhǎng)到2034年的33.5億美元,預(yù)測(cè)期內(nèi)復(fù)合年增長(zhǎng)率(CAGR)為18.80%。

在強(qiáng)勁的市場(chǎng)需求的下,上至科技巨頭、下至創(chuàng)業(yè)公司,再到影視工作室,各路玩家都加入了這一賽道,馬不停蹄地卷畫(huà)質(zhì)、卷時(shí)長(zhǎng)、卷分辨率,工具推出了一個(gè)又一個(gè)、模型迭代了一版又一版。而大家似乎也看到了AI生成視頻在內(nèi)容和運(yùn)鏡上存在的問(wèn)題,開(kāi)始在音畫(huà)同步和敘事一致性上不斷發(fā)力。

比如,「甲子光年」觀(guān)察到,即夢(mèng)最新發(fā)布的Seedance 2.0模型就也把重點(diǎn)放在了音視頻聯(lián)合生成、音畫(huà)同步、運(yùn)鏡控制與敘事連貫性上;而Seko、Oii Oii、納米漫劇流水線(xiàn)等市場(chǎng)上的后起之秀產(chǎn)品也在聲畫(huà)同步和故事一致性上持續(xù)加碼、快速迭代,后勁十足。

以擬人化狐貍Nick靠在積雪的城市橋欄桿上的視頻為例,可以看到——Seedance 2.0在Nick閉眼的特寫(xiě)鏡頭上表現(xiàn)力較好;Vidu Q3不僅很好還原了提示詞中的“雪花落在鼻尖融化”這一鏡頭,而且生成的Nick皮毛紋理也是最清晰的,最后,結(jié)合視頻的效果,增加了對(duì)應(yīng)的bgm背景音,提升了整體視頻的完整度。

提示詞:Shot 1: 全景,擬人化狐貍 Nick 靠在積雪的城市橋欄桿上,身著棕色蓬松羽絨服、厚針織圍巾與手套,雪花飄落,雪花簌簌飄落的細(xì)碎聲響,皮毛和衣物沾雪,背景是冰封河面、覆雪摩天樓與暖光路燈,冷調(diào)柔光營(yíng)造冬日氛圍。遠(yuǎn)處城市街道隱約的車(chē)流聲,路燈旁偶爾的風(fēng)吹過(guò)欄桿的嗚咽聲,Nick 呼出的氣息凝成白霧時(shí)的輕微呵氣聲。

Shot 2: 特寫(xiě),Nick 的皮毛紋理清晰,雪花落在鼻尖融化,圍巾邊緣結(jié)著薄霜,爪子搭在冰涼的欄桿上,遠(yuǎn)處暖光路燈下傳來(lái)的零星行人腳步聲。Shot 3: 中景拉遠(yuǎn),Nick 望向冰封河面,身后城市建筑群的暖光與雪景形成冷暖對(duì)比,河面偶爾傳來(lái)冰塊碰撞的脆響。城市背景里的圣誕頌歌隱約旋律,寒風(fēng)掠過(guò)橋身的呼嘯聲,Nick 輕輕嘆氣的低沉聲線(xiàn)。

再來(lái)看一個(gè)短劇場(chǎng)景,可以看到,Seedance 2.0 在切鏡節(jié)奏上更為流暢,而 Vidu Q3 在人物情緒表達(dá)與情緒貼合度上表現(xiàn)更為到位。

提示詞:現(xiàn)代高層辦公室,冷灰色調(diào)搭配落地窗的自然光線(xiàn)。女主穿著黑色西裝,手肘撐在辦公桌托腮凝視鏡頭,眼神冷靜且有力量。鏡頭從正面鏡頭,切換到側(cè)面鏡頭,捕捉她手指輕敲桌面的細(xì)節(jié),她皺起眉頭,有點(diǎn)生氣,中文開(kāi)口說(shuō)道:“這就是這個(gè)星期的成果么?我不滿(mǎn)意,重新做吧。”背景加入鍵盤(pán)敲擊聲與窗外城市車(chē)流的環(huán)境音,營(yíng)造專(zhuān)業(yè)且略帶壓迫感的職場(chǎng)氛圍,無(wú)背景音樂(lè)。

再來(lái)看一段打斗場(chǎng)景(素材來(lái)源于網(wǎng)絡(luò))。可以看到,Seedance 2.0 的自動(dòng)分鏡銜接更加流暢,而 Vidu Q3 在黑紅火焰等特效的表現(xiàn)上更具張力。

提示詞:起始畫(huà)面中大量敵人涌向少女,少女瞬間展開(kāi)攻擊,使用武器與敵人劇烈撞擊,鏡頭隨著攻擊震顫,能量炸開(kāi)。少女速度之快拉出殘影,鏡頭難以捕捉,少女持續(xù)揮刀斬?fù)羝渌麛橙耍S著少女的斬衣,黑紅火焰在敵人身上燃燒,粒子能量濺射開(kāi),所有敵人被擊倒。實(shí)時(shí)高速動(dòng)作,強(qiáng)烈運(yùn)動(dòng)模糊。

總體來(lái)看,Seedance 2.0 更側(cè)重多模態(tài)參考能力、自動(dòng)分鏡以及視頻編輯層面的靈活性,適合對(duì)創(chuàng)作過(guò)程控制要求較高、希望快速生成高完成度視頻內(nèi)容的創(chuàng)作者;而 Vidu Q3 則以長(zhǎng)視頻聲畫(huà)同出、鏡頭調(diào)度能力與更強(qiáng)的物理一致性為核心優(yōu)勢(shì),更適合敘事性較強(qiáng)、對(duì)畫(huà)面質(zhì)量與物理真實(shí)感要求更高的內(nèi)容生產(chǎn)場(chǎng)景。

從生數(shù)科技Vidu Q3的發(fā)布,到Seedance 2.0的更新,再到雪佬、幻夢(mèng)等創(chuàng)作者在真實(shí)項(xiàng)目中的工作流遷移,這些信號(hào)共同指向同一件事:AI視頻行業(yè)正在進(jìn)入“下半場(chǎng)”。競(jìng)爭(zhēng)焦點(diǎn)不再停留在“視覺(jué)生成”本身,而是全面轉(zhuǎn)向“視聽(tīng)一體化 + 結(jié)構(gòu)化鏡頭語(yǔ)言 + 可復(fù)制的制作流程”,也就是把模型能力嵌入可控的鏡頭組織、可復(fù)用的段落單元與可規(guī)模化的交付節(jié)奏之中。

回到Vidu Q3,「甲子光年」認(rèn)為,它的此次發(fā)布更像一次把行業(yè)拉回同一張牌桌的“交付型升級(jí)”——把音畫(huà)割裂變成一次性交付、把單鏡頭素材推到段落閾值、把鏡頭調(diào)度前置讓輸出更可控。當(dāng)這種能力開(kāi)始成為行業(yè)默認(rèn)對(duì)標(biāo)的標(biāo)準(zhǔn)時(shí),Vidu Q3扮演的就不只是“更強(qiáng)的模型”,而是把AI視頻推向工業(yè)化生產(chǎn)范式的那只“定標(biāo)器”。

換句話(huà)說(shuō),Vidu Q3把行業(yè)問(wèn)題從“能不能生成”改寫(xiě)為“能不能穩(wěn)定交付”,并迫使所有玩家在同一套更接近內(nèi)容工業(yè)的指標(biāo)體系里重新排位。

最終,內(nèi)容工業(yè)會(huì)用最樸素的標(biāo)準(zhǔn)篩選工具:誰(shuí)能縮短鏈條、降低失敗率、穩(wěn)定交付,誰(shuí)就更接近“基礎(chǔ)設(shè)施”。而AI漫劇的爆發(fā)式增長(zhǎng),也意味著這種篩選會(huì)越來(lái)越快發(fā)生。

(封面圖來(lái)源:AI生成)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中國(guó)寧可向美國(guó)購(gòu)買(mǎi)轉(zhuǎn)基因大豆,也不考慮俄羅斯,到底是為什么?

中國(guó)寧可向美國(guó)購(gòu)買(mǎi)轉(zhuǎn)基因大豆,也不考慮俄羅斯,到底是為什么?

文史道
2026-03-20 06:45:03
中俄印徹底崩盤(pán)!普京急求建“新三角”?中方:兩大死穴不解沒(méi)戲

中俄印徹底崩盤(pán)!普京急求建“新三角”?中方:兩大死穴不解沒(méi)戲

牛鍋巴小釩
2026-03-20 19:53:42
終于知道采購(gòu)吃回扣是怎么被發(fā)現(xiàn)的了,網(wǎng)友分享真實(shí),太開(kāi)眼了

終于知道采購(gòu)吃回扣是怎么被發(fā)現(xiàn)的了,網(wǎng)友分享真實(shí),太開(kāi)眼了

夜深?lèi)?ài)雜談
2026-03-13 22:02:43
地獄之門(mén)將閉!土庫(kù)曼斯坦巨坑燃燒半世紀(jì),科學(xué)家探秘發(fā)現(xiàn)了啥?

地獄之門(mén)將閉!土庫(kù)曼斯坦巨坑燃燒半世紀(jì),科學(xué)家探秘發(fā)現(xiàn)了啥?

向航說(shuō)
2026-03-18 00:20:03
再次流拍!南京這套頂配雙學(xué)區(qū)豪宅,單價(jià)已降到了4.9萬(wàn)

再次流拍!南京這套頂配雙學(xué)區(qū)豪宅,單價(jià)已降到了4.9萬(wàn)

地產(chǎn)銳評(píng)
2026-03-20 17:37:58
8萬(wàn)左右!大眾剛剛官宣,3月31見(jiàn)

8萬(wàn)左右!大眾剛剛官宣,3月31見(jiàn)

手機(jī)評(píng)測(cè)室
2026-03-20 11:51:22
張?zhí)m說(shuō)她不會(huì)去參加汪寶兒滿(mǎn)月宴,等孫子回去后再稀罕,有隔閡了

張?zhí)m說(shuō)她不會(huì)去參加汪寶兒滿(mǎn)月宴,等孫子回去后再稀罕,有隔閡了

查爾菲的筆記
2026-03-20 13:39:41
以牙還牙!伊朗特種部隊(duì)深入以色列境內(nèi),斬首以色列政府內(nèi)閣高官

以牙還牙!伊朗特種部隊(duì)深入以色列境內(nèi),斬首以色列政府內(nèi)閣高官

像夢(mèng)一場(chǎng)a
2026-03-19 05:46:58
近百?lài)嵶咚健敖┦狻彪U(xiǎn)流入江蘇!現(xiàn)場(chǎng)觸目驚心……

近百?lài)嵶咚健敖┦狻彪U(xiǎn)流入江蘇!現(xiàn)場(chǎng)觸目驚心……

環(huán)球網(wǎng)資訊
2026-03-20 14:27:19
送外賣(mài)北大學(xué)子曾是高考市第一名 外賣(mài)平臺(tái)稱(chēng)其實(shí)僅跑了5單 本人回應(yīng)質(zhì)疑

送外賣(mài)北大學(xué)子曾是高考市第一名 外賣(mài)平臺(tái)稱(chēng)其實(shí)僅跑了5單 本人回應(yīng)質(zhì)疑

封面新聞
2026-03-19 16:00:21
史無(wú)前例的評(píng)估后:美國(guó)突然“全線(xiàn)戒嚴(yán)”

史無(wú)前例的評(píng)估后:美國(guó)突然“全線(xiàn)戒嚴(yán)”

李榮茂
2026-03-20 18:59:45
突發(fā)!601100:實(shí)控人被留置!

突發(fā)!601100:實(shí)控人被留置!

大眾證券報(bào)
2026-03-20 17:43:59
收評(píng):滬指跌超1%失守4000點(diǎn) 全市場(chǎng)超4700只個(gè)股下挫

收評(píng):滬指跌超1%失守4000點(diǎn) 全市場(chǎng)超4700只個(gè)股下挫

財(cái)聯(lián)社
2026-03-20 15:04:15
西甲盛世!10年后再現(xiàn)一奇觀(guān):6隊(duì)殺入歐戰(zhàn)8強(qiáng) 英超5隊(duì)自嘆不如

西甲盛世!10年后再現(xiàn)一奇觀(guān):6隊(duì)殺入歐戰(zhàn)8強(qiáng) 英超5隊(duì)自嘆不如

風(fēng)過(guò)鄉(xiāng)
2026-03-20 07:26:02
“三伏天熱不熱,就看春分”,明日春分,今年三伏天會(huì)熱到哭嗎?

“三伏天熱不熱,就看春分”,明日春分,今年三伏天會(huì)熱到哭嗎?

有范又有料
2026-03-19 14:34:26
以為只是小毛病,一查竟是晚期!做完所有治療,他還是永遠(yuǎn)離開(kāi)了

以為只是小毛病,一查竟是晚期!做完所有治療,他還是永遠(yuǎn)離開(kāi)了

新時(shí)代的兩性情感
2026-02-18 08:36:45
中東傳來(lái)大消息!美艦隊(duì)被襲,以傷亡慘重,伊朗這下可以放寬心了

中東傳來(lái)大消息!美艦隊(duì)被襲,以傷亡慘重,伊朗這下可以放寬心了

墨羽怪談
2026-03-20 13:29:52
就在今晚!3月20日晚19:30!中央5套CCTV5、CCTV5+直播節(jié)目表

就在今晚!3月20日晚19:30!中央5套CCTV5、CCTV5+直播節(jié)目表

皮皮觀(guān)天下
2026-03-20 11:33:19
3:2贏美國(guó),委內(nèi)瑞拉舉國(guó)沸騰,代總統(tǒng)當(dāng)即宣布:全國(guó)放假一天!

3:2贏美國(guó),委內(nèi)瑞拉舉國(guó)沸騰,代總統(tǒng)當(dāng)即宣布:全國(guó)放假一天!

嫹筆牂牂
2026-03-20 09:42:49
“普五”破價(jià)到了756元,五糧液卻不吭聲了

“普五”破價(jià)到了756元,五糧液卻不吭聲了

無(wú)冕財(cái)經(jīng)
2026-03-20 13:29:15
2026-03-20 21:16:49
甲子光年
甲子光年
中國(guó)科技產(chǎn)業(yè)化前沿智庫(kù)
3377文章數(shù) 9262關(guān)注度
往期回顧 全部

科技要聞

新SU7只漲4千!雷軍:真怕交車(chē)慢挨罵

頭條要聞

美防長(zhǎng):盟友不知感恩 全世界都應(yīng)對(duì)特朗普說(shuō)聲"謝謝"

頭條要聞

美防長(zhǎng):盟友不知感恩 全世界都應(yīng)對(duì)特朗普說(shuō)聲"謝謝"

體育要聞

6年前的一場(chǎng)悲劇,造就了“法國(guó)瓦爾迪”

娛樂(lè)要聞

總臺(tái)首屆電影盛典,“沈馬”CP再合體

財(cái)經(jīng)要聞

金融法草案向社會(huì)公開(kāi)征求意見(jiàn)

汽車(chē)要聞

何小鵬坦白局:每月3億的“慌”與通向L4的堅(jiān)定

態(tài)度原創(chuàng)

數(shù)碼
本地
藝術(shù)
公開(kāi)課
軍事航空

數(shù)碼要聞

240Hz登頂 成電競(jìng)顯示器第一大刷新率

本地新聞

春色滿(mǎn)城關(guān)不住|紹興春日頂流,這片櫻花海藏不住了

藝術(shù)要聞

吳昌碩『圓扇花卉』清新俊逸

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普會(huì)晤高市早苗 把美國(guó)襲擊伊朗比作偷襲珍珠港

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版