去年5月我發(fā)過一條朋友圈:不負(fù)責(zé)任地盲猜,最晚2026年,會有一部漫威質(zhì)量的純AI制作電影全球上映。然后,大量媒體開始寫:好萊塢死了。
![]()
這兩天,一個(gè)爆火的新模型,讓我感覺這一天越來越近了。
我甚至看到網(wǎng)上有人說:2026,會是傳統(tǒng)電影的“最后一年”。我們正在見證全新電影的誕生。
真有那么夸張嗎?寫篇文章,記錄一下,順便帶你回顧是怎么回事。
![]()
01
改變視頻行業(yè)的AI,快來了
這兩天,我朋友圈被一條條震撼視頻刷屏了。
這是字節(jié)旗下的即夢內(nèi)測最新視頻模型Seedance2.0。按理說,新模型發(fā)布我們已經(jīng)不稀奇了,幾個(gè)禮拜一個(gè)幾個(gè)禮拜一個(gè)。今早看到吳曉波老師一句話:中國AI人,已經(jīng)三年沒過好年了。我會心一笑。別說研發(fā)者了,我們這種媒體,都已經(jīng)連續(xù)好幾年春節(jié)在家寫稿,年年撞上“突然發(fā)布的現(xiàn)象級大模型”。
然而,Seedance2.0的效果,還是有億點(diǎn)點(diǎn)超預(yù)期。
在X上,已經(jīng)有一大堆用戶測評,給出極高的評價(jià)。
![]()
它只用一兩句提示詞,就能生出電影級大片。它能讓蜜雪冰城和星巴克等好幾個(gè)咖啡品牌,在東方明珠下貼身肉搏。把咖啡大戰(zhàn)“具象化”。哎呀,文字實(shí)在表達(dá)不出感覺,我從Tim(影視颶風(fēng))的視頻里截一小段,你一看就明白。
它厲害在哪?具體來說,在至少3個(gè)方面有了極大提高。
1、運(yùn)動時(shí)的人物精細(xì)度
以前很多AI視頻,定格畫面還行。但只要一動,五官就像在拍《午夜兇鈴》,到處亂飛。
但你看Seedance2.0生成的內(nèi)容,衣服的光澤很自然、發(fā)絲的陰影很自然。如果你暫停看,甚至能發(fā)現(xiàn),連門鎖金屬的反光都很自然。
2、細(xì)滑且高級的運(yùn)鏡
很多視頻人都有個(gè)口頭禪:這個(gè)視頻有“廉價(jià)感”。其實(shí)基本差就差在運(yùn)鏡上。以前的AI視頻,要么是動的固定機(jī)位,要么是無邏輯的亂晃。
但你看這個(gè),這是我用年度演講現(xiàn)場照片生成的視頻。
注意它的視角,就像是架在一臺專業(yè)搖臂上。而且它不是機(jī)械平移,甚至可以環(huán)繞和俯沖。我們真實(shí)現(xiàn)場攝影師拍的效果,也差不多就是這樣了。
3、充滿敘事邏輯的分鏡
Tim的視頻里也有提到,過往的視頻模型是沒有什么“分鏡思維”的。都是為了切鏡頭而切鏡頭,最多給點(diǎn)特寫,鏡頭間是毫無邏輯的。
但你看這段“星際穿越”的視頻,你能看出,鏡頭的切換明顯是有邏輯的,它能理解“當(dāng)前的畫面在干什么”,用各種鏡頭語言幫你理解“什么是現(xiàn)在的重點(diǎn)”。它知道什么叫“導(dǎo)演邏輯”。
當(dāng)然,它也說不上完美無瑕。比如,上面那個(gè)蜜雪冰城大戰(zhàn)咖啡人的視頻,你仔細(xì)看能看到,前一秒東方明珠是被激光擊中了的。下一秒,它又完好無損的出現(xiàn)在背景里。
但總之,考慮到這是只給了“一句話”就生成的視頻,已經(jīng)足夠震撼。
![]()
02
為什么能這么厲害?因?yàn)椤皟芍皇之嫯嫛?/strong>
我趕緊去研究了一下,為什么它能這么厲害?究竟是靠什么技術(shù)?我試著用大白話給你說明白。
傳統(tǒng)視頻經(jīng)常“畸形”,就是因?yàn)樵谝曨l生成領(lǐng)域,有兩個(gè)目標(biāo)一直在打架:
目標(biāo)1:內(nèi)容一致性,俗稱“長得像”。
AI得盯著你上傳的那張照片,不能把你的眼睛畫大,也不能把你的衣服換了。
目標(biāo)2:動作自然度,俗稱“動得順”。
AI得讓你的身體動起來,比如揮手、走動,還要保持光影自然。
過往的視頻大模型,只有一條“處理流水線”(專業(yè)術(shù)語叫“分支”),所以往往會顧此失彼:要么為了讓你動起來,臉就變形了。要么為了保住你的臉,整個(gè)人就僵在那像個(gè) PPT。
但這次的Seedance2.0,用了一種“雙分支擴(kuò)散”技術(shù)。它就像給AI配了兩條一起協(xié)作的流水線。
流水線1:動作分支。
它負(fù)責(zé)“構(gòu)思動作”。根據(jù)指令(比如“在街頭漫步”)去計(jì)算像素該怎么動,確保物理連貫,手臂不會不自然的彎曲。
流水線2:內(nèi)容分支。
它負(fù)責(zé)“盯著照片”。它提取特征。包括面部、發(fā)型、膚質(zhì)。確保像素級一致。臉部不再恐怖變形。
而且,這兩條流水線并不是各跑各的,它們之間有一個(gè)“跨注意力機(jī)制”,它是兩個(gè)分支之間的協(xié)調(diào)員,不停進(jìn)行信息交換。這樣,Seedance2.0就可以通過調(diào)節(jié)這兩個(gè)分支的“發(fā)言權(quán)”,確保動作不走形。比如,設(shè)定“長相上100%聽內(nèi)容分支的,動作上100%聽動作分支的”。
這就解決了前面那個(gè)難題:以前動起來就臉崩,現(xiàn)在因?yàn)橥庥^分支擁有“絕對話語權(quán)”,所以臉被死死“鎖”住了。
就像兩只手作畫,右手畫皮,左手畫骨。動作分支問:我現(xiàn)在要讓這個(gè)身體轉(zhuǎn)個(gè)身,該怎么畫?內(nèi)容分支答:給,這是他轉(zhuǎn)身后側(cè)臉該有的輪廓,別畫錯(cuò)了。
驚艷的效果,就在這樣實(shí)現(xiàn)的。
![]()
03
用本人授權(quán),解決安全隱患
昨天看到了一大堆討論和測試視頻,又聽說這個(gè)“真人人臉”的功能好像一度被下架。我好奇極了,按住發(fā)癢的雙手想試試,結(jié)果,果然沒成功。
![]()
仔細(xì)一看,原來Seedance2.0下方標(biāo)注了一行小字:暫不支持真人人臉。
![]()
我很奇怪,用自己的臉拍電影,這才有趣啊?為什么不支持。一搜之下,馬上明白了人們的擔(dān)憂。
這個(gè)模型的效果真的太好了,好到你甚至很難通過“尋找破綻”來安慰自己。以往那種僵硬的表情、漂移的五官消失了,取而代之的是極致的真實(shí)。這在技術(shù)上叫“突破”,但也會讓人擔(dān)憂。
你會不自覺地打個(gè)冷顫:“如果屏幕那頭,一個(gè)長得和我一模一樣、聲音分毫不差的人,正對著我年邁的父母談笑風(fēng)生,他們該如何分辨?”
字節(jié)的伙伴告訴我,在內(nèi)測階段,就有很多人在討論,會不會被壞人利用?《黑神話:悟空》之父馮驥也評價(jià)說,這是當(dāng)前地表最強(qiáng)視頻生成模型,沒有之一。但同時(shí)也在擔(dān)憂,會不會造成假視頻泛濫?
幸好,這是個(gè)技術(shù)問題,不是路線問題。通過技術(shù)調(diào)整,很好找到解決方案:活體檢測。
字節(jié)的伙伴告訴我,你試試手機(jī)APP版,做一下本人的授權(quán)驗(yàn)證,就沒問題了。
我試了試,果然,它讓我打開攝像頭,先讀一段數(shù)字,再把臉向左轉(zhuǎn)、向右轉(zhuǎn)。通過驗(yàn)證后,上傳視頻,給指令,做一段我開著敞篷跑車在海邊吹風(fēng),就能看到這樣的結(jié)果。
怎么樣?是不是有點(diǎn)意思。
很多年后,回頭來看,也許我們會發(fā)現(xiàn),很多行業(yè)的邏輯,都會被改變。
比如,電影行業(yè)。原本的生產(chǎn)方式,可能被徹底重構(gòu)。
現(xiàn)在的影視劇,如果演員后期臺詞改了,或者某個(gè)鏡頭要補(bǔ)拍,場地、演員、燈光,隨便一弄就是六位數(shù)七位數(shù)的成本。在一些特殊情況下,像《速度與激情》的保羅·沃克,在拍攝過程中去世,就會留下永久的遺憾。
但現(xiàn)在,只要獲得本人或者親屬的授權(quán),就可以AI補(bǔ)拍。甚至,真的還需要明星真人出鏡嗎?都不一定了。這就是為什么有人說:2026,是“傳統(tǒng)電影”的最后一年。
比如,心理咨詢行業(yè)。我們有可能獲得一個(gè)“24小時(shí)的理想傾聽者”。
現(xiàn)在的心理咨詢,非常昂貴且受限于時(shí)間。然而,在得到你本人(或者你信任的人)授權(quán)后,AI可以生成一個(gè)你最信任、最能給你安全感,還完美掌握前沿心理學(xué)知識的“數(shù)字分身”。
它長著一張你最親近的臉,用最溫柔的語氣和你對話。許多抑郁癥患者、孤獨(dú)老人、焦慮人群,都會因此受益。
但這一切都有個(gè)前提:只要是真人,就要確保必須得到本人或者親人的授權(quán)。一定要有這樣的機(jī)制。
好在,字節(jié)的伙伴,已經(jīng)充分意識到了這一點(diǎn)。
有了這道安全感,我們再來看那些被重構(gòu)的未來,才會覺得是驚喜,而不是驚嚇。
![]()
最后的話
十年以后,面對大屏幕,當(dāng)我們以現(xiàn)在無法想象的全新形式看著電影,也許會回憶起2026年春節(jié)前,這個(gè)遙遠(yuǎn)的下午。
網(wǎng)上有一句非常扎心的話:
我們總是以為,技術(shù)的進(jìn)步,會減少普通人和高手間的差距。然而殘酷的現(xiàn)實(shí)是,每次,它都會拉大差距。
因?yàn)榧夹g(shù)只是一根“杠桿”。它把普通人的努力放大了10倍,卻把高手的洞察放大了1000倍。這難免讓人感到“冒犯”。所以,每一項(xiàng)偉大的發(fā)明誕生時(shí),人類的第一反應(yīng)往往不是歡呼,而是恐懼。
電燈發(fā)明時(shí),總被擔(dān)心“光對眼睛有害”。微波爐發(fā)明時(shí),總被擔(dān)心有“死亡射線”。照相機(jī)發(fā)明時(shí),甚至有人擔(dān)心它會“吸走靈魂”。
然而,就像照相機(jī)沒有殺死繪畫,它只是殺死了“作為復(fù)印機(jī)的畫家”,然后催生了梵高、高更、莫奈。
當(dāng)導(dǎo)演的門檻降到零,剩下的,也就只剩大導(dǎo)演們對世界獨(dú)一無二的理解。
斯皮爾伯格如果不是猶太裔,沒有經(jīng)歷過猶太家庭從小的耳濡目染和深入骨髓的民族傷痕,就拍不出《辛德勒的名單》
卡梅隆如果不是對深海有著近乎偏執(zhí)的狂熱,沒有在無數(shù)次深潛中,直面過那種足以毀滅一切的孤獨(dú)與靜謐,就拍不出《泰坦尼克號》。
王家衛(wèi)如果不是從上海移居香港,沒有在那代人特有的漂泊感中長大,沒有在燈紅酒綠的疏離中體會過那種“欲言又止”的孤獨(dú),就拍不出《花樣年華》。
這些東西,AI永遠(yuǎn)學(xué)不會,因?yàn)樗鼪]有經(jīng)歷過你所經(jīng)歷的寒冬,也沒有見過你所見過的盛放。
2026年,也許真的是傳統(tǒng)電影行業(yè)的最后一年。但那又怎樣?技術(shù)殺死的只是膠片,而人那顆不可模擬的靈魂,才是永不落幕的電影。
觀點(diǎn)/ 劉潤主筆/ 歌平編輯/ 歌平版面/ 黃 靜
這是劉潤公眾號第2860篇原創(chuàng)文章。未經(jīng)授權(quán),禁止任何機(jī)構(gòu)或個(gè)人抓取本文內(nèi)容,用于訓(xùn)練AI大模型等用途
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.