大家好,我是冷逸。
“你是否在雪山上救過一只狐貍?”打開最近的B站、抖音,幾乎全是這種AI短視頻。
每次刷到各種腦洞百出的視頻,我的內心os是這樣的:
![]()
今天,我也仿做了一個,這只龍蝦送給你,希望你能熬過今天這篇文章。
還有,農大山泉,每一滴都是自然的饋贈。
![]()
怎么做的?
你可能想問,怎么做的?
還記得前幾天我測過的嗎?最近,我發現他們上線了一個非常牛逼的模型:「Star Video 2.0」,可以一鍵直出音畫一體的完整成片。
對,完整成片,而遠非幾秒鐘的單鏡頭。
使用也很簡單,直接把這段提示詞發給模型就行。
提示詞:邵氏電影風格,中國古裝服飾風格。
男主身穿樸素的古裝,在充滿光影的雪山里,把一只龍蝦放到雪地里一只凍死的白色狐貍身旁,說:"這只龍蝦給你,希望你能熬過這個冬天。
男主在一個院落里劈柴,一個妙齡女子推開破舊的木門走進來,溫柔地問:"敢問公子是不是在去年冬天丟過一只龍蝦?"
男子開心地說:"你就是那只龍蝦"。
妙齡女子憤怒的說:“我是那只狐貍,我不吃龍蝦”,然后變身狐貍。模型會自動幫你搞定分鏡、轉場、節奏、BGM、對白,甚至連環境音都有。全部由模型直接生成,我們只需要描述好畫面故事就行。
![]()
至于「農大山泉」這個廣告片,那就更簡單了,就這一句話。
提示詞:給“農大山泉”做一支TVC廣告。
是的,真就這一句話,其他什么都沒有。給大家看下我的創作界面。
![]()
當然,我不是鼓勵大家隨便寫句提示詞就丟給模型,畢竟每秒視頻成本差不多一塊錢呢。
想要更精細控制視頻,建議上傳參考圖(比如主角人物)、參考視頻,或由臺詞來驅動視頻,這樣視頻質量還能再提升一大截。
![]()
我真正想表達的是,這個模型具備極其的多鏡頭敘事能力,能直接生成包括對白、環境音和動作音效等完整視頻,我們只需要描述清楚畫面就可以了。
剩下的,交給模型。
![]()
一些我跑的Case
我還用它跑了一些比較有創意的視頻,短片、廣告片、動畫片以及電影級畫面都有,大家可以看下。
1、《流體肖像》
第一個是《流體肖像》,我的提示詞是讓它做一個短漫劇,要邏輯自洽。我給出了視覺核心、劇情介紹和隱約含義等Prompt約束,讓模型自行理解,生成視頻。
提示詞:做一個短漫劇,主題是《流體肖像》 (Fluid Portrait)。
視覺核心:微距攝影 + 液體模擬。全片無真人出鏡,僅用不同顏色的墨水、水銀與油在玻璃箱中碰撞。
劇情:鏡頭極度貼近液面,記錄一場無聲的“戰爭”。黑色墨汁如軍隊般入侵純凈的藍色水域,兩者纏繞、吞噬、融合,形成類似人臉的痛苦扭曲形態。隨著節奏加快,液體沸騰般炸裂,最終沉淀為一抹渾濁的灰。
隱喻:通過抽象流體力學,具象化展現移民文化沖突或人格解體的心理過程。
這個視頻有幾個難點:多相流體形態演化、“手”變“臉”再爆炸開來的劇烈變化過程以及美學風格的始終統一,沒想到模型都完成得不錯。
這種東西,放過去是屬于實驗影像團隊的活,現在一句話就能出。
2、《消失的人類》
第二個視頻講的是低頭族的故事,人們經常看手機,結果都被吸進手機里了,最終成為機房服務器的字節。劇情倒是很簡單,但比較考驗模型的時空一致性和復雜形變控制。
傳統CGI制作此類鏡頭需要精細的3D建模與逐幀渲染,而AI需要在保持攝像機運動軌跡穩定的同時,實時計算并重構場景中所有物體的拓撲結構——讓人體合理溶解為數據流,讓車廂內飾平滑變形為服務器陣列。這要求模型不僅理解光影紋理,更要深刻理解物理空間的邏輯關系,才能避免在劇烈形變中出現畫面崩壞或邏輯斷裂。
提示詞:地鐵車廂內,人群安靜坐著。突然其中一個人開始“像素化”,身體逐漸解構成數據流向手機屏幕。隨后越來越多人消失,只剩下一座運行著數據的機房。
最終成片完成得還不錯,鏡頭、轉場、電流音效和列車運行的音效都配得很好,感覺就像一支電影團隊產出的作品。
Ps,這個創意我也是真的喜歡。低頭族的結局,大概就是這樣。
3、《書頁變成真實世界》
還有書頁立體化這個case,我也很喜歡,視覺震撼。
提示詞:翻開一本書,每翻一頁,紙上的內容變成立體真實場景溢出書外:海浪沖出書頁、風吹動房間、沙子灑落地面。最后鏡頭拉遠,整個房間被書里的世界覆蓋。
發覺這個模型,拿來做一些爆炸、變身的特效視頻,特別擅長。它不需要你整什么復雜的墊圖,就描述畫面就行。
比如,美少女變身鋼鐵戰士。
![]()
以及女特工街頭換裝,這種子彈時間的視頻看著就真爽。
![]()
4、《紙人的世界》
這個創意視頻,我本來沒抱什么希望,結果出來還挺驚喜的。
提示詞:主角是一個平面的折紙人,生活在二維書頁中。某天,一滴真實的墨水(實拍液體)滴落,暈染出一個洞。主角好奇鉆入,發現世界變成了立體的折紙雕塑群。他不斷折疊自己的身體以適應三維空間,每折疊一次,周圍的環境就隨之重構(如將高樓折成小船)。結尾,一只巨大的人類手(實拍)出現,將他輕輕折起放入信封,鏡頭拉遠,整個宇宙不過是一張正在被書寫的信紙。
我數了下,短短15s的短片居然有8個鏡頭,這也太離譜了……而且有2個鏡頭是來回切,紙片人、場景的一致性保持得很好,一點都不亂。
就是最后“整個宇宙不過是一張正在被書寫的信紙”的視覺表達稍微弱了點,這大概是我的提示詞有問題。如果能再改改,相信效果會更好。
5、《悟空大戰蝦兵蟹將》
最后,我還試了一個動畫場景的視頻,以孫悟空為原型,創建一個充滿童趣與動感的水岸戰斗場景。
提示詞:做一個《悟空大戰蝦兵蟹將》的短漫劇,劇情設計如下:
鏡頭1: 特寫。碧波潭水面破開,一只肥碩蟹將舉著雙鉗,囂張地朝岸邊悟空勾鉗子。
鏡頭2 : 岸邊。悟空從耳邊拔出金箍棒,棒子在手中轉了一圈,掂了掂,瞇眼一笑。
鏡頭3: 悟空躍起,半空中一棒橫掃。金色棒風呈扇形劈出,正中沖來的蝦兵蟹將。
鏡頭4:慢動作。蝦兵的長須斷裂,蟹將的硬殼瞬間布滿裂紋,它們被震得口吐白沫。
鏡頭5: 悟空落地,把金箍棒往肩上一扛。身后,蝦兵蟹將全趴在翻白肚的魚群里,動彈不得。
鏡頭6:悟空撓撓手背,吹著口哨,轉身離去。水面恢復平靜。
動畫片最難的是“在卡通夸張中保持物理可信”,即在允許角色飛天遁地的同時,讓每一次撞擊、濺射、反彈都符合觀眾潛意識中的力學預期。
這2D動畫質量,說實話,已經很能打了。畫風,也很符合東方美術風格。
![]()
整個體驗下來,這個模型效果確實沒話說。
所以我第一時間就開了團隊會員(目前只對企業團隊開放),狠狠測了一波。
![]()
體驗地址:www.liblib.tv
整體感受就兩個字:絲滑。
15秒的視頻,2分鐘出片,而且還支持多并發。像我充的大師版,可以支持10個并發(就是一次能跑10條視頻)。
但說實話,大師版根本不夠用,不到1小時,我就把額度干光了……
于是干脆直接升到尊享版,可以無限并發,大概能跑200條5秒視頻(如果拉上同事一起用,額外還能白嫖120多條)。
這個模型配上LibTV的畫布式編輯器,用起來賊爽。
他們家有海量的模型,覆蓋了劇本、腳本、分鏡/角色設計/海報、音效/配音/音樂、視頻等多個創作環節,都可以直接在LibTV里搞定。
當工具把門檻抹平,創作就只剩下一件事:你有沒有想法。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.