大家好,我是冷逸,你們的測(cè)評(píng)手替又上線了。
今天,我想和大家聊一款昨晚剛剛發(fā)布的Real-time World Model——PixVerse R1。
我深度體驗(yàn)了一番,這個(gè)模型還真的有點(diǎn)不太一樣。
它不是一款“生成得更快”的視頻模型(盡管速度上PixVerse早已沒(méi)有對(duì)手),而是從根本上改變了視頻的生成方式和交互邏輯。
給大家看個(gè)case,你就明白了。
初始畫(huà)面:一個(gè)人在冰雪世界中行走。
你可以馬上命令,讓她跑得更快點(diǎn)。
![]()
也可以讓畫(huà)面中出現(xiàn)龍卷風(fēng)(別問(wèn)為什么雪山上能見(jiàn)到龍卷風(fēng),就沒(méi)有AI辦不到的事情)。
![]()
整個(gè)過(guò)程非常絲滑、連貫。你的Prompt會(huì)立刻作用于畫(huà)面本身,實(shí)時(shí)改變視頻狀態(tài),生成一個(gè)持續(xù)演化的視覺(jué)世界。
完整演示錄屏我放在這里了,一幀未剪。
這和以往的AI視頻生成模式完全不同:
以往的AI視頻:輸入Prompt → 等待生成 → 得到一個(gè)固定的視頻文件。
而PixVerse R1讓視頻不再是一次性生成的“結(jié)果”,而是一個(gè)可實(shí)時(shí)干預(yù)、持續(xù)演化的視覺(jué)世界。
![]()
一手體驗(yàn)
昨晚模型上線后,我深度玩了玩,給大家說(shuō)下我的使用體驗(yàn)。
體驗(yàn)地址是realtime.pixverse.ai,首次打開(kāi)你會(huì)看到這樣的提示:
Visualize Your World in Real-time,Powered by PixVerse R1. 通過(guò)PixVerse R1,實(shí)時(shí)生成你的世界。
![]()
點(diǎn)擊「Start」,進(jìn)入創(chuàng)作頁(yè)面,可以自建主題或選擇推薦主題。
![]()
我們選擇一個(gè)「War Thunder」主題。
![]()
隨后進(jìn)入創(chuàng)作界面。
![]()
這時(shí)候你會(huì)發(fā)現(xiàn),它和所有傳統(tǒng)AI視頻工具的界面都不一樣:
中央畫(huà)面區(qū)域始終在實(shí)時(shí)生成、流式播放
右上角是倒計(jì)時(shí)
下方是你的Prompt輸入?yún)^(qū)(支持語(yǔ)音)
你輸入的每一句指令,都會(huì)立刻作用在當(dāng)前世界上。
![]()
我錄制了一段操作過(guò)程,大家可以直觀感受下。
這種體驗(yàn)非常新鮮。
它不像傳統(tǒng)AI視頻:發(fā)一句Prompt,等一會(huì)兒,拿到一個(gè)鏡頭;
也不像3D模型:先生成一個(gè)靜態(tài)世界,再讓你進(jìn)入;
更不像游戲:把一個(gè)“提前造好的世界”裝進(jìn)盒子里讓你游玩。
PixVerse-R1是在“邊想,邊造世界”。
世界不是預(yù)制的,而是現(xiàn)炒的。一手,鮮活,且充滿(mǎn)無(wú)限可能。
所以說(shuō)實(shí)話,我剛開(kāi)始體驗(yàn)PixVerse R1,也沒(méi)法立刻給它下一個(gè)準(zhǔn)確的定義。但有一點(diǎn)我很確定,它不是現(xiàn)有任何一種媒體形態(tài)的簡(jiǎn)單延伸。
它更像是一個(gè)全新的物種。
一個(gè)可能會(huì)引領(lǐng)未來(lái)AI生成世界的全新媒介。
特別值得一提的是,它也支持語(yǔ)音輸入。
![]()
大家都知道,鍵盤(pán)打字的速度,很難跟上實(shí)時(shí)生成的視頻世界。一旦世界開(kāi)始“跑起來(lái)”,語(yǔ)音輸入的優(yōu)勢(shì)就非常明顯。
你可以用PixVerse內(nèi)置的語(yǔ)音工具,也可以用第三方語(yǔ)音輸入。我同樣錄了一個(gè)演示視頻。
目前這一版PixVerse R1,單次創(chuàng)作最長(zhǎng)支持5分鐘。
但我覺(jué)得,這一定不是它的終點(diǎn)。
未來(lái)或許會(huì)實(shí)現(xiàn)無(wú)限時(shí)長(zhǎng),屆時(shí)限制它的只能是我們的想象力。
當(dāng)然,如果單純看畫(huà)面質(zhì)量,比如清晰度、物理細(xì)節(jié)、鏡頭精度等,它還不及PixVerse原始模型的效果,不像大家熟悉的AI視頻的質(zhì)感。
![]()
但PixVerse R1開(kāi)啟的,是一種全新的交互范式:
Real-time、Playable Reality
在這里,用戶(hù)不再只是使用者,而更像是一個(gè)共創(chuàng)者,甚至是世界的一部分。
你不是在“生成視頻”,而是在和一個(gè)平行世界持續(xù)對(duì)話。
它不是AI視頻,不是游戲,不是直播,也不是虛擬世界,而是一種可以被“玩”的視頻現(xiàn)實(shí)(Playable Reality)。
從這角度看,我感覺(jué):PixVerse R1給整個(gè)行業(yè)扔下了一枚不太容易被立刻理解的炸彈。
這也是為什么,這個(gè)Real-time World Model會(huì)被命名為PixVerse R1。
![]()
技術(shù)拆解
在模型發(fā)布的同時(shí),PixVerse也公開(kāi)了他們的技術(shù)論文:
《PixVerse-R1: Next-Generation Real-Time World Model》。
核心目標(biāo)只有一個(gè):把視頻生成,從“離線片段”,變成“連續(xù)、可交互、實(shí)時(shí)響應(yīng)的視覺(jué)流”。
怎么做到的呢?簡(jiǎn)單來(lái)說(shuō)由三部分構(gòu)成:
Omni基座模型 + 無(wú)限流式生成架構(gòu) + 實(shí)時(shí)生成引擎
首先是Omni基座模型。
這是一個(gè)端到端的原生多模態(tài)模型,把文本、圖像、視頻、音頻統(tǒng)一成連續(xù)的token流。
![]()
在訓(xùn)練階段,它學(xué)習(xí)了大量真實(shí)世界的視頻數(shù)據(jù),因此具備生成復(fù)雜、長(zhǎng)時(shí)間一致場(chǎng)景的能力——也就是我們直觀感受到的“世界感”。
初始畫(huà)面:一位士兵趴在雪地里,用望遠(yuǎn)鏡觀察前方。
一只烏鴉飛過(guò)。(綠色部分為提示詞)
![]()
巡邏隊(duì)發(fā)現(xiàn)了士兵。他開(kāi)始拼命逃跑。
![]()
他跌倒在坦克旁邊。
![]()
飛機(jī)對(duì)坦克實(shí)施轟炸。
![]()
整個(gè)鏡頭銜接非常自然,且遵循物理規(guī)律。完整的demo,我放在這里了。
第二個(gè)關(guān)鍵點(diǎn),是生成機(jī)制。
PixVerse R1采用的是自回歸生成,而非傳統(tǒng)擴(kuò)散模型那種“先算完整片段”的方式。
![]()
這意味著,它可以持續(xù)生成、無(wú)限延展視覺(jué)流,而不是只能吐出一個(gè)固定長(zhǎng)度的視頻。
最后,也是PixVerse的傳統(tǒng)強(qiáng)項(xiàng)——速度。
在PixVerse R1中,他們重新設(shè)計(jì)了實(shí)時(shí)生成引擎,把傳統(tǒng)視頻生成中動(dòng)輒幾十步的采樣過(guò)程,壓縮到了1–4步。
![]()
所以,我們能看到近乎實(shí)時(shí)響應(yīng)的畫(huà)面變化。
![]()
整個(gè)體驗(yàn)下來(lái),我的感覺(jué)是:PixVerse R1讓實(shí)時(shí)、長(zhǎng)時(shí)序的AI生成世界第一次變得可行。
這不僅是視頻媒介的一次演進(jìn),更是一次從「生成內(nèi)容」走向「生成世界」的躍遷。
它的意義在于,把「世界模型」從離線想象,推進(jìn)到了實(shí)時(shí)生成、即時(shí)響應(yīng)、長(zhǎng)時(shí)一致的階段。
每一次用戶(hù)輸入,不只是剪輯點(diǎn),而是一次對(duì)世界狀態(tài)的干預(yù);每一幀畫(huà)面,也不只是結(jié)果,而是下一步推理的上下文。
一旦這樣的世界可以被反復(fù)運(yùn)行、被規(guī)模化調(diào)用、被Agent接管,游戲、仿真、訓(xùn)練、創(chuàng)作,甚至現(xiàn)實(shí)決策的預(yù)演,都會(huì)在同一條技術(shù)線上融合。
所以,這并不是“視頻生成更快了”。
而是:AI,第一次開(kāi)始擁有一個(gè)可以長(zhǎng)期存在的世界。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.