337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)話(huà)智象未來(lái)CTO姚霆:當(dāng)Sora退場(chǎng)后,世界模型的終局是"輪回"

0
分享至

以Sora的發(fā)布和關(guān)停為時(shí)間節(jié)點(diǎn),AI視頻生成產(chǎn)業(yè)分為兩個(gè)世界。

2024年春節(jié),OpenAI發(fā)布Sora,一石激起千層浪,當(dāng)年5月17日,智象未來(lái)旗下vivago平臺(tái)上線(xiàn),這個(gè)時(shí)間點(diǎn)比快手可靈還早了兩周,這家核心班底來(lái)自微軟亞研院的多模態(tài)大模型創(chuàng)企,并不缺少對(duì)技術(shù)的敏銳嗅覺(jué)。

一年后,OpenAI驟然宣布關(guān)停了Sora的獨(dú)立服務(wù),將視頻生成功能并入ChatGPT的付費(fèi)體系,留給行業(yè)是一些未有明確答案的思考,多模態(tài)大模型的技術(shù)和商業(yè)化會(huì)走向何處,創(chuàng)業(yè)企業(yè)又該如何在窗口關(guān)閉前找到自己的空間。

在智象未來(lái)聯(lián)合創(chuàng)始人兼CTO姚霆看來(lái),Sora的退場(chǎng)并非偶然,而是通用視頻生成這門(mén)好技術(shù)在商業(yè)化面前的必然結(jié)局,對(duì)于當(dāng)前火爆的世界模型賽道,他給出了一個(gè)頗具哲學(xué)意味的答案:輪回。

據(jù)了解,智象未來(lái)的 ARR(年度經(jīng)常性收入)達(dá)到數(shù)千萬(wàn)美元量級(jí),B輪融資正在最后 Close階段,持續(xù)獲得產(chǎn)業(yè)資本加持。這家公司的路線(xiàn)選擇,或許代表了中國(guó) AIGC 創(chuàng)業(yè)公司在多模態(tài)賽道上的一種生存策略。


通用視頻生成是一門(mén)好技術(shù),不是Sora的好生意

對(duì)話(huà)伊始,姚霆便開(kāi)門(mén)見(jiàn)山地給出了自己的判斷。在他看來(lái),Sora的“失敗”可以從三個(gè)維度來(lái)理解。

"第一,Sora想做的是非常通用的視頻生成,但這與垂直領(lǐng)域的應(yīng)用需求相對(duì)脫離。"姚霆分析道,"OpenAI天然沒(méi)有視頻相關(guān)的業(yè)務(wù),也沒(méi)有那樣的生態(tài)。"

第二,成本是不可忽視的現(xiàn)實(shí)問(wèn)題。"今天跟互聯(lián)網(wǎng)時(shí)代不一樣,所有的服務(wù)上線(xiàn)背后都在跑GPU,成本還是很昂貴的。"姚霆坦言,智象每一次模型迭代,推理成本都是首要考量因素,做模型架構(gòu)本身就要考慮成本,否則后面就沒(méi)法做大量服務(wù)。

第三,Sora缺乏商業(yè)化的土壤。對(duì)比字節(jié)跳動(dòng)的Seedance和快手的可靈,這兩家公司的視頻生成產(chǎn)品都能與主營(yíng)業(yè)務(wù)形成協(xié)同,而OpenAI并沒(méi)有這樣的業(yè)務(wù)場(chǎng)景來(lái)承接技術(shù)能力。

Sora的退場(chǎng),也折射出國(guó)內(nèi)外視頻生成路線(xiàn)的差異。

"國(guó)外更看重模型架構(gòu)的創(chuàng)新,國(guó)內(nèi)則傾向于做大而全的平臺(tái)鏈路。"姚霆觀察道。對(duì)于智象來(lái)說(shuō),這兩條路都不是唯一選擇。

"我們是從技術(shù)出身的,以前在微軟的時(shí)候,大家想做全世界最好的模型,對(duì)標(biāo)谷歌、Facebook、CMU、伯克利。"姚霆回憶,"做視頻理解的模型,這種基因天然就是希望模型上有架構(gòu)創(chuàng)新。"

智象也的確在踐行這一點(diǎn)。從2023年的Unet架構(gòu),到DiT,再到自回歸+DiT的融合,直到今天全新的全模態(tài)架構(gòu),智象每一次迭代都試圖在技術(shù)層面做更多的創(chuàng)新,而且每次還是精準(zhǔn)的踩住了整個(gè)技術(shù)迭代的突破口。

"但同時(shí),在中國(guó)做這件事,肯定還是要以垂直領(lǐng)域的商業(yè)化作為導(dǎo)向。"姚霆強(qiáng)調(diào),"不是為了做模型炫技,而是要有商業(yè)化落地的指標(biāo)。"

世界模型的五個(gè)等級(jí)——從靜態(tài)復(fù)刻到"輪回"

世界模型的概念在過(guò)去一年里經(jīng)歷了劇烈的收斂過(guò)程,也是當(dāng)前多數(shù)大模型相關(guān)企業(yè)想要講述的故事。

"世界模型的定義一直很廣,早期可以分成三個(gè)類(lèi)別。"姚霆解釋道,"第一類(lèi)是以語(yǔ)言模型為主,屬于高層知識(shí)的提煉和壓縮;第二類(lèi)是Yann LeCun做的JEPA,偏中層的表達(dá)學(xué)習(xí);第三類(lèi)是底層的像素生成,也就是視頻生成。"

但如今,世界模型的定義正在收斂。姚霆認(rèn)為,今天的世界模型可以大致分為三類(lèi):在視頻生成模型中融入因果關(guān)系和物理規(guī)律;根據(jù)用戶(hù)指令實(shí)時(shí)生成場(chǎng)景(如Genie-3);以及跟具身智能強(qiáng)相關(guān)的World Action Model。

對(duì)于智象而言,姚霆更看重兩個(gè)維度的突破。

"第一個(gè)是模型側(cè),要用一個(gè)神經(jīng)網(wǎng)絡(luò)同時(shí)理解和生成文本、圖像、視頻、3D以及動(dòng)作。"姚霆強(qiáng)調(diào),"它一定是端到端的全模態(tài)架構(gòu),各個(gè)模態(tài)之間不會(huì)單獨(dú)編碼,而是統(tǒng)一的tokenization。"

為什么要追求"全模態(tài)"而非"多模態(tài)"?姚霆的解釋很直接:"世界模型好歹要跟物理世界打通,如果不打通憑什么叫世界模型?從這個(gè)角度來(lái)說(shuō)肯定要有具身的數(shù)據(jù),不然就是割裂的數(shù)字世界模型。"

在他看來(lái),世界模型的底座是基于視頻訓(xùn)練出來(lái)的,還是基于VLA(視覺(jué)-語(yǔ)言-動(dòng)作)訓(xùn)練出來(lái)的,其實(shí)并不重要,最終的形態(tài)一定是任意輸入,任意輸出,想怎么輸入,想它輸出什么它就可以輸出什么。

但這還不是終局。


"從宏觀角度,我對(duì)世界模型分了幾個(gè)等級(jí)。"姚霆說(shuō),"第一級(jí)是靜態(tài)復(fù)刻,就是一幅圖;第二級(jí)是視頻,有三維有時(shí)間域;第三級(jí)是交互;第四級(jí)加入物理規(guī)律和因果關(guān)系;第五級(jí),終局是輪回。"

他進(jìn)一步解釋道,"輪回是什么?是完美的因果關(guān)系。比如蝴蝶效應(yīng),今天我在這兒扇了一下翅膀,明天那個(gè)地方就應(yīng)該出現(xiàn)海嘯。再往上一級(jí),才是真正的世界模型,才是真正的推理。"

這個(gè)說(shuō)法聽(tīng)起來(lái)有些哲學(xué)意味,但姚霆很快將其拉回到產(chǎn)品層面。

"第二個(gè)維度是Agent。"他說(shuō),"所有的Agentic App等于一個(gè)平臺(tái)(可能是PC或手機(jī))乘以Harness(對(duì)底層skills的管理、適配和組合),再加上底層的skills(可能是OS或OpenAI)。"

姚霆舉例說(shuō)明:用戶(hù)想做一個(gè)VLOG,只需要輸入"我想賺錢(qián)"這一句話(huà),Agent就能自動(dòng)搜索、調(diào)用、編排各種skills,完成從腳本撰寫(xiě)到視頻制作的全流程。

"這需要全模態(tài)的支持。"姚霆強(qiáng)調(diào),"底層有文本、視頻、圖像、語(yǔ)音,全打通了,才能知道誰(shuí)跟誰(shuí)該怎么組合。"

大廠環(huán)伺,創(chuàng)業(yè)公司如何出牌?

快手可靈月收入突破兩千萬(wàn)美元,即夢(mèng)背靠字節(jié)過(guò)億的生態(tài)日活。在這樣的雙寡頭格局下,智象這樣的創(chuàng)業(yè)公司如何找到出路?

"大廠在資本、人才、算力上都有優(yōu)勢(shì),包括入口。"姚霆坦率表示,但在某些條件下,它的束縛也會(huì)比較多,難免對(duì)主營(yíng)業(yè)務(wù)有所妥協(xié)。相比之下,創(chuàng)業(yè)公司的團(tuán)隊(duì)架構(gòu)更加靈活。

"AI時(shí)代,機(jī)會(huì)是相對(duì)平等的。"姚霆說(shuō),"但作為初創(chuàng)公司,有幾點(diǎn)還是要做好。"

第一,認(rèn)知要新。

"首先要對(duì)整個(gè)趨勢(shì)有充分的預(yù)判,不能等大廠做到什么樣我們?cè)購(gòu)?fù)制,這樣基本就沒(méi)機(jī)會(huì)。"姚霆強(qiáng)調(diào),"還要有堅(jiān)持,要做正確但很難的事情。智象的產(chǎn)品經(jīng)理現(xiàn)在必須會(huì)用vibe-coding(AI輔助編程)。"

第二,速度要快。

"AI產(chǎn)品的穩(wěn)定版本,產(chǎn)品推上線(xiàn),用戶(hù)用兩次能成功得到一次想要的結(jié)果,這就是穩(wěn)定版本。"姚霆說(shuō),"讓用戶(hù)使用、反饋、迭代,這樣才能形成壁壘。"

第三,架構(gòu)要靈活。

"產(chǎn)品和技術(shù)的邊界越來(lái)越模糊,因?yàn)楫a(chǎn)品也可以通過(guò)vibe-coding寫(xiě)前端。"姚霆打了個(gè)比方,"有點(diǎn)像打牌,上手一副牌很難改變,但出牌方式可以調(diào)整,有些‘王炸’是要拆掉的。"

面對(duì)大廠競(jìng)爭(zhēng),智象的應(yīng)對(duì)策略已經(jīng)明確:2026年的核心戰(zhàn)略是搭建"1+1+3"的架構(gòu)體系。

"第一個(gè)'1'是全模態(tài)底座大模型,這是最重要的。"姚霆解釋道,"第二個(gè)'1'是HiHarness平臺(tái),可以理解為中間的Harness層,負(fù)責(zé)打通各種skills。'3'是優(yōu)先級(jí)最高的三個(gè)Agent:專(zhuān)業(yè)創(chuàng)作者智能體、商業(yè)營(yíng)銷(xiāo)內(nèi)容生成智能體、AI影視智能體。未來(lái)還會(huì)拓展出更多方向,比如具身智能、游戲引擎等。"


這個(gè)架構(gòu)的核心邏輯,是從"分而治之"轉(zhuǎn)向"并而治之"。

姚霆說(shuō),"以前不同創(chuàng)作用不同方式,可能是工具可能是內(nèi)容,今天會(huì)變成一個(gè)并而治之。底座是Agent,上面根據(jù)不同場(chǎng)景去實(shí)例化。"

他把這個(gè)邏輯比作搜索引擎:"當(dāng)年做搜索引擎,下面有眾多網(wǎng)頁(yè),今天網(wǎng)頁(yè)變成skills,如何在海量里面尋找、定位、編排,這是核心問(wèn)題。"

全模態(tài)底座的價(jià)值就在于此,如果全模態(tài)模型天然把這些模態(tài)之間打通,那么只要建一套索引就可以解決所有模態(tài)的事情,不管用戶(hù)輸入什么,想要得到什么,都可以給到用戶(hù)最終結(jié)果。(本文作者 | 張帥,編輯 | 楊林)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
航運(yùn)數(shù)據(jù)顯示:委內(nèi)瑞拉3月石油日出口量突破100萬(wàn)桶大關(guān) 為六個(gè)月來(lái)首次

航運(yùn)數(shù)據(jù)顯示:委內(nèi)瑞拉3月石油日出口量突破100萬(wàn)桶大關(guān) 為六個(gè)月來(lái)首次

財(cái)聯(lián)社
2026-04-02 17:04:07
76人153-131大勝奇才!喬治創(chuàng)31年紀(jì)錄,不愧是年薪5100萬(wàn)球員

76人153-131大勝奇才!喬治創(chuàng)31年紀(jì)錄,不愧是年薪5100萬(wàn)球員

籃球大視野
2026-04-02 09:46:05
伊朗稱(chēng)發(fā)起第90波打擊行動(dòng),美國(guó)鋼鐵鋁業(yè)被炸慘,美軍數(shù)十人死傷

伊朗稱(chēng)發(fā)起第90波打擊行動(dòng),美國(guó)鋼鐵鋁業(yè)被炸慘,美軍數(shù)十人死傷

軍武咖
2026-04-03 11:13:52
1552億,600臺(tái)光刻機(jī),ASML正式表態(tài),美媒:相當(dāng)于是攤牌了

1552億,600臺(tái)光刻機(jī),ASML正式表態(tài),美媒:相當(dāng)于是攤牌了

瘋狂小菠蘿
2026-04-02 17:19:58
兩年前“預(yù)言”美伊開(kāi)戰(zhàn)的北京高中老師,對(duì)局勢(shì)有了新判斷

兩年前“預(yù)言”美伊開(kāi)戰(zhàn)的北京高中老師,對(duì)局勢(shì)有了新判斷

用淚來(lái)贖罪
2026-04-01 16:45:43
美國(guó)炸毀伊朗標(biāo)志性大橋,致8死95傷!伊朗:襲擊美甲骨文和亞馬遜數(shù)據(jù)中心,此前將蘋(píng)果等18家美企列為打擊目標(biāo)

美國(guó)炸毀伊朗標(biāo)志性大橋,致8死95傷!伊朗:襲擊美甲骨文和亞馬遜數(shù)據(jù)中心,此前將蘋(píng)果等18家美企列為打擊目標(biāo)

新民晚報(bào)
2026-04-03 08:58:19
羅技再次翻車(chē)!宣傳頁(yè)驚現(xiàn)狗爪與人手同框?qū)Ρ葓D,網(wǎng)友徹底怒了

羅技再次翻車(chē)!宣傳頁(yè)驚現(xiàn)狗爪與人手同框?qū)Ρ葓D,網(wǎng)友徹底怒了

雷科技
2026-04-01 12:29:21
董璇陪張維伊回老家給公婆掃墓,網(wǎng)友:本人好漂亮,47看著像37

董璇陪張維伊回老家給公婆掃墓,網(wǎng)友:本人好漂亮,47看著像37

老吳教育課堂
2026-04-03 04:51:07
這面相太好了,妥妥旺夫相,膀大腰圓氣血足,穿著干凈舒服!

這面相太好了,妥妥旺夫相,膀大腰圓氣血足,穿著干凈舒服!

科學(xué)發(fā)掘
2026-04-01 00:28:34
一飯店發(fā)現(xiàn)3人死亡

一飯店發(fā)現(xiàn)3人死亡

南方都市報(bào)
2026-04-02 12:15:28
周薪30萬(wàn)鎊 31歲曼城隊(duì)長(zhǎng)確定自由身離隊(duì) 9年隨隊(duì)奪19冠 去向曝光

周薪30萬(wàn)鎊 31歲曼城隊(duì)長(zhǎng)確定自由身離隊(duì) 9年隨隊(duì)奪19冠 去向曝光

我愛(ài)英超
2026-04-03 05:55:59
江西女碩士失蹤,被發(fā)現(xiàn)時(shí)已在教授實(shí)驗(yàn)室待6年,魔鬼真的存在

江西女碩士失蹤,被發(fā)現(xiàn)時(shí)已在教授實(shí)驗(yàn)室待6年,魔鬼真的存在

燦爛夏天
2025-02-10 20:20:13
我在臺(tái)灣吃了三個(gè)月便當(dāng),才明白為啥他們的快餐文化如此發(fā)達(dá)

我在臺(tái)灣吃了三個(gè)月便當(dāng),才明白為啥他們的快餐文化如此發(fā)達(dá)

復(fù)轉(zhuǎn)這些年
2026-04-02 11:55:50
大瓜,特朗普稱(chēng)中國(guó)富豪有56個(gè)美國(guó)孩子!各種猜測(cè)越來(lái)越離譜了!

大瓜,特朗普稱(chēng)中國(guó)富豪有56個(gè)美國(guó)孩子!各種猜測(cè)越來(lái)越離譜了!

眼光很亮
2026-04-02 06:09:52
王藝迪4-1張本美和采訪!對(duì)結(jié)果意外,點(diǎn)教練重要性,展望打溫特

王藝迪4-1張本美和采訪!對(duì)結(jié)果意外,點(diǎn)教練重要性,展望打溫特

籃球資訊達(dá)人
2026-04-02 21:36:52
東方美人的氛圍感,被她狠狠拿捏了

東方美人的氛圍感,被她狠狠拿捏了

娛你同歡
2026-04-02 23:50:38
狂轟31+6+3!登頂歷史第一,杰倫格林再超神下去,火箭就要后悔了

狂轟31+6+3!登頂歷史第一,杰倫格林再超神下去,火箭就要后悔了

巴叔GO聊體育
2026-04-02 15:17:24
4月3日:深南大道創(chuàng)造了歷史!

4月3日:深南大道創(chuàng)造了歷史!

微評(píng)社
2026-04-03 09:05:28
FZ 三月榜單TOP19| 瀨戶(hù):壞了!這是沖著我來(lái)的??!

FZ 三月榜單TOP19| 瀨戶(hù):壞了!這是沖著我來(lái)的??!

孤獨(dú)的獨(dú)角獸影視
2026-04-02 09:15:11
55授銜,國(guó)軍班長(zhǎng)出身的他自報(bào)大校被羅榮桓批評(píng),原因:太過(guò)謙虛

55授銜,國(guó)軍班長(zhǎng)出身的他自報(bào)大校被羅榮桓批評(píng),原因:太過(guò)謙虛

鶴羽說(shuō)個(gè)事
2026-04-02 22:47:46
2026-04-03 11:56:49
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
131748文章數(shù) 862051關(guān)注度
往期回顧 全部

科技要聞

SpaceX沖刺2萬(wàn)億美元估值,馬斯克野心太大

頭條要聞

牛彈琴:美國(guó)干了一件令人發(fā)指的事 全世界都無(wú)法接受

頭條要聞

牛彈琴:美國(guó)干了一件令人發(fā)指的事 全世界都無(wú)法接受

體育要聞

沖擊世界杯失敗,80歲老帥一氣之下病倒了

娛樂(lè)要聞

《浪姐7》最新人氣TOP 曾沛慈斷層第一

財(cái)經(jīng)要聞

專(zhuān)家稱(chēng)長(zhǎng)期攝入“飄香劑”存在健康隱患

汽車(chē)要聞

你介意和遠(yuǎn)房親戚長(zhǎng)得很像嗎?

態(tài)度原創(chuàng)

數(shù)碼
房產(chǎn)
本地
公開(kāi)課
軍事航空

數(shù)碼要聞

盧偉冰回應(yīng)小米及REDMI部分在售產(chǎn)品調(diào)價(jià):內(nèi)存漲價(jià)力度遠(yuǎn)超預(yù)期

房產(chǎn)要聞

理科生的浪漫,都藏在細(xì)節(jié)里!中交·藍(lán)色港灣這場(chǎng)交付太硬核!

本地新聞

跟著歌聲游安徽,聽(tīng)古村回響

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗自殺無(wú)人機(jī)突進(jìn) 逼退林肯號(hào)航母

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版