網易首頁 > 網易號 > 正文申請入駐

從Sora到可靈，視頻AI還沒到GPT時刻

2025-12-10 21:54:11　來源: 節點AI

山東舉報

分享至

文 / 道哥

來源 / 智百道

視頻大模型的競速還在持續。

作為國內視頻生成大模型的代表，快手旗下的可靈AI近日宣布，其核心產品可靈O1正式上線“主體庫”與“對比模板”兩大重要功能，旨在提升AI創作的效率與作品展示效果。

但與此同時，在大洋彼岸，OpenAI旗下的Sora2，卻開始陷入新的困境。根據a16z合伙人前段時間貼出的一組對比，Sora留存率遠不如TikTok，首日留存率只有10%，30天留存率只有1%。對比來看，TikTok對應的留存率分別是50%和32%，差距明顯。

在9月底OpenAI正式發布Sora 2及獨立App時，不少預言家當時甚至集體狂歡，“Sora App將吞噬TikTok和Instagram上的網紅，一場由AI主導的視頻革命即將到來”。

OpenAI自己也說，我們可能迎來視頻領域的GPT-3.5時刻。

然而，到了2026年年末，現實還是比概念更骨感。

在這一輪AI泡沫論底層，實際上是資本市場與產業界開始冷靜審視這條賽道：所謂的“視頻GPT時刻”似乎并未如期而至。相反，高昂的推理成本、難以閉環的商業模式以及尚不穩定的技術表現，正在構成一道道難以逾越的“嘆息之墻”。

無論是谷歌被寄予厚望的Veo，還是曾驚艷全球的Sora，亦或是國內卷出天際的可靈、即夢，此刻都站在了一個尷尬的十字路口：技術看起來固然很炫酷，但到底誰能真正靠它賺到大錢？

01 模型競速

時間需要回到2024年。

彼時隨著Sora憑借60秒長視頻、多角度鏡頭切換以及驚人的物理世界模擬能力震驚世界后，當年被科技圈定義為“視頻生成元年”。

隨后Runway推出了Gen-3 Alpha，Luma AI發布了Dream Machine，谷歌則在I/O大會上祭出了Veo；而在國內，字節跳動的即夢（Jimeng）、快手的可靈（Kling）、生數科技的Vidu等模型如雨后春筍般涌現

這一年的主旋律，無疑是中美兩大科技陣營在視頻模型上的瘋狂競速。這種競速不僅體現在發布頻率上，更體現在參數規模與生成質量的軍備競賽中。

但很快，這種競速呈現出一種明顯的“同質化內卷”趨勢。現在的視頻模型，大多采用了DiT（Diffusion Transformer）架構，這一架構有效地結合了Transformer處理序列數據的能力與Diffusion生成高質量圖像的能力。

因為技術路徑的趨同，各家比拼的焦點迅速轉移到了數據質量、上下文長度以及對物理規律的理解上。

以國內戰場為例，可靈AI的突圍極具代表性。依托快手龐大的短視頻生態，可靈在視頻數據的理解上擁有天然優勢，其生成的視頻在運動幅度與邏輯連貫性上，一度被評測為“最接近Sora”的產品之一。而字節跳動的即夢則背靠抖音，在審美風格與運鏡語言上更懂C端用戶的偏好。

但問題是，作為視頻模型代表的Sora,都正在陷入爭議之中。前文提及的留存率，其實只是結果，真正的原因是，號稱打造AI短視頻的Sora2，其用戶體驗卻非常差。

目前的模型競速，更像是一場“演示片”的戰爭。哪怕是Sora2也同樣如此。

官方放出的Demo往往是百里挑一的結果，而當普通用戶上手時，人物肢體扭曲、物體憑空消失、物理邏輯崩壞（如倒出的水往天上流）等“抽卡失敗”的現象比比皆是。這種“Demo與實物不符”的現狀，直接導致了用戶體驗的斷層。

目前的模型能力，雖然已經從“不可用”跨越到了“偶爾驚艷”，但距離ChatGPT那樣“穩定且通用”的GPT-3.5時刻，仍有巨大的鴻溝。

大家都在卷時長、卷分辨率，卻很少有人能徹底解決“可控性”這一導演與創作者最在意的核心命題。

02 算力黑洞

如果說模型能力的不足是可以通過時間解決的“軟傷”，那么算力成本則是懸在所有視頻AI公司頭頂的“達摩克利斯之劍”。

視頻生成是目前所有AI模態中，對算力消耗最為恐怖的領域，沒有之一。

這不僅是因為視頻增加了“時間”這一維度，導致數據量呈幾何級數增長，更因為為了保證視頻的連貫性與物理邏輯，模型需要在極短時間內進行海量的推理計算。

我們可以算一筆賬。

在文本模態下，ChatGPT生成一段文字的成本雖然不低，但已經可以通過訂閱費覆蓋并實現盈利。然而，視頻生成的算力需求是文本的成百上千倍。生成一秒鐘的高清視頻，其所需的GPU算力，足以生成數萬字的文本或數十張高質量圖片。

Sora之所以采用“切片”的方式處理視頻數據，正是為了在Transformer架構下盡可能地壓縮計算量，但即便如此，其推理成本依然高得令人咋舌。

這就是“算力黑洞”。

對于谷歌、OpenAI這樣的巨頭來說，或許還能通過燒錢來維持戰略卡位，利用自身的云服務設施進行內部補貼。但對于Runway、Luma以及國內眾多創業公司而言，每一幀視頻的生成都是在燃燒真金白銀。

更可怕的是，視頻模型似乎還沒有摸到“Scaling Law”（縮放定律）的邊界，或者說，繼續Scaling的邊際收益正在遞減，而邊際成本卻在指數級上升。

為了追求更好的物理模擬效果，模型參數量需要進一步擴大，訓練所需的高質量視頻數據（如電影級素材、高幀率實拍）卻比文本數據更加稀缺且版權復雜。

互聯網上雖然有海量視頻，但大部分是低質量、高壓縮、缺乏標注的“垃圾數據”，清洗和標注這些數據的成本遠高于文本。

用戶的使用習慣也加劇了這一困境。在ChatGPT中，用戶輸入Query，得到答案，流程是線性的。而在視頻生成中，由于結果的不可控，用戶往往需要反復生成、反復修改，就像玩“老虎機”一樣，直到搖出滿意的畫面。

這意味著，一個最終可用的視頻片段背后，可能伴隨著十幾次甚至幾十次的廢片生成。這些廢片消耗的算力，全部是沉沒成本。

目前，無論是國內的可靈、即夢，還是國外的Sora、Veo，都在面臨同一個拷問：這把火到底能燒多久？

如果無法在算力成本與生成效果之間找到一個具備正向經濟效益的平衡點，那么視頻生成極有可能成為一個“叫好不叫座”的富人游戲。

在硬件架構出現革命性突破之前，算力瓶頸將死死卡住視頻AI大規模普及的咽喉。

03 商業困境

其實說到底，技術競速與算力成本最終都要回歸到一個終極問題：商業模式。

為什么ChatGPT能迅速成為殺手級應用？因為它直接解決了信息檢索、代碼編寫、文案撰寫等具有明確“生產力屬性”的剛需，且交付結果相對確定。

反觀視頻生成，目前的定位極其模糊。

在C端市場，視頻AI陷入了“玩具化”的陷阱。絕大多數用戶下載Sora或可靈，更多是出于獵奇心理。他們生成幾個搞怪視頻發朋友圈，獲得社交貨幣后，新鮮感便迅速消退。這解釋了為什么首日留存率尚可，但30天留存率會暴跌至1%。

對于普通人而言，制作視頻并非高頻剛需，且目前AI視頻生成的精細度遠未達到替代拍攝的程度，更無法提供TikTok那種基于算法推薦的娛樂消費體驗。

指望AI生成工具去取代TikTok，在現階段無異于癡人說夢——一個是生產工具，一個是內容消費平臺，兩者的底層邏輯截然不同。

在B端專業市場，視頻AI其實同樣面臨著“不可控”的致命傷。對于影視制作、廣告營銷等專業領域，核心訴求是“精確控制”——導演需要指定角色的微表情、光影的具體走向、物體運動的精確軌跡。

目前的視頻大模型，雖然能生成“看起來很美”的畫面，但本質上還是基于概率的“抽卡”。好萊塢大亨泰勒·佩里雖然因為看了Sora的演示而暫停了影視基地的擴建，但這更多是一種對未來的防御性恐慌，而非當下的實際替代。

真正的影視工作流中，由于AI生成內容難以保持角色一致性和場景連續性，導致其目前只能充當“動態分鏡腳本”或“靈感參考”，很難直接輸出成品素材。

最后也是最為關鍵的，還是變現路徑的狹窄。

目前主流的商業模式依然是Sora、Runway采用的SaaS訂閱制，即賣點數、賣時長。但在高昂的推理成本面前，這種訂閱費往往只能勉強覆蓋成本，甚至虧本賺吆喝。如果為了覆蓋成本而提高定價，又會將大量中小用戶拒之門外，限制了規模效應的形成。

國內市場的情況更為復雜。

可靈、即夢等背靠短視頻巨頭，它們的算盤或許不是直接賣會員賺錢，而是將AI能力融入到自家的短視頻生態中，降低創作者門檻，從而維持內容生態的繁榮，最終通過廣告和電商變現。

這是一種“羊毛出在豬身上”的策略。但問題在于，如果AI生成的視頻內容泛濫且質量參差不齊，反而可能稀釋平臺的內容質量，導致用戶審美疲勞。

從這個角度來看，視頻AI目前正處于Gartner技術成熟度曲線的“期望膨脹期”頂峰滑落向“泡沫破裂谷底期”的階段。

雖然谷歌、OpenAI、快手、字節都在全力以赴，但視頻AI距離“GPT時刻”，也就是要成為一個低門檻、高可用、全行業通用的基礎設施，目前看，無論硅谷還是國內大廠，都還有很長的路要走。

這不僅需要算法層面的突破來解決“可控性”難題，更需要算力成本的數量級下降，以及一個能真正能夠跑通ROI的殺手級應用場景。

在此之前，視頻AI注定依然是一場還得繼續海量燒錢的馬拉松。

*題圖由AI生成

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

一夜之間，微信為何失守？

虎嗅APP 2026-03-24 16:50:56
13 跟貼 13
OpenClaw重大升級遇挫激進重構致用戶全線報錯

財聯社 2026-03-24 16:42:07
30 跟貼 30

Meta又收編智能體創企！谷歌大佬加入超級智能實驗室，原創企獨立運營

智東西 2026-03-24 17:29:20
0 跟貼 0

Clawdbot進化速度離譜：突然開口說話，給自己捏臉，還能炒股砍價

DeepTech深科技 2026-01-29 18:14:10
627 跟貼 627
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
74 跟貼 74

5歲童星爆紅背后，短劇人設失控引熱議，童真淪為流量犧牲品

像風走了八萬里不問歸期 2026-03-23 03:48:53
0 跟貼 0

留學生在國外的視頻火了播放3000w，網友：這學上不明白就回來吧

熱劇迷 2026-03-24 08:52:28
1 跟貼 1
41歲張雪峰去世！賬號頭像變黑白，搶救照疑曝光，生前一語成真

離離言幾許 2026-03-24 22:09:49
16 跟貼 16

你以為在養龍蝦，其實龍蝦在養你

孤獨大腦 2026-03-24 19:41:59
0 跟貼 0
“成為中國人”成海外社交平臺熱詞

北青網-北京青年報 2026-03-25 00:39:25
0 跟貼 0
把AI裝進出海營銷全鏈路，易點天下揭秘智能體落地方法論

智東西 2026-03-24 23:18:08
0 跟貼 0
比Google的傳輸協議快10倍，他要給8000億Agent修高速公路｜AI Founder 請回答

鈦媒體APP 2026-03-24 18:39:05
0 跟貼 0
00后兄弟輟學創業，盯上Sora弱點，3個月融資2900萬

智東西 2026-01-04 18:09:55
1 跟貼 1
華誼王中磊夫婦進軍短視頻，水晶、手串、茶葉等在視頻出現

每日經濟新聞 2025-11-22 12:34:10
0 跟貼 0
這是什么算法

金鑫影視 2026-03-24 11:10:02
1 跟貼 1
富家花重金頭下，泰森11的拳頭模型，有錢就是豪橫

易說搞笑部 2026-03-20 16:00:28
1 跟貼 1
武鋼退休大爺退休金震撼曝光：財富之巔令人驚嘆

故巷笑別w 2026-03-22 11:36:47
0 跟貼 0
在20平方的老房子里住了40多年，一位上海的大姐打理的井井有條

行者東談西說 2026-03-21 14:33:59
50 跟貼 50
百詞斬崩了！連續打卡幾百天的學生稱因“斷簽”急哭，公司深夜回應

極目新聞 2026-03-24 07:58:43
1701 跟貼 1701
印度留學生為何在中國不受歡迎？真相讓人震動

始于初見見 2026-03-25 02:03:41
0 跟貼 0
河南“最愛發錢老板”請員工父母旅游，4000余人預計花費近千萬元，公司：活動持續了14年，老板想幫員工盡孝心

極目新聞 2026-03-24 11:40:03
1598 跟貼 1598
美國模型飛機試飛，鏡頭一轉事不簡單，指揮員吃了熊心豹子膽

桔子笑笑 2026-03-23 14:56:42
1 跟貼 1
小林燕燕在越南建全村最大的碼頭，開工下柱子，建成會是啥樣？

搞笑芒果 2026-03-25 00:09:23
0 跟貼 0
封殺、追捧與3800億估值：Anthropic2026奇幻漂流

鈦媒體APP 2026-03-24 17:47:07
0 跟貼 0
女孩在湖邊拍短視頻，下腰再起身動作，柔軟絲滑！

搞笑面包狗 2026-03-24 15:32:46
3 跟貼 3
龍蝦史上最大更新，亂成一鍋粥了

智東西 2026-03-24 23:50:27
0 跟貼 0
史上最大造芯計劃啟動，馬斯克胃口為何這么大

澎湃新聞 2026-03-24 07:30:37
886 跟貼 886
機器人的算法太恐怖了

阿朵看劇 2026-03-22 08:53:18
1 跟貼 1
0設計基礎、不會PS軟件，我用悟空做出了《一圖看懂華為發布會》

雷科技 2026-03-24 20:26:43
0 跟貼 0
不早不晚，中國一組數據擺上桌，美國緊張不已

洋聊生活 2026-03-23 10:45:30
0 跟貼 0
龍蝦硬件能讓電池更健康，支持智能充電器

愛范兒 2026-03-10 04:18:42
0 跟貼 0
智能體大戰升溫：Claude可代用戶操作電腦 AI代理走向實用化

財聯社 2026-03-24 22:34:11
0 跟貼 0
劉強東的“龍蝦天團”來了！首次開源通用基礎大模型

智東西 2026-03-24 23:50:27
0 跟貼 0
龍蝦爆火之后，AI初創的全球化機會來了嗎？｜線下沙龍報名

量子位 2026-03-24 21:11:09
0 跟貼 0
“億元村”飲水難的背后：重慶奉節縣永樂鎮大壩村部分村民反映，日常生活要喝雨水、溪溝水

澎湃新聞 2026-03-24 13:42:03
427 跟貼 427
人民日報嚴選40首巔峰詩詞，每一首都是天花板，收藏轉發！

大象新聞 2026-03-24 07:13:24
72 跟貼 72
十連勝！上海男籃“復刻”95申花？

上觀新聞 2026-03-24 09:26:12
61 跟貼 61
2026影視剪輯師必備：空鏡慢鏡頭延時FPV高清視頻素材網站推薦

全球汽車匯 2026-03-24 21:12:35
0 跟貼 0
陳志龍事件引發關注，如今拍成短視頻了，這下有好戲看

笑的牙癢癢 2026-03-23 00:00:00
0 跟貼 0
財政部：將合理提高公共服務支出占財政支出的比重

界面新聞 2026-03-22 15:09:33
0 跟貼 0

節點AI

專注于人工智能領域的產業媒體

106文章數 2關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

親子

旅游

游戲

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

從Sora到可靈，視頻AI還沒到GPT時刻

年僅41歲，教育名師張雪峰猝然離世

張雪峰去世 猝死前身體的3個求救信號別忽視

張雪峰去世 猝死前身體的3個求救信號別忽視

NBA最強左手射手，是個右撇子

張雪峰經搶救無效不幸去世 年僅41歲

特朗普再TACO 可以押注伊朗局勢降級？

尚界Z7雙車預售22.98萬起 問界M6預售26.98萬起

態度原創

雷蛇新品來襲！毒蝰V4和巨甲蟲V2專業版亮相

拍完這條，老母親學會了好多西語單詞

余霜管澤元官宣懷孕！“小隊新成員” 來了

張雪峰去世猝死前身體的3個求救信號別忽視

張雪峰去世猝死前身體的3個求救信號別忽視

張雪峰經搶救無效不幸去世年僅41歲

尚界Z7雙車預售22.98萬起問界M6預售26.98萬起