![]()
文|魏琳華
編|王一粟
越到春節(jié)越熱鬧,2月接近過半,全球AI行業(yè)迎來了一個忙碌的“超級發(fā)布月”。
海外御三家先后參戰(zhàn),先是OpenAI和Anthropic撞檔期,前后腳發(fā)布了GPT 5.3 codex和Claude Opus 4.6,隔了幾天,Google把Deep Think端了上來;國內(nèi),兩家上市的六小虎智譜、MiniMax發(fā)模型,視頻領(lǐng)域,快手的可靈3.0和字節(jié)的Seedance對打。真是好不熱鬧。
在這場模型對決中,字節(jié)算得上是本周掀起最大熱度的一家參戰(zhàn)者。不說Seedance 2.0的破圈效應(yīng),在發(fā)模型的力度上,字節(jié)本周一口氣把視頻、圖片生成和大語言模型全都放了出來,每個領(lǐng)域都在刷存在感。
回顧這兩年,其實在大語言模型的領(lǐng)域,字節(jié)的存在感顯然不如視頻、圖文等多模態(tài)領(lǐng)域更強,但豆包卻成了AI入口之爭中表現(xiàn)最好的產(chǎn)品。
事事爭先的字節(jié),目標(biāo)一定是全領(lǐng)域覆蓋。所以這次的豆包2.0大模型(Seed 2.0),也是有備而來。
豆包之所以領(lǐng)先,靠的不僅僅是字節(jié)系流量的灌溉,更關(guān)鍵的是找對了用戶想玩的場景。比如最近刷視頻,天天都能刷到豆包指點人類穿搭。
所以在大語言模型的優(yōu)化上,豆包的進(jìn)展也延續(xù)了場景思路,重點在兩個方向:一是繼續(xù)在多模態(tài)能力上發(fā)光發(fā)熱,二是為了火山引擎做鋪墊,優(yōu)化了Agent相關(guān)能力,讓它在企業(yè)端更好用。
字節(jié)的AI野心,正在隨著模型能力的補全緩緩展開。
進(jìn)化靠場景:左手多模態(tài)、右手抓Agent
可以說,Seed 2.0更新最亮眼的能力,就是多模態(tài)的進(jìn)化。
在官方曬出取得成績的一系列領(lǐng)域中,一部分功勞就要歸到視覺理解能力身上。以數(shù)學(xué)領(lǐng)域為例,字節(jié)超過海外多個閉源大模型的其中兩個指標(biāo)MathVista、MathVision,這兩者重點考察模型對包含視覺信息的數(shù)學(xué)問題的理解能力——也就是模型不僅得數(shù)學(xué)好,還得“看”得明白。
![]()
除了視覺推理,在視頻場景的理解上,Seed 2.0的表現(xiàn)也相對突出。在官方演示中,它能通過對于時間、運動感知的理解,讓大模型看明白視頻中的內(nèi)容。比如吃透臺球的走位、推測擊打臺球的位置。
不難想象,這個功能如果后期和視頻通話進(jìn)行聯(lián)動,豆包又能做出來多少出圈視頻。
多模態(tài)能力的加強,也讓Seed 2.0優(yōu)化了一些在現(xiàn)實中更剛需的場景。豆包不僅僅是基于用戶需求優(yōu)化,字節(jié)在做模型的思路上,也同樣是朝著場景落地來做優(yōu)化。
在Seed 2.0文檔描述中,官方提到,之前分析過Seed 通用模型在 MaaS 服務(wù)中的調(diào)用情況,發(fā)現(xiàn),最高比例的需求為處理混雜圖表、文檔等非結(jié)構(gòu)化信息的知識內(nèi)容。
光錐智能用網(wǎng)上搜集來的一張簡歷表的圖片給到豆包做參考,讓它做個一模一樣的表格出來。在實際測試效果中,雖然表格的大小比例還需要自己優(yōu)化,但豆包已經(jīng)能把表格的內(nèi)容完整復(fù)制下來。
![]()
左為參考圖片,右為Seed 2.0生成的表格
我們又丟了一張混雜著各種柱狀圖表的圖片讓豆包解讀,它也能準(zhǔn)確識別不同軸每個月份的信息。并且讀出來柱狀圖上的數(shù)字、不同顏色的軸代表的意義是收入和差值,然后講解圖片代表的意義。
![]()
![]()
另外,除了提升文件信息的處理,豆包這次把重心放在了Agent上。同樣是為了企業(yè)應(yīng)用的場景考慮,做了對長內(nèi)容理解和連續(xù)多步驟執(zhí)行能力的優(yōu)化。
從測評數(shù)據(jù)來看,在Agent任務(wù)的執(zhí)行上,Seed 2.0確實站上了第一梯隊的位置。
以HLE(人類最后的測試,用于評判處理復(fù)雜任務(wù)的能力)為例,Seed 2.0拿到了52.4,超過了海外多個模型,超過了這幾天新發(fā)的模型GLM 5.0、MiniMax 2.5。但如果和開源老大哥阿里的Qwen-3 Thinking Max(58.3)相比,還有些許差距。
![]()
為了測試豆包的Agent能力,光錐智能給了豆包一串月之暗面曾經(jīng)展示過的提示詞,讓Seed 2.0做一個在手機端運行防止作弊的小問卷,主題是考驗用戶對豆包2.0的理解,一共出十道題就行。
雖然豆包一開始做的版本沒辦法點擊測試按鈕跳轉(zhuǎn)到題目,但我們讓它自動修正兩次后,豆包把這個需求成功復(fù)刻出來了。能運行、能跳轉(zhuǎn)、能打分。
再讓它做了下連連看、黃金礦工這類小游戲,雖然在畫面上還有很大的優(yōu)化空間,不算美觀。但豆包給到的已經(jīng)是一個能直接運行的游戲網(wǎng)頁。
![]()
可以說,現(xiàn)在的Seed 2.0,對于普通用戶的體驗來說足夠友好。不過在今年大火的Coding場景上,豆包的大模型梯隊還背著追趕第一梯隊的任務(wù)。
比如,在SWE-bench Verfied(用代碼解決問題的能力)測試上,Seed 2.0的表現(xiàn)還沒辦法和智譜、MiniMax的新模型抗衡。Vibe Coding上,Seed 2.0的表現(xiàn)也不算突出。不過字節(jié)也沒準(zhǔn)備把Coding塞到這個模型里,而是另發(fā)了一個Coding模型補全代碼能力。
![]()
在模型定價上,Seed 2.0可以說把價格壓到了非常低的程度,這一如既往地符合字節(jié)在大模型方面的低價策略。官方給出的價格展示中,Seed 2.0的輸入價格被壓低至0.6元/百萬tokens,對比Claude Sonnet 4.5 3美元/百萬token的價格,Seed僅是其 1/35,相比智譜GLM-5每百萬tokens6元的價格,它僅是其1/10。
這樣的價格,在Agent搶跑的2026年,可以想象,會成為字節(jié)做Agent的落地優(yōu)勢。
字節(jié)式勝利:視頻模型的場景和速度戰(zhàn)
如果說Seed 2.0是基礎(chǔ)設(shè)施的加固,那么本周發(fā)布的視頻模型Seedance 2.0,則算得上字節(jié)打得相當(dāng)漂亮的一場仗。
時間倒退回幾年前,可靈是第一個在國內(nèi)引起震動的視頻生成模型。而現(xiàn)在,這種先發(fā)優(yōu)勢正在被后者追趕上。
本月,快手和字節(jié)先后發(fā)布了視頻生成模型的更新,快手發(fā)了可靈3.0,在分鏡能力上有所優(yōu)化,但目前還在內(nèi)測階段,尚未在官網(wǎng)全量上線;字節(jié)的Seedance 2.0雖然發(fā)得晚,但在真人素材、分鏡、物理規(guī)律理解和視頻匹配的音頻效果上的優(yōu)化,加上不到一周時間就基本開放到人人可用的程度,后者成為當(dāng)前聲量最大的視頻生成產(chǎn)品。
但在實際測試中,光錐智能以快手可靈2.6和字節(jié)Seedance 2.0做測試,其實兩者拉開的差距并沒有大到拉開一個量級的差距。
就以物理規(guī)律為例,光錐智能以“臺球撞擊”為提示詞,讓兩個模型分別生成白球擊打紅球、紅球落袋的視頻,從結(jié)果來看,兩者各有優(yōu)勢:可靈2.6沒有生成球桿擊打的效果,但白球擊中紅球一次后就順利落袋;Seedance 2.0給到了球桿擊打的畫面碰撞了兩次紅球才落袋。
但復(fù)盤Seedance 2.0的破圈之路,會發(fā)現(xiàn),這個模型的破圈在場景需求+字節(jié)工廠的能力下,幾乎是必勝的。
先說場景,字節(jié)在社媒的快速破圈,不僅是靠影視颶風(fēng)Tim、游戲科學(xué)創(chuàng)始人馮驥的點評和測試,還有真人素材生成視頻的玩法破圈。這種生成的真實度包括了人像的真實、語音效果和本人的接近,讓更多用戶愿意“嘗鮮”。
找到場景的情況下,字節(jié)正在靠剪映、豆包覆蓋到更多用戶。當(dāng)競爭對手快手可靈3.0仍處于內(nèi)測階段,僅限小范圍用戶體驗的情況下,字節(jié)把Seedance 2.0的體驗放到了剪映、豆包中。當(dāng)前,剪映及海外CCapcu工具t在剪輯中處在斷層領(lǐng)先的優(yōu)勢,而豆包也是AI助手月活第一的產(chǎn)品。
![]()
現(xiàn)在,你可以直接在豆包里用上Seedance 2.0
可以說,字節(jié)用速度和生態(tài)的覆蓋,成功拿下了市場。
除了視頻生成模型外,在圖像生成方面,字節(jié)本周發(fā)布的Seedream 5.0 Lite延續(xù)了字節(jié)在圖片生成領(lǐng)域的優(yōu)勢。這次的更新,主要圍繞著實時信息搜索和指令遵循兩部分能力的提升,前者讓圖片生成能夠基于網(wǎng)上的信息增強理解效果,后者則讓它生成的結(jié)果更符合用戶提示詞給出的需求。
反過來,字節(jié)在多模態(tài)能力上的持續(xù)加強,也在反哺著豆包App。
最近爆火的豆包視頻實時指導(dǎo)你穿搭,效果搞笑,被更多人當(dāng)成了新奇玩法,這些高頻場景不僅培養(yǎng)了用戶習(xí)慣,也為模型提供了更多有效的對話信息。
本周三個大模型更新的“超級發(fā)布周”,是一次典型的字節(jié)式勝利:優(yōu)勢不僅是單點技術(shù)的突破,還靠接地氣的產(chǎn)品化能力和與普通用戶貼近的場景。
模型層面,字節(jié)在春節(jié)前交了一個能讓團隊滿意的答卷,證明了豆包不止是一個“搞笑姐”。產(chǎn)品層面,豆包要和各家大廠AI App打的仗,即將在春晚掀開帷幕。
隨著模型能力差距的拉近,這場AI戰(zhàn)爭,注定越來越激烈。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.