字節(jié)證明了，豆包不止是個搞笑姐

2026-02-14 22:39:14　來源: 光錐智能

山西舉報

分享至

文｜魏琳華

編｜王一粟

越到春節(jié)越熱鬧，2月接近過半，全球AI行業(yè)迎來了一個忙碌的“超級發(fā)布月”。

海外御三家先后參戰(zhàn)，先是OpenAI和Anthropic撞檔期，前后腳發(fā)布了GPT 5.3 codex和Claude Opus 4.6，隔了幾天，Google把Deep Think端了上來；國內(nèi)，兩家上市的六小虎智譜、MiniMax發(fā)模型，視頻領(lǐng)域，快手的可靈3.0和字節(jié)的Seedance對打。真是好不熱鬧。

在這場模型對決中，字節(jié)算得上是本周掀起最大熱度的一家參戰(zhàn)者。不說Seedance 2.0的破圈效應(yīng)，在發(fā)模型的力度上，字節(jié)本周一口氣把視頻、圖片生成和大語言模型全都放了出來，每個領(lǐng)域都在刷存在感。

回顧這兩年，其實在大語言模型的領(lǐng)域，字節(jié)的存在感顯然不如視頻、圖文等多模態(tài)領(lǐng)域更強，但豆包卻成了AI入口之爭中表現(xiàn)最好的產(chǎn)品。

事事爭先的字節(jié)，目標(biāo)一定是全領(lǐng)域覆蓋。所以這次的豆包2.0大模型（Seed 2.0），也是有備而來。

豆包之所以領(lǐng)先，靠的不僅僅是字節(jié)系流量的灌溉，更關(guān)鍵的是找對了用戶想玩的場景。比如最近刷視頻，天天都能刷到豆包指點人類穿搭。

所以在大語言模型的優(yōu)化上，豆包的進(jìn)展也延續(xù)了場景思路，重點在兩個方向：一是繼續(xù)在多模態(tài)能力上發(fā)光發(fā)熱，二是為了火山引擎做鋪墊，優(yōu)化了Agent相關(guān)能力，讓它在企業(yè)端更好用。

字節(jié)的AI野心，正在隨著模型能力的補全緩緩展開。

進(jìn)化靠場景：左手多模態(tài)、右手抓Agent

可以說，Seed 2.0更新最亮眼的能力，就是多模態(tài)的進(jìn)化。

在官方曬出取得成績的一系列領(lǐng)域中，一部分功勞就要歸到視覺理解能力身上。以數(shù)學(xué)領(lǐng)域為例，字節(jié)超過海外多個閉源大模型的其中兩個指標(biāo)MathVista、MathVision，這兩者重點考察模型對包含視覺信息的數(shù)學(xué)問題的理解能力——也就是模型不僅得數(shù)學(xué)好，還得“看”得明白。

除了視覺推理，在視頻場景的理解上，Seed 2.0的表現(xiàn)也相對突出。在官方演示中，它能通過對于時間、運動感知的理解，讓大模型看明白視頻中的內(nèi)容。比如吃透臺球的走位、推測擊打臺球的位置。

不難想象，這個功能如果后期和視頻通話進(jìn)行聯(lián)動，豆包又能做出來多少出圈視頻。

多模態(tài)能力的加強，也讓Seed 2.0優(yōu)化了一些在現(xiàn)實中更剛需的場景。豆包不僅僅是基于用戶需求優(yōu)化，字節(jié)在做模型的思路上，也同樣是朝著場景落地來做優(yōu)化。

在Seed 2.0文檔描述中，官方提到，之前分析過Seed 通用模型在 MaaS 服務(wù)中的調(diào)用情況，發(fā)現(xiàn)，最高比例的需求為處理混雜圖表、文檔等非結(jié)構(gòu)化信息的知識內(nèi)容。

光錐智能用網(wǎng)上搜集來的一張簡歷表的圖片給到豆包做參考，讓它做個一模一樣的表格出來。在實際測試效果中，雖然表格的大小比例還需要自己優(yōu)化，但豆包已經(jīng)能把表格的內(nèi)容完整復(fù)制下來。

左為參考圖片，右為Seed 2.0生成的表格

我們又丟了一張混雜著各種柱狀圖表的圖片讓豆包解讀，它也能準(zhǔn)確識別不同軸每個月份的信息。并且讀出來柱狀圖上的數(shù)字、不同顏色的軸代表的意義是收入和差值，然后講解圖片代表的意義。

另外，除了提升文件信息的處理，豆包這次把重心放在了Agent上。同樣是為了企業(yè)應(yīng)用的場景考慮，做了對長內(nèi)容理解和連續(xù)多步驟執(zhí)行能力的優(yōu)化。

從測評數(shù)據(jù)來看，在Agent任務(wù)的執(zhí)行上，Seed 2.0確實站上了第一梯隊的位置。

以HLE（人類最后的測試，用于評判處理復(fù)雜任務(wù)的能力）為例，Seed 2.0拿到了52.4，超過了海外多個模型，超過了這幾天新發(fā)的模型GLM 5.0、MiniMax 2.5。但如果和開源老大哥阿里的Qwen-3 Thinking Max（58.3）相比，還有些許差距。

為了測試豆包的Agent能力，光錐智能給了豆包一串月之暗面曾經(jīng)展示過的提示詞，讓Seed 2.0做一個在手機端運行防止作弊的小問卷，主題是考驗用戶對豆包2.0的理解，一共出十道題就行。

雖然豆包一開始做的版本沒辦法點擊測試按鈕跳轉(zhuǎn)到題目，但我們讓它自動修正兩次后，豆包把這個需求成功復(fù)刻出來了。能運行、能跳轉(zhuǎn)、能打分。

再讓它做了下連連看、黃金礦工這類小游戲，雖然在畫面上還有很大的優(yōu)化空間，不算美觀。但豆包給到的已經(jīng)是一個能直接運行的游戲網(wǎng)頁。

可以說，現(xiàn)在的Seed 2.0，對于普通用戶的體驗來說足夠友好。不過在今年大火的Coding場景上，豆包的大模型梯隊還背著追趕第一梯隊的任務(wù)。

比如，在SWE-bench Verfied（用代碼解決問題的能力）測試上，Seed 2.0的表現(xiàn)還沒辦法和智譜、MiniMax的新模型抗衡。Vibe Coding上，Seed 2.0的表現(xiàn)也不算突出。不過字節(jié)也沒準(zhǔn)備把Coding塞到這個模型里，而是另發(fā)了一個Coding模型補全代碼能力。

在模型定價上，Seed 2.0可以說把價格壓到了非常低的程度，這一如既往地符合字節(jié)在大模型方面的低價策略。官方給出的價格展示中，Seed 2.0的輸入價格被壓低至0.6元/百萬tokens，對比Claude Sonnet 4.5 3美元/百萬token的價格，Seed僅是其 1/35，相比智譜GLM-5每百萬tokens6元的價格，它僅是其1/10。

這樣的價格，在Agent搶跑的2026年，可以想象，會成為字節(jié)做Agent的落地優(yōu)勢。

字節(jié)式勝利：視頻模型的場景和速度戰(zhàn)

如果說Seed 2.0是基礎(chǔ)設(shè)施的加固，那么本周發(fā)布的視頻模型Seedance 2.0，則算得上字節(jié)打得相當(dāng)漂亮的一場仗。

時間倒退回幾年前，可靈是第一個在國內(nèi)引起震動的視頻生成模型。而現(xiàn)在，這種先發(fā)優(yōu)勢正在被后者追趕上。

本月，快手和字節(jié)先后發(fā)布了視頻生成模型的更新，快手發(fā)了可靈3.0，在分鏡能力上有所優(yōu)化，但目前還在內(nèi)測階段，尚未在官網(wǎng)全量上線；字節(jié)的Seedance 2.0雖然發(fā)得晚，但在真人素材、分鏡、物理規(guī)律理解和視頻匹配的音頻效果上的優(yōu)化，加上不到一周時間就基本開放到人人可用的程度，后者成為當(dāng)前聲量最大的視頻生成產(chǎn)品。

但在實際測試中，光錐智能以快手可靈2.6和字節(jié)Seedance 2.0做測試，其實兩者拉開的差距并沒有大到拉開一個量級的差距。

就以物理規(guī)律為例，光錐智能以“臺球撞擊”為提示詞，讓兩個模型分別生成白球擊打紅球、紅球落袋的視頻，從結(jié)果來看，兩者各有優(yōu)勢：可靈2.6沒有生成球桿擊打的效果，但白球擊中紅球一次后就順利落袋；Seedance 2.0給到了球桿擊打的畫面碰撞了兩次紅球才落袋。

但復(fù)盤Seedance 2.0的破圈之路，會發(fā)現(xiàn)，這個模型的破圈在場景需求+字節(jié)工廠的能力下，幾乎是必勝的。

先說場景，字節(jié)在社媒的快速破圈，不僅是靠影視颶風(fēng)Tim、游戲科學(xué)創(chuàng)始人馮驥的點評和測試，還有真人素材生成視頻的玩法破圈。這種生成的真實度包括了人像的真實、語音效果和本人的接近，讓更多用戶愿意“嘗鮮”。

找到場景的情況下，字節(jié)正在靠剪映、豆包覆蓋到更多用戶。當(dāng)競爭對手快手可靈3.0仍處于內(nèi)測階段，僅限小范圍用戶體驗的情況下，字節(jié)把Seedance 2.0的體驗放到了剪映、豆包中。當(dāng)前，剪映及海外CCapcu工具t在剪輯中處在斷層領(lǐng)先的優(yōu)勢，而豆包也是AI助手月活第一的產(chǎn)品。

現(xiàn)在，你可以直接在豆包里用上Seedance 2.0

可以說，字節(jié)用速度和生態(tài)的覆蓋，成功拿下了市場。

除了視頻生成模型外，在圖像生成方面，字節(jié)本周發(fā)布的Seedream 5.0 Lite延續(xù)了字節(jié)在圖片生成領(lǐng)域的優(yōu)勢。這次的更新，主要圍繞著實時信息搜索和指令遵循兩部分能力的提升，前者讓圖片生成能夠基于網(wǎng)上的信息增強理解效果，后者則讓它生成的結(jié)果更符合用戶提示詞給出的需求。

反過來，字節(jié)在多模態(tài)能力上的持續(xù)加強，也在反哺著豆包App。

最近爆火的豆包視頻實時指導(dǎo)你穿搭，效果搞笑，被更多人當(dāng)成了新奇玩法，這些高頻場景不僅培養(yǎng)了用戶習(xí)慣，也為模型提供了更多有效的對話信息。

本周三個大模型更新的“超級發(fā)布周”，是一次典型的字節(jié)式勝利：優(yōu)勢不僅是單點技術(shù)的突破，還靠接地氣的產(chǎn)品化能力和與普通用戶貼近的場景。

模型層面，字節(jié)在春節(jié)前交了一個能讓團隊滿意的答卷，證明了豆包不止是一個“搞笑姐”。產(chǎn)品層面，豆包要和各家大廠AI App打的仗，即將在春晚掀開帷幕。

隨著模型能力差距的拉近，這場AI戰(zhàn)爭，注定越來越激烈。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.