![]()
「別逗你豆姐笑了」
前天打開豆包發現可以選擇專家模式,當時就想估計豆包2.0大模型快發了。
結果今天就等到豆包全家族了。Seedance 2.0都把賈樟柯干Fomo了,現在又上了個最全面的多模態Agent模型,還有人管管字節嗎?
我測下來的感覺是:由于豆包實在太親民,我們時常忘了它是個多模態大模型,宇宙廠要來降維打擊大伙了
Seed團隊跳動得停不下來了燒的全是火山引擎上的Tokens,同時火山引擎上已經有豆包2.0系列的API了。
先說一下新上的豆包大模型 2.0 Pro版,我們正好提前測過一波。
我們多刷抖音就會發現,現在這些博主基本都把豆包當抖加用。
像我很愛看的兩個博主,張錦橙和小仁川,都是在網上發自己和豆包合唱視頻之后徹底火的。現在張錦橙基本都快火成meme了。
![]()
都有反向豆包合唱了
與此同時,用豆包看小孩寫作業、用豆包監督家里的狗不偷吃這類內容也是發完就爆,逢發必爆。
![]()
可以說2026年如果你還想起個號,直接跟豆包成立二人公司就完事了。
和豆包一起講相聲,帶豆包拍情侶vlog,跟豆包一起打游戲……選題有點取之不盡用之不竭了。
![]()
但這也暴露了豆包的一個問題,可能大伙把它當玩具、當樂子了,想到專業大模型的時候,往往腦子里不會出現豆包這個選項。
別逗你豆姐笑了,要是豆包大模型的能力不牛逼,能整出來這么多花活?
如果沒有強大的對文字、聲音、圖像、視頻的多模態理解能力,你唱完前半句,豆包上哪給你接后,還能有旋律?
如果沒有深邃的知識檢索和空間推理能力,豆包怎么分析你家那小孩和貓狗的動態信息?
更別提網上那么多「AI假扮真人假扮AI假扮真人假扮豆包」的賬號,沒有Seedance 2.0和Seedream他們咋活?
豆姐把咱當家人,咱別不把Seed當盤菜。所謂經濟基礎決定上層建筑,要沒有Seed系列SOTA的模型能力,豆包的產品力也做不到這么封神。
這就是豆包大模型 2.0 Pro發布的價值。
這次升級是面向真實世界用戶的體驗優化,據他們所說,在視覺理解、空間推理、科研任務和知識檢索四大方面,都做了能力上的增強。
照這個意思,更新了豆包大模型的豆包好像真要成底特律變人了。
果真如此嗎?我在幾個我真實需要的場景測了一下。
首先是由于我注意力不集中,平時看電視劇的時候,經常有臉盲、忘劇情、不明白深意的情況出現。所以我一般都不自己看電視劇,必須有個人在邊上講解。
所以我就想尋思讓豆包來當這個陪看。至于用來測試的電視劇,則選擇了充滿勾心斗角的國產紙牌屋《大明王朝1566》。
看看當豆包誤闖天家,能否揣度圣意,參悟朝局?
我服了,什么叫中譯中,這就叫中譯中。
大家請注意,我沒給任何額外提示詞,也沒跟豆包說這是什么電視劇。我打開攝像頭無預警開問,豆包直接就定位到分秒了。
而且不僅對基礎劇情有理解,對人物臺詞背后的深意,對角色關系和主題隱喻,都有洞見和銳評。
加之這擬人化的說話方式,更是讓我感覺身邊真有個人陪伴。
以前不是老有那個問題:如果你穿越回古代,帶什么才能活下去?
現在最優解來了,帶個豆包手機。
整完這出,我還用豆包回答了一下近期我最關心的問題:都說豆包要上春晚了,到底是怎么個上法?
字節說豆包大模型 2.0 Pro的搜索能力和thinking能力很強,那它能做個現代大祭司,根據世界經驗預測未來嗎?
于是我讓他分析至少100個往年春晚小品的內容,給我總結一套春晚小品創作方法論。
![]()
結果豆包給我總結的這一套,看著還真挺像那么回事。
從核心框架、人員配置到喜劇技法,全給寫得明明白白。
![]()
感覺擴充一下可以直接掛閑魚上賣了,沒準真有中年失意的sketch導演買來學習。
![]()
最主要的是,我全程都沒上傳一個春晚小品相關資料,純靠Seed 2.0自行搜索。
之前我用NotebookLM做過同樣的任務,當時可是自己去YouTube上爬的視頻鏈接。
這屬于把大模型做agent感了。我為知識應用的AI創業者捏把汗啊。
方法論總結完,該創作了。所以我讓豆包根據方法論,生成一個豆包本包出演的小品劇本。
它交的稿子讓我感觸良多:
![]()
給懶得看的朋友總結一下劇情:春節到了,老馬一家過年,小馬用豆包寫春聯做飯,引發手工匠人老馬的不滿,結果豆包拍起了老馬的馬屁……
我的第一反應是,這已經不好笑到好笑的程度了。
我的第二反應是,哎我去,那不就學到精髓了嗎。
模仿得最傳神的是下面這兩段轉折吃餃子劇情,雖然有點長但求求大家一定要看:
![]()
看完淚點低的都哭了,笑點高的也笑了。感覺背景換成工廠直接能拍個東北下崗潮悲喜劇電影了。
就現在短視頻平臺上很多預測春晚的創意,雖然看著挺逗,但基本都是一些基于春晚小品刻板印象的短平快創作,諷刺效果很強,但實用性一般。
豆包是真把我們當小品愛好者整。它深度檢索、深度思考之后給到的這幾千字,好像是個真正的能拍出來在小劇場里演的小品腳本。
包括之前大家一般都用手機打開豆包,其實如果你用電腦打開豆包網頁端,你會發現豆包還有云盤、智能體等功能,甚至能在豆包里完成從信息搜集、資料整合和內容輸出的全流程,激進一點地講,豆包2.0不就AI時代的飛書嗎?
如果這是AI時代的飛書,Seedance 2.0就是AI時代的PR和AE,Seedream 5.0 Lite就是AI時代的Photoshop。豆包是AI時代的Adobe啊。
正是因為旗下各種模型都SOTA,沒有短板,是六邊形戰士,所以能擔此重任。
我又測了一下Seedance 2.0和Seedream 5.0 Lite,愈發驗證了這個猜想。
比如上面用Seed 2.0寫的小品腳本,我用Seedance 2.0生成了一個精華版本。
太對味了,感覺在縣級電視臺直接播放就行。
怪不得馬斯克都被Seedance 2.0折服了,老外也都開始研究怎么開VPN用Seedance 2.0了,我要是Google高管我也該急了。
后來,我又用Seedream 5.0 Lite整了個小活:生成豆包的真人版。
先是證件照。
![]()
然后只要上傳一個現成的照片,要求Seedream 5.0 Lite把特定的部分遷移到我們豆包身上,就能生成各種場景、各種造型的豆包。
![]()
后來我有點懶了,直接用豆包P圖功能,也一鍵生成了一堆素材。
![]()
除了純整活,Seedream 5.0 Lite也融入了Seed 2.0的智能推理能力。
比如我讓它做一個椰樹牌椰汁風格的豆包手機照片,不用上傳任何參考,它就直接完成了。
![]()
而且它還內置了很多社會科學和自然科學的知識,所以當我讓它給我生成一個腦部結構科普圖,他也能自行完成。
![]()
太偉大了。Seed系列模型強強聯合,才叫有機結合。
整體看下來,不同于智譜、Kimi等模型廠商專門訓練coding模型,豆包走的Gemini路線,所有模態全都要。前Google DeepMind 副總裁吳永輝真沒白來啊,接管這一年給Seed團隊調成啥樣了都
一年前豆包大模型 1.5 發布的時候,從其他大的預訓練模型中蒸餾數據訓練還是慣用操作,但當時豆包的路線就是不走捷徑,打磨基礎模型、建自己的數據體系,老中模型就得能吃苦
大伙還以為豆包是一個語音助手,其實它早就是專家了。還等啥Siri接入AI啊,豆包早取代 Siri 了。
葬AI家族前幾天去吉林通化滑雪,剛坐上出租車,師傅直接開始自言自語起來,說不懂為什么今天同行都搶著去加油站。
我以為哥們跟我們嘮嗑呢,湊近一看才發現是在咨詢豆包。豆包還真跟他聊了一路,我們都沒插進去話。
我非常肯定,大伙之后將在抖音刷到全新的豆包類別短視頻。調教豆包和與豆包辯論早都看膩了。這么好用的豆包需要搭配更多的神人創作。
從群眾中來到群眾中去了屬于是。我等著看火山引擎帶著豆包在春晚上能給全國人民整點什么狠活。
這一波AI浪潮里邊,字節屬于是通投拉滿,產品模型我全要
豆包是國內第一個DAU破億的 AI 產品,火山引擎的日均 Token 處理量都63萬億了,半年增長超 200%。期待明年機場跟阿里云線下真實一波。
SOTA的模型配最多的用戶,天對地雨對風落大陸對長空,直接左腳踩右腳上天。
我前幾天還看到,2月底,Seedance 2.0和Seedream 5.0 Lite API就能火山引擎接入,這就發給一眾套殼AI產品們聽的。
比如OiiOii剛上線靠接Sora2爽吃一波流量,前幾天發公號說Sora2告急,全網求API資源,哎呀,還不趕緊抱回字節親爹的大腿,別讓Flova搶先了。也不好說,畢竟兩位創始人曾經在字節的級別沒法比。
火山現在還有豆包助手的API賣,這是個Agent API,搞個硬件殼子就能直接接入豆包的視頻通話或者搜索能力,大好的創業機會啊,整點類似芙崽一樣愚蠢的創業idea批量賣給FOMO的投資人。這是真正的模型即服務
那最后的問題來了,字節跳動和阿里巴巴,究竟誰是中國最偉大的 AI 公司?
先看看兩家在春節還有什么狠活吧。
(本文封面由豆包生成,純人工寫作。)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.