![]()
撰文|喬雨晴
編輯|翟文婷
鄭州一位大媽怎么也沒想到,自己在家門口學會的廣場舞,會被百度AI搬到法國凱旋門前,而且火爆了自己的老年朋友圈。
在百度「AI環球盲盒拜年」里,只需上傳自己的照片,輕輕一點,紅綢扇舞的視頻就能出現在紐約時代廣場、南極科考站甚至迪拜高樓前。這些帶著中國年味的數字影像,如同蒲公英種子般飄向全球地標。
一年前,AI可能還是一種高大上的技術概念;現如今,百度已經把AI融入鄉音、灶臺油漬里的人情冷暖。當AI不僅能聽懂東北話「波棱蓋卡禿嚕皮」,還能精準捕捉重慶麻將桌上的「刮風下雨」時,這場技術革命正在以最柔軟的方式重塑中國人的日常生活。
老年人甚至比年輕人玩得更上頭。他們不需要明白那些復雜的技術參數,只是動動手指在小程序里上傳照片,就能在老朋友圈子里揚眉吐氣一把。——這種「科技爽感」帶來的滿足,遠比刷短視頻來得更持久。
這場始于春節的AI實驗證明:真正的技術革命,從來不是自上而下的顛覆,而是自下而上地打撈那些被忽視的人間煙火。
01什么才是真正的出圈
「我們的模型在N個維度超越了GPT-4」——這樣的新聞標題也許能讓科技圈興奮不已,但在這個春節,我們看到了更有意思的現象。
喜歡跳廣場舞的阿姨們,只需要在百度AI環球盲盒拜年里上傳自己的跳舞視頻,就像打開任意門,把自己的舞蹈搬運到盧浮宮、時代廣場等全球地標前,效果逼真到自家孩子也會問問「奶奶,你什么時候出國玩啦」。
而通過百度智能云曦靈數字人微信小程序「飛貼賀新春」活動,你不僅可以上傳自己的、父母的、孩子的照片,生成定制的拜年視頻,表情自然、唇音同步;還可以上傳蒙娜麗莎、兵馬俑、達芬奇等歷史文化名人,讓他們用佟湘玉的陜西話、東北話、四川話、閩南話,替你傳遞祝福。
「AI拜年」功能,更是打開了我們對拜年賀卡的想象力。在百度中搜索「AI拜年」,只需要上傳照片,一句話,25秒就能收獲一張專屬的拜年賀卡。
你可以讓Taylor Swift穿上東北大花襖包餃子:
![]()
也可以讓馬斯克拱手作揖拜年:
![]()
還可以讓向佐一個手扶著鼻梁,另一個手撒紅包:
![]()
在家族群里,二舅把全家福P到月球表面舞獅,三嬸則在喜馬拉雅山頂煮出會發光的餃子,表哥就能把財神爺請到自家的客廳里來。
![]()
出門在外、春節旅行的體驗,也在發生變化。百度上線了34個省級行政區的文旅智能體,用會說方言的AI重新定義了導游。這些操著鄉音的AI角色,不再復述千篇一律的景區簡介,而是化身成帶著煙火氣的數字老鄉。
福建的簪花花用閩南軟語講述土樓屋檐滴落的煙雨,徽州的包拯以合肥話解密徽商暗藏在馬頭墻里的算盤聲,湖南的芙小蘭甚至能用湘江浪花般的語速,教你分辨剁椒魚頭里朝天椒與七星椒的比例,天津baibai不僅能用天津話推薦景點、解說五大道,還能即興給你來一段快板。
![]()
這些參與、發布、體驗的用戶,大部分從未接觸過AI工具。
他們不需要理解CLIP或Diffusion模型,只需要知道像跟自己的兒孫對話一樣,用自家的方言,說出自己想做的事——「在巴黎跳廣場舞」,「我要恭喜發財拜年視頻」。
技術的真正價值,不在于能打破多少記錄,而在于能觸達多少普通人的生活。
當不會說普通話的老人能用方言和AI對話,當從未出過遠門的大媽能在世界地標起舞,當小學生能用AI設計旅游路線,當不會打字的大爺大媽用四川話讓AI生成全家福賀卡——這才是技術真正的出圈。
02技術蹲下來
技術只有蹲到市井煙火的高度,才能聽懂真實世界的需求。真正的技術革命,往往發生在人們意識不到這是「技術」的時刻。
就像此刻,當爺爺奶奶們對著手機吼著東北話、河南話、紹興話時:「給俺整個在埃菲爾鐵塔扭秧歌的視頻」,他們并不知道,這句話正在觸發全球最先進的多模態大模型協同作業。
百度悄無聲息地降低了創作門檻,讓男女老少都能享受到技術的樂趣。
之前AI生圖、AI生視頻沒有在普通人里火起來,本質上是因為創作門檻高。你需要用非常精細的prompt,甚至加入「4K ultra-detailed」「cinematic lighting」之類的專業術語,多輪調整、反復測試,才能像抽盲盒一樣抽到理想的效果。而且AI生圖和文本模型一樣,本質上是對每一個像素點的預測,很容易出現幻覺,生成不符合現實的詭異畫面,比如經典的「威爾·史密斯吃意大利面」。
![]()
百度的iRAG技術致力于消除這樣的幻覺。RAG(Retrieval-Augmented Generation,檢索增強生成)是一種結合了檢索和生成的技術,之前被廣泛用在文本數據或者表格這類結構化的數據上。但百度創新性地把 RAG 技術用在了圖像數據上,搞出了iRAG(Image-Based Retrieval-Augmented Generation,檢索增強的文生圖技術)。
你可以把RAG想象成,給AI配了個「小抄」,讓他在回答問題前能參考一些額外的資料。這些資料通常不在大模型原本的學習范圍里,是些專屬或私有的數據。通過參考這些數據,大模型回答問題時就能更貼合實際情況,不用重新學習,就能提升回答質量,減少幻覺。
百度的 iRAG 技術是 RAG 技術的一種進階版,是 RAG 向多模態的泛化與拓展,即 iRAG = 圖像 + RAG。
iRAG通過檢索百度搜索的大規模圖像數據庫,可通過參考和引用真實的圖像元素,結合文本提示詞要求進行重繪。這為文生圖的真實感和事實性保駕護航。同時保持良好的主體一致性,通過提示詞「Hello Kitty 在某某著名景點前」,你可以讓這只世界上最著名的小貓漫游中國。
![]()
以前讓AI繪畫「大媽在埃菲爾鐵塔前跳舞」,可能會長出六根手指,或者鐵塔上掛著蘭州拉面旗。現在IRAG就像個嚴格的監工:紅綢緞該有飄揚的質感,大媽抬腿的角度必須符合人體工學。
方言的處理也是如此。以前每個方言都需要單獨開發一套系統,比如上海話、廣東話各自有不同的處理模塊。再比如,用周杰倫的聲音說東北話,還需要模型能夠分離音色和方言特征。
之前, AI學會說方言,不僅要收集成千上萬個小時的純正發音,還要再像語文老師一樣逐個標注聲調,光是讓AI分清廣東話的「九聲六調」,就要花半年時間調整參數。好不容易教會AI說粵語,換成閩南語又得從頭再來。
而現在,通過深度神經網絡,百度的語音AI系統能將語音拆解為獨立控制的模塊:音色(誰在說話),內容(說什么),方言(怎么發音),情感(用什么語氣)。這種參數化重組技術,使方言研發從手工作業躍升到工業化生產。這意味著周杰倫的聲音可以說出純正東北話,而重慶嬢嬢的語調能完美移植到英語拜年視頻中。
現在,僅需幾分鐘數據就能達到超越真人的tts水平;意味著大爺大媽只要錄兩句話,就能讓AI模仿他們的音色音調和方言,在賽博世界替他們拜年送祝福。
百度把創作門檻打了下來。在技術專家視角里,這些效果體現為主體一致性、物理合理性、時空連貫性、語音和口型的匹配度等硬性指標的提升;但對老百姓來說,就是「這玩意兒真像那么回事」。
當大媽們生成廣場舞視頻時,她們并不關心背后的技術如何優化,只在乎家族群里收獲了多少點贊表情包——這才是技術普惠最生動的注腳。
03 AI與煙火氣的化學反應
一個不難發現的趨勢是,AI應用正在從「精英工具」變成「大眾玩具」,我們可能正處在2025年超級應用爆發前夜。
兩年前,當ChatGPT寫出莎士比亞風格的十四行詩時,全世界為之驚嘆。但這個春節讓我們明白:文字只是人類表達的一小部分,真實世界是多模態的,真正的智能必須理解紅綢扇舞動的物理學,以及鄉音的抑揚頓挫。
2024年的AI還在實驗室里卷參數、比benchmark;2025年的春節,它已經坐上了千家萬戶的團圓飯桌。從寫論文、畫圖表的精英玩具,到大媽跳舞、給親戚拜年的大眾工具,AI正在完成一次意義深遠的位移。
這種位移的背后,是過去幾年的積累和普及。大模型賦予的AI原生應用正在滲透各行各業,并且從城市進入下沉市場,AI含量越來越高,破圈效應呼之欲出。
百度就是一個縮影,展現了AI在不同場景下的廣泛應用。從生產力變革的工作場景到日常生活情感陪伴,百度都有產品日漸深入人心。
李彥宏在2025年全員信中表示:大模型賦能的AI原生應用正在各行各業各種場景迅速普及,雖然超級應用尚未出現,AI的實際滲透率已經不低,并且將在2025年繼續井噴式增長。
![]()
百度文心智能體平臺已有15萬家企業和80萬開發者入駐,在律師、情感、健康等多個領域成功跑通模式。這表明AI的應用已經不再局限于理論和實驗階段,而是真正開始在各個行業中發揮作用,為不同領域的企業和開發者提供了強大的支持和賦能。
因為文心大模型賦能,百度文庫新增上百項AI能力,涉及寫作、PPT制作、搜索、文生圖等,使得這個舊產品爆發新能量,百度文庫AI功能MAU突破9000萬,AI DAU年同比增長230%,甚至成了付費界的頂流。
4000萬真金白銀的付費用戶,不是靠單純的營銷打法能實現的,本質上還是解決了用戶真實需求,獲得大家認可。
包括今年春節出圈的方言搜索,也是因為AI的魔力,穿透了不同圈層人群,人與人之間的距離也被拉近。方言作為一種承載著地域文化和情感的特殊語言形式,通過AI的搜索和識別功能,讓更多人能夠方便地使用和交流,這不僅促進了文化的傳承和交流,也體現了AI在情感連接方面的巨大潛力。
過去兩年,全球科技巨頭在尋找 AI killer app 的路上幾經波折。他們投入了大量的資源和精力,試圖找到那個能夠真正引爆AI市場的殺手級應用。
但這個春節給出了答案:當全家老小圍著AI生成的拜年視頻笑作一團時,超級應用便有了破土的能量。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.