一水 聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
中國AI音樂,悄悄把全球第一拿走了——
昆侖萬維Mureka V8,最新登頂Artificial Analysis音樂模型榜,一舉超越Suno V4.5、Udio v1.5 Allegro等國際主流模型。
而且還是人聲(vocal)、器樂(instrument)雙料第一那種。
![]()
![]()
那么問題來了,這個(gè)新鮮出爐的“雙料第一”到底有多能打?
咱直接實(shí)測說話。
人聲、器樂雙實(shí)測
先看最直觀的人聲
這塊兒我們先給出了一個(gè)極簡提示詞,不加復(fù)雜的結(jié)構(gòu)和參數(shù),就看Mureka V8最原始的理解和生成能力:
- 晚風(fēng)民謠,溫柔女聲,黃昏鄉(xiāng)間的慢時(shí)光。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/tw18swYdQYE2oxyuMWikEg
怎么說?AI唱歌是不是太有真人感了!!
吐字清晰咱就不提了,關(guān)鍵在細(xì)節(jié)。
第四句開頭能聽到一個(gè)明顯的換氣聲,再往后,幾處歌詞結(jié)尾也明顯能聽出氣息的上揚(yáng)or下落處理。
這種呼吸起伏恰到好處地在曲子里穿插銜接,非常自然,而不是那種生硬堆砌。
還有溫柔這個(gè)標(biāo)簽,不只是貼在聲音上,在段落的推進(jìn)上也貫穿始終。
主歌更克制、更貼耳、氣息更輕;副歌才稍微把聲帶打開,情緒抬起來,不過這種情緒依然是收著的,沒有用力過猛。
木吉他帶入,人聲一出,田間、黃昏、晚風(fēng)……這愜意感簡直撲面而來。
聽完民謠,我們又甩給Mureka V8一個(gè)極其刁鉆的指令。
“曲風(fēng)要Pop Rock和R&B混著來,節(jié)奏要卡死在72BPM的慢板,人聲還得在幾個(gè)段落里來回切換:
第一段氣聲唱法是那種沙沙的、帶點(diǎn)破碎感的聲音;
副歌直接切搖滾嗓,帶嘶吼的那種;
間奏再來一段R&B轉(zhuǎn)音,最后用假聲慢慢收尾。”
![]()
視頻鏈接:https://mp.weixin.qq.com/s/tw18swYdQYE2oxyuMWikEg
沒想到這反復(fù)橫跳的刁鉆需求,還真被Mureka V8給跑出來了,聽上去完成得不錯(cuò)(doge)。
幾種狀態(tài)截然不同的絲滑轉(zhuǎn)聲,中間切換還不斷檔、不卡頓。
好吧我承認(rèn)V8你的唱商在我之上……
再讓AI試試玩樂器
一提到樂器,英式搖滾樂隊(duì)The Kinks的《You Really Got Me》簡直不要太出名——
這首歌的前奏,是一段1960年代最具標(biāo)志性的失真吉他riff。
所謂riff就是一段簡短、重復(fù)、極具辨識度的樂器樂句,通常是吉他或貝斯演奏,構(gòu)成整首歌的記憶點(diǎn)。
而Mureka V8在學(xué)到這種技巧后,為我們生成了一首純器樂演奏曲《Got Me Going》:
![]()
視頻鏈接:https://mp.weixin.qq.com/s/tw18swYdQYE2oxyuMWikEg
就問有誰不想邊聽邊搖頭抖腿呢(笑.jpg)。
開頭的riff味道非常正,一下子就把記憶點(diǎn)拉滿,然后整個(gè)器樂編排也十分有畫面感——
一聽就知道人已經(jīng)坐在酒館或Livehouse臺下了,而此時(shí)臺上正有一支帥氣逼人的樂隊(duì)在演奏,還是邊演邊跳舞那種。
u1s1,AI生成的器樂演奏如今能到這個(gè)水平,確實(shí)給了人很大驚喜。
聽完之后,你會很明顯感受到它對不同樂器特性、歌曲意境的理解等,都往前邁出了一大步。
![]()
而當(dāng)這種器樂演奏能力和人聲能力相結(jié)合之后,Mureka V8曾被反復(fù)提及的一點(diǎn),也愈發(fā)清晰——
它所生成的,已經(jīng)不再是一段“AI音頻片段”,而是一首結(jié)構(gòu)完整、情感連貫、制作精良的“歌”
換句話說,它知道什么時(shí)候該唱、情緒怎么推進(jìn)、用什么樂器以及該怎么用。
這種近乎專業(yè)音樂人的創(chuàng)作能力,讓它真正跨越了一條從“可生成”到“可直接發(fā)布”的線。
因?yàn)槎魳罚钥梢灾苯由伞案琛薄?/p>
而能夠生成一首完整的“歌”,則意味著普通人無需專業(yè)訓(xùn)練也能擁有屬于自己的作品——
人人都能參與創(chuàng)作發(fā)表的時(shí)代,真的來了。
至此,靠著“雙料第一”實(shí)力打底的Mureka V8,也把AI音樂直接卷到了新的高度。
三個(gè)月一更,昆侖萬維太卷了
不過實(shí)測一圈下來,我就想知道:它這股子暴力進(jìn)化感是咋做到的?
答案大概藏在那條密密麻麻的時(shí)間線里——
昆侖萬維這家公司在AI音樂的賽道上簡直卷瘋了。
2024年2月SkyMusic 1.0內(nèi)測起步,到了2026年1月,Mureka V8正式發(fā)布,滿打滿算不到兩年時(shí)間,硬生生迭代了8個(gè)大版本。
什么概念?平均三個(gè)月一更?!
能這么玩,到底是在燒錢還是真憋著一口氣要把這事兒干成?
![]()
從結(jié)果來看,昆侖萬維應(yīng)該是后者。
回看Mureka這不到兩年的進(jìn)化史,其實(shí)就是一個(gè)把“AI音樂好聽”從玄學(xué)變成可量化、可復(fù)現(xiàn)的工業(yè)化生產(chǎn)能力的迭代過程。
第一階段是從不能用到能用
SkyMusic 1.0當(dāng)時(shí)還只是個(gè)能跑通的內(nèi)測版本,那時(shí)候團(tuán)隊(duì)就盯著一件事,先把端到端“能用”這件事做出來,跑通訓(xùn)練到評測的基礎(chǔ)閉環(huán)。
緊接著兩個(gè)月后,2.0版本就直接把中英文版本上線到天工,這時(shí)候的AI音樂勉強(qiáng)算是邁過了“能出聲、不鬼畜”的門檻。
第二階段是從能用到好用
到了2024年8月,產(chǎn)品迎來3.0到4.0大版本躍遷,解決了規(guī)模化的問題。
昆侖萬維這次不僅落地了Mureka首個(gè)超大規(guī)模版本,構(gòu)建起穩(wěn)定的規(guī)模化基模能力,還在聽感和音質(zhì)方面還實(shí)現(xiàn)了“肉耳可聽”的級數(shù)躍遷。
獨(dú)立產(chǎn)品也借此殺出重圍,正式切入市場。
到了5.0/5.5版本,多語種工程化能力補(bǔ)齊,Mureka開始在全球市場刷臉。
進(jìn)入2025年,隨著MusiCoT和更系統(tǒng)化的強(qiáng)化學(xué)習(xí)跑成閉環(huán),模型開始具備主動(dòng)思考的能力
這時(shí)候的Mureka就不是盲目撞大運(yùn)了,擁有了先規(guī)劃音樂框架、敲定配器細(xì)節(jié)和情緒,再按邏輯推進(jìn)創(chuàng)作的主動(dòng)能力。
第三階段是從好用到直接生產(chǎn)可發(fā)布內(nèi)容
到了V8,量變終于引起了質(zhì)變。
人聲的呼吸感、樂器的空間感、混音的專業(yè)度讓它在AA榜單雙料登頂,直接干翻了Suno和Udio。
![]()
這一步跨了兩年,但昆侖萬維是真跨過去了。
所以那套看似“超速”的迭代節(jié)奏,好像也沒那么“瘋”了——
不這么卷,怎么在兩年內(nèi)把一個(gè)從零開始的模型做到全球第一?
說它卷它還真沒完!!
V8發(fā)布剛剛過去兩個(gè)月,基于MusiCoT進(jìn)一步深化的Mureka V9就要來了……
Mureka V8解決了AI音樂“能寫出來”這件事,至于V9卷成了什么樣嘛——
咱只能說,它琢磨的是“能按你想的方式寫出來”
不懂?3月27日看發(fā)布會估計(jì)你就懂了。
AI音樂,這下得看北京了
當(dāng)然了,即使不談Mureka V9,僅從V8的兩次登頂,我們也已經(jīng)能看到一個(gè)更清晰的變化:
“東升西落”正在AI音樂這個(gè)垂類賽道上演
之所以這樣說,是因?yàn)檫^去很長一段時(shí)間,AI音樂基本是太平洋那頭的主場,出名的模型也就那幾家。
包括這次提到的Suno、Udio等,基本有一個(gè)算一個(gè)。
但是現(xiàn)在,以昆侖萬維Mureka V8為代表的國產(chǎn)模型,卻悄然間拿回了主動(dòng)權(quán)。
說到這里有人或許就好奇了,為什么會出現(xiàn)這種反轉(zhuǎn)?
答案,其實(shí)早就已經(jīng)浮出水面了。
![]()
一旦把這件事放在一個(gè)更大的背景下來看,你會發(fā)現(xiàn),“東升西落”幾乎已經(jīng)成了各個(gè)AI賽道必然會出現(xiàn)的一幕景象。
從引爆這輪AI革命的大語言模型,到最近掀起熱潮的“龍蝦”,劇本基本都一樣——
前期由海外公司完成技術(shù)引爆,后期則由國產(chǎn)團(tuán)隊(duì)實(shí)現(xiàn)追趕,甚至反超
到現(xiàn)在,國產(chǎn)開源已經(jīng)成了比肩閉源的重要力量、國產(chǎn)模型被海外公司“友好借鑒”拿去玩“龍蝦”……人們總是后知后覺發(fā)現(xiàn),很多原本以為的“追趕”,其實(shí)早就變了。
而這一切背后的邏輯,其實(shí)大家也都心知肚明。
放在制造業(yè)領(lǐng)域,大家會說這是因?yàn)橛小爸袊圃臁保欢旁诨ヂ?lián)網(wǎng)科技、放在AI領(lǐng)域,答案則是“中國速度”“中國規(guī)模”“中國場景”。
一方面,國內(nèi)這批AI玩家基本都經(jīng)歷過互聯(lián)網(wǎng)從誕生到發(fā)展的完整時(shí)期,所以他們很熟悉那套“小步快跑、不斷根據(jù)用戶反饋進(jìn)行迭代”的打法。
可以說,相比從0到1,我們尤為擅長從1到100。
另一方面,在內(nèi)容、場景和用戶規(guī)模上,國內(nèi)也擁有得天獨(dú)厚的“練兵場”——
無論是龐大的互聯(lián)網(wǎng)用戶群體、豐富多元的應(yīng)用場景,還是足夠復(fù)雜的內(nèi)容生態(tài),都給國產(chǎn)模型提供了快速試錯(cuò)、持續(xù)優(yōu)化的土壤。相應(yīng)地,國產(chǎn)AI也能更快形成“飛輪效應(yīng)”。
![]()
而這些,也同樣正在支撐著AI音樂賽道的發(fā)展。
所以,此時(shí)國產(chǎn)玩家里有人能“站出來、站起來”,也就不足為奇了。
至于為什么會是昆侖萬維,上一部分也已經(jīng)說了很多了——
圍繞把“好聽”變成可復(fù)現(xiàn)的系統(tǒng)能力這個(gè)目標(biāo),他們對AI音樂這個(gè)垂類賽道進(jìn)行了長期持續(xù)投入
俗話說,水滴石穿、繩鋸木斷。所以如今能有這個(gè)結(jié)果,也算是水到渠成的事情。
再加上昆侖萬維還是北京市人工智能產(chǎn)業(yè)的科技創(chuàng)新代表,所以登頂這件事本身也多了另一層象征意義:
AI音樂,往后高地就是北京了。
據(jù)說,昆侖萬維還會在3.27(本周五)舉辦的中關(guān)村論壇開專場發(fā)布會
屆時(shí)Mureka V9,應(yīng)該會有更多詳情和介紹。
酷~
體驗(yàn)地址:
國內(nèi)版:https://www.mureka.cn/
海外版:https://www.mureka.ai/
榜單地址:
人聲:https://artificialanalysis.ai/music/leaderboard/vocals
器樂:https://artificialanalysis.ai/music/leaderboard/instrumental
— 完 —
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.