新音樂產(chǎn)業(yè)觀察原創(chuàng)文章,未經(jīng)授權(quán)謝絕轉(zhuǎn)載
作者 | 朱力克
在發(fā)展顯著提速的當(dāng)下,AI已經(jīng)以一種非常具體的方式進(jìn)入音樂行業(yè)。
有職業(yè)音樂人抱怨,因?yàn)閺V告公司改用AI音樂,自己在半年內(nèi)失去了多份定制音樂合同;另有游戲音樂從業(yè)者表示,在引入AI工具之后,其公司的錄音師團(tuán)隊(duì)從4人減少到1人。
廣告音樂和游戲音樂等都屬于典型的功能性音樂,制作流程高度標(biāo)準(zhǔn)化,恰恰在這一領(lǐng)域,AI音樂具有顯而易見的替代性。
功能性音樂只是行業(yè)變革的前沿陣地,隨著AI作曲家和AI制作人登場,大量依賴標(biāo)準(zhǔn)化流程的工作崗位正在被重新劃分,“搶飯碗”不再是危言聳聽,而是一種正逐漸顯現(xiàn)的現(xiàn)實(shí)。
但與此同時(shí),另一種變化也正在出現(xiàn),當(dāng)標(biāo)準(zhǔn)化生產(chǎn)逐漸被AI接管,人類創(chuàng)作者反而將聚焦于更能發(fā)揮創(chuàng)造力的“非標(biāo)準(zhǔn)化工作”。
在這個(gè)巨變的周期里,行業(yè)急需在技術(shù)替代與創(chuàng)意共生之間尋找新的平衡點(diǎn)。
親測,AI音樂已經(jīng)夠用了
過去兩年,AI音樂的發(fā)展大致沿著兩條路徑同步推進(jìn)。
一條路徑是普適化,豆包和Gemini等泛AI平臺已經(jīng)集成音樂工具,將AI生成音樂轉(zhuǎn)化為可被廣泛調(diào)用的基礎(chǔ)生產(chǎn)力能力;另一條路徑則是專業(yè)化,Suno和MiniMax等廠商開始針對具體行業(yè)場景進(jìn)行模型優(yōu)化,使生成音樂真正具備進(jìn)入商業(yè)生產(chǎn)流程的條件。
今年年初,MiniMax推出MiniMax Music 2.5,將歌曲生成能力提升至格萊美級別。對此,我們曾在《AI音樂的下半場,誰能夠真正上岸?》一文分析認(rèn)為,MiniMax Music 2.5顯示出AI音樂已經(jīng)發(fā)展為能夠?qū)有袠I(yè)需求的專業(yè)級生產(chǎn)工具。
而最新推出的Music 2.5+則進(jìn)一步補(bǔ)齊了純音樂生成這一環(huán)節(jié),使整個(gè)Music 02系列逐漸成為一個(gè)沒了短板的“水桶型模型”。
![]()
這一變化看似只是功能補(bǔ)全,但實(shí)際上意義不小。
關(guān)于AI音樂的討論,人們往往更關(guān)注“AI寫歌”,但在實(shí)際商業(yè)應(yīng)用中,需求量更大的往往是功能性純音樂,廣告、游戲、影視、播客、直播、電商視頻……幾乎所有內(nèi)容產(chǎn)業(yè)都需要大量背景音樂。
當(dāng)AI模型在純音樂生成能力上達(dá)到可用水平時(shí),也就意味著AI真正具備了進(jìn)入商業(yè)音樂生產(chǎn)流程的能力。
為了更直觀地理解這一變化,我們簡單做了一系列測試,針對不同場景用MiniMax Music2.5+生成幾段音樂,包括強(qiáng)調(diào)劇情感的游戲音樂、強(qiáng)調(diào)氛圍感的助眠類純音樂和強(qiáng)調(diào)情緒引導(dǎo)的廣告音樂等。為了體驗(yàn)AI的智能性,我們還盡可能簡化提示詞。
1.游戲音樂
提示詞:游戲音樂
生成結(jié)果呈現(xiàn)出較清晰的劇情變化,音樂開頭以鋼琴和氛圍音效鋪墊節(jié)奏,隨后逐漸加入弦樂和打擊樂,使整體張力不斷增強(qiáng)。中段出現(xiàn)短暫過渡后,多樂器組合進(jìn)入更高強(qiáng)度的節(jié)奏段落。整體來看,這段音樂已經(jīng)具備較明顯的劇情推進(jìn)感,符合動(dòng)作或冒險(xiǎn)類游戲配樂常見的編排邏輯。
2.療愈音樂
提示詞:國風(fēng),自然采樣,療愈
生成結(jié)果以鳥鳴和海浪等自然環(huán)境音作為開頭,輔以彈撥類樂器作為鋪墊。整體節(jié)奏較為平緩,旋律變化較少,主要通過自然聲景與輕音樂器維持穩(wěn)定的氛圍感。這種設(shè)計(jì)與助眠或冥想類音樂常見的制作思路較為一致,即通過低強(qiáng)度旋律和持續(xù)聲場構(gòu)建放松氛圍。
3.廣告音樂
提示詞:電子產(chǎn)品廣告音樂
生成音樂整體節(jié)奏感較強(qiáng),以電子節(jié)拍為基礎(chǔ),并加入打擊樂強(qiáng)化律動(dòng)。旋律結(jié)構(gòu)相對簡潔,節(jié)奏推進(jìn)直接,使情緒表達(dá)更加集中。這種明快且節(jié)奏突出的音樂類型,與廣告或品牌宣傳視頻中常見的配樂風(fēng)格較為接近。
4.Lo-Fi音樂
提示詞:辦公室Lo-Fi
生成音樂以電吉他作為主旋律,通過輕快掃弦進(jìn)行節(jié)奏鋪墊,在鼓組節(jié)拍的帶動(dòng)下形成穩(wěn)定律動(dòng),背景中還加入輕微的黑膠顆粒噪聲,為音樂增加了典型的Lo-Fi質(zhì)感,使整體氛圍更加松弛,適合用作工作背景音樂。
5.泛化音樂
提示詞:電子舞曲,爵士,中國風(fēng),凱爾特,古典音樂,印度
這一測試主要用于觀察模型的大跨度泛化能力,電子舞曲的鼓點(diǎn)構(gòu)成基礎(chǔ)結(jié)構(gòu),而旋律與音色中則出現(xiàn)一些帶有民族風(fēng)格特征的元素,使音樂呈現(xiàn)出一定的跨文化風(fēng)格混合。即使多流派混搭,模型也能保持整體的音樂結(jié)構(gòu)不亂。
綜合看來,僅使用較為簡單的提示詞,AI生成音樂已經(jīng)能夠形成相對完整的結(jié)構(gòu)框架,如果進(jìn)一步引入精細(xì)化的參數(shù)控制,其輸出質(zhì)量還將有明顯的提升空間。據(jù)此,我們的判斷是,當(dāng)前階段的AI生成音樂已經(jīng)能夠滿足不同商用場景的基礎(chǔ)需求,為游戲、短視頻或廣告等提供BGM。
AI正在重塑商業(yè)音樂工作流
在商用音樂領(lǐng)域,AI已經(jīng)開始對傳統(tǒng)生產(chǎn)模式產(chǎn)生沖擊。
早在五年前,一些國外功能性音樂公司就開始嘗試使用AI生成音樂。到2024年,數(shù)據(jù)顯示,31%的廣告公司在營銷活動(dòng)中使用AI生成音樂,27%的游戲音頻設(shè)計(jì)師使用AI音樂生成工具,19%的YouTube創(chuàng)作者使用AI生成背景音樂。
廣告、游戲和視頻內(nèi)容對音樂的需求通常可量化程度高,制作流程也相對標(biāo)準(zhǔn)化,這使其成為AI音樂最容易進(jìn)入的領(lǐng)域。
![]()
在這些場景中,AI的優(yōu)勢并不在于創(chuàng)意表達(dá),而在于穩(wěn)定的規(guī)模化生成能力。當(dāng)AI模型能夠持續(xù)輸出結(jié)構(gòu)完整、風(fēng)格穩(wěn)定的音樂內(nèi)容時(shí),就不再只是創(chuàng)作輔助工具,而開始具有改變行業(yè)鏈條的能力。
以影視配樂為例,傳統(tǒng)配樂制作通常是一個(gè)成本高、周期長的工業(yè)流程。一分鐘頂級電影配樂的制作成本往往在2萬美元以上,如果邀請一線配樂師,整部電影的配樂預(yù)算可能達(dá)到數(shù)百萬美元,同時(shí)還需要樂團(tuán)錄制、專業(yè)錄音棚以及復(fù)雜的后期制作。
相比之下,AI一分鐘即可生成音樂,并且可以隨時(shí)調(diào)整結(jié)構(gòu)、情緒或配器,價(jià)格也非常低廉,這種效率和成本差距對于需要大量音樂內(nèi)容的行業(yè)來說具有明顯吸引力。
工作流程的變化已經(jīng)在不同內(nèi)容行業(yè)中出現(xiàn),在游戲開發(fā)中,一些團(tuán)隊(duì)已經(jīng)開始嘗試使用AI生成動(dòng)態(tài)配樂,使音樂能夠隨游戲劇情實(shí)時(shí)變化;影視行業(yè)也在探索AI在內(nèi)容制作中的可能性,華納和迪士尼等公司都在嘗試將AI工具引入影視制作流程。
在國內(nèi),一些AIGC內(nèi)容項(xiàng)目開始嘗試完整的AI創(chuàng)作鏈路,并走出國界。例如基于經(jīng)典香港電影IP開發(fā)的AIGC漫劇《花好月圓之狐妃嫁到》,就使用MiniMax的全模態(tài)模型完成了從視頻生成、語音配音到音樂創(chuàng)作的全流程制作,其中,Music 02音樂模型為作品生成了專屬OST。
AI工具正在從不同方向進(jìn)入內(nèi)容生產(chǎn)的核心環(huán)節(jié),被改變的將不僅是某一類內(nèi)容的創(chuàng)作方式,而是整個(gè)內(nèi)容產(chǎn)業(yè)的工作流程,AI與人類在其中的角色也將隨之重新分配。
AI負(fù)責(zé)“標(biāo)準(zhǔn)”,人類回歸“非標(biāo)”
從某種意義上說,AI音樂大模型創(chuàng)造了一個(gè)新角色,全能的AI作曲家。
過去,AI音樂更多被視為創(chuàng)作輔助工具,例如生成靈感、制作Demo或提供簡單的編曲素材。但隨著模型能力的不斷進(jìn)步,AI已經(jīng)能夠獨(dú)立完成完整音樂的生成,并直接進(jìn)入廣告、游戲、視頻等商業(yè)內(nèi)容生產(chǎn)流程。
當(dāng)AI開始具備完整的音樂創(chuàng)作能力時(shí),它也就成為了一種新的“創(chuàng)作者”。
![]()
在這一背景下,音樂行業(yè)中大量高度標(biāo)準(zhǔn)化的生產(chǎn)環(huán)節(jié),將首先受到?jīng)_擊。從音樂庫制作、初級編曲與混音,到基礎(chǔ)音效和采樣生成,這些依賴固定模式與穩(wěn)定風(fēng)格輸出的工作,正是AI發(fā)揮效率優(yōu)勢的地方。
MiniMax音樂模型所體現(xiàn)的正是這樣一個(gè)趨勢,AI已經(jīng)可以生成符合專業(yè)場景需求的成品音樂,并因此將接管傳統(tǒng)的標(biāo)準(zhǔn)化崗位。
但這一變化并不只是簡單的技術(shù)威脅,更像是一場審美工程的“騰籠換鳥”,AI接管標(biāo)準(zhǔn)化工序的同時(shí),人類創(chuàng)作者也將轉(zhuǎn)向具有更高價(jià)值的非標(biāo)準(zhǔn)化工作環(huán)節(jié),例如風(fēng)格設(shè)計(jì)、情緒深度控制以及跨媒介的藝術(shù)整合,并在內(nèi)容巨量輸出的時(shí)代,依靠個(gè)人審美扮演一個(gè)“策展人”的角色。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.