![]()
![]()
從媒體機構與AI公司的版權糾紛,到音樂、影視行業對生成式模型的質疑,再到創作者發現作品被秘密用于AI訓練,圍繞訓練數據來源的爭議不斷浮現。
AI模型賴以成長的海量數據,究竟來自哪里,又該如何獲得合法授權?
隨著生成式AI從技術探索走向產業應用,這一問題已成為行業無法回避的現實。當AI從技術探索走向產業應用,訓練數據不再只是技術問題,而開始成為一個制度問題。
本文附
2023至2025
年全球相關熱點案件整理,僅作事實匯總。
合作止痛 難醫根本
面對不斷增加的版權爭議,一些企業已經開始嘗試通過合作方式,為AI訓練數據尋找更加穩定的來源。
部分AI公司正在與媒體機構、出版機構建立內容授權合作,通過付費授權或聯合開發的方式,為模型訓練提供合法數據來源。一些大型內容集團,例如迪士尼與OpenAI以及達成相關協議,探索類似合作路徑。
這種模式在一定程度上緩解了版權沖突,也讓AI企業能夠獲得更清晰的數據來源。
但從行業角度看,個別合作很難成為長期解決方案。AI模型訓練所需的數據規模往往以億計,涉及的內容類型復雜,權利主體極其分散。即便大型機構之間能夠達成合作,也難以覆蓋數量龐大的中小創作者和海量內容。
換句話說,合作可以緩解局部問題,卻無法解決規模問題。
權利合流 集體授權
AI模型需要規模化數據,而版權卻天然是分散的,這是技術與制度之間自然形成的矛盾。
當逐一授權無法支撐產業規模時,制度化授權往往會成為新的解決方式。
在傳統版權領域,類似問題早已出現。音樂、文字作品等內容同樣具有"權利分散、使用規模巨大"的特點。如果每一次使用都需要逐一取得授權,文化產業幾乎無法正常運轉。
為了解決這一問題,市場逐漸發展出著作權集體管理制度。通過集體管理組織,大量分散的作品權利被集中管理,使用者只需獲得一次許可,便可以在一定范圍內合法使用大量作品,而相關收益則通過統一機制分配給權利人。
從制度邏輯看,AI訓練數據所面臨的問題,與傳統版權領域的"大規模分散權利交易"高度相似。如果仍然依賴逐一授權,不僅成本難以承受,也幾乎無法在現實中操作。
因此,借鑒集體管理制度,探索面向AI訓練的數據集體授權機制,很可能成為未來的重要制度方向。
這一制度的核心作用,可以概括為"降本增效"。
降本,降的不僅是權利人的維權成本,也降低了AI企業在談判與合規上的交易成本。
增效,增的不只是權利人的穩定收益,也使AI企業能夠在合法框架下獲得規模化訓練數據。
這一制度的核心作用,可以概括為"降本增效"。
降本,降的不僅是權利人的維權成本,也降低了AI企業在談判與合規上的交易成本。
增效,增的不只是權利人的穩定收益,也使AI企業能夠在合法框架下獲得規模化訓練數據。
在這樣的機制下,分散的內容資源可以進入更順暢的數據流通體系,既提高作品利用效率,也為AI訓練建立更加穩定的合法來源。
當然,這并不意味著簡單復制現有模式。與傳統作品使用相比,AI訓練數據在權利界定、使用方式和價值分配上都更加復雜。例如訓練數據中可能同時包含原始作品、二次創作內容以及來源不清的數據;不同內容對模型能力的貢獻也難以精確衡量。
這意味著,圍繞AI訓練數據建立集體授權體系,本身將是一項復雜的制度工程。但隨著訓練規模擴大、版權爭議增加,市場與制度都可能推動更加集中化的數據授權機制逐步形成。
數據門檻 壟斷隱現
訓練數據問題,正在悄然改變AI行業的競爭結構。
過去幾年,AI行業的競爭主要集中在算力和算法能力上。誰擁有更強的計算資源,誰能夠訓練出更大的模型,往往就能在技術競賽中占據優勢。
但隨著版權爭議不斷增加,訓練數據的來源和合規性開始成為新的現實約束。獲取高質量、合法來源的數據,不僅意味著更高成本,也意味著更復雜的合規體系。
如果未來的數據獲取主要依賴大型內容機構與頭部AI企業之間的個別合作,這種模式很可能進一步抬高行業門檻。
大型科技企業更容易通過資金和資源獲得優質內容授權,而大量中小創作者和小型IP卻難以進入合作體系。
對于資源有限的新興AI企業而言,缺乏穩定的數據來源,也可能使其難以參與競爭。
從長期看,如果訓練數據逐漸集中在少數大型企業手中,AI產業甚至可能形成新的數據壟斷格局。屆時,數據不僅是技術資源,更可能成為新的產業權力。
也正因為如此,建立更加開放、規模化的數據授權機制才顯得尤為重要。如果能夠通過集體授權等制度安排,讓分散的內容權利進入統一的數據流通體系,不僅可以降低AI企業的授權成本,也能夠讓更多創作者參與數據價值分配,從而避免數據資源過度集中。
AI行業的競爭正在悄然改變方向。
如果說過去的門檻是算力和算法,那么未來的門檻很可能是數據來源的合法性。
當訓練數據成為新的準入條件時,AI行業的競爭規則也將隨之改寫。
注:掃描二維碼查看相關案件整理共享文檔|僅作事實匯總
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.