AI之戰,終于打到了“署名權”這一層。
2026年3月13日,Encyclopaedia Britannica(大英百科全書,以下簡稱大英百科) 與 Merriam-Webster (韋氏詞典)在紐約曼哈頓聯邦地區法院起訴 OpenAI,指控其未經授權使用近10萬篇百科與詞典內容訓練模型,并在回答中近乎逐字復現原文。原告同時主張,ChatGPT會把錯誤甚至幻覺內容歸因給大英百科或韋氏詞典。
這不是一場普通的AI版權案
從表面看,這起訴訟仍屬于近兩年AI內容訴訟潮的一部分,訓練階段是否未經授權使用作品,輸出階段是否構成復現,商業上是否替代原網站流量。 但大英百科這次不只是說:你用了我的內容,還在說,你用了我的名字。
這就讓案件從“版權使用邊界之爭”,進一步轉向“知識權威能否被AI借名調用”之爭。
對內容行業來說,版權當然重要;但對百科、詞典這類知識品牌而言,來源可信度和品牌署名權威,同樣是核心資產。
第一條戰線:訓練階段,近10萬篇內容是否構成未經授權復制
根據路透等報道,原告稱 OpenAI 非法使用了近10萬篇 Britannica 與 Merriam-Webster 的文章、詞條和定義,用于訓練 GPT 系列模型。
這類內容與普通網頁信息不同。
百科條目、詞典釋義、編輯體系、條目編排、表達方式,本身就具有穩定的商業價值和版權屬性。原告的核心邏輯也因此非常明確:
不是零散引用,不是個別摘錄,而是系統性、規模化、商業化地吸收進模型訓練流程。
如果法院未來認可這種主張,訓練階段的“合理使用”抗辯空間,至少在高質量、結構化、可替代性強的知識內容上,可能會被進一步壓縮。
這也是為什么百科和詞典類原告,比一般媒體原告更容易把爭點壓到“作品體系整體被吸收”這一層。這個判斷,是基于本案起訴路徑作出的分析。
第二條戰線:輸出階段,模型到底是在“學習”還是在“記住”
本案另一項重要指控,是 ChatGPT 輸出與大英百科 原文“逐字相同或高度近似”的內容。相關媒體在報道時都提到,訴狀附有 ChatGPT 輸出與原文近乎逐字對應的示例。
這正是當前AI版權案里最危險、也最核心的問題,
模型究竟是在抽象學習,還是在可觸發條件下對原文進行近似復現?
如果后續程序中,這部分證據被法院認為足以證明“記憶化”或可歸責的近似復制,那么案件的重心就不再只是“訓練時碰過沒有”,而會變成,
你最終生成出來的東西,是否已經回到了版權法最傳統的禁區——復制。
對大模型公司來說,這一層風險比單純“訓練數據來源爭議”更實在。
因為訓練階段還可以辯論技術中間過程、統計抽象、轉換性使用;但一旦輸出端出現成段近似復現,法院看到的就不再是抽象技術,而是一個更直觀的問題——用戶拿到的,是不是原告作品的替代品。
第三條戰線:RAG不是避風港,反而可能變成新風險點
原告還把矛頭指向了 RAG,也就是檢索增強生成工作流,稱 OpenAI 在回答中直接調用大英百科內容來補充輸出。路透報道中明確提到,原告訴求覆蓋了訓練使用、輸出復現,以及讓 ChatGPT 借助其內容直接回答用戶問題所造成的損害。
這部分為什么值得警惕?
因為訓練爭議還可以說是“過去式”的數據吸收;RAG則更像“現在式”的內容調用。訓練階段的爭議,圍繞的是模型成長過程;RAG階段的爭議,圍繞的是模型當下正在用誰的內容回答問題。
如果法院未來對這一路徑持嚴格態度,那影響就不只是 OpenAI 一家。
大量“搜索+生成”“知識庫+回答”“外部內容實時檢索+整合輸出”的AI產品,都要重新審視幾個問題,有沒有授權,調用邊界在哪里,引用和替代之間的線畫在哪。
換句話說,本案真正可能外溢的,不只是版權法邏輯,而是整個AI信息架構的合規成本。
這起案件最有辨識度的地方,不在版權,而在商標與來源標注。
過去很多AI爭議,焦點都在作品有沒有被抓取、答案有沒有過度相似。
而大英百科這次在問的是:
誰有資格說 “according to Britannica?”
對百科和詞典來說,內容當然重要,但真正稀缺的,是被社會長期承認的可信來源身份。
如果AI生成了錯誤內容,卻掛上大英百科的名字,那損害的就不只是某個條目的點擊量,而是品牌所代表的知識權威。
從法律路徑看,這種打法也更有延展性。
版權問題常常會落入合理使用、轉換性利用、訓練必要性的激烈爭論;
但一旦進入“虛假來源標注”“錯誤歸因”、“品牌背書被挪用”的框架,訴訟的直覺張力更強,陪審團或法官也更容易理解其損害邏輯。
被替代的不只是文章,還有流量入口
大英百科認為 ChatGPT 直接生成答案,削弱了用戶訪問其網站的必要性,從而“蠶食”原本屬于其平臺的流量、廣告與訂閱價值。
這也是內容行業與AI平臺沖突不斷升級的底層現實。
過去搜索引擎至少還會把流量導回網站;現在生成式AI越來越像“答案終點站”,用戶在對話框里拿到結論,就不再去原頁面。
最后,用戶記住的是AI,原始內容提供者反而被留在后臺。
對于媒體、百科、詞典、數據庫這類機構來說,這不只是版權收益受損,而是入口地位被改寫。
誰控制答案分發,誰就更接近下一代知識基礎設施。
這也是大英百科這類老牌知識機構必須出手的真正原因。
OpenAI的回應與這案子的真正看點
路透援引 OpenAI 發言人表態稱,ChatGPT 有助于提升創造力、科學發現和日常效率,其模型基于公開可用數據訓練,并以合理使用原則為依據。
這當然是AI公司目前最標準、也最核心的抗辯框架。
但大英百科案的看點恰恰在于,它試圖把爭議從“公開可用數據能否訓練”轉向三個更難回避的問題:
第一,模型是否會近似復現原文。
第二,RAG或其他調用機制是否構成對版權內容的實時利用。
第三,AI能否把錯誤內容歸在知名知識品牌名下。
前兩個問題,AI行業過去兩年已經在打;
第三個問題,才是這案子真正的新變量。
知產力判斷
如果說過去的AI版權訴訟,爭的是“數據能不能喂模型”;
那么這起案件,爭的已經是:答案能不能掛我的名。
從這個意義上看,大英百科起訴OpenAI,不只是一次版權維權。
它更像是傳統知識機構對AI時代“來源秩序”的一次反擊。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.