網易首頁 > 網易號 > 正文申請入駐

大英百科起訴OpenAI：答案你寫，憑什么署我的名

2026-03-18 08:30:03　來源: 知產力

北京舉報

分享至

AI之戰，終于打到了“署名權”這一層。
2026年3月13日，Encyclopaedia Britannica（大英百科全書，以下簡稱大英百科）與 Merriam-Webster （韋氏詞典）在紐約曼哈頓聯邦地區法院起訴 OpenAI，指控其未經授權使用近10萬篇百科與詞典內容訓練模型，并在回答中近乎逐字復現原文。原告同時主張，ChatGPT會把錯誤甚至幻覺內容歸因給大英百科或韋氏詞典。

這不是一場普通的AI版權案

從表面看，這起訴訟仍屬于近兩年AI內容訴訟潮的一部分，訓練階段是否未經授權使用作品，輸出階段是否構成復現，商業上是否替代原網站流量。但大英百科這次不只是說：你用了我的內容，還在說，你用了我的名字。

這就讓案件從“版權使用邊界之爭”，進一步轉向“知識權威能否被AI借名調用”之爭。
對內容行業來說，版權當然重要；但對百科、詞典這類知識品牌而言，來源可信度和品牌署名權威，同樣是核心資產。

第一條戰線：訓練階段，近10萬篇內容是否構成未經授權復制

根據路透等報道，原告稱 OpenAI 非法使用了近10萬篇 Britannica 與 Merriam-Webster 的文章、詞條和定義，用于訓練 GPT 系列模型。

這類內容與普通網頁信息不同。
百科條目、詞典釋義、編輯體系、條目編排、表達方式，本身就具有穩定的商業價值和版權屬性。原告的核心邏輯也因此非常明確：
不是零散引用，不是個別摘錄，而是系統性、規模化、商業化地吸收進模型訓練流程。

如果法院未來認可這種主張，訓練階段的“合理使用”抗辯空間，至少在高質量、結構化、可替代性強的知識內容上，可能會被進一步壓縮。
這也是為什么百科和詞典類原告，比一般媒體原告更容易把爭點壓到“作品體系整體被吸收”這一層。這個判斷，是基于本案起訴路徑作出的分析。

第二條戰線：輸出階段，模型到底是在“學習”還是在“記住”

本案另一項重要指控，是 ChatGPT 輸出與大英百科原文“逐字相同或高度近似”的內容。相關媒體在報道時都提到，訴狀附有 ChatGPT 輸出與原文近乎逐字對應的示例。

這正是當前AI版權案里最危險、也最核心的問題，
模型究竟是在抽象學習，還是在可觸發條件下對原文進行近似復現？

如果后續程序中，這部分證據被法院認為足以證明“記憶化”或可歸責的近似復制，那么案件的重心就不再只是“訓練時碰過沒有”，而會變成，
你最終生成出來的東西，是否已經回到了版權法最傳統的禁區——復制。

對大模型公司來說，這一層風險比單純“訓練數據來源爭議”更實在。
因為訓練階段還可以辯論技術中間過程、統計抽象、轉換性使用；但一旦輸出端出現成段近似復現，法院看到的就不再是抽象技術，而是一個更直觀的問題——用戶拿到的，是不是原告作品的替代品。

第三條戰線：RAG不是避風港，反而可能變成新風險點

原告還把矛頭指向了 RAG，也就是檢索增強生成工作流，稱 OpenAI 在回答中直接調用大英百科內容來補充輸出。路透報道中明確提到，原告訴求覆蓋了訓練使用、輸出復現，以及讓 ChatGPT 借助其內容直接回答用戶問題所造成的損害。

這部分為什么值得警惕？
因為訓練爭議還可以說是“過去式”的數據吸收；RAG則更像“現在式”的內容調用。訓練階段的爭議，圍繞的是模型成長過程；RAG階段的爭議，圍繞的是模型當下正在用誰的內容回答問題。

如果法院未來對這一路徑持嚴格態度，那影響就不只是 OpenAI 一家。
大量“搜索+生成”“知識庫+回答”“外部內容實時檢索+整合輸出”的AI產品，都要重新審視幾個問題，有沒有授權，調用邊界在哪里，引用和替代之間的線畫在哪。
換句話說，本案真正可能外溢的，不只是版權法邏輯，而是整個AI信息架構的合規成本。

這起案件最有辨識度的地方，不在版權，而在商標與來源標注。

過去很多AI爭議，焦點都在作品有沒有被抓取、答案有沒有過度相似。
而大英百科這次在問的是：
誰有資格說 “according to Britannica？”

對百科和詞典來說，內容當然重要，但真正稀缺的，是被社會長期承認的可信來源身份。
如果AI生成了錯誤內容，卻掛上大英百科的名字，那損害的就不只是某個條目的點擊量，而是品牌所代表的知識權威。

從法律路徑看，這種打法也更有延展性。
版權問題常常會落入合理使用、轉換性利用、訓練必要性的激烈爭論；
但一旦進入“虛假來源標注”“錯誤歸因”、“品牌背書被挪用”的框架，訴訟的直覺張力更強，陪審團或法官也更容易理解其損害邏輯。

被替代的不只是文章，還有流量入口
大英百科認為 ChatGPT 直接生成答案，削弱了用戶訪問其網站的必要性，從而“蠶食”原本屬于其平臺的流量、廣告與訂閱價值。

這也是內容行業與AI平臺沖突不斷升級的底層現實。
過去搜索引擎至少還會把流量導回網站；現在生成式AI越來越像“答案終點站”，用戶在對話框里拿到結論，就不再去原頁面。

最后，用戶記住的是AI，原始內容提供者反而被留在后臺。

對于媒體、百科、詞典、數據庫這類機構來說，這不只是版權收益受損，而是入口地位被改寫。
誰控制答案分發，誰就更接近下一代知識基礎設施。
這也是大英百科這類老牌知識機構必須出手的真正原因。

OpenAI的回應與這案子的真正看點

路透援引 OpenAI 發言人表態稱，ChatGPT 有助于提升創造力、科學發現和日常效率，其模型基于公開可用數據訓練，并以合理使用原則為依據。

這當然是AI公司目前最標準、也最核心的抗辯框架。
但大英百科案的看點恰恰在于，它試圖把爭議從“公開可用數據能否訓練”轉向三個更難回避的問題：

第一，模型是否會近似復現原文。
第二，RAG或其他調用機制是否構成對版權內容的實時利用。
第三，AI能否把錯誤內容歸在知名知識品牌名下。

前兩個問題，AI行業過去兩年已經在打；
第三個問題，才是這案子真正的新變量。

知產力判斷

如果說過去的AI版權訴訟，爭的是“數據能不能喂模型”；
那么這起案件，爭的已經是：答案能不能掛我的名。

從這個意義上看，大英百科起訴OpenAI，不只是一次版權維權。
它更像是傳統知識機構對AI時代“來源秩序”的一次反擊。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.