網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

想成為下一個(gè) Manus，先把這些出海合規(guī)問(wèn)題處理好

2025-12-31 19:05:43　來(lái)源: FounderPark

北京舉報(bào)

分享至

Meta 收購(gòu) Manus 無(wú)疑是本月最重磅的行業(yè)新聞。不到一年時(shí)間，產(chǎn)品上線、拿到美元投資、團(tuán)隊(duì)主體搬到新加坡、一億美元 ARR，然后就是被 Meta 收購(gòu)，Manus 發(fā)展速度驚人。

這其中，搬到新加坡是比較關(guān)鍵的一步。不管是從數(shù)據(jù)合規(guī)、法律合規(guī)上來(lái)說(shuō)，還是為了更好融入國(guó)際市場(chǎng)。

Manus 的創(chuàng)業(yè)路徑，也給國(guó)內(nèi)很多其他 AI 出海公司一個(gè)可參考的對(duì)標(biāo)。對(duì)國(guó)內(nèi)的 AI 創(chuàng)業(yè)公司來(lái)說(shuō)，如果能利用本土的產(chǎn)品化能力，加上供應(yīng)鏈的優(yōu)勢(shì)，去降維打擊全球市場(chǎng)，是 AI 時(shí)代的一個(gè)絕佳策略。

這其中，數(shù)據(jù)、監(jiān)管、存儲(chǔ)、主體架構(gòu)等，是產(chǎn)品增長(zhǎng)之外，絕對(duì)要前置、重點(diǎn)解決的問(wèn)題。

因此，在最近的一場(chǎng)閉門(mén) Workshop 中，我們邀請(qǐng)了北京星也律師事務(wù)所的兩位資深律師，系統(tǒng)性地聊聊 AI 企業(yè)出海合規(guī)的話題。星也律所的團(tuán)隊(duì)在 AI 領(lǐng)域有著非常豐富的實(shí)踐經(jīng)驗(yàn)，服務(wù)過(guò)多家 AI 企業(yè)。

這次的分享內(nèi)容非常干貨，兩位侓師解答了包括跨境數(shù)據(jù)傳輸、用戶數(shù)據(jù)訓(xùn)練、業(yè)務(wù)模式、生成物侵權(quán)等方面的典型合規(guī)難題。

在進(jìn)行一些脫敏處理后，F(xiàn)ounder Park 整理了這次分享的精華內(nèi)容。

??關(guān)注 Founder Park，最及時(shí)最干貨的創(chuàng)業(yè)分享

超 17000 人的「AI 產(chǎn)品市集」社群！不錯(cuò)過(guò)每一款有價(jià)值的 AI 應(yīng)用。

邀請(qǐng)從業(yè)者、開(kāi)發(fā)人員和創(chuàng)業(yè)者，飛書(shū)掃碼加群：

進(jìn)群后，你有機(jī)會(huì)得到：

最新、最值得關(guān)注的 AI 新品資訊；
不定期贈(zèng)送熱門(mén)新品的邀請(qǐng)碼、會(huì)員碼；
最精準(zhǔn)的AI產(chǎn)品曝光渠道

01「三明治架構(gòu)」風(fēng)險(xiǎn)很大

AI 產(chǎn)品出海已經(jīng)不是「要不要做」的選擇題，而是「該怎么做」的必答題了。對(duì)中國(guó)的 AI 創(chuàng)業(yè)團(tuán)隊(duì)來(lái)說(shuō)，如果能利用本土的產(chǎn)品化能力，加上供應(yīng)鏈的優(yōu)勢(shì)，去降維打擊全球市場(chǎng)，絕對(duì)是 AI 時(shí)代的一個(gè)絕佳策略。

在實(shí)踐中，團(tuán)隊(duì)首先需要明確自身的出海類型。根據(jù)我們的觀察，現(xiàn)在主要有兩種模式。

一種是，資本驅(qū)動(dòng)型出海。這類出海的核心目標(biāo)是追求高估值和海外上市。硅谷等海外資本市場(chǎng)對(duì) AI 概念的認(rèn)可度更高，給出的估值也相應(yīng)更高。但往往要求團(tuán)隊(duì)在早期就必須解決業(yè)務(wù)和團(tuán)隊(duì)的歸屬地問(wèn)題，地緣政治是無(wú)法回避的因素。

第二種是，業(yè)務(wù)驅(qū)動(dòng)型出海。這是更普遍的模式，核心目標(biāo)是在海外市場(chǎng)獲得營(yíng)收。具體又分為兩類：

風(fēng)險(xiǎn)規(guī)避型：國(guó)內(nèi)監(jiān)管門(mén)檻高，在內(nèi)容審核、數(shù)據(jù)監(jiān)管或特定業(yè)務(wù)（如 Web3）上存在嚴(yán)格限制，部分業(yè)務(wù)只能選擇在政策更寬松的海外地區(qū)開(kāi)展。
市場(chǎng)適配型：通常是陪伴類、生成類等 AI 產(chǎn)品，海外市場(chǎng)和用戶更成熟，付費(fèi)意愿更強(qiáng)，更適合業(yè)務(wù)落地。

對(duì)于業(yè)務(wù)驅(qū)動(dòng)的出海企業(yè)，需要特別注意提前布局、主動(dòng)規(guī)劃合規(guī)問(wèn)題。很多企業(yè)發(fā)展速度非常的快，短短幾個(gè)月用戶就能漲到幾萬(wàn)用戶，甚至還沒(méi)完成下一輪融資，用戶規(guī)模就已經(jīng)爆發(fā)。如果在這時(shí)才考慮數(shù)據(jù)架構(gòu)遷移或者團(tuán)隊(duì)海外落地，不僅成本極高，風(fēng)險(xiǎn)也更大。所以，合規(guī)布局必須比業(yè)務(wù)推進(jìn)早半步。

目前，企業(yè)常見(jiàn)的是「三明治架構(gòu)」。

這種架構(gòu)的特點(diǎn)是，資金（來(lái)源包括融資、用戶付費(fèi)）和用戶數(shù)據(jù)產(chǎn)生在海外，但核心的技術(shù)研發(fā)與運(yùn)營(yíng)團(tuán)隊(duì)完全留在中國(guó)。這種模式常常導(dǎo)致，海外用戶數(shù)據(jù)會(huì)被傳回國(guó)內(nèi)進(jìn)行研發(fā)、處理等環(huán)節(jié)。

同時(shí)，許多應(yīng)用會(huì)調(diào)用 OpenAI、谷歌、Claude 等海外大廠的模型 API，使得數(shù)據(jù)流轉(zhuǎn)路徑更為復(fù)雜：海外用戶數(shù)據(jù)先傳回中國(guó)處理，隨后再傳輸至美國(guó)等服務(wù)器進(jìn)行模型推理，最后將結(jié)果返回給用戶。

從數(shù)據(jù)安全和合規(guī)角度來(lái)看，「三明治」架構(gòu)面臨著數(shù)據(jù)主權(quán)和國(guó)家安全的雙重挑戰(zhàn)，完全忽視了全球各國(guó)對(duì)「數(shù)據(jù)主權(quán)」的高度重視。

「數(shù)據(jù)是新的石油」，幾乎所有國(guó)家在數(shù)據(jù)立法時(shí)，第一步都會(huì)明確：在本國(guó)產(chǎn)生的數(shù)據(jù)，其主權(quán)歸本國(guó)所有。在這種背景下，數(shù)據(jù)的反復(fù)跨境傳輸，必然會(huì)帶來(lái)巨大的合規(guī)風(fēng)險(xiǎn)。

02中國(guó)、美國(guó)和歐盟，

監(jiān)管邏輯有什么不同？

在企業(yè)出海時(shí)，通常最關(guān)注國(guó)內(nèi)、美國(guó)、歐盟這三個(gè)區(qū)域的合規(guī)問(wèn)題。這三個(gè)法域的監(jiān)管邏輯和側(cè)重點(diǎn)各有不同。

美國(guó)：市場(chǎng)準(zhǔn)入風(fēng)險(xiǎn)

美國(guó)監(jiān)管的特點(diǎn)是，一旦找到一個(gè)小的違規(guī)切口，就可能「順藤摸瓜」，引發(fā)一系列罰款和長(zhǎng)期整改要求。核心風(fēng)險(xiǎn)在訴訟，執(zhí)法機(jī)構(gòu)一旦發(fā)現(xiàn)違規(guī)，往往會(huì)通過(guò)訴訟發(fā)起處罰，后果可能遠(yuǎn)超罰款本身。

以兒童機(jī)器人產(chǎn)品 Apitor 為例，因?yàn)檫`反美國(guó)《兒童在線隱私保護(hù)法》（COPPA）被處罰。違規(guī)點(diǎn)集中在多個(gè)敏感環(huán)節(jié)：通過(guò)內(nèi)嵌的 SDK 強(qiáng)制收集兒童的精確地理位置等敏感信息，并將數(shù)據(jù)回傳至中國(guó)服務(wù)器，同時(shí)隱私政策聲明與實(shí)際操作完全不符。

最終，Apitor 面臨的不僅是 50 萬(wàn)美元的和解金，還有一份長(zhǎng)達(dá)十年的強(qiáng)制整改令，要求企業(yè)銷毀違規(guī)數(shù)據(jù)、引入第三方審計(jì)并定期向監(jiān)管機(jī)構(gòu)提交合規(guī)報(bào)告。這種長(zhǎng)期且成本高昂的整改要求，幾乎宣告了產(chǎn)品在北美市場(chǎng)的「死刑」。

歐盟：以GDPR為核心的嚴(yán)格數(shù)據(jù)保護(hù)

歐盟的合規(guī)核心是《通用數(shù)據(jù)保護(hù)條例》（GDPR），是全球第一部完整、成體系的數(shù)據(jù)保護(hù)法案，歐盟以極其嚴(yán)格的標(biāo)準(zhǔn)執(zhí)行。

GDPR 的核心原則很明確：數(shù)據(jù)屬于用戶個(gè)人，企業(yè)獲取數(shù)據(jù)必須獲得用戶明確、具體的同意。

GDPR 有五大「狠招」：第一是天價(jià)罰款，幾乎所有的大企業(yè)在歐盟都被罰了個(gè)遍；第二是被遺忘權(quán)，對(duì) AI 企業(yè)來(lái)說(shuō)非常棘手。對(duì)于傳統(tǒng)數(shù)據(jù)企業(yè)，刪除用戶個(gè)人數(shù)據(jù)就行，但如果數(shù)據(jù)已用于 AI 訓(xùn)練或功能完善，刪除的邊界在哪里？第三是數(shù)據(jù)采集的最小必要原則，這也是 GDPR 首次明確規(guī)范的；第四是知情同意的明確性要求，企業(yè)必須用通俗易懂的語(yǔ)言，向用戶說(shuō)明數(shù)據(jù)的使用對(duì)象、用途、存儲(chǔ)期限等內(nèi)容；第五是嚴(yán)格的跨境數(shù)據(jù)傳輸要求。

以一個(gè)消費(fèi)級(jí)攝像頭產(chǎn)品為例。該產(chǎn)品曾被德國(guó)與法國(guó)的數(shù)據(jù)保護(hù)機(jī)構(gòu)調(diào)查，原因是：盡管其用戶數(shù)據(jù)存儲(chǔ)在歐洲本地的數(shù)據(jù)中心，但國(guó)內(nèi)的工程師可通過(guò) VPN 直接訪問(wèn)。這種行為被歐盟監(jiān)管機(jī)構(gòu)認(rèn)定為等效的數(shù)據(jù)跨境傳輸。

從這個(gè)案例可以看出，歐盟監(jiān)管不僅關(guān)注數(shù)據(jù)存儲(chǔ)的物理位置，更關(guān)注數(shù)據(jù)的訪問(wèn)權(quán)限管控。對(duì)于研發(fā)團(tuán)隊(duì)在國(guó)內(nèi)、僅在海外設(shè)立銷售點(diǎn)的大多數(shù)出海企業(yè)，產(chǎn)品維護(hù)工作往往由國(guó)內(nèi)團(tuán)隊(duì)完成，甚至存在生產(chǎn)環(huán)境與測(cè)試環(huán)境混用的情況。國(guó)內(nèi)工程師對(duì)海外生產(chǎn)環(huán)境數(shù)據(jù)的任何遠(yuǎn)程訪問(wèn)，都可能被視為數(shù)據(jù)跨境行為，引發(fā)監(jiān)管風(fēng)險(xiǎn)。遠(yuǎn)程數(shù)據(jù)處理行為，是合規(guī)監(jiān)管的重點(diǎn)。

中國(guó)：數(shù)據(jù)出境評(píng)估與 AI 服務(wù)備案

在國(guó)內(nèi)，《網(wǎng)絡(luò)安全法》、《數(shù)據(jù)安全法》和《個(gè)人信息保護(hù)法》構(gòu)成了數(shù)據(jù)合規(guī)的基礎(chǔ)框架。對(duì)于出海業(yè)務(wù)，核心在于數(shù)據(jù)出境的合規(guī)性。

同時(shí)，國(guó)內(nèi)對(duì) AI 服務(wù)有明確的備案要求。無(wú)論是算法本身，還是包含 AI 功能的應(yīng)用上架，都必須完成算法備案。對(duì)于具有輿論屬性或內(nèi)容生成能力的應(yīng)用，還需進(jìn)行生成式 AI 服務(wù)的上線備案與安全評(píng)估，即「雙備案」，這是在國(guó)內(nèi)開(kāi)展業(yè)務(wù)必須完成的合規(guī)環(huán)節(jié)。

03一個(gè)基礎(chǔ)的全球數(shù)據(jù)存儲(chǔ)布局，

至少要覆蓋四個(gè)節(jié)點(diǎn)

通過(guò)分析完以上不同地區(qū)的監(jiān)管要求，我們會(huì)發(fā)現(xiàn)一個(gè)共性點(diǎn)：多數(shù)軟件產(chǎn)品涉及的敏感數(shù)據(jù)都被要求本地存儲(chǔ)。

這其中，有六類數(shù)據(jù)需要特別關(guān)注：金融類、醫(yī)療健康類、汽車與交通數(shù)據(jù)（尤其在中國(guó)，涉及人臉、環(huán)境的視覺(jué)數(shù)據(jù)監(jiān)管極為嚴(yán)格）、生物識(shí)別數(shù)據(jù)、精確的地理位置與行動(dòng)軌跡信息，以及包括關(guān)鍵基礎(chǔ)設(shè)施和政務(wù)信息在內(nèi)的傳統(tǒng)重要數(shù)據(jù)。只要產(chǎn)品涉及這些領(lǐng)域，數(shù)據(jù)的本地化存儲(chǔ)幾乎是所有國(guó)家的強(qiáng)制要求。

除了這六類數(shù)據(jù)，對(duì)于一般的用戶數(shù)據(jù)，可以根據(jù)目標(biāo)市場(chǎng)的不同來(lái)制定更靈活的全球存儲(chǔ)策略。

在美國(guó)市場(chǎng)，美國(guó)本土的數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施完善，有大量供應(yīng)商可供選擇，所以只要涉及美國(guó)市場(chǎng)，哪怕用戶只有幾百人、幾千人，建議都要第一時(shí)間將數(shù)據(jù)存儲(chǔ)在美國(guó)本土，即使只有幾千條用戶數(shù)據(jù)也可能觸發(fā)監(jiān)管處罰。同時(shí)，這樣做的一個(gè)好處是，一個(gè)美國(guó)節(jié)點(diǎn)通常可以合規(guī)地覆蓋包括加拿大、墨西哥在內(nèi)的整個(gè)北美乃至大部分中南美洲市場(chǎng)，巴西和阿根廷等少數(shù)例外。

歐洲的情況相對(duì)簡(jiǎn)單。由于歐盟法規(guī)的一致性，大部分企業(yè)通常會(huì)選擇在法蘭克福等基礎(chǔ)設(shè)施完善的城市設(shè)立單一數(shù)據(jù)節(jié)點(diǎn)，可以覆蓋整個(gè)歐盟市場(chǎng)，這個(gè)策略也基本適用于脫歐后的英國(guó)。

對(duì)于亞洲及中東市場(chǎng)，東南亞的通用解決方案是在新加坡存儲(chǔ)，因?yàn)樾录悠略谌蚍秶鷥?nèi)屬于數(shù)據(jù)中立程度較高的國(guó)家，但有幾個(gè)例外：如果印度是核心市場(chǎng)，需要在當(dāng)?shù)剡M(jìn)行數(shù)據(jù)存儲(chǔ)；中東大部分國(guó)家可由歐洲節(jié)點(diǎn)覆蓋，但沙特已立法要求數(shù)據(jù)本地化；日韓市場(chǎng)，通常要求數(shù)據(jù)分別在各自境內(nèi)存儲(chǔ)。

綜合成本、合規(guī)因素來(lái)看，一個(gè)基礎(chǔ)的全球數(shù)據(jù)存儲(chǔ)布局至少需要覆蓋四個(gè)節(jié)點(diǎn)：美國(guó)、歐盟、新加坡，以及服務(wù)國(guó)內(nèi)用戶的中國(guó)節(jié)點(diǎn)。如果業(yè)務(wù)重點(diǎn)涉及日韓等市場(chǎng)，就需要單獨(dú)再增加存儲(chǔ)節(jié)點(diǎn)。

04輸入端：哪些數(shù)據(jù)能拿來(lái)訓(xùn)練，哪些不能？

接下來(lái)，是訓(xùn)練數(shù)據(jù)的合規(guī)問(wèn)題。全球范圍內(nèi)高質(zhì)量的訓(xùn)練數(shù)據(jù)都很稀缺，對(duì)初創(chuàng) AI 企業(yè)來(lái)說(shuō)，數(shù)據(jù)來(lái)源通常限于：網(wǎng)絡(luò)爬取、自有用戶數(shù)據(jù)以及開(kāi)源數(shù)據(jù)集，不同來(lái)源數(shù)據(jù)的風(fēng)險(xiǎn)也各有不同。

首先是網(wǎng)絡(luò)公開(kāi)數(shù)據(jù)的爬取。這里一個(gè)典型的侵權(quán)案例就是紐約時(shí)報(bào)起訴 OpenAI。《紐約時(shí)報(bào)》認(rèn)為 OpenAI 在訓(xùn)練 GPT 時(shí)，爬取了他們的上百萬(wàn)篇文章，侵犯了著作權(quán)。另一個(gè)案例是 Clearview AI，因?yàn)榕廊《嗉疑缃幻襟w的上百億張人臉照片，在歐美多地因侵犯?jìng)€(gè)人信息權(quán)和隱私權(quán)遭到封禁。

從這兩個(gè)案例可以得出一個(gè)關(guān)鍵結(jié)論的結(jié)論：公開(kāi)數(shù)據(jù)不等于可以隨意使用，數(shù)據(jù)的具體內(nèi)容決定了風(fēng)險(xiǎn)屬性。公開(kāi)爬取行為涉及到了兩個(gè)層面的權(quán)利：一是平臺(tái)通過(guò)技術(shù)和勞動(dòng)投入形成的受法律保護(hù)的數(shù)據(jù)資產(chǎn)權(quán)益；二是數(shù)據(jù)內(nèi)容本身所承載的權(quán)利，如著作權(quán)或個(gè)人信息權(quán)。

這并不意味著公開(kāi)爬取的數(shù)據(jù)完全不能用。只要不觸碰人臉、聲音等敏感個(gè)人信息的紅線，且爬取行為不對(duì)目標(biāo)服務(wù)器造成沖擊，或開(kāi)發(fā)出與對(duì)方存在實(shí)質(zhì)性競(jìng)爭(zhēng)關(guān)系的產(chǎn)品，引發(fā)的直接沖突的風(fēng)險(xiǎn)就相對(duì)可控。

核心合規(guī)建議是，遵守目標(biāo)網(wǎng)站的 robots 協(xié)議，控制爬取頻率，同時(shí)建立清晰的數(shù)據(jù)來(lái)源清單，記錄網(wǎng)址、時(shí)間與方式，從而將風(fēng)險(xiǎn)控制在可接受范圍內(nèi)。

其次是，自有用戶數(shù)據(jù)的使用。這部分?jǐn)?shù)據(jù)對(duì)企業(yè)來(lái)說(shuō)是相當(dāng)大的誘惑，因?yàn)閳F(tuán)隊(duì)會(huì)天然認(rèn)為對(duì)自己服務(wù)器上的數(shù)據(jù)擁有所有權(quán)。以 Meta 為例，Meta 此前計(jì)劃利用其平臺(tái)用戶數(shù)據(jù)進(jìn)行模型訓(xùn)練，后被歐盟監(jiān)管機(jī)構(gòu)叫停。監(jiān)管方給出的核心觀點(diǎn)是：平臺(tái)對(duì)所收集的用戶數(shù)據(jù)并不享有當(dāng)然的合法使用權(quán)，如果要是用于訓(xùn)練，必須獲得用戶的明確同意。

這個(gè)邏輯其實(shí)很簡(jiǎn)單，數(shù)據(jù)保護(hù)遵循「生命周期管理」原則，即數(shù)據(jù)的收集與使用是兩個(gè)獨(dú)立環(huán)節(jié)，需要分別進(jìn)行合規(guī)處理。因此，解決方案的核心是更新隱私政策與用戶協(xié)議，明確告知用戶哪些數(shù)據(jù)將被用于模型訓(xùn)練等用途。在此基礎(chǔ)上，歐美法規(guī)還要求必須為用戶提供清晰的退出選項(xiàng)（Opt-out）。

近期 LinkedIn 宣布使用用戶數(shù)據(jù)訓(xùn)練模型，采用的正是這種「明確授權(quán) + 退出機(jī)制」的合規(guī)路徑，即告知用戶有權(quán)選擇退出，如果在規(guī)定期限內(nèi)未操作，視為默認(rèn)同意。

第三種來(lái)源是開(kāi)源數(shù)據(jù)集，我們稱為「盲盒」。以 Stable Diffusion 模型使用知名開(kāi)源數(shù)據(jù)集 LAION 為例，LAION 數(shù)據(jù)集包含超過(guò) 58 億張圖片，但后續(xù)被曝出其中含有大量未經(jīng)授權(quán)的版權(quán)作品，甚至涉及未成年人的非法內(nèi)容，最后被迫下架清洗。這個(gè)案例說(shuō)明，開(kāi)源不等于無(wú)瑕疵。

企業(yè)在使用前，必須進(jìn)行兩項(xiàng)基礎(chǔ)的風(fēng)險(xiǎn)防范：一是仔細(xì)審查數(shù)據(jù)集的授權(quán)協(xié)議（License），明確數(shù)據(jù)是不是可用于商用，以及有沒(méi)有其他特殊限制；二是如果使用了當(dāng)前存在爭(zhēng)議的開(kāi)源數(shù)據(jù)，建議做隔離處理，確保訓(xùn)練的功能和生成的內(nèi)容與其他部分區(qū)隔，來(lái)降低潛在風(fēng)險(xiǎn)對(duì)整個(gè)產(chǎn)品的影響。

除了以上三種數(shù)據(jù)來(lái)源外，還必須高度警惕兩類特殊數(shù)據(jù)：生物識(shí)別數(shù)據(jù)和未成年人數(shù)據(jù)。無(wú)論數(shù)據(jù)來(lái)自哪里，只要涉及到人臉、聲音等生物識(shí)別信息，或與未成年人相關(guān)，都必須高度警惕。除非產(chǎn)品功能本身必須依賴這類數(shù)據(jù)，這種情況下需要通過(guò)更直接、更精準(zhǔn)的方式獲取授權(quán)。否則，需要對(duì)這類數(shù)據(jù)進(jìn)行匿名化或去標(biāo)識(shí)化處理。

同時(shí)，這套評(píng)估數(shù)據(jù)來(lái)源、權(quán)利歸屬和用戶授權(quán)的邏輯，同樣適用于評(píng)估外購(gòu)的第三方數(shù)據(jù)。

05輸出端：AI 生成的內(nèi)容歸誰(shuí)？

侵權(quán)風(fēng)險(xiǎn)如何避免？

在輸出端，AI 生成內(nèi)容合規(guī)主要圍繞三個(gè)核心維度依次展開(kāi)：生成內(nèi)容的權(quán)利歸屬、生成內(nèi)容是否侵犯第三方權(quán)利，以及生成內(nèi)容的標(biāo)識(shí)規(guī)范。

首先是生成內(nèi)容的版權(quán)歸屬問(wèn)題。目前全球主流的法律共識(shí)基本都是否定的，AI 本身無(wú)法成為作者。無(wú)論是美國(guó)版權(quán)局在《黎明的扎利亞》案中的裁定，還是中國(guó)與歐洲的司法觀點(diǎn)，都明確指出了著作權(quán)是為人類設(shè)計(jì)的權(quán)利。因此，AI 企業(yè)不能因?yàn)閮?nèi)容由模型生成，就理所當(dāng)然地成為版權(quán)所有者。

但一個(gè)突破性的可能是，如果最終促使 AI 生成內(nèi)容的用戶，付出了足夠多的智力投入，比如使用了非常具體的提示詞、詳細(xì)描述了需求，或者對(duì) AI 生成的內(nèi)容做了大量細(xì)致調(diào)整，這種「用戶的智力汗水」可能會(huì)得到法律認(rèn)可。在《黎明的扎利亞》案中，美國(guó)版權(quán)局認(rèn)為，用戶對(duì)最終作品的特殊編排部分可以享有著作權(quán)。不過(guò)，如何界定和保護(hù)這部分用戶貢獻(xiàn)，還需要在實(shí)踐中進(jìn)一步明確和探索。

由此得出的一個(gè)結(jié)論是，目前，想直接依據(jù)著作權(quán)法將 AI 生成內(nèi)容的版權(quán)歸于企業(yè)，難度極大。可行的替代方案是通過(guò)用戶協(xié)議進(jìn)行約定。在條款中明確與使用者（無(wú)論是 C 端個(gè)人還是 B 端企業(yè)）約定 AI 生成內(nèi)容的權(quán)利歸屬與使用方式，用私人協(xié)議的約定，來(lái)替代目前法律還沒(méi)有明確的版權(quán)歸屬問(wèn)題。這是關(guān)于生成內(nèi)容權(quán)利歸屬的核心思路。

AI 生成的內(nèi)容，是否可能侵犯第三方權(quán)利，是當(dāng)前更現(xiàn)實(shí)的法律風(fēng)險(xiǎn)。一旦發(fā)生侵權(quán)，責(zé)任由誰(shuí)承擔(dān)？以 AI 公司的大模型產(chǎn)品生成與其經(jīng)典 IP 形象高度相似圖像的案例來(lái)說(shuō)。這類訴訟通常會(huì)圍繞兩條侵權(quán)路徑展開(kāi)：第一，原告主張 AI 公司的訓(xùn)練數(shù)據(jù)包含了其受版權(quán)保護(hù)的作品，構(gòu)成直接侵權(quán)；第二，原告指控 AI 公司在宣傳中以「生成迪士尼形象」為賣(mài)點(diǎn)，誘導(dǎo)和助長(zhǎng)了用戶的侵權(quán)行為，應(yīng)承擔(dān)間接侵權(quán)責(zé)任。

目前這類案件還沒(méi)有有最終判決結(jié)果，但這基本代表了 AI 生成內(nèi)容侵權(quán)糾紛的核心爭(zhēng)議方向。判定 AI 生成內(nèi)容侵權(quán)判定的核心標(biāo)準(zhǔn)，是「實(shí)質(zhì)性相似」，即生成結(jié)果與原作品相比，能不能讓普通第三方認(rèn)為兩者足夠相似。

同時(shí)，需要明確的是，AI 企業(yè)不會(huì)因?yàn)?AI 生成了侵權(quán)內(nèi)容就必然承擔(dān)責(zé)任，關(guān)鍵在于企業(yè)有沒(méi)有盡到了相應(yīng)的管理義務(wù)，能否適用「避風(fēng)港原則」免責(zé)。國(guó)內(nèi)外的監(jiān)管思路在這方面基本一致，平臺(tái)需要盡最大努力防范侵權(quán)。具體措施包括，設(shè)置侵權(quán)舉報(bào)渠道、避免通過(guò)編輯或推薦等方式誘導(dǎo)用戶生成侵權(quán)內(nèi)容等。

對(duì)于許多初創(chuàng)企業(yè)來(lái)說(shuō)，在難以回溯調(diào)整訓(xùn)練數(shù)據(jù)和核心功能時(shí)，更要做好那些可被清晰感知的合規(guī)措施，即所謂的「表面功夫」。例如，建立關(guān)鍵詞屏蔽機(jī)制、完善侵權(quán)內(nèi)容的下架流程，并在用戶協(xié)議中明確免責(zé)條款。這些可核查、能被監(jiān)管和用戶清晰看到的合規(guī)措施，往往是企業(yè)免于承擔(dān)侵權(quán)責(zé)任的重要保障。

最后一點(diǎn)，關(guān)于 AI 生成內(nèi)容的標(biāo)識(shí)與水印問(wèn)題。

與版權(quán)問(wèn)題不同，標(biāo)識(shí)要求更多屬于行政監(jiān)管義務(wù)，不直接對(duì)應(yīng)某個(gè)原始權(quán)利，但因?yàn)闆](méi)有標(biāo)識(shí) AI 身份可能引發(fā)虛假信息傳播、公眾誤導(dǎo)等輿論風(fēng)險(xiǎn)，是目前各國(guó)監(jiān)管的重重點(diǎn)方向。

全球幾乎在同一時(shí)期都開(kāi)始要求對(duì) AI 生成內(nèi)容進(jìn)行明確區(qū)分，具體分為兩個(gè)層面：一是「顯性標(biāo)識(shí)」，比如在界面標(biāo)注「由 AI 生成」；二是「隱性水印」，即將標(biāo)識(shí)信息嵌入元數(shù)據(jù)中供機(jī)器識(shí)別。這是企業(yè)必須遵守的底線性合規(guī)要求。

06主體架構(gòu)優(yōu)化，

新加坡可能是現(xiàn)階段更優(yōu)的選擇

Q：公司和創(chuàng)始人在美國(guó)，技術(shù)團(tuán)隊(duì)在中國(guó)，產(chǎn)品面向美國(guó) ToC 用戶，數(shù)據(jù)合規(guī)需要注意什么？

星也：這是一個(gè)非常典型的場(chǎng)景，藏著兩個(gè)核心風(fēng)險(xiǎn)點(diǎn)：第一，面向美國(guó)的 ToC 產(chǎn)品，必然會(huì)涉及大量用戶信息，不管是登錄、支付等個(gè)人信息，還是用戶的使用行為數(shù)據(jù)；第二，技術(shù)團(tuán)隊(duì)在國(guó)內(nèi)，意味著產(chǎn)品的更新、調(diào)試等運(yùn)維工作都要在國(guó)內(nèi)完成。這就直接導(dǎo)致了數(shù)據(jù)存儲(chǔ)與操作主體地理位置的不一致，很容易觸發(fā)合規(guī)風(fēng)險(xiǎn)。

針對(duì)這種情況，最基礎(chǔ)的操作有兩點(diǎn)，也是必須要做的：第一，用戶數(shù)據(jù)必須存儲(chǔ)在美國(guó)本地，并做嚴(yán)格的環(huán)境隔離，也就是將生產(chǎn)環(huán)境與測(cè)試環(huán)境徹底分開(kāi)，尤其是要為生產(chǎn)數(shù)據(jù)建立沙箱保護(hù)，確保國(guó)內(nèi)團(tuán)隊(duì)可訪問(wèn)的數(shù)據(jù)與核心的用戶生產(chǎn)數(shù)據(jù)完全隔離開(kāi)。第二，國(guó)內(nèi)團(tuán)隊(duì)如果需要遠(yuǎn)程訪問(wèn)美國(guó)的服務(wù)器，必須做好完整的日志記錄，詳細(xì)記載訪問(wèn)時(shí)間、訪問(wèn)內(nèi)容、具體操作等行為。這樣即便未來(lái)面臨美國(guó)監(jiān)管機(jī)構(gòu)的調(diào)查，企業(yè)也能拿出證據(jù)證明雖然存在遠(yuǎn)程訪問(wèn)，但并沒(méi)有接觸到任何用戶數(shù)據(jù)。

如果團(tuán)隊(duì)發(fā)展到一定階段，建議進(jìn)一步優(yōu)化，比如可以從技術(shù)團(tuán)隊(duì)中拆分出部分人員，派駐到新加坡或歐洲等地區(qū)開(kāi)展運(yùn)維工作，這樣安全性會(huì)更高。

Q：中國(guó)公司+海外用戶=是否必然觸發(fā)跨境數(shù)據(jù)傳輸。需要海外子公司、本地?cái)?shù)據(jù)中心以及本地?cái)?shù)據(jù)處理嗎？

星也：設(shè)立海外子公司首先要從成本角度考量，因?yàn)樗馕吨枰獫M足當(dāng)?shù)毓痉ㄏ碌囊徽缀弦?guī)要求，并且通常需要搭建一個(gè)如開(kāi)曼或 BVI 的頂層控股架構(gòu)。這里想特別提醒一點(diǎn)，很多團(tuán)隊(duì)試圖通過(guò)在香港設(shè)立主體來(lái)弱化「中國(guó)屬性」，但從實(shí)踐來(lái)看，無(wú)論在歐洲還是美國(guó)，監(jiān)管和市場(chǎng)普遍將香港與中國(guó)內(nèi)地緊密綁定，這種架構(gòu)很難起到預(yù)期的效果。如果想通過(guò)主體架構(gòu)進(jìn)行優(yōu)化，新加坡可能是現(xiàn)階段成本與效果更優(yōu)的選擇。

再結(jié)合數(shù)據(jù)中心與數(shù)據(jù)處理來(lái)看，像俄羅斯這類國(guó)家有強(qiáng)制本地化的要求，而對(duì)于歐美等核心敏感市場(chǎng)，監(jiān)管機(jī)構(gòu)也會(huì)對(duì)此進(jìn)行嚴(yán)格審查。對(duì)于其他非敏感地區(qū)，企業(yè)在早期若想以最小成本實(shí)現(xiàn)全球覆蓋，建議優(yōu)先布局中國(guó)、美國(guó)、歐盟、新加坡這四個(gè)核心節(jié)點(diǎn)。

Q：用戶量達(dá)到多少才需要做數(shù)據(jù)本地化存儲(chǔ)？

星也：這個(gè)問(wèn)題沒(méi)有明確的數(shù)量標(biāo)準(zhǔn)。坦白說(shuō)，核心取決于你對(duì)目標(biāo)市場(chǎng)的重視程度。在美歐這類監(jiān)管嚴(yán)格的市場(chǎng)，只要你開(kāi)始主動(dòng)進(jìn)行市場(chǎng)推廣、投放廣告或有其他明確的市場(chǎng)開(kāi)拓行為，就應(yīng)該同步規(guī)劃并推進(jìn)數(shù)據(jù)的本地化存儲(chǔ)，而不是等到用戶量達(dá)到 1000 或者 1 萬(wàn)才啟動(dòng)。如果等到積累了大量用戶才開(kāi)始合規(guī)，那么在此之前產(chǎn)生的所有數(shù)據(jù)都會(huì)成為既定的違規(guī)事實(shí)。但這里要注意不同地區(qū)的邏輯差異：中國(guó)法規(guī)可能會(huì)有基于數(shù)據(jù)量或用戶量的標(biāo)準(zhǔn)，但在美國(guó)，合規(guī)更多地是基于企業(yè)對(duì)長(zhǎng)期市場(chǎng)的布局和考量，不是一個(gè)固定的數(shù)字門(mén)檻。

07用戶行為數(shù)據(jù)處理的合規(guī)風(fēng)險(xiǎn)在哪里？

Q：對(duì)于調(diào)用基礎(chǔ)模型生成內(nèi)容的應(yīng)用層產(chǎn)品，怎么規(guī)避侵權(quán)責(zé)任？

星也：這里必須明確，應(yīng)用層和基礎(chǔ)模型層是兩個(gè)獨(dú)立的法律主體。

很多時(shí)候用戶的指令先輸入應(yīng)用層，再由應(yīng)用層傳遞給基礎(chǔ)模型。合規(guī)的關(guān)鍵可以從輸入端進(jìn)行風(fēng)險(xiǎn)控制。比如，在用戶輸入指令的環(huán)節(jié)，應(yīng)用層可以先設(shè)置一層資產(chǎn)合規(guī)審查機(jī)制，通過(guò)技術(shù)手段過(guò)濾掉那些明顯可能涉及侵權(quán)的需求。如果前端審查缺位，導(dǎo)致最終生成了侵權(quán)內(nèi)容，那么應(yīng)用層和基礎(chǔ)模型層都可能面臨侵權(quán)責(zé)任。但最終起訴誰(shuí)的選擇權(quán)掌握在權(quán)利人（比如版權(quán)方）手中。由于基礎(chǔ)模型往往不直接暴露給用戶，所以權(quán)利人大概率會(huì)起訴作為直接面向用戶主體的應(yīng)用層。在美國(guó)或中國(guó)的法律體系下，應(yīng)用層幾乎必然會(huì)被認(rèn)定為承擔(dān)責(zé)任，只是內(nèi)部責(zé)任如何劃分的問(wèn)題。

Q：我們的產(chǎn)品有信息聚合功能，整合了來(lái)自媒體平臺(tái)上的博主內(nèi)容，是否合規(guī)？

星也：信息聚合工作的概念有一些模糊，我結(jié)合現(xiàn)有的法律框架嘗試解答下。首先是數(shù)據(jù)爬取的技術(shù)合規(guī)問(wèn)題，這種整合行為很可能涉及爬蟲(chóng)技術(shù)，核心要先判斷是否違反了被爬取平臺(tái)的 robots 協(xié)議，或是否觸發(fā)了其反爬措施，一旦存在這種情況，就很容易與媒體平臺(tái)本身產(chǎn)生沖突。

其次是內(nèi)容的著作權(quán)問(wèn)題，需要區(qū)分內(nèi)容形式：長(zhǎng)博文可能構(gòu)成受著作權(quán)保護(hù)的文章，而圖片本身必然涉及相關(guān)權(quán)利，關(guān)鍵要看博主有沒(méi)有明確允許這些內(nèi)容在其他平臺(tái)呈現(xiàn)或轉(zhuǎn)載，未經(jīng)許可的整合轉(zhuǎn)載可能構(gòu)成侵權(quán)。

另外，整合規(guī)模也很關(guān)鍵，如果是大范圍整合，把原本分散在不同博主賬號(hào)下的內(nèi)容集中起來(lái)，可能會(huì)使聚合平臺(tái)具備與原平臺(tái)相同或類似的功能，形成直接競(jìng)爭(zhēng)關(guān)系，這種行為存在被認(rèn)定為不正當(dāng)競(jìng)爭(zhēng)的風(fēng)險(xiǎn)。

Q：ToC 社交/游戲類產(chǎn)品，怎么規(guī)避「用戶行為數(shù)據(jù)用于訓(xùn)練」的合規(guī)風(fēng)險(xiǎn)？

星也：核心在于把握以下三個(gè)關(guān)鍵點(diǎn)：首先，用戶協(xié)議和隱私政策中必須明確約定數(shù)據(jù)的使用范圍，清晰地告知用戶哪些具體的數(shù)據(jù)會(huì)被用于模型訓(xùn)練；其次，社交類數(shù)據(jù)等可能涉及隱私或敏感個(gè)人信息的內(nèi)容，必須做好匿名化和去標(biāo)識(shí)化處理，對(duì)于生物識(shí)別信息、兒童數(shù)據(jù)等高度敏感內(nèi)容，最穩(wěn)妥的做法是直接剔除；最后，也是至關(guān)重要的一點(diǎn)，要賦予用戶退出數(shù)據(jù)訓(xùn)練的權(quán)利。需要在產(chǎn)品功能層面落地，提供一個(gè)明確、便捷的選項(xiàng)，并且不能把這個(gè)選項(xiàng)藏得太深，確保用戶可以輕松完成退出操作。

Q：抓取海外公開(kāi)數(shù)據(jù)用于「內(nèi)部研發(fā)」和「產(chǎn)品化商用」，合規(guī)要求上有什么不同？

星也：內(nèi)部研發(fā)的風(fēng)險(xiǎn)遠(yuǎn)小于產(chǎn)品化商用。從理論上來(lái)說(shuō)，內(nèi)部研發(fā)在某些情況下甚至可能落入科研活動(dòng)的豁免范疇，但一旦進(jìn)入產(chǎn)品化商用階段，情況就完全不同了。因?yàn)樯逃眯袨闀?huì)產(chǎn)生實(shí)際經(jīng)濟(jì)收益，還可能實(shí)質(zhì)性地剝奪原數(shù)據(jù)平臺(tái)的市場(chǎng)空間。

在 AI 領(lǐng)域，產(chǎn)品化商用的表現(xiàn)形式可能不一樣，不是把數(shù)據(jù)原封不動(dòng)拿來(lái)用，比如我們接觸過(guò)的一個(gè)案例，抓取海外考試的公開(kāi)題庫(kù)，通過(guò)學(xué)習(xí)生成新題目并做成模擬考試功能，這種行為看似生成了新內(nèi)容，但最終與原題庫(kù)的權(quán)利方形成了直接競(jìng)爭(zhēng)關(guān)系，還可能涉及著作權(quán)等一系列問(wèn)題。在界定產(chǎn)品化商用的侵權(quán)風(fēng)險(xiǎn)時(shí)，生成物和原數(shù)據(jù)的關(guān)聯(lián)度會(huì)被重點(diǎn)關(guān)注，關(guān)聯(lián)度越高，越容易被認(rèn)定為存在主觀故意的行為。

我們?cè)趯彶檫@類行為時(shí)，會(huì)重點(diǎn)關(guān)注生成物和原數(shù)據(jù)的關(guān)聯(lián)度，以及源網(wǎng)站的具體權(quán)利協(xié)議，是允許自由使用的 CC 協(xié)議，還是保留所有權(quán)利的用戶協(xié)議，會(huì)得出完全不同的合規(guī)結(jié)論。

Q：在 IP 侵權(quán)判定中，「相似度」的標(biāo)準(zhǔn)是什么？

星也：其實(shí)這是一個(gè)很主觀的問(wèn)題，但核心標(biāo)準(zhǔn)不是簡(jiǎn)單的「像不像」，而是生成內(nèi)容是否落入了原 IP 的保護(hù)范圍。以?shī)W特曼為例，侵權(quán)行為不一定非要生成一個(gè)與迪迦、賽羅等具體形象完全一致的角色。只要生成的內(nèi)容包含了核心的、受保護(hù)的視覺(jué)元素，比如「身穿紅銀配色緊身衣、佩戴藍(lán)色護(hù)目鏡、胸口有燈」的巨人形象，那么即便生成的是一個(gè)「胖胖的奧特曼」，也極有可能落入形象侵權(quán)的范疇。侵權(quán)判斷的本質(zhì)還是看是否調(diào)用了受保護(hù)的創(chuàng)作元素，不僅僅是外觀的復(fù)刻。

Q：AI 生成的音樂(lè)/音效與現(xiàn)有作品相似，有沒(méi)有實(shí)際的訴訟案例參考？

星也：音樂(lè)侵權(quán)的邏輯與圖像侵權(quán)一致，都屬于著作權(quán)侵權(quán)的范疇，核心是判斷「實(shí)質(zhì)性相似」，但從實(shí)踐情況來(lái)看，音樂(lè)的判斷標(biāo)準(zhǔn)更主觀。

目前已經(jīng)出現(xiàn)了幾個(gè)比較受關(guān)注的相關(guān)的案例。例如，美國(guó)音樂(lè)行業(yè)協(xié)會(huì)起訴大型 AI 機(jī)構(gòu)，主張其生成內(nèi)容在旋律上構(gòu)成侵權(quán)。所有此類生成內(nèi)容的侵權(quán)爭(zhēng)議，本質(zhì)上都圍繞兩個(gè)層面展開(kāi)。第一個(gè)層面是訓(xùn)練數(shù)據(jù)侵權(quán)，即在訓(xùn)練過(guò)程中使用受版權(quán)保護(hù)的作品是否構(gòu)成侵權(quán)，涉及到復(fù)雜的「合理使用」或「轉(zhuǎn)換性使用」的辯論。第二個(gè)層面才是生成結(jié)果侵權(quán)，即輸出的內(nèi)容與原作品是否構(gòu)成相似。目前，原告方大多會(huì)提出復(fù)合型主張，將數(shù)據(jù)侵權(quán)、結(jié)果侵權(quán)和不正當(dāng)競(jìng)爭(zhēng)等訴求打包在一起進(jìn)行訴訟。

Q：用戶上傳已有 IP 的聲音作為素材生成新內(nèi)容，平臺(tái)怎么規(guī)避風(fēng)險(xiǎn)？

星也：這種情況風(fēng)險(xiǎn)極高，可能同時(shí)侵犯 IP 的人格權(quán)和著作權(quán)。規(guī)避風(fēng)險(xiǎn)的首要方式是優(yōu)先爭(zhēng)取商業(yè)授權(quán)。如果無(wú)法獲得授權(quán)，就必須在用戶協(xié)議中要求用戶承諾其對(duì)上傳素材擁有合法權(quán)屬，并建立清晰便捷的投訴報(bào)警通道，在收到侵權(quán)通知后及時(shí)處理，適用「避風(fēng)港規(guī)則」減輕責(zé)任。

同時(shí)，平臺(tái)在功能設(shè)計(jì)上要極為謹(jǐn)慎，盡量避免對(duì)這類生成內(nèi)容進(jìn)行推薦、分發(fā)或打榜，因?yàn)檫@些行為可能被認(rèn)定為平臺(tái)主動(dòng)參與了共同侵權(quán)。另外要注意，警惕利用知名 IP 聲音制造假新聞或損害當(dāng)事人名譽(yù)的風(fēng)險(xiǎn)，即使技術(shù)難度大，也要嘗試在生成的聲音中加入標(biāo)識(shí)，作為重要的合規(guī)證據(jù)。

Q：什么規(guī)模的公司會(huì)被處罰？如果沒(méi)做合規(guī)通常在哪個(gè)階段會(huì)被處罰？

星也：會(huì)不會(huì)被處罰，和公司規(guī)模沒(méi)有直接關(guān)系，關(guān)鍵在有沒(méi)有碰了明確的「紅線」。很多小公司甚至個(gè)人被處罰，都是因?yàn)閺氖铝烁唢L(fēng)險(xiǎn)行為，比如用爬蟲(chóng)導(dǎo)致對(duì)方系統(tǒng)癱瘓，可能構(gòu)成破壞計(jì)算機(jī)信息系統(tǒng)罪；或者收集個(gè)人信息后進(jìn)行轉(zhuǎn)賣(mài)，同樣會(huì)涉及刑事責(zé)任。

合規(guī)很像一場(chǎng)持續(xù)的考試，日常的合規(guī)工作就是學(xué)習(xí)和復(fù)習(xí)的過(guò)程，沒(méi)到「考試」的時(shí)候，你不知道自己到底做的有多合規(guī)或者多不合規(guī)。

有幾個(gè)非常明顯的「考試節(jié)點(diǎn)」：第一個(gè)是產(chǎn)品上架時(shí)，無(wú)論是微信小程序還是 App Store，都會(huì)要求提供合規(guī)證明；第二個(gè)是融資過(guò)程中，投資方會(huì)對(duì)已上線產(chǎn)品的合規(guī)狀況進(jìn)行嚴(yán)格盡職調(diào)查；第三個(gè)是日常的監(jiān)管專項(xiàng)行動(dòng)，各地的網(wǎng)信、信通等部門(mén)每年都會(huì)開(kāi)展專項(xiàng)檢查。對(duì)于穩(wěn)定運(yùn)營(yíng)期的公司來(lái)說(shuō)，如果有法務(wù)或外部律師，一定要關(guān)注這些專項(xiàng)行動(dòng)的動(dòng)向，而且每年的監(jiān)管重點(diǎn)也會(huì)有一定風(fēng)向變化。

轉(zhuǎn)載原創(chuàng)文章請(qǐng)?zhí)砑游⑿牛篺ounderparker

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.