Meta 收購(gòu) Manus 無(wú)疑是本月最重磅的行業(yè)新聞。不到一年時(shí)間,產(chǎn)品上線、拿到美元投資、團(tuán)隊(duì)主體搬到新加坡、一億美元 ARR,然后就是被 Meta 收購(gòu),Manus 發(fā)展速度驚人。
這其中,搬到新加坡是比較關(guān)鍵的一步。不管是從數(shù)據(jù)合規(guī)、法律合規(guī)上來(lái)說(shuō),還是為了更好融入國(guó)際市場(chǎng)。
Manus 的創(chuàng)業(yè)路徑,也給國(guó)內(nèi)很多其他 AI 出海公司一個(gè)可參考的對(duì)標(biāo)。對(duì)國(guó)內(nèi)的 AI 創(chuàng)業(yè)公司來(lái)說(shuō),如果能利用本土的產(chǎn)品化能力,加上供應(yīng)鏈的優(yōu)勢(shì),去降維打擊全球市場(chǎng),是 AI 時(shí)代的一個(gè)絕佳策略。
這其中,數(shù)據(jù)、監(jiān)管、存儲(chǔ)、主體架構(gòu)等,是產(chǎn)品增長(zhǎng)之外,絕對(duì)要前置、重點(diǎn)解決的問(wèn)題。
因此,在最近的一場(chǎng)閉門(mén) Workshop 中,我們邀請(qǐng)了北京星也律師事務(wù)所的兩位資深律師,系統(tǒng)性地聊聊 AI 企業(yè)出海合規(guī)的話題。星也律所的團(tuán)隊(duì)在 AI 領(lǐng)域有著非常豐富的實(shí)踐經(jīng)驗(yàn),服務(wù)過(guò)多家 AI 企業(yè)。
這次的分享內(nèi)容非常干貨,兩位侓師解答了包括跨境數(shù)據(jù)傳輸、用戶數(shù)據(jù)訓(xùn)練、業(yè)務(wù)模式、生成物侵權(quán)等方面的典型合規(guī)難題。
在進(jìn)行一些脫敏處理后,F(xiàn)ounder Park 整理了這次分享的精華內(nèi)容。
??關(guān)注 Founder Park,最及時(shí)最干貨的創(chuàng)業(yè)分享
超 17000 人的「AI 產(chǎn)品市集」社群!不錯(cuò)過(guò)每一款有價(jià)值的 AI 應(yīng)用。
邀請(qǐng)從業(yè)者、開(kāi)發(fā)人員和創(chuàng)業(yè)者,飛書(shū)掃碼加群:
進(jìn)群后,你有機(jī)會(huì)得到:
最新、最值得關(guān)注的 AI 新品資訊;
不定期贈(zèng)送熱門(mén)新品的邀請(qǐng)碼、會(huì)員碼;
最精準(zhǔn)的AI產(chǎn)品曝光渠道
01「三明治架構(gòu)」風(fēng)險(xiǎn)很大
AI 產(chǎn)品出海已經(jīng)不是「要不要做」的選擇題,而是「該怎么做」的必答題了。對(duì)中國(guó)的 AI 創(chuàng)業(yè)團(tuán)隊(duì)來(lái)說(shuō),如果能利用本土的產(chǎn)品化能力,加上供應(yīng)鏈的優(yōu)勢(shì),去降維打擊全球市場(chǎng),絕對(duì)是 AI 時(shí)代的一個(gè)絕佳策略。
在實(shí)踐中,團(tuán)隊(duì)首先需要明確自身的出海類型。根據(jù)我們的觀察,現(xiàn)在主要有兩種模式。
一種是,資本驅(qū)動(dòng)型出海。這類出海的核心目標(biāo)是追求高估值和海外上市。硅谷等海外資本市場(chǎng)對(duì) AI 概念的認(rèn)可度更高,給出的估值也相應(yīng)更高。但往往要求團(tuán)隊(duì)在早期就必須解決業(yè)務(wù)和團(tuán)隊(duì)的歸屬地問(wèn)題,地緣政治是無(wú)法回避的因素。
第二種是,業(yè)務(wù)驅(qū)動(dòng)型出海。這是更普遍的模式,核心目標(biāo)是在海外市場(chǎng)獲得營(yíng)收。具體又分為兩類:
風(fēng)險(xiǎn)規(guī)避型:國(guó)內(nèi)監(jiān)管門(mén)檻高,在內(nèi)容審核、數(shù)據(jù)監(jiān)管或特定業(yè)務(wù)(如 Web3)上存在嚴(yán)格限制,部分業(yè)務(wù)只能選擇在政策更寬松的海外地區(qū)開(kāi)展。
市場(chǎng)適配型:通常是陪伴類、生成類等 AI 產(chǎn)品,海外市場(chǎng)和用戶更成熟,付費(fèi)意愿更強(qiáng),更適合業(yè)務(wù)落地。
對(duì)于業(yè)務(wù)驅(qū)動(dòng)的出海企業(yè),需要特別注意提前布局、主動(dòng)規(guī)劃合規(guī)問(wèn)題。很多企業(yè)發(fā)展速度非常的快,短短幾個(gè)月用戶就能漲到幾萬(wàn)用戶,甚至還沒(méi)完成下一輪融資,用戶規(guī)模就已經(jīng)爆發(fā)。如果在這時(shí)才考慮數(shù)據(jù)架構(gòu)遷移或者團(tuán)隊(duì)海外落地,不僅成本極高,風(fēng)險(xiǎn)也更大。所以,合規(guī)布局必須比業(yè)務(wù)推進(jìn)早半步。
目前,企業(yè)常見(jiàn)的是「三明治架構(gòu)」。
![]()
這種架構(gòu)的特點(diǎn)是,資金(來(lái)源包括融資、用戶付費(fèi))和用戶數(shù)據(jù)產(chǎn)生在海外,但核心的技術(shù)研發(fā)與運(yùn)營(yíng)團(tuán)隊(duì)完全留在中國(guó)。這種模式常常導(dǎo)致,海外用戶數(shù)據(jù)會(huì)被傳回國(guó)內(nèi)進(jìn)行研發(fā)、處理等環(huán)節(jié)。
同時(shí),許多應(yīng)用會(huì)調(diào)用 OpenAI、谷歌、Claude 等海外大廠的模型 API,使得數(shù)據(jù)流轉(zhuǎn)路徑更為復(fù)雜:海外用戶數(shù)據(jù)先傳回中國(guó)處理,隨后再傳輸至美國(guó)等服務(wù)器進(jìn)行模型推理,最后將結(jié)果返回給用戶。
從數(shù)據(jù)安全和合規(guī)角度來(lái)看,「三明治」架構(gòu)面臨著數(shù)據(jù)主權(quán)和國(guó)家安全的雙重挑戰(zhàn),完全忽視了全球各國(guó)對(duì)「數(shù)據(jù)主權(quán)」的高度重視。
「數(shù)據(jù)是新的石油」,幾乎所有國(guó)家在數(shù)據(jù)立法時(shí),第一步都會(huì)明確:在本國(guó)產(chǎn)生的數(shù)據(jù),其主權(quán)歸本國(guó)所有。在這種背景下,數(shù)據(jù)的反復(fù)跨境傳輸,必然會(huì)帶來(lái)巨大的合規(guī)風(fēng)險(xiǎn)。
02中國(guó)、美國(guó)和歐盟,
監(jiān)管邏輯有什么不同?
在企業(yè)出海時(shí),通常最關(guān)注國(guó)內(nèi)、美國(guó)、歐盟這三個(gè)區(qū)域的合規(guī)問(wèn)題。這三個(gè)法域的監(jiān)管邏輯和側(cè)重點(diǎn)各有不同。
美國(guó):市場(chǎng)準(zhǔn)入風(fēng)險(xiǎn)
美國(guó)監(jiān)管的特點(diǎn)是,一旦找到一個(gè)小的違規(guī)切口,就可能「順藤摸瓜」,引發(fā)一系列罰款和長(zhǎng)期整改要求。核心風(fēng)險(xiǎn)在訴訟,執(zhí)法機(jī)構(gòu)一旦發(fā)現(xiàn)違規(guī),往往會(huì)通過(guò)訴訟發(fā)起處罰,后果可能遠(yuǎn)超罰款本身。
以兒童機(jī)器人產(chǎn)品 Apitor 為例,因?yàn)檫`反美國(guó)《兒童在線隱私保護(hù)法》(COPPA)被處罰。違規(guī)點(diǎn)集中在多個(gè)敏感環(huán)節(jié):通過(guò)內(nèi)嵌的 SDK 強(qiáng)制收集兒童的精確地理位置等敏感信息,并將數(shù)據(jù)回傳至中國(guó)服務(wù)器,同時(shí)隱私政策聲明與實(shí)際操作完全不符。
最終,Apitor 面臨的不僅是 50 萬(wàn)美元的和解金,還有一份長(zhǎng)達(dá)十年的強(qiáng)制整改令,要求企業(yè)銷毀違規(guī)數(shù)據(jù)、引入第三方審計(jì)并定期向監(jiān)管機(jī)構(gòu)提交合規(guī)報(bào)告。這種長(zhǎng)期且成本高昂的整改要求,幾乎宣告了產(chǎn)品在北美市場(chǎng)的「死刑」。
歐盟:以GDPR為核心的嚴(yán)格數(shù)據(jù)保護(hù)
歐盟的合規(guī)核心是《通用數(shù)據(jù)保護(hù)條例》(GDPR),是全球第一部完整、成體系的數(shù)據(jù)保護(hù)法案,歐盟以極其嚴(yán)格的標(biāo)準(zhǔn)執(zhí)行。
GDPR 的核心原則很明確:數(shù)據(jù)屬于用戶個(gè)人,企業(yè)獲取數(shù)據(jù)必須獲得用戶明確、具體的同意。
GDPR 有五大「狠招」:第一是天價(jià)罰款,幾乎所有的大企業(yè)在歐盟都被罰了個(gè)遍;第二是被遺忘權(quán),對(duì) AI 企業(yè)來(lái)說(shuō)非常棘手。對(duì)于傳統(tǒng)數(shù)據(jù)企業(yè),刪除用戶個(gè)人數(shù)據(jù)就行,但如果數(shù)據(jù)已用于 AI 訓(xùn)練或功能完善,刪除的邊界在哪里?第三是數(shù)據(jù)采集的最小必要原則,這也是 GDPR 首次明確規(guī)范的;第四是知情同意的明確性要求,企業(yè)必須用通俗易懂的語(yǔ)言,向用戶說(shuō)明數(shù)據(jù)的使用對(duì)象、用途、存儲(chǔ)期限等內(nèi)容;第五是嚴(yán)格的跨境數(shù)據(jù)傳輸要求。
以一個(gè)消費(fèi)級(jí)攝像頭產(chǎn)品為例。該產(chǎn)品曾被德國(guó)與法國(guó)的數(shù)據(jù)保護(hù)機(jī)構(gòu)調(diào)查,原因是:盡管其用戶數(shù)據(jù)存儲(chǔ)在歐洲本地的數(shù)據(jù)中心,但國(guó)內(nèi)的工程師可通過(guò) VPN 直接訪問(wèn)。這種行為被歐盟監(jiān)管機(jī)構(gòu)認(rèn)定為等效的數(shù)據(jù)跨境傳輸。
從這個(gè)案例可以看出,歐盟監(jiān)管不僅關(guān)注數(shù)據(jù)存儲(chǔ)的物理位置,更關(guān)注數(shù)據(jù)的訪問(wèn)權(quán)限管控。對(duì)于研發(fā)團(tuán)隊(duì)在國(guó)內(nèi)、僅在海外設(shè)立銷售點(diǎn)的大多數(shù)出海企業(yè),產(chǎn)品維護(hù)工作往往由國(guó)內(nèi)團(tuán)隊(duì)完成,甚至存在生產(chǎn)環(huán)境與測(cè)試環(huán)境混用的情況。國(guó)內(nèi)工程師對(duì)海外生產(chǎn)環(huán)境數(shù)據(jù)的任何遠(yuǎn)程訪問(wèn),都可能被視為數(shù)據(jù)跨境行為,引發(fā)監(jiān)管風(fēng)險(xiǎn)。遠(yuǎn)程數(shù)據(jù)處理行為,是合規(guī)監(jiān)管的重點(diǎn)。
中國(guó):數(shù)據(jù)出境評(píng)估與 AI 服務(wù)備案
在國(guó)內(nèi),《網(wǎng)絡(luò)安全法》、《數(shù)據(jù)安全法》和《個(gè)人信息保護(hù)法》構(gòu)成了數(shù)據(jù)合規(guī)的基礎(chǔ)框架。對(duì)于出海業(yè)務(wù),核心在于數(shù)據(jù)出境的合規(guī)性。
同時(shí),國(guó)內(nèi)對(duì) AI 服務(wù)有明確的備案要求。無(wú)論是算法本身,還是包含 AI 功能的應(yīng)用上架,都必須完成算法備案。對(duì)于具有輿論屬性或內(nèi)容生成能力的應(yīng)用,還需進(jìn)行生成式 AI 服務(wù)的上線備案與安全評(píng)估,即「雙備案」,這是在國(guó)內(nèi)開(kāi)展業(yè)務(wù)必須完成的合規(guī)環(huán)節(jié)。
03一個(gè)基礎(chǔ)的全球數(shù)據(jù)存儲(chǔ)布局,
至少要覆蓋四個(gè)節(jié)點(diǎn)
通過(guò)分析完以上不同地區(qū)的監(jiān)管要求,我們會(huì)發(fā)現(xiàn)一個(gè)共性點(diǎn):多數(shù)軟件產(chǎn)品涉及的敏感數(shù)據(jù)都被要求本地存儲(chǔ)。
這其中,有六類數(shù)據(jù)需要特別關(guān)注:金融類、醫(yī)療健康類、汽車與交通數(shù)據(jù)(尤其在中國(guó),涉及人臉、環(huán)境的視覺(jué)數(shù)據(jù)監(jiān)管極為嚴(yán)格)、生物識(shí)別數(shù)據(jù)、精確的地理位置與行動(dòng)軌跡信息,以及包括關(guān)鍵基礎(chǔ)設(shè)施和政務(wù)信息在內(nèi)的傳統(tǒng)重要數(shù)據(jù)。只要產(chǎn)品涉及這些領(lǐng)域,數(shù)據(jù)的本地化存儲(chǔ)幾乎是所有國(guó)家的強(qiáng)制要求。
除了這六類數(shù)據(jù),對(duì)于一般的用戶數(shù)據(jù),可以根據(jù)目標(biāo)市場(chǎng)的不同來(lái)制定更靈活的全球存儲(chǔ)策略。
![]()
在美國(guó)市場(chǎng),美國(guó)本土的數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施完善,有大量供應(yīng)商可供選擇,所以只要涉及美國(guó)市場(chǎng),哪怕用戶只有幾百人、幾千人,建議都要第一時(shí)間將數(shù)據(jù)存儲(chǔ)在美國(guó)本土,即使只有幾千條用戶數(shù)據(jù)也可能觸發(fā)監(jiān)管處罰。同時(shí),這樣做的一個(gè)好處是,一個(gè)美國(guó)節(jié)點(diǎn)通常可以合規(guī)地覆蓋包括加拿大、墨西哥在內(nèi)的整個(gè)北美乃至大部分中南美洲市場(chǎng),巴西和阿根廷等少數(shù)例外。
歐洲的情況相對(duì)簡(jiǎn)單。由于歐盟法規(guī)的一致性,大部分企業(yè)通常會(huì)選擇在法蘭克福等基礎(chǔ)設(shè)施完善的城市設(shè)立單一數(shù)據(jù)節(jié)點(diǎn),可以覆蓋整個(gè)歐盟市場(chǎng),這個(gè)策略也基本適用于脫歐后的英國(guó)。
對(duì)于亞洲及中東市場(chǎng),東南亞的通用解決方案是在新加坡存儲(chǔ),因?yàn)樾录悠略谌蚍秶鷥?nèi)屬于數(shù)據(jù)中立程度較高的國(guó)家,但有幾個(gè)例外:如果印度是核心市場(chǎng),需要在當(dāng)?shù)剡M(jìn)行數(shù)據(jù)存儲(chǔ);中東大部分國(guó)家可由歐洲節(jié)點(diǎn)覆蓋,但沙特已立法要求數(shù)據(jù)本地化;日韓市場(chǎng),通常要求數(shù)據(jù)分別在各自境內(nèi)存儲(chǔ)。
綜合成本、合規(guī)因素來(lái)看,一個(gè)基礎(chǔ)的全球數(shù)據(jù)存儲(chǔ)布局至少需要覆蓋四個(gè)節(jié)點(diǎn):美國(guó)、歐盟、新加坡,以及服務(wù)國(guó)內(nèi)用戶的中國(guó)節(jié)點(diǎn)。如果業(yè)務(wù)重點(diǎn)涉及日韓等市場(chǎng),就需要單獨(dú)再增加存儲(chǔ)節(jié)點(diǎn)。
04輸入端:哪些數(shù)據(jù)能拿來(lái)訓(xùn)練,哪些不能?
接下來(lái),是訓(xùn)練數(shù)據(jù)的合規(guī)問(wèn)題。全球范圍內(nèi)高質(zhì)量的訓(xùn)練數(shù)據(jù)都很稀缺,對(duì)初創(chuàng) AI 企業(yè)來(lái)說(shuō),數(shù)據(jù)來(lái)源通常限于:網(wǎng)絡(luò)爬取、自有用戶數(shù)據(jù)以及開(kāi)源數(shù)據(jù)集,不同來(lái)源數(shù)據(jù)的風(fēng)險(xiǎn)也各有不同。
首先是網(wǎng)絡(luò)公開(kāi)數(shù)據(jù)的爬取。這里一個(gè)典型的侵權(quán)案例就是紐約時(shí)報(bào)起訴 OpenAI。《紐約時(shí)報(bào)》認(rèn)為 OpenAI 在訓(xùn)練 GPT 時(shí),爬取了他們的上百萬(wàn)篇文章,侵犯了著作權(quán)。另一個(gè)案例是 Clearview AI,因?yàn)榕廊《嗉疑缃幻襟w的上百億張人臉照片,在歐美多地因侵犯?jìng)€(gè)人信息權(quán)和隱私權(quán)遭到封禁。
從這兩個(gè)案例可以得出一個(gè)關(guān)鍵結(jié)論的結(jié)論:公開(kāi)數(shù)據(jù)不等于可以隨意使用,數(shù)據(jù)的具體內(nèi)容決定了風(fēng)險(xiǎn)屬性。公開(kāi)爬取行為涉及到了兩個(gè)層面的權(quán)利:一是平臺(tái)通過(guò)技術(shù)和勞動(dòng)投入形成的受法律保護(hù)的數(shù)據(jù)資產(chǎn)權(quán)益;二是數(shù)據(jù)內(nèi)容本身所承載的權(quán)利,如著作權(quán)或個(gè)人信息權(quán)。
這并不意味著公開(kāi)爬取的數(shù)據(jù)完全不能用。只要不觸碰人臉、聲音等敏感個(gè)人信息的紅線,且爬取行為不對(duì)目標(biāo)服務(wù)器造成沖擊,或開(kāi)發(fā)出與對(duì)方存在實(shí)質(zhì)性競(jìng)爭(zhēng)關(guān)系的產(chǎn)品,引發(fā)的直接沖突的風(fēng)險(xiǎn)就相對(duì)可控。
核心合規(guī)建議是,遵守目標(biāo)網(wǎng)站的 robots 協(xié)議,控制爬取頻率,同時(shí)建立清晰的數(shù)據(jù)來(lái)源清單,記錄網(wǎng)址、時(shí)間與方式,從而將風(fēng)險(xiǎn)控制在可接受范圍內(nèi)。
其次是,自有用戶數(shù)據(jù)的使用。這部分?jǐn)?shù)據(jù)對(duì)企業(yè)來(lái)說(shuō)是相當(dāng)大的誘惑,因?yàn)閳F(tuán)隊(duì)會(huì)天然認(rèn)為對(duì)自己服務(wù)器上的數(shù)據(jù)擁有所有權(quán)。以 Meta 為例,Meta 此前計(jì)劃利用其平臺(tái)用戶數(shù)據(jù)進(jìn)行模型訓(xùn)練,后被歐盟監(jiān)管機(jī)構(gòu)叫停。監(jiān)管方給出的核心觀點(diǎn)是:平臺(tái)對(duì)所收集的用戶數(shù)據(jù)并不享有當(dāng)然的合法使用權(quán),如果要是用于訓(xùn)練,必須獲得用戶的明確同意。
這個(gè)邏輯其實(shí)很簡(jiǎn)單,數(shù)據(jù)保護(hù)遵循「生命周期管理」原則,即數(shù)據(jù)的收集與使用是兩個(gè)獨(dú)立環(huán)節(jié),需要分別進(jìn)行合規(guī)處理。因此,解決方案的核心是更新隱私政策與用戶協(xié)議,明確告知用戶哪些數(shù)據(jù)將被用于模型訓(xùn)練等用途。在此基礎(chǔ)上,歐美法規(guī)還要求必須為用戶提供清晰的退出選項(xiàng)(Opt-out)。
近期 LinkedIn 宣布使用用戶數(shù)據(jù)訓(xùn)練模型,采用的正是這種「明確授權(quán) + 退出機(jī)制」的合規(guī)路徑,即告知用戶有權(quán)選擇退出,如果在規(guī)定期限內(nèi)未操作,視為默認(rèn)同意。
第三種來(lái)源是開(kāi)源數(shù)據(jù)集,我們稱為「盲盒」。以 Stable Diffusion 模型使用知名開(kāi)源數(shù)據(jù)集 LAION 為例,LAION 數(shù)據(jù)集包含超過(guò) 58 億張圖片,但后續(xù)被曝出其中含有大量未經(jīng)授權(quán)的版權(quán)作品,甚至涉及未成年人的非法內(nèi)容,最后被迫下架清洗。這個(gè)案例說(shuō)明,開(kāi)源不等于無(wú)瑕疵。
企業(yè)在使用前,必須進(jìn)行兩項(xiàng)基礎(chǔ)的風(fēng)險(xiǎn)防范:一是仔細(xì)審查數(shù)據(jù)集的授權(quán)協(xié)議(License),明確數(shù)據(jù)是不是可用于商用,以及有沒(méi)有其他特殊限制;二是如果使用了當(dāng)前存在爭(zhēng)議的開(kāi)源數(shù)據(jù),建議做隔離處理,確保訓(xùn)練的功能和生成的內(nèi)容與其他部分區(qū)隔,來(lái)降低潛在風(fēng)險(xiǎn)對(duì)整個(gè)產(chǎn)品的影響。
除了以上三種數(shù)據(jù)來(lái)源外,還必須高度警惕兩類特殊數(shù)據(jù):生物識(shí)別數(shù)據(jù)和未成年人數(shù)據(jù)。無(wú)論數(shù)據(jù)來(lái)自哪里,只要涉及到人臉、聲音等生物識(shí)別信息,或與未成年人相關(guān),都必須高度警惕。除非產(chǎn)品功能本身必須依賴這類數(shù)據(jù),這種情況下需要通過(guò)更直接、更精準(zhǔn)的方式獲取授權(quán)。否則,需要對(duì)這類數(shù)據(jù)進(jìn)行匿名化或去標(biāo)識(shí)化處理。
同時(shí),這套評(píng)估數(shù)據(jù)來(lái)源、權(quán)利歸屬和用戶授權(quán)的邏輯,同樣適用于評(píng)估外購(gòu)的第三方數(shù)據(jù)。
05輸出端:AI 生成的內(nèi)容歸誰(shuí)?
侵權(quán)風(fēng)險(xiǎn)如何避免?
在輸出端,AI 生成內(nèi)容合規(guī)主要圍繞三個(gè)核心維度依次展開(kāi):生成內(nèi)容的權(quán)利歸屬、生成內(nèi)容是否侵犯第三方權(quán)利,以及生成內(nèi)容的標(biāo)識(shí)規(guī)范。
首先是生成內(nèi)容的版權(quán)歸屬問(wèn)題。目前全球主流的法律共識(shí)基本都是否定的,AI 本身無(wú)法成為作者。無(wú)論是美國(guó)版權(quán)局在《黎明的扎利亞》案中的裁定,還是中國(guó)與歐洲的司法觀點(diǎn),都明確指出了著作權(quán)是為人類設(shè)計(jì)的權(quán)利。因此,AI 企業(yè)不能因?yàn)閮?nèi)容由模型生成,就理所當(dāng)然地成為版權(quán)所有者。
但一個(gè)突破性的可能是,如果最終促使 AI 生成內(nèi)容的用戶,付出了足夠多的智力投入,比如使用了非常具體的提示詞、詳細(xì)描述了需求,或者對(duì) AI 生成的內(nèi)容做了大量細(xì)致調(diào)整,這種「用戶的智力汗水」可能會(huì)得到法律認(rèn)可。在《黎明的扎利亞》案中,美國(guó)版權(quán)局認(rèn)為,用戶對(duì)最終作品的特殊編排部分可以享有著作權(quán)。不過(guò),如何界定和保護(hù)這部分用戶貢獻(xiàn),還需要在實(shí)踐中進(jìn)一步明確和探索。
由此得出的一個(gè)結(jié)論是,目前,想直接依據(jù)著作權(quán)法將 AI 生成內(nèi)容的版權(quán)歸于企業(yè),難度極大。可行的替代方案是通過(guò)用戶協(xié)議進(jìn)行約定。在條款中明確與使用者(無(wú)論是 C 端個(gè)人還是 B 端企業(yè))約定 AI 生成內(nèi)容的權(quán)利歸屬與使用方式,用私人協(xié)議的約定,來(lái)替代目前法律還沒(méi)有明確的版權(quán)歸屬問(wèn)題。這是關(guān)于生成內(nèi)容權(quán)利歸屬的核心思路。
AI 生成的內(nèi)容,是否可能侵犯第三方權(quán)利,是當(dāng)前更現(xiàn)實(shí)的法律風(fēng)險(xiǎn)。一旦發(fā)生侵權(quán),責(zé)任由誰(shuí)承擔(dān)?以 AI 公司的大模型產(chǎn)品生成與其經(jīng)典 IP 形象高度相似圖像的案例來(lái)說(shuō)。這類訴訟通常會(huì)圍繞兩條侵權(quán)路徑展開(kāi):第一,原告主張 AI 公司的訓(xùn)練數(shù)據(jù)包含了其受版權(quán)保護(hù)的作品,構(gòu)成直接侵權(quán);第二,原告指控 AI 公司在宣傳中以「生成迪士尼形象」為賣(mài)點(diǎn),誘導(dǎo)和助長(zhǎng)了用戶的侵權(quán)行為,應(yīng)承擔(dān)間接侵權(quán)責(zé)任。
目前這類案件還沒(méi)有有最終判決結(jié)果,但這基本代表了 AI 生成內(nèi)容侵權(quán)糾紛的核心爭(zhēng)議方向。判定 AI 生成內(nèi)容侵權(quán)判定的核心標(biāo)準(zhǔn),是「實(shí)質(zhì)性相似」,即生成結(jié)果與原作品相比,能不能讓普通第三方認(rèn)為兩者足夠相似。
同時(shí),需要明確的是,AI 企業(yè)不會(huì)因?yàn)?AI 生成了侵權(quán)內(nèi)容就必然承擔(dān)責(zé)任,關(guān)鍵在于企業(yè)有沒(méi)有盡到了相應(yīng)的管理義務(wù),能否適用「避風(fēng)港原則」免責(zé)。國(guó)內(nèi)外的監(jiān)管思路在這方面基本一致,平臺(tái)需要盡最大努力防范侵權(quán)。具體措施包括,設(shè)置侵權(quán)舉報(bào)渠道、避免通過(guò)編輯或推薦等方式誘導(dǎo)用戶生成侵權(quán)內(nèi)容等。
對(duì)于許多初創(chuàng)企業(yè)來(lái)說(shuō),在難以回溯調(diào)整訓(xùn)練數(shù)據(jù)和核心功能時(shí),更要做好那些可被清晰感知的合規(guī)措施,即所謂的「表面功夫」。例如,建立關(guān)鍵詞屏蔽機(jī)制、完善侵權(quán)內(nèi)容的下架流程,并在用戶協(xié)議中明確免責(zé)條款。這些可核查、能被監(jiān)管和用戶清晰看到的合規(guī)措施,往往是企業(yè)免于承擔(dān)侵權(quán)責(zé)任的重要保障。
最后一點(diǎn),關(guān)于 AI 生成內(nèi)容的標(biāo)識(shí)與水印問(wèn)題。
與版權(quán)問(wèn)題不同,標(biāo)識(shí)要求更多屬于行政監(jiān)管義務(wù),不直接對(duì)應(yīng)某個(gè)原始權(quán)利,但因?yàn)闆](méi)有標(biāo)識(shí) AI 身份可能引發(fā)虛假信息傳播、公眾誤導(dǎo)等輿論風(fēng)險(xiǎn),是目前各國(guó)監(jiān)管的重重點(diǎn)方向。
![]()
全球幾乎在同一時(shí)期都開(kāi)始要求對(duì) AI 生成內(nèi)容進(jìn)行明確區(qū)分,具體分為兩個(gè)層面:一是「顯性標(biāo)識(shí)」,比如在界面標(biāo)注「由 AI 生成」;二是「隱性水印」,即將標(biāo)識(shí)信息嵌入元數(shù)據(jù)中供機(jī)器識(shí)別。這是企業(yè)必須遵守的底線性合規(guī)要求。
06主體架構(gòu)優(yōu)化,
新加坡可能是現(xiàn)階段更優(yōu)的選擇
Q:公司和創(chuàng)始人在美國(guó),技術(shù)團(tuán)隊(duì)在中國(guó),產(chǎn)品面向美國(guó) ToC 用戶,數(shù)據(jù)合規(guī)需要注意什么?
星也:這是一個(gè)非常典型的場(chǎng)景,藏著兩個(gè)核心風(fēng)險(xiǎn)點(diǎn):第一,面向美國(guó)的 ToC 產(chǎn)品,必然會(huì)涉及大量用戶信息,不管是登錄、支付等個(gè)人信息,還是用戶的使用行為數(shù)據(jù);第二,技術(shù)團(tuán)隊(duì)在國(guó)內(nèi),意味著產(chǎn)品的更新、調(diào)試等運(yùn)維工作都要在國(guó)內(nèi)完成。這就直接導(dǎo)致了數(shù)據(jù)存儲(chǔ)與操作主體地理位置的不一致,很容易觸發(fā)合規(guī)風(fēng)險(xiǎn)。
針對(duì)這種情況,最基礎(chǔ)的操作有兩點(diǎn),也是必須要做的:第一,用戶數(shù)據(jù)必須存儲(chǔ)在美國(guó)本地,并做嚴(yán)格的環(huán)境隔離,也就是將生產(chǎn)環(huán)境與測(cè)試環(huán)境徹底分開(kāi),尤其是要為生產(chǎn)數(shù)據(jù)建立沙箱保護(hù),確保國(guó)內(nèi)團(tuán)隊(duì)可訪問(wèn)的數(shù)據(jù)與核心的用戶生產(chǎn)數(shù)據(jù)完全隔離開(kāi)。第二,國(guó)內(nèi)團(tuán)隊(duì)如果需要遠(yuǎn)程訪問(wèn)美國(guó)的服務(wù)器,必須做好完整的日志記錄,詳細(xì)記載訪問(wèn)時(shí)間、訪問(wèn)內(nèi)容、具體操作等行為。這樣即便未來(lái)面臨美國(guó)監(jiān)管機(jī)構(gòu)的調(diào)查,企業(yè)也能拿出證據(jù)證明雖然存在遠(yuǎn)程訪問(wèn),但并沒(méi)有接觸到任何用戶數(shù)據(jù)。
如果團(tuán)隊(duì)發(fā)展到一定階段,建議進(jìn)一步優(yōu)化,比如可以從技術(shù)團(tuán)隊(duì)中拆分出部分人員,派駐到新加坡或歐洲等地區(qū)開(kāi)展運(yùn)維工作,這樣安全性會(huì)更高。
Q:中國(guó)公司+海外用戶=是否必然觸發(fā)跨境數(shù)據(jù)傳輸。需要海外子公司、本地?cái)?shù)據(jù)中心以及本地?cái)?shù)據(jù)處理嗎?
星也:設(shè)立海外子公司首先要從成本角度考量,因?yàn)樗馕吨枰獫M足當(dāng)?shù)毓痉ㄏ碌囊徽缀弦?guī)要求,并且通常需要搭建一個(gè)如開(kāi)曼或 BVI 的頂層控股架構(gòu)。這里想特別提醒一點(diǎn),很多團(tuán)隊(duì)試圖通過(guò)在香港設(shè)立主體來(lái)弱化「中國(guó)屬性」,但從實(shí)踐來(lái)看,無(wú)論在歐洲還是美國(guó),監(jiān)管和市場(chǎng)普遍將香港與中國(guó)內(nèi)地緊密綁定,這種架構(gòu)很難起到預(yù)期的效果。如果想通過(guò)主體架構(gòu)進(jìn)行優(yōu)化,新加坡可能是現(xiàn)階段成本與效果更優(yōu)的選擇。
再結(jié)合數(shù)據(jù)中心與數(shù)據(jù)處理來(lái)看,像俄羅斯這類國(guó)家有強(qiáng)制本地化的要求,而對(duì)于歐美等核心敏感市場(chǎng),監(jiān)管機(jī)構(gòu)也會(huì)對(duì)此進(jìn)行嚴(yán)格審查。對(duì)于其他非敏感地區(qū),企業(yè)在早期若想以最小成本實(shí)現(xiàn)全球覆蓋,建議優(yōu)先布局中國(guó)、美國(guó)、歐盟、新加坡這四個(gè)核心節(jié)點(diǎn)。
Q:用戶量達(dá)到多少才需要做數(shù)據(jù)本地化存儲(chǔ)?
星也:這個(gè)問(wèn)題沒(méi)有明確的數(shù)量標(biāo)準(zhǔn)。坦白說(shuō),核心取決于你對(duì)目標(biāo)市場(chǎng)的重視程度。在美歐這類監(jiān)管嚴(yán)格的市場(chǎng),只要你開(kāi)始主動(dòng)進(jìn)行市場(chǎng)推廣、投放廣告或有其他明確的市場(chǎng)開(kāi)拓行為,就應(yīng)該同步規(guī)劃并推進(jìn)數(shù)據(jù)的本地化存儲(chǔ),而不是等到用戶量達(dá)到 1000 或者 1 萬(wàn)才啟動(dòng)。如果等到積累了大量用戶才開(kāi)始合規(guī),那么在此之前產(chǎn)生的所有數(shù)據(jù)都會(huì)成為既定的違規(guī)事實(shí)。但這里要注意不同地區(qū)的邏輯差異:中國(guó)法規(guī)可能會(huì)有基于數(shù)據(jù)量或用戶量的標(biāo)準(zhǔn),但在美國(guó),合規(guī)更多地是基于企業(yè)對(duì)長(zhǎng)期市場(chǎng)的布局和考量,不是一個(gè)固定的數(shù)字門(mén)檻。
07用戶行為數(shù)據(jù)處理的合規(guī)風(fēng)險(xiǎn)在哪里?
Q:對(duì)于調(diào)用基礎(chǔ)模型生成內(nèi)容的應(yīng)用層產(chǎn)品,怎么規(guī)避侵權(quán)責(zé)任?
星也:這里必須明確,應(yīng)用層和基礎(chǔ)模型層是兩個(gè)獨(dú)立的法律主體。
很多時(shí)候用戶的指令先輸入應(yīng)用層,再由應(yīng)用層傳遞給基礎(chǔ)模型。合規(guī)的關(guān)鍵可以從輸入端進(jìn)行風(fēng)險(xiǎn)控制。比如,在用戶輸入指令的環(huán)節(jié),應(yīng)用層可以先設(shè)置一層資產(chǎn)合規(guī)審查機(jī)制,通過(guò)技術(shù)手段過(guò)濾掉那些明顯可能涉及侵權(quán)的需求。如果前端審查缺位,導(dǎo)致最終生成了侵權(quán)內(nèi)容,那么應(yīng)用層和基礎(chǔ)模型層都可能面臨侵權(quán)責(zé)任。但最終起訴誰(shuí)的選擇權(quán)掌握在權(quán)利人(比如版權(quán)方)手中。由于基礎(chǔ)模型往往不直接暴露給用戶,所以權(quán)利人大概率會(huì)起訴作為直接面向用戶主體的應(yīng)用層。在美國(guó)或中國(guó)的法律體系下,應(yīng)用層幾乎必然會(huì)被認(rèn)定為承擔(dān)責(zé)任,只是內(nèi)部責(zé)任如何劃分的問(wèn)題。
Q:我們的產(chǎn)品有信息聚合功能,整合了來(lái)自媒體平臺(tái)上的博主內(nèi)容,是否合規(guī)?
星也:信息聚合工作的概念有一些模糊,我結(jié)合現(xiàn)有的法律框架嘗試解答下。首先是數(shù)據(jù)爬取的技術(shù)合規(guī)問(wèn)題,這種整合行為很可能涉及爬蟲(chóng)技術(shù),核心要先判斷是否違反了被爬取平臺(tái)的 robots 協(xié)議,或是否觸發(fā)了其反爬措施,一旦存在這種情況,就很容易與媒體平臺(tái)本身產(chǎn)生沖突。
其次是內(nèi)容的著作權(quán)問(wèn)題,需要區(qū)分內(nèi)容形式:長(zhǎng)博文可能構(gòu)成受著作權(quán)保護(hù)的文章,而圖片本身必然涉及相關(guān)權(quán)利,關(guān)鍵要看博主有沒(méi)有明確允許這些內(nèi)容在其他平臺(tái)呈現(xiàn)或轉(zhuǎn)載,未經(jīng)許可的整合轉(zhuǎn)載可能構(gòu)成侵權(quán)。
另外,整合規(guī)模也很關(guān)鍵,如果是大范圍整合,把原本分散在不同博主賬號(hào)下的內(nèi)容集中起來(lái),可能會(huì)使聚合平臺(tái)具備與原平臺(tái)相同或類似的功能,形成直接競(jìng)爭(zhēng)關(guān)系,這種行為存在被認(rèn)定為不正當(dāng)競(jìng)爭(zhēng)的風(fēng)險(xiǎn)。
Q:ToC 社交/游戲類產(chǎn)品,怎么規(guī)避「用戶行為數(shù)據(jù)用于訓(xùn)練」的合規(guī)風(fēng)險(xiǎn)?
星也:核心在于把握以下三個(gè)關(guān)鍵點(diǎn):首先,用戶協(xié)議和隱私政策中必須明確約定數(shù)據(jù)的使用范圍,清晰地告知用戶哪些具體的數(shù)據(jù)會(huì)被用于模型訓(xùn)練;其次,社交類數(shù)據(jù)等可能涉及隱私或敏感個(gè)人信息的內(nèi)容,必須做好匿名化和去標(biāo)識(shí)化處理,對(duì)于生物識(shí)別信息、兒童數(shù)據(jù)等高度敏感內(nèi)容,最穩(wěn)妥的做法是直接剔除;最后,也是至關(guān)重要的一點(diǎn),要賦予用戶退出數(shù)據(jù)訓(xùn)練的權(quán)利。需要在產(chǎn)品功能層面落地,提供一個(gè)明確、便捷的選項(xiàng),并且不能把這個(gè)選項(xiàng)藏得太深,確保用戶可以輕松完成退出操作。
Q:抓取海外公開(kāi)數(shù)據(jù)用于「內(nèi)部研發(fā)」和「產(chǎn)品化商用」,合規(guī)要求上有什么不同?
星也:內(nèi)部研發(fā)的風(fēng)險(xiǎn)遠(yuǎn)小于產(chǎn)品化商用。從理論上來(lái)說(shuō),內(nèi)部研發(fā)在某些情況下甚至可能落入科研活動(dòng)的豁免范疇,但一旦進(jìn)入產(chǎn)品化商用階段,情況就完全不同了。因?yàn)樯逃眯袨闀?huì)產(chǎn)生實(shí)際經(jīng)濟(jì)收益,還可能實(shí)質(zhì)性地剝奪原數(shù)據(jù)平臺(tái)的市場(chǎng)空間。
在 AI 領(lǐng)域,產(chǎn)品化商用的表現(xiàn)形式可能不一樣,不是把數(shù)據(jù)原封不動(dòng)拿來(lái)用,比如我們接觸過(guò)的一個(gè)案例,抓取海外考試的公開(kāi)題庫(kù),通過(guò)學(xué)習(xí)生成新題目并做成模擬考試功能,這種行為看似生成了新內(nèi)容,但最終與原題庫(kù)的權(quán)利方形成了直接競(jìng)爭(zhēng)關(guān)系,還可能涉及著作權(quán)等一系列問(wèn)題。在界定產(chǎn)品化商用的侵權(quán)風(fēng)險(xiǎn)時(shí),生成物和原數(shù)據(jù)的關(guān)聯(lián)度會(huì)被重點(diǎn)關(guān)注,關(guān)聯(lián)度越高,越容易被認(rèn)定為存在主觀故意的行為。
我們?cè)趯彶檫@類行為時(shí),會(huì)重點(diǎn)關(guān)注生成物和原數(shù)據(jù)的關(guān)聯(lián)度,以及源網(wǎng)站的具體權(quán)利協(xié)議,是允許自由使用的 CC 協(xié)議,還是保留所有權(quán)利的用戶協(xié)議,會(huì)得出完全不同的合規(guī)結(jié)論。
Q:在 IP 侵權(quán)判定中,「相似度」的標(biāo)準(zhǔn)是什么?
星也:其實(shí)這是一個(gè)很主觀的問(wèn)題,但核心標(biāo)準(zhǔn)不是簡(jiǎn)單的「像不像」,而是生成內(nèi)容是否落入了原 IP 的保護(hù)范圍。以?shī)W特曼為例,侵權(quán)行為不一定非要生成一個(gè)與迪迦、賽羅等具體形象完全一致的角色。只要生成的內(nèi)容包含了核心的、受保護(hù)的視覺(jué)元素,比如「身穿紅銀配色緊身衣、佩戴藍(lán)色護(hù)目鏡、胸口有燈」的巨人形象,那么即便生成的是一個(gè)「胖胖的奧特曼」,也極有可能落入形象侵權(quán)的范疇。侵權(quán)判斷的本質(zhì)還是看是否調(diào)用了受保護(hù)的創(chuàng)作元素,不僅僅是外觀的復(fù)刻。
Q:AI 生成的音樂(lè)/音效與現(xiàn)有作品相似,有沒(méi)有實(shí)際的訴訟案例參考?
星也:音樂(lè)侵權(quán)的邏輯與圖像侵權(quán)一致,都屬于著作權(quán)侵權(quán)的范疇,核心是判斷「實(shí)質(zhì)性相似」,但從實(shí)踐情況來(lái)看,音樂(lè)的判斷標(biāo)準(zhǔn)更主觀。
目前已經(jīng)出現(xiàn)了幾個(gè)比較受關(guān)注的相關(guān)的案例。例如,美國(guó)音樂(lè)行業(yè)協(xié)會(huì)起訴大型 AI 機(jī)構(gòu),主張其生成內(nèi)容在旋律上構(gòu)成侵權(quán)。所有此類生成內(nèi)容的侵權(quán)爭(zhēng)議,本質(zhì)上都圍繞兩個(gè)層面展開(kāi)。第一個(gè)層面是訓(xùn)練數(shù)據(jù)侵權(quán),即在訓(xùn)練過(guò)程中使用受版權(quán)保護(hù)的作品是否構(gòu)成侵權(quán),涉及到復(fù)雜的「合理使用」或「轉(zhuǎn)換性使用」的辯論。第二個(gè)層面才是生成結(jié)果侵權(quán),即輸出的內(nèi)容與原作品是否構(gòu)成相似。目前,原告方大多會(huì)提出復(fù)合型主張,將數(shù)據(jù)侵權(quán)、結(jié)果侵權(quán)和不正當(dāng)競(jìng)爭(zhēng)等訴求打包在一起進(jìn)行訴訟。
Q:用戶上傳已有 IP 的聲音作為素材生成新內(nèi)容,平臺(tái)怎么規(guī)避風(fēng)險(xiǎn)?
星也:這種情況風(fēng)險(xiǎn)極高,可能同時(shí)侵犯 IP 的人格權(quán)和著作權(quán)。規(guī)避風(fēng)險(xiǎn)的首要方式是優(yōu)先爭(zhēng)取商業(yè)授權(quán)。如果無(wú)法獲得授權(quán),就必須在用戶協(xié)議中要求用戶承諾其對(duì)上傳素材擁有合法權(quán)屬,并建立清晰便捷的投訴報(bào)警通道,在收到侵權(quán)通知后及時(shí)處理,適用「避風(fēng)港規(guī)則」減輕責(zé)任。
同時(shí),平臺(tái)在功能設(shè)計(jì)上要極為謹(jǐn)慎,盡量避免對(duì)這類生成內(nèi)容進(jìn)行推薦、分發(fā)或打榜,因?yàn)檫@些行為可能被認(rèn)定為平臺(tái)主動(dòng)參與了共同侵權(quán)。另外要注意,警惕利用知名 IP 聲音制造假新聞或損害當(dāng)事人名譽(yù)的風(fēng)險(xiǎn),即使技術(shù)難度大,也要嘗試在生成的聲音中加入標(biāo)識(shí),作為重要的合規(guī)證據(jù)。
Q:什么規(guī)模的公司會(huì)被處罰?如果沒(méi)做合規(guī)通常在哪個(gè)階段會(huì)被處罰?
星也:會(huì)不會(huì)被處罰,和公司規(guī)模沒(méi)有直接關(guān)系,關(guān)鍵在有沒(méi)有碰了明確的「紅線」。很多小公司甚至個(gè)人被處罰,都是因?yàn)閺氖铝烁唢L(fēng)險(xiǎn)行為,比如用爬蟲(chóng)導(dǎo)致對(duì)方系統(tǒng)癱瘓,可能構(gòu)成破壞計(jì)算機(jī)信息系統(tǒng)罪;或者收集個(gè)人信息后進(jìn)行轉(zhuǎn)賣(mài),同樣會(huì)涉及刑事責(zé)任。
合規(guī)很像一場(chǎng)持續(xù)的考試,日常的合規(guī)工作就是學(xué)習(xí)和復(fù)習(xí)的過(guò)程,沒(méi)到「考試」的時(shí)候,你不知道自己到底做的有多合規(guī)或者多不合規(guī)。
有幾個(gè)非常明顯的「考試節(jié)點(diǎn)」:第一個(gè)是產(chǎn)品上架時(shí),無(wú)論是微信小程序還是 App Store,都會(huì)要求提供合規(guī)證明;第二個(gè)是融資過(guò)程中,投資方會(huì)對(duì)已上線產(chǎn)品的合規(guī)狀況進(jìn)行嚴(yán)格盡職調(diào)查;第三個(gè)是日常的監(jiān)管專項(xiàng)行動(dòng),各地的網(wǎng)信、信通等部門(mén)每年都會(huì)開(kāi)展專項(xiàng)檢查。對(duì)于穩(wěn)定運(yùn)營(yíng)期的公司來(lái)說(shuō),如果有法務(wù)或外部律師,一定要關(guān)注這些專項(xiàng)行動(dòng)的動(dòng)向,而且每年的監(jiān)管重點(diǎn)也會(huì)有一定風(fēng)向變化。
轉(zhuǎn)載原創(chuàng)文章請(qǐng)?zhí)砑游⑿牛篺ounderparker
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.