![]()
導(dǎo)讀:一份終止合作的公告,暴露了醫(yī)療數(shù)據(jù)交易中最隱蔽的漏洞——數(shù)據(jù)可以要回來,但訓(xùn)練好的模型不會(huì)失憶。
紐約市健康與醫(yī)院公司(NYC Health + Hospitals)最近宣布,旗下8家公立醫(yī)院將停止向Palantir共享患者私人健康數(shù)據(jù)。這家運(yùn)營著全美最大公立醫(yī)療系統(tǒng)的機(jī)構(gòu),管理著約300萬份活躍病歷。合作終止的消息傳出后,Reddit上的討論迅速分化成兩派:一派憤怒于"他們居然一直在干這個(gè)",另一派冷靜分析"這完全合法"。
真正的問題藏在合法性的縫隙里。
數(shù)據(jù)共享的灰色地帶:HIPAA沒說的那部分
Palantir與紐約公立醫(yī)院的合作始于2022年,核心產(chǎn)品是名為"Foundry"的數(shù)據(jù)整合平臺(tái)。醫(yī)院將患者信息導(dǎo)入系統(tǒng),用于優(yōu)化床位分配、預(yù)測(cè)急診高峰、追蹤慢性病管理效果。從合同角度看,這屬于"醫(yī)療運(yùn)營"范疇,Palantir作為"商業(yè)伙伴"(Business Associate)簽署B(yǎng)AA協(xié)議后,接收受保護(hù)健康信息(PHI)完全符合《健康保險(xiǎn)流通與責(zé)任法案》(HIPAA)規(guī)定。
一位在臨床研究領(lǐng)域深耕多年的MD/PhD在Reddit thread中直言:「HIPAA實(shí)際上并不禁止這種行為——醫(yī)院可以在運(yùn)營、支付或特定研究用途下,與Palantir這樣的商業(yè)伙伴共享PHI。」
但這位研究者拋出了一個(gè)更尖銳的問題:「更關(guān)鍵的問題不是'這是否合法',而是'誰來監(jiān)管Palantir從數(shù)據(jù)中推導(dǎo)出的產(chǎn)物,以及合同結(jié)束后這些衍生知識(shí)存放在哪里'。」
HIPAA、歐盟AI法案、ISO 42001,所有這些規(guī)范都約束的是"接觸數(shù)據(jù)的系統(tǒng)",而非"系統(tǒng)產(chǎn)出的產(chǎn)物"。
一個(gè)用800萬份紐約患者記錄訓(xùn)練出的風(fēng)險(xiǎn)預(yù)測(cè)模型,不會(huì)因?yàn)閿?shù)據(jù)共享協(xié)議終止而自動(dòng)刪除。模型的權(quán)重參數(shù)、特征關(guān)聯(lián)模式、對(duì)特定人群的健康風(fēng)險(xiǎn)評(píng)估能力——這些"衍生品"的法律地位,目前處于監(jiān)管真空。
Palantir的醫(yī)療版圖:從戰(zhàn)場(chǎng)到醫(yī)院走廊
要理解醫(yī)院為何選擇Palantir,得先看這家公司的基因。Palantir由PayPal聯(lián)合創(chuàng)始人Peter Thiel于2003年創(chuàng)立,早期核心客戶是美國情報(bào)機(jī)構(gòu)(CIA、NSA)和軍方。其名字源自《指環(huán)王》中那顆可以透視遠(yuǎn)方、卻可能被邪惡力量監(jiān)視的水晶球——這個(gè)隱喻在醫(yī)療數(shù)據(jù)語境下顯得頗為諷刺。
2010年代后期,Palantir開始將"戰(zhàn)場(chǎng)級(jí)"數(shù)據(jù)整合能力商業(yè)化,醫(yī)療成為重點(diǎn)擴(kuò)張領(lǐng)域。其邏輯很直接:如果系統(tǒng)能在伊拉克追蹤叛亂分子網(wǎng)絡(luò),自然也能在醫(yī)院里追蹤疾病傳播路徑和患者流動(dòng)模式。
紐約市健康與醫(yī)院公司的合作是Palantir公立醫(yī)療領(lǐng)域的標(biāo)桿案例。根據(jù)公開信息,F(xiàn)oundry平臺(tái)接入了11家醫(yī)院的電子病歷系統(tǒng)、實(shí)驗(yàn)室數(shù)據(jù)、影像檔案和醫(yī)保索賠記錄,構(gòu)建"統(tǒng)一患者視圖"。宣傳材料中的典型應(yīng)用場(chǎng)景包括:識(shí)別可能失約的糖尿病患者、預(yù)測(cè)哪些急診科患者將在72小時(shí)內(nèi)再次入院、優(yōu)化手術(shù)室排班。
這些功能對(duì)資源緊張的公立醫(yī)療系統(tǒng)確有吸引力。紐約市健康與醫(yī)院公司每年服務(wù)超過100萬無保險(xiǎn)或保險(xiǎn)不足的患者,運(yùn)營效率的壓力真實(shí)存在。但效率提升的代價(jià)是:數(shù)百萬患者的完整健康畫像流入了一家以政府監(jiān)控合同起家的公司。
Reddit評(píng)論區(qū)的一條高贊回復(fù)道出了核心焦慮:「他們 literally 是我最不想擁有我私人健康數(shù)據(jù)的公司。」另一條回復(fù)則更具黑色幽默:「這就是為什么我只去深山老林找薩滿看病。」
終止合作的真正動(dòng)因:壓力來自哪里
官方公告對(duì)終止原因語焉不詳,僅稱"經(jīng)過全面評(píng)估后決定"。但時(shí)間線提供了線索。
2024年下半年,紐約州總檢察長(zhǎng)Letitia James辦公室開始對(duì)公立醫(yī)療機(jī)構(gòu)的數(shù)據(jù)共享協(xié)議展開審查,重點(diǎn)關(guān)注患者知情同意流程和第三方數(shù)據(jù)使用范圍。幾乎同時(shí),美國衛(wèi)生與公眾服務(wù)部(HHS)更新了HIPAA guidance,強(qiáng)調(diào)"去標(biāo)識(shí)化"數(shù)據(jù)的重新識(shí)別風(fēng)險(xiǎn),以及AI訓(xùn)練場(chǎng)景下的合規(guī)邊界。
更大的背景是Palantir自身的輿論困境。2024年,該公司因參與美國移民與海關(guān)執(zhí)法局(ICE)的驅(qū)逐行動(dòng)追蹤系統(tǒng)而遭遇大規(guī)模抗議,多個(gè)學(xué)術(shù)機(jī)構(gòu)和非營利組織切斷了與其的合作。醫(yī)療領(lǐng)域的客戶開始重新評(píng)估品牌風(fēng)險(xiǎn)——與一家政治爭(zhēng)議纏身的公司綁定,是否值得?
紐約市健康與醫(yī)院公司的決策,很可能是風(fēng)險(xiǎn)計(jì)算的結(jié)果:繼續(xù)合作的收益(運(yùn)營效率提升)與成本(潛在的訴訟、監(jiān)管處罰、公眾信任流失)之間的天平發(fā)生了傾斜。
但這里有個(gè)關(guān)鍵的認(rèn)知陷阱。許多報(bào)道和社交媒體討論將"停止共享"等同于"數(shù)據(jù)回歸安全"。事實(shí)遠(yuǎn)非如此。
模型不會(huì)失憶:被忽視的數(shù)據(jù)衍生品問題
Palantir Foundry的核心價(jià)值不在于存儲(chǔ)原始數(shù)據(jù),而在于通過機(jī)器學(xué)習(xí)提取模式。過去兩年多的合作中,系統(tǒng)持續(xù)學(xué)習(xí)紐約患者群體的特征:哪些社區(qū)的高血壓控制率最低?哪些因素最能預(yù)測(cè)急診室的非必要就診?特定種族或年齡組的并發(fā)癥風(fēng)險(xiǎn)模式如何?
這些洞察被編碼進(jìn)預(yù)測(cè)模型的參數(shù)中。當(dāng)數(shù)據(jù)共享終止時(shí),醫(yī)院可以要求刪除原始PHI,可以要求返還或銷毀本地存儲(chǔ)的數(shù)據(jù)副本。但已經(jīng)訓(xùn)練完成的模型呢?
目前沒有任何美國法律明確要求刪除或限制使用基于歷史數(shù)據(jù)訓(xùn)練的AI模型。歐盟AI法案對(duì)"高風(fēng)險(xiǎn)AI系統(tǒng)"有持續(xù)合規(guī)要求,但Palantir的Foundry平臺(tái)是否構(gòu)成"高風(fēng)險(xiǎn)系統(tǒng)"取決于具體用途,且該法案對(duì)模型衍生品的追溯效力同樣模糊。
那位MD/PhD研究者的警告值得重復(fù):「合同結(jié)束后,那些衍生知識(shí)存放在哪里?」
Palantir可能在其他客戶場(chǎng)景中復(fù)用這些模型的架構(gòu),甚至通過"遷移學(xué)習(xí)"將紐約患者數(shù)據(jù)中學(xué)到的模式應(yīng)用到其他地區(qū)。公司官方否認(rèn)這種做法,但外部無法審計(jì)。更現(xiàn)實(shí)的擔(dān)憂是:即使Palantir本人恪守承諾,模型中編碼的群體層面洞察——例如"某郵編區(qū)域居民的心血管風(fēng)險(xiǎn)顯著高于平均水平"——已經(jīng)成為其"領(lǐng)域知識(shí)"的一部分,影響著后續(xù)產(chǎn)品的設(shè)計(jì)邏輯。
Reddit評(píng)論區(qū)有人諷刺:「我猜Palantir會(huì)做正確的事,停止使用他們之前共享的所有患者數(shù)據(jù)。他們是家好公司,對(duì)吧?讓我查查他們到底是干什么的……」
這種不信任并非空穴來風(fēng)。Palantir的商業(yè)模式建立在數(shù)據(jù)網(wǎng)絡(luò)的規(guī)模效應(yīng)上:服務(wù)越多客戶,積累的行業(yè)洞察越深厚,產(chǎn)品競(jìng)爭(zhēng)力越強(qiáng)。醫(yī)療數(shù)據(jù)一旦進(jìn)入這個(gè)飛輪,就很難完全剝離。
監(jiān)管滯后:當(dāng)法律追不上技術(shù)
紐約醫(yī)院事件暴露的系統(tǒng)性問題,是數(shù)據(jù)治理框架與AI技術(shù)演進(jìn)之間的脫節(jié)。
HIPAA制定于1996年,最后一次重大修訂是2013年。其設(shè)計(jì)初衷是規(guī)范"數(shù)據(jù)流動(dòng)"——誰可以在什么條件下訪問哪些信息。但AI時(shí)代的核心問題變成了"數(shù)據(jù)轉(zhuǎn)化":原始信息如何被蒸餾為模型能力,這種能力如何被轉(zhuǎn)移、復(fù)用、貨幣化。
現(xiàn)有法規(guī)對(duì)此幾乎沉默。BAA協(xié)議通常規(guī)定數(shù)據(jù)使用范圍和保密義務(wù),但很少涉及"基于數(shù)據(jù)開發(fā)的算法資產(chǎn)"的歸屬和處置。當(dāng)合作終止時(shí),雙方往往只關(guān)注數(shù)據(jù)刪除,而忽略模型處置。
一些前沿討論正在嘗試填補(bǔ)空白。"機(jī)器遺忘"(Machine Unlearning)是學(xué)術(shù)研究的熱點(diǎn),目標(biāo)是讓模型"忘記"特定訓(xùn)練數(shù)據(jù)的影響,但目前技術(shù)遠(yuǎn)不成熟,且對(duì)復(fù)雜深度學(xué)習(xí)模型的適用性有限。歐盟正在探索"算法影響評(píng)估"制度,要求高風(fēng)險(xiǎn)AI系統(tǒng)記錄訓(xùn)練數(shù)據(jù)來源和模型變更歷史,但執(zhí)行細(xì)節(jié)仍在博弈中。
更根本的挑戰(zhàn)在于:即使法律要求刪除模型,如何驗(yàn)證執(zhí)行?AI系統(tǒng)的"記憶"不像數(shù)據(jù)庫記錄那樣可以被逐條清點(diǎn)。模型參數(shù)是數(shù)百萬個(gè)數(shù)字的矩陣,每個(gè)數(shù)字都間接受到所有訓(xùn)練數(shù)據(jù)的影響,無法對(duì)應(yīng)到具體某條患者記錄。
這意味著"數(shù)據(jù)可攜帶權(quán)"和"被遺忘權(quán)"在AI語境下面臨技術(shù)性失效。患者可以要求醫(yī)院刪除自己的病歷,但無法要求從Palantir的模型中"提取"出自己的那部分影響——因?yàn)榧夹g(shù)上做不到。
行業(yè)連鎖反應(yīng):公立醫(yī)療系統(tǒng)的信任危機(jī)
紐約市健康與醫(yī)院公司的決定,可能引發(fā)公立醫(yī)療機(jī)構(gòu)對(duì)AI供應(yīng)商的重新評(píng)估。與私營醫(yī)療系統(tǒng)不同,公立醫(yī)院承擔(dān)著更重的公共服務(wù)使命,也面臨更嚴(yán)格的政治問責(zé)。與爭(zhēng)議性科技公司的合作,容易成為攻擊靶點(diǎn)。
已有跡象顯示這種"去Palantir化"趨勢(shì)在蔓延。2024年底,英國國家醫(yī)療服務(wù)體系(NHS)推遲了與Palantir的續(xù)約談判,盡管官方否認(rèn)與政治壓力有關(guān)。美國退伍軍人事務(wù)部(VA)的內(nèi)部評(píng)估報(bào)告也顯示,對(duì)Palantir合同的反對(duì)聲音在增加。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.