最近,又因?yàn)橄锤宓氖鲁称饋砹恕?/p>
不表態(tài),也沒有明確的態(tài)度,就說說看法。我記得多年前一位作家,撰文說自己夢中偶得一佳句“江湖夜雨十年燈”,結(jié)果不想是黃庭堅的詩句,被人笑話了一陣。
洗稿,是處于“人人都知道,但卻難以下定論”的一種狀態(tài)。
![]()
這其實(shí)很正常,很合理。
因?yàn)椋鳈?quán)法保護(hù)的是思想的表達(dá)而非思想本身。思想一般指概念、術(shù)語、原則、客觀事實(shí)、創(chuàng)意、發(fā)現(xiàn)等等。表達(dá)則一般指是指對于思想觀念的各種形式或方式的表述,如文字的、音符的、數(shù)字的、線條的、色彩的、造型的、形體動作的表述或傳達(dá)等。顯然,洗稿就是從表達(dá)上改變,從而避開著作權(quán)法。嚴(yán)格地說,通過“洗稿”方式,篡改刪減,是可以不構(gòu)成侵權(quán)抄襲剽竊原創(chuàng)作品的。
知識產(chǎn)權(quán)的保護(hù),本來就存在一定的模糊性。中國知識產(chǎn)權(quán)法學(xué)界的泰斗鄭成思曾說:“知識產(chǎn)權(quán)是一門詭辯的學(xué)科。
其實(shí),要講獨(dú)創(chuàng)思路、觀點(diǎn)的話,這么多年,我就太多了,我文章的特點(diǎn)就是有觀點(diǎn)。都要追究,哪里追究得完。當(dāng)然,我并不覺得該追究。別說所謂觀點(diǎn),各類期刊直接把文章拿去發(fā),cnki一查。都很多。這個其實(shí)可以追究,但也麻煩。
比如,“智力的回歸”這個概念,我最初發(fā)在騰訊大家上的,把身高回歸的規(guī)律用在了智力上。我在網(wǎng)上搜索過,在我之前,沒人這么說過。如今,十多年過去,已經(jīng)成為常識了。那么,這是觀點(diǎn)的傳播還是洗稿?我能要求人人提到“智力回歸”都提到我的名字嗎?顯然,文章不是論文,沒辦法這樣要求。那么,不洗稿,觀點(diǎn)能傳播嗎?
其實(shí),騰訊的洗稿評議機(jī)制,也在我公開發(fā)表的文章之后。當(dāng)時是六神磊磊指控另一個大號周沖洗稿,引發(fā)業(yè)內(nèi)熱議。我當(dāng)時提出,洗稿不違法,所以只能用行業(yè)評議解決。我是這么寫的:
洗稿乃至抄襲,大致上確定只需要兩個初中生,5分鐘,20塊錢。但法律上確定,需要請兩個博士后,5個月,200萬。如果洗稿的維權(quán)成本從后者變?yōu)榍罢撸S權(quán)就會變得簡單。所以,只有通過貝葉斯后驗(yàn)的理念來進(jìn)行判斷,即通過觀察到的信號來判斷發(fā)出信號的本質(zhì)。簡單地說就是,如果一只鳥多次看起來像鴨子,多次聽起來像鴨子,那么,它就是鴨子。
![]()
后來騰訊就有了洗稿評審,現(xiàn)在,我也不時能收到評議需求。不過,我當(dāng)時提出的是對公號原創(chuàng)程度的標(biāo)識,騰訊現(xiàn)在應(yīng)該是直接刪除。我提標(biāo)注,是因?yàn)橄锤宀⒉磺謾?quán),刪除有法律風(fēng)險。不過,騰訊可以基于用戶協(xié)議刪除。
這類例子,很多我也想不起了。
比如,最近想寫一篇文章,核心觀點(diǎn)就幾個字“優(yōu)質(zhì)教育資源,是不可能增加的,因?yàn)槠唇逃Y源是為了競爭,而不是多學(xué)知識。人們要的是排序,而不是絕對值。”這個觀點(diǎn),隨著國家抹平內(nèi)卷的效率,過個十來年也許也會成為常識。
但法律并不能,也不該保護(hù)“觀點(diǎn)是我的”。因?yàn)閭鞑ケ厝话殡S啟發(fā),傳播和啟發(fā)是同時發(fā)生的,而且,啟發(fā)應(yīng)該再次被傳播。而且,這個過程,正是法律想要保護(hù)的。某種程度上,它也是作者本身想達(dá)到的目的。
我們追求的正是這種外部性。
天下文章一大抄,這話說的是一個一直存在的現(xiàn)象。這其實(shí)很難免。
太陽之下無新事,常識需要不斷說,被別人重復(fù),被自己重復(fù)。當(dāng)然,我用自己之前的說理,我肯定會改改,不能完全一樣,或者引入當(dāng)時的具體事件。再比如某個2萬字的報告,有人總結(jié)了,我拿過來,改一下就用。或者某個新聞,有人總結(jié)了,我改一下用。一般來說,我接到洗稿評議,文章只是洗一兩段,不是核心部分,我不會給出洗稿的判斷。
對于洗稿質(zhì)疑,當(dāng)然還沒人質(zhì)疑過我哈,我覺得是不需要回應(yīng)的。因?yàn)槲揖褪怯^點(diǎn)產(chǎn)出型的,洗稿的指控對我不會有多大傷害。這同樣是基于貝葉斯后驗(yàn)的,要多次看起來像洗稿,才能構(gòu)成對能力的質(zhì)疑。
寫這篇文章的時候,從洗稿想到AI訓(xùn)練的版權(quán)問題。這也是最近知識產(chǎn)權(quán)領(lǐng)域的爭論點(diǎn)。現(xiàn)在有很多觀點(diǎn)了,我補(bǔ)充一個更底層的。(寫完了才發(fā)現(xiàn),這本身就是一個關(guān)于觀點(diǎn)傳播和洗稿的辨析例子)
![]()
第一個問題,訓(xùn)練是不是對素材的商業(yè)性應(yīng)用?
如果一個人看了一部電影,比如阿凡達(dá),從中受到啟發(fā),創(chuàng)造了另一種外星人的形象。這個形象不侵權(quán),完全不一樣。那么,可以說他對阿凡達(dá)進(jìn)行了商業(yè)性應(yīng)用嗎?
一本書,讓一個人讀了,這個人學(xué)到一個道理,一個句式,產(chǎn)生了一幅圖像,得到一個靈感,應(yīng)用到了另一個地方。
這就是所謂的“啟發(fā)”。顯然,這不構(gòu)成對這本書、這部電影的商業(yè)應(yīng)用。正如我前面所說,法律不可能限制“啟發(fā)”——這正是知識產(chǎn)權(quán)保護(hù)想要達(dá)到的目標(biāo)。
那么,就進(jìn)到第二個問題:啟發(fā)這個詞,形容的是一種觸類旁通的關(guān)系,是發(fā)散的、具有不確定性的智能上的因果關(guān)系。只有人才具有智能,所以,只有人才能受到啟發(fā)。那么,機(jī)器,從訓(xùn)練到生成文本或圖片,還是“啟發(fā)”嗎?
如果不是,反過來,則構(gòu)成對素材的商業(yè)應(yīng)用。某種程度上,就是另一種形式的洗稿。
那么,AI訓(xùn)練,從訓(xùn)練到生成新文本,是一種洗稿還是啟發(fā)?
如果計算機(jī)具有智慧的某種特征,那么,就可以視為啟發(fā)。現(xiàn)在說大模型已經(jīng)有了涌現(xiàn)現(xiàn)象,應(yīng)該視為一個智能體。我覺得更關(guān)鍵的是,涌現(xiàn)具有發(fā)散性、不確定性的特征。
大模型中有很多隨機(jī)性。比如,temperature參數(shù)會直接改變輸出token的概率,這個參數(shù)甚至可以從外部環(huán)境調(diào)用,以獲得隨機(jī)性。
openai的api中也用seed這個參數(shù)來改變生成策略的隨機(jī)種子。
不同型號的GPU 之間的浮點(diǎn)數(shù)計算可能會略有差異,不能保證bit級別的一致性。這些差異,在巨大的參數(shù)累積下,剛開始生成的token是一樣的,但是從某個 token 開始,后續(xù)的生成結(jié)果就不一樣了。從這個角度,涌現(xiàn),也有發(fā)散、不確定性的特征。
這些隨機(jī)性,很多已經(jīng)是不可還原的了。這種不可還原的發(fā)散和不確定性,可以認(rèn)定類似人類智慧,所以,訓(xùn)練是被啟發(fā),而不是洗稿,那么,就不構(gòu)成商業(yè)應(yīng)用,就無需許可。
![]()
單純從數(shù)量上說,資料浩如煙海,參數(shù)多數(shù)繁星,很難認(rèn)定“素材——產(chǎn)出”的因果關(guān)系。而沒有這種因果關(guān)系,當(dāng)然不構(gòu)成商業(yè)應(yīng)用,所以,自然不需要特殊的許可。凡是公開的,都可以被合法地用來訓(xùn)練。
或者說,只要被人看到是合法的,無需許可,那么,被用來訓(xùn)練,就無需許可。
需要注意的是,有這樣一種論證方式:人作為智能體,是有民事權(quán)利的。這是“啟發(fā)”的法律前提。但顯然,大模型沒有這個資格,所以,它不能被“啟發(fā)”。但是,這種論證只是循環(huán)論證。
這一段中,一些技術(shù)細(xì)節(jié),是我查閱的,然后拿來用了,另一些技術(shù)細(xì)節(jié)我本來就知道(當(dāng)然,也是從其他地方看到),但這都并不影響我這段論述的原創(chuàng)性。
這一段論述,遇到相關(guān)話題,我肯定是要用的,不然挺可惜的。如果有人洗稿了,我也會不高興,但時間足夠長,我也就無所謂了。總之,要求高沒錯,辯解也沒錯,都不必太在意。
劉 遠(yuǎn) 舉
![]()
央視網(wǎng)、第一財經(jīng)、光明日報、騰訊大家、南方周末、新京報、南方都市報、FT中文網(wǎng)、澎湃等特約作家,多家智庫研究員。
關(guān)注時政、財經(jīng)、科技話題,以深度、專業(yè)、理性的態(tài)度,去掘現(xiàn)象背后的事實(shí)。
中國科技自媒體50人
第35屆中國新聞獎評論三等獎
第34屆中國經(jīng)濟(jì)新聞獎評論二等獎
第28屆北京新聞獎一等獎
2024年湖南新聞獎一等獎
騰訊大家年度作家獎
新浪最有價值專欄作家獎
紅辣椒評論年度佳作獎
已開快捷轉(zhuǎn)載,歡迎轉(zhuǎn)載
已開過白名單的公眾號,轉(zhuǎn)載請遵循轉(zhuǎn)載規(guī)則
您的關(guān)注是最好的支持!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.