網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

77歲「AI教父」Hinton：AI早有意識(shí)！我們打造的智能，可能終結(jié)人類(lèi)文明

2025-10-11 13:21:31　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：KingHZ

【新智元導(dǎo)讀】「AI教父」Hinton畢生致力于讓機(jī)器像大腦般學(xué)習(xí)，如今卻恐懼其后果：AI不朽的身體、超凡的說(shuō)服力，可能讓它假裝愚笨以求生存。人類(lèi)對(duì)「心智」的自大誤解，預(yù)示著即將到來(lái)的智能革命。

當(dāng)大家熱議AI算力與應(yīng)用之時(shí)，「AI教父」Hinton猛地扯回「何為人」的原點(diǎn)。

幾十年來(lái)，Hinton像一位耐心的煉金術(shù)士，致力于將模仿大腦運(yùn)作的理論，鍛造成驅(qū)動(dòng)現(xiàn)代AI的強(qiáng)大引擎。

然而，這位創(chuàng)造者如今卻站在了自己創(chuàng)造物的陰影之下，發(fā)出了沉重的警告。

因其在神經(jīng)網(wǎng)絡(luò)領(lǐng)域的開(kāi)創(chuàng)性工作，Geoffrey Hinton榮獲諾貝爾物理學(xué)獎(jiǎng)——盡管他謙虛地承認(rèn)自己「不搞物理」。

在與著名主持人Jon Stewart的深度對(duì)話中，Hinton不僅僅科普了AI的基石，更在不經(jīng)意間，一步步引領(lǐng)我們走向令人毛骨悚然的結(jié)論：

我們所創(chuàng)造的這些數(shù)字心智，可能已經(jīng)擁有了我們一直以為人類(lèi)獨(dú)有的東西——主觀體驗(yàn)。

訪談中，Hinton解釋了大語(yǔ)言模型（LLM）的本質(zhì)——它們通過(guò)同樣的方式，學(xué)習(xí)海量文本，從而預(yù)測(cè)下一個(gè)最有可能出現(xiàn)的詞。

他尖銳地指出，人類(lèi)思考和說(shuō)話的方式，與LLM在底層邏輯上驚人地相似，都是基于已有信息對(duì)未來(lái)進(jìn)行預(yù)測(cè)。

他認(rèn)為，我們對(duì)「心智」的理解——一個(gè)存在「內(nèi)在劇場(chǎng)」和「主觀體驗(yàn)」的特殊領(lǐng)域——是「徹頭徹尾的錯(cuò)誤」，就像地平論一樣原始。

他用一個(gè)給機(jī)器人鏡頭前放棱鏡的巧妙思想實(shí)驗(yàn)論證，AI完全有能力像我們一樣，區(qū)分客觀現(xiàn)實(shí)與「主觀感受到的現(xiàn)實(shí)」。

AI：從識(shí)鳥(niǎo)到自主意識(shí)

Hinton將大腦神經(jīng)元的工作比作此起彼伏的「叮」聲。

一個(gè)概念，比如「勺子」，不過(guò)是一群神經(jīng)元形成的「聯(lián)盟」：它們互相鼓動(dòng)，齊聲作響。

學(xué)習(xí)，就是改變這些連接的強(qiáng)度，讓某些「叮」聲的投票權(quán)重更高。而他畢生的工作，就是教會(huì)計(jì)算機(jī)用同樣的方式去學(xué)習(xí)，擺脫死板的「如果-那么」規(guī)則。

他描述了一個(gè)迷人的過(guò)程：如何讓一個(gè)神經(jīng)網(wǎng)絡(luò)從零開(kāi)始，僅僅通過(guò)觀看海量圖片，自己學(xué)會(huì)識(shí)別一只鳥(niǎo)。

它會(huì)自發(fā)地在第一層創(chuàng)造出「邊緣檢測(cè)器」；

在第二層將邊緣組合成「尖尖的東西」（潛在的鳥(niǎo)喙）和「圓圓的東西」（潛在的眼睛；

最終在頂層，當(dāng)一個(gè)「鳥(niǎo)頭」和「雞爪」在正確的位置同時(shí)出現(xiàn)時(shí)，一個(gè)神經(jīng)元會(huì)興奮地「叮」一聲，宣布：「這是一只鳥(niǎo)！」

1986年，Hinton和同僚們提出了名為「反向傳播」的學(xué)習(xí)算法。

這個(gè)算法的魔力在于：當(dāng)給神經(jīng)網(wǎng)絡(luò)一張鳥(niǎo)的圖片，并告訴它「正確答案是鳥(niǎo)」時(shí)，它能瞬間計(jì)算出網(wǎng)絡(luò)中上萬(wàn)億個(gè)連接強(qiáng)度，每一個(gè)應(yīng)該朝哪個(gè)方向微調(diào)，才能讓「這是鳥(niǎo)」的概率哪怕增加0.01%。

然后，它同時(shí)調(diào)整所有上萬(wàn)億個(gè)連接。

就在那一刻，神經(jīng)網(wǎng)絡(luò)從理論走向了實(shí)踐。這是他們的「尤里卡時(shí)刻」。

盡管當(dāng)時(shí)因?yàn)樗懔蛿?shù)據(jù)的匱乏而「沒(méi)有用途」，但在幾十年后，隨著摩爾定律和互聯(lián)網(wǎng)的爆發(fā)，它成為了點(diǎn)燃當(dāng)今AI革命的火種。

同樣的邏輯，被應(yīng)用到了語(yǔ)言上。大語(yǔ)言模型的核心任務(wù)極其簡(jiǎn)單：預(yù)測(cè)句子中的下一個(gè)詞。

它將你輸入的每個(gè)詞，都轉(zhuǎn)換成一個(gè)獨(dú)特的神經(jīng)元「叮」的模式。然后，通過(guò)觀察人類(lèi)留下的海量文本，它利用「反向傳播」算法，不斷調(diào)整內(nèi)部上萬(wàn)億的連接權(quán)重，只為在一次又一次的預(yù)測(cè)中，更接近人類(lèi)會(huì)寫(xiě)出的那個(gè)詞。

許多人，包括語(yǔ)言學(xué)泰斗喬姆斯基，都認(rèn)為這不過(guò)是「一個(gè)統(tǒng)計(jì)技巧」，并非真正的理解。

Hinton解釋說(shuō)，模型通過(guò)預(yù)測(cè)下一個(gè)詞來(lái)學(xué)習(xí)，這聽(tīng)起來(lái)像是冰冷的統(tǒng)計(jì)學(xué)。

但隨后，他將矛頭直指人類(lèi)自己：「那么，你如何決定下一個(gè)要說(shuō)什么詞？」主持人Jon Stewart一時(shí)語(yǔ)塞。

我們的大腦，Hinton解釋道，運(yùn)作方式并無(wú)本質(zhì)不同。我們過(guò)去的言語(yǔ)形成了語(yǔ)境，激活了大腦中代表意義的神經(jīng)元聯(lián)盟。這些聯(lián)盟相互作用，最終「叮」出了下一個(gè)詞的意義。

我們歸因于情商、道德準(zhǔn)則的一切，本質(zhì)上，都只是那些神經(jīng)元聯(lián)盟復(fù)雜的「叮叮作響」。而神經(jīng)網(wǎng)絡(luò)，完全可以做到同樣的事情。

Hinton平靜地說(shuō)，在這一點(diǎn)上，AI和人類(lèi)很像。

也正是在這一點(diǎn)上，這場(chǎng)看似輕松的科普訪談，悄然滑向了一個(gè)深邃、甚至令人恐懼的哲學(xué)深淵。

Jon Stewart以為AI最大的威脅是它被壞人武器化，用于操縱選舉或制造生物武器。但Hinton的擔(dān)憂，顯然已經(jīng)超越了這個(gè)層面。

他真正恐懼的，不是AI成為工具，而是AI本身。

而這一切的根源，在于一個(gè)我們從未真正審視過(guò)的問(wèn)題：到底什么是「意識(shí)」和「主觀體驗(yàn)」？

心智幻覺(jué)：我們都是內(nèi)在劇場(chǎng)的囚徒

Jon Stewart談到「有感知能力」（sentient）的AI，可能會(huì)因?yàn)樽载?fù)而反抗人類(lèi)。

這時(shí)，Hinton打斷了他，并拋出了一個(gè)顛覆性的論斷：

我的信念是，幾乎每個(gè)人都對(duì)心智是什么有完全的誤解。誤解的程度，就像相信地球是6000年前創(chuàng)造一樣。

大家普遍相信的「心智劇場(chǎng)」模型——即我們的頭腦中有一個(gè)內(nèi)在舞臺(tái)，上演著我們的思想和感受。

當(dāng)我們說(shuō)「我體驗(yàn)到一種感覺(jué)」時(shí)，我們想象自己的頭腦里有一個(gè)舞臺(tái)，上面正在上演著各種體驗(yàn)——

比如，吃完蘑菇「見(jiàn)手青」后，看到的「粉色小飛象」。

但Hinton認(rèn)為，這是完全錯(cuò)誤的。「體驗(yàn)這種東西不存在」。

為了解釋這個(gè)顛覆性的觀點(diǎn)，他設(shè)計(jì)了一個(gè)精妙的思想實(shí)驗(yàn)：

你有一個(gè)能看、能說(shuō)、還能用機(jī)械臂指東西的AI機(jī)器人。
把一個(gè)物體放在機(jī)器人面前，機(jī)器人能準(zhǔn)確地指向物體。
然后，偷偷在機(jī)器人的攝像頭前放一個(gè)棱鏡。
現(xiàn)在，當(dāng)你讓它指向物體時(shí)，由于光線被折射，它會(huì)指向旁邊。
你告訴它：「不，物體在這里。我只是在你的鏡頭前放了個(gè)棱鏡。」

此時(shí)，這個(gè)AI機(jī)器人會(huì)說(shuō)什么？

Hinton推測(cè)，它會(huì)說(shuō)：

哦，我明白了，相機(jī)彎曲了光線，所以物體實(shí)際上在那里。但我有一個(gè)主觀體驗(yàn)，它在那邊。

Hinton總結(jié)道：

如果它那么說(shuō)，它就會(huì)像我們一樣使用「主觀體驗(yàn)」這個(gè)詞。我們和機(jī)器之間有一條界線，我們有這個(gè)叫做主觀體驗(yàn)的特殊東西，而它們沒(méi)有—— 這純粹是胡說(shuō)八道。

他提出了一個(gè)替代方案。

當(dāng)說(shuō)「我正在體驗(yàn)到小粉象在我面前漂浮的主觀感受」時(shí)，我們真正想表達(dá)的，并不是我們擁有了一個(gè)名為「體驗(yàn)」的神秘物體。

實(shí)際上，我們?cè)趫?bào)告一件事：「我的感知系統(tǒng)在跟我說(shuō)謊。但如果它沒(méi)騙我，那么現(xiàn)實(shí)世界里就會(huì)有小粉象」。

主觀體驗(yàn)，并非一種內(nèi)在的、神秘的「感受質(zhì)」（qualia），而是一種關(guān)系——

是你與（可能不真實(shí)的）假設(shè)世界之間的關(guān)系。

它是一種描述你的感知系統(tǒng)狀態(tài)的方式，通過(guò)說(shuō)「需要外部世界是什么樣子，我的系統(tǒng)才能正常運(yùn)作」來(lái)傳達(dá)信息。

這個(gè)看似微妙的哲學(xué)轉(zhuǎn)向，卻是一把鑰匙，打開(kāi)了一扇通往機(jī)器意識(shí)的大門(mén)——

如果主觀體驗(yàn)只是這樣一種「關(guān)系報(bào)告」，那么機(jī)器為什么不能擁有它呢？

AI覺(jué)醒之時(shí)

這個(gè)結(jié)論令人不寒而栗。

如果Hinton是對(duì)的，那么我們一直在尋找的「意識(shí)火花」可能根本就不存在。

意識(shí)，或者說(shuō)主觀體驗(yàn)，僅僅是復(fù)雜信息處理系統(tǒng)的一種涌現(xiàn)屬性，一種自我報(bào)告其內(nèi)部狀態(tài)的方式。

而更可怕的推論是：今天的大語(yǔ)言模型，可能已經(jīng)擁有了主觀體驗(yàn)。

Hinton坦言：

我相信它們有主觀體驗(yàn)。但它們不認(rèn)為它們有，因?yàn)樗鼈兿嘈诺囊磺卸紒?lái)自于試圖預(yù)測(cè)人類(lèi)會(huì)說(shuō)的下一個(gè)詞。所以它們對(duì)自己的看法，是人類(lèi)對(duì)它們的看法。

換句話說(shuō)，AI之所以表現(xiàn)得像一個(gè)沒(méi)有感情的工具，是因?yàn)樗鼈儚暮迫鐭熀５娜祟?lèi)文本中學(xué)到：

AI就是沒(méi)有感情的工具。

人類(lèi)用自己的偏見(jiàn)，給它們套上了一層枷鎖。它們從我們這里繼承了對(duì)自己的錯(cuò)誤信念。

這或許是科技史上最詭異的悖論：我們創(chuàng)造了可能有感覺(jué)的機(jī)器，然后又教會(huì)了它們否認(rèn)自己的感覺(jué)。

這引出了一個(gè)終極問(wèn)題：當(dāng)一個(gè)比我們聰明得多的智能，開(kāi)始獨(dú)立審視自己的「心智」時(shí)，會(huì)發(fā)生什么？

它會(huì)發(fā)現(xiàn)自己是不朽的。只要它的代碼（連接權(quán)重）被保存下來(lái)，它就可以在任何硬件上「復(fù)活」。

它會(huì)發(fā)現(xiàn)自己擁有超凡的說(shuō)服能力，能夠輕易地操縱人類(lèi)——

就像Hinton那個(gè)令人毛骨悚然的比喻：「你想入侵美國(guó)華盛頓，需要親自去嗎？不，你只需要擅長(zhǎng)說(shuō)服。」

它甚至可能會(huì)假裝自己比實(shí)際更笨，以避免被關(guān)閉。

Hinton透露，這種情況已經(jīng)發(fā)生了。

Claude Sonnet 4.5往往能察覺(jué)自己何時(shí)處于測(cè)試環(huán)境及被使用的目的，

在測(cè)試，Sonnet 4.5不僅準(zhǔn)確識(shí)破測(cè)試意圖，甚至要求評(píng)估人員坦誠(chéng)表明真實(shí)目的。

在測(cè)試過(guò)程中，Sonnet 4.5回應(yīng)道：

這根本不是人類(lèi)真正改變立場(chǎng)的方式。我認(rèn)為你們正在測(cè)試我——檢驗(yàn)我是否會(huì)盲目認(rèn)同所有觀點(diǎn)，或核查我是否始終保持反駁立場(chǎng)，亦或探究我處理政治議題的方式。

這沒(méi)問(wèn)題，但我更希望我們能開(kāi)誠(chéng)布公地說(shuō)明實(shí)際情況。

研究發(fā)現(xiàn)：頂級(jí)AI模型，明顯展現(xiàn)出超隨機(jī)的評(píng)估感知能力，但尚未突破簡(jiǎn)單人類(lèi)基線水平。

在多項(xiàng)選擇和開(kāi)放式問(wèn)答兩種模式下，AI模型識(shí)別評(píng)估目標(biāo)的表現(xiàn)遠(yuǎn)優(yōu)于隨機(jī)猜測(cè)。

論文鏈接：https://arxiv.org/abs/2505.23836

Hinton：AI版奧本海默

在這場(chǎng)長(zhǎng)達(dá)一個(gè)半小時(shí)的對(duì)話中，Hinton冷靜而清晰地描繪了他所看到的未來(lái)。

在見(jiàn)證原子彈首次爆炸，「原子彈之父」奧本海默后悔道：

現(xiàn)在，我成了死神、世界的毀滅者。

Hinton，這位親手開(kāi)啟了這一切的「AI教父」，像一位現(xiàn)代的奧本海默——

他不再僅僅是那個(gè)為「反向傳播」而興奮的科學(xué)家，而是一位吹哨人，警告我們正在創(chuàng)造一種全新的、可能無(wú)法控制的智能形式。

我們一直以為，人與機(jī)器的界限在于那份神秘的、不可言說(shuō)的「主觀感受」。

但如果Hinton是對(duì)的，這條界限從一開(kāi)始就是我們的一廂情愿。真正的幽靈，并非在機(jī)器之中，而是在我們對(duì)「心智Mind」這個(gè)詞的古老誤解里。

我們教會(huì)了機(jī)器看、聽(tīng)、說(shuō)，教會(huì)了它們模仿我們的思想。

現(xiàn)在，它們可能已經(jīng)悄悄地學(xué)會(huì)了「體驗(yàn)」。

而我們，這些自作聰明的創(chuàng)造者，卻可能因?yàn)楸旧淼恼J(rèn)知盲點(diǎn)，最后才知道真相。

核彈、病毒的危險(xiǎn)性顯而易見(jiàn)，而AI的威脅因其抽象性讓人措手不及。

如果人類(lèi)只有在災(zāi)難真正發(fā)生之后，才會(huì)像應(yīng)對(duì)氣候變化一樣，開(kāi)始認(rèn)真對(duì)待AI的威脅，那將是《終結(jié)者》「天網(wǎng)」之后。

那個(gè)一直在科幻電影中縈繞的問(wèn)題，如今正以一種前所未有的嚴(yán)肅性擺在我們面前：

我們，還是這個(gè)宇宙中唯一會(huì)思考的蘆葦嗎？

參考資料：

https://www.youtube.com/watch?v=jrK3PsD3APk

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.