337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

他用一根橡皮筋,講透了AI的底層邏輯

0
分享至


序幕:神經網絡

老喻:辛頓教授,深度學習對大多數人來說就是一個"黑盒",幾百億參數在里面像魔法一樣運作。您能不能用打比方加一點初級數學,把"前向傳播"和"反向傳播"徹底揉碎了講講?

辛頓:沒問題。但在講機制之前,我想先讓大家理解一件事:大腦里正在發(fā)生的事情,離我們平時的"有意識邏輯思考"非常遙遠。它們更像是在做"感知"或"類比",你沒法用傳統(tǒng)的符號處理去解釋。


我舉個最自然的例子:給你一張灰度照片,一堆像素點,請你告訴我——里面有沒有鳥?

過去半個世紀,人們一直試圖寫程序解決這個問題,基本全部失敗。為什么?因為"鳥"根本無法用一組固定的數學值來定義。它可以是懟到你臉上的一只鴕鳥,也可以是天邊的一只海鷗;黑的、白的、飛著的、蹲著的。

那大腦是怎么做的?我們來手工搭一個神經網絡看看。

第一層,我們放一批神經元,專門檢測圖片里最微小的邊緣——比如取三個像素點,如果左邊亮、右邊暗,這個神經元就興奮:"這里有一條邊!"

第二層,神經元不再看像素,而是看第一層傳來的信號——幾條短邊緣向下傾斜、幾條向上傾斜、前端交匯成一個尖角——它就喊:"我可能發(fā)現了一個鳥嘴!"


第三層,有個神經元同時收到"鳥嘴"和"鳥眼"的信號,并且空間位置對得上,它就說:"這是一個鳥頭!"

最頂層,當"鳥頭""鳥腳""翅膀尖"的信號同時涌入,它大喊:"這絕對是一只鳥!"


老喻:邏輯很清晰!但如果手工搭建,這個網絡得多大?


辛頓:至少10億個連接。我絕不可能讓我的研究生去手動設置10億個權重——所以我們需要一種機制,讓網絡自己學會怎么設置這些權重。這就是我接下來要講的核心:前向傳播和反向傳播。

第一幕:前向傳播

辛頓:我們把正在學習“如何認出一只鳥”的神經網絡,想象成一家擁有 10 億名員工的“看圖識物大公司”。


這家公司等級森嚴,分為四個層級:

1、基層業(yè)務員(底層神經元):只負責盯圖片上最基礎的像素亮暗,只有當像素亮到一定程度,業(yè)務員才會“興奮”地往上喊(這就是激活函數)。

2、小組長(第二層神經元):聽業(yè)務員匯報,負責尋找“邊緣”和“線條”。

3、部門經理(第三層神經元):聽小組長匯報,負責拼湊“鳥嘴”或“狗耳朵”這樣的局部特征。

4、CEO(頂層神經元/輸出層):聽取所有經理的匯報,向客戶拍板出最終結論:“這是一只鳥,還是一只狗!”

老喻好家伙,10 億人的大廠!那平時遞進去一張圖片,他們是怎么協(xié)同工作的?

辛頓:這就叫“前向傳播”,也就是自下而上的情報匯報。

假設客戶遞來一張“麻雀”的照片。底層業(yè)務員看到像素就開始往上喊。但在職場里,上級對下屬絕不會一視同仁。這里有我們第一個極其關鍵的數學概念: 在學術上,下屬喊話的音量叫“激活值”,上級對下屬的信任程度叫“權重(Weight)”。

下屬匯報的音量(激活值) × 上級對他的信任度(權重) = 對上級的實際影響力


假設公司開業(yè)第一天,這 10 億人的“信任度(權重)”全都是隨機瞎填的(這叫隨機初始化)。碰巧,負責找“狗耳朵”的經理 A 今天瞎激動,喊得特大聲,而 CEO 給他的初始信任度又極高;相反,“鳥嘴部門”的經理 B 明明嘀咕了正確答案,卻因信任度太低被徹底無視。


信號就這樣一層一層做著乘法往上傳遞。CEO 綜合了所有匯報后一拍腦門,給出了最終預測:“客戶您好,根據我司嚴密計算,這張圖有 80% 的概率是狗,只有 10% 的概率是鳥!”


老喻:對著麻雀喊狗,這是一場災難性的業(yè)務事故!由于初始信任度是隨機的,前向傳播等于是在盲人摸象、瞎猜一氣??蛻艨隙ㄒ谱雷恿恕?/p>

第二幕:誤差與梯度

辛頓:沒錯!客戶(也就是訓練數據里的標準答案/標簽 Label)勃然大怒:“瞎了嗎?這是鳥!鳥的概率必須是 100%(1.0),狗的概率必須是 0%(0.0)!”


這個時候,全公司就要開始計算這次業(yè)務事故錯得有多離譜了。為了讓你有直觀的物理感受,老喻,我在 CEO 的辦公桌上放一個極其具象的“橡皮筋與滑軌”道具,來給你演示什么叫“誤差/損失(Loss)”“梯度(Gradient)”。

想象桌上豎著兩排帶刻度的滑軌,分別寫著“鳥”和“狗”?;壍淖畹撞渴?0.0,最頂部是 1.0。 每條滑軌上都有兩個東西:

1、客戶手里拿的“真理鐵釘”(代表標準答案),砰的一聲死死釘在滑軌的正確刻度上,絕對不許動。

2、CEO 手里推的“預測滑塊”(代表他瞎猜的概率輸出),停在他剛才匯報的刻度上。 最要命的是:在“真理鐵釘”和“預測滑塊”之間,死死套著一根極其強韌的橡皮筋!


老喻:畫面感太強了!那這桌上現在的戰(zhàn)況如何?CEO 豈不是被勒得很慘?

辛頓:極其痛苦!我們先看“鳥”的滑軌: 這是一張真麻雀,所以客戶把“真理鐵釘”釘在了最頂端的1.0。但 CEO 瞎猜,把“預測滑塊”留在了最底部的0.1。 老喻你看,鐵釘在天上,滑塊在地下。這根原本短短的橡皮筋,被強行跨越 0.9 的巨大物理距離,死死繃緊了!因為鐵釘(錨點)在上方,這根緊繃的橡皮筋產生了一個巨大的拉力,拼命想把底下的滑塊往上拽。


我們再看“狗”的滑軌: 照片里根本沒狗,客戶把“真理鐵釘”死死釘在了最底部的0.0。但 CEO 聽信讒言,把“預測滑塊”推到了0.8的高空! 仔細看這根橡皮筋——鐵釘在地下(0.0),滑塊在天上(0.8)。兩點之間同樣隔著 0.8 的巨大距離!所以這根橡皮筋同樣被極度拉長、死死繃緊了、勒得生疼!只不過這一次,鐵釘在下方,橡皮筋的收縮本能拼命想把天上的滑塊往下拽


老喻:(恍然大悟)噢!我徹底明白了!很多初學者覺得往下按應該是“壓縮彈簧”,但其實橡皮筋根本沒法被壓縮,它只在乎你和真理之間的“絕對距離”!只要偏離真理,無論偏高還是偏低,橡皮筋都會被無情地拉長、繃緊!這根橡皮筋被拉得有多長、勒得有多疼,就是“誤差大?。↙oss)”;而它拼命往上拽還是往下拽的“方向和力道”,就是微積分里大名鼎鼎的“梯度(Gradient)”!所以算法本質上是在做“負梯度下降”,即違背讓痛苦增加的趨勢。


辛頓:Bingo!你完美推導出了深度學習最核心的數學直覺:偏離即拉伸,拉伸即痛苦。梯度精確地告訴 CEO:你下一步該去提拔誰、打壓誰,才能逃避這種痛苦。

第三幕:反向傳播

老喻:現在 CEO 頭頂著這兩根繃到極致、隨時要把頭皮扯掉的橡皮筋,被勒得痛不欲生。他現在的唯一本能,就是想盡辦法讓所有橡皮筋都“縮回原點、徹底松弛”!但他總不能把 10 億人全開除吧?他該怎么善后?


辛頓:為了讓頂層的橡皮筋放松,他必須把拉扯的痛感順著公司的層級向下分攤。這就需要“反向傳播”(Backpropagation)登場了!在微積分里它叫“鏈式法則(Chain Rule)”,但我更愿意稱之為“企業(yè)級精準連坐分鍋機制”!


CEO 順著那根拽著他往下死里勒的“狗皮筋”去查賬:“這股痛感(負向梯度)是誰造成的?哦!是因為經理 A 剛才喊得最大聲,我又極度信任他。他坑慘我了!”

CEO 掏出小本本開始懲罰,這是我們的第二個核心公式:

修改對下屬的信任度(更新權重) = 橡皮筋傳導給我的痛感(梯度) × 該下屬剛才匯報的音量(激活值)

這個公式無比殘酷:如果橡皮筋繃得極緊(錯得離譜),而你作為下屬剛才又喊得最起勁,你挨的板子就最重!CEO 狠狠扣減了經理 A 的信任度:“為了緩解往下拽的拉力,下次你再喊,我就當耳旁風?!蓖瑫r,順著“鳥皮筋”向上的正向梯度拉力,CEO 給受了委屈的鳥嘴經理 B大幅增加了信任度。


老喻:絕妙的連坐乘法!但這只是高管層的分鍋,底下那 9 億多人怎么辦?

辛頓:繼續(xù)用“鏈式法則”反向往下套公式??!經理 A 挨了罵,信任度被降級,他也感受到了被橡皮筋拉扯的痛感(梯度的向下傳遞)。他憋著火回到辦公室叫來手下:“剛才到底是哪個混蛋給我亂報‘狗耳朵’的?”


經理 A 用同樣的乘法公式,把緊繃的拉力按比例向下分攤,揪出那個瞎報“毛茸茸邊緣”的小組長,狠狠扣減對他的信任度。而剛才沒作聲的人,因為音量乘積為 0,完美隱身。


接著,小組長感受到拉力,轉身再去罵基層業(yè)務員……你看,這股“為了讓頂層橡皮筋徹底放松”的求生欲,就這樣順著公司的層級做著連環(huán)乘法,一路反向(Backwards)傳導(Propagate)到了最底層。 全公司 10 億人瞬間收到了一份極其精確的微調通知:“為了緩解上面的緊繃感,你該把對某下屬的信任度調高 0.01,還是調低 0.05?!?/p>


尾聲:梯度下降與智能涌現


老喻:太透徹了!等于說每一次輸入一張圖片,全公司就經歷一次完整的循環(huán):“前向瞎猜匯報(Forward) → 橡皮筋拉緊勒疼(計算誤差 Loss 和梯度 Gradient) → 反向精準連坐分鍋以求放松(Backpropagation 更新權重)”。

辛頓:完全正確!全公司努力順著梯度的拉力,通過微調信任度讓橡皮筋越來越松的這個過程,在數學上就叫做“梯度下降”(Gradient Descent)。


看一張圖,10 億個“信任度”旋鈕只在橡皮筋的拉扯下微調一絲絲。但當你給這家公司看 1000 萬張照片,把拉緊、分鍋、放松的循環(huán)重復幾千萬次后,奇跡就發(fā)生了:

只會制造噪音的員工,信任通道被徹底切斷;而真正能準確識圖的骨干,他們之間的信任通道被一點點拓寬成了極其順暢的高速公路。


此時,當下一張全新的鳥圖出現時,正確的像素瞬間完美激活正確的業(yè)務員、正確的主管,信號順著高速公路直達頂層。CEO 連腦子都不用動就能脫口而出:“100% 是鳥,0% 是狗!”


那一刻,真理鐵釘和預測滑塊完美重合,他頭頂所有代表誤差的橡皮筋,全都處于完美、舒適的徹底放松狀態(tài)(模型收斂)。


老喻:極其震撼!系統(tǒng)沒有所謂的人類自我意識,只有“橡皮筋追求放松”的物理本能,以及極其優(yōu)雅的微積分乘法連坐。幾百億參數的大模型,其智能就這樣從冰冷的誤差和梯度公式里涌現了出來。


謝謝辛頓教授,這是我聽過最精彩的一堂深度學習降維課!

本文部分文字來自辛頓近期在播客中的講話。

想了解如何生成本文的圖文表達?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
狂卷:中國科舉1300年

狂卷:中國科舉1300年

最愛歷史
2026-03-23 15:27:07
誰在幫馬斯克翻查選民名冊?神秘組織浮出水面,美司法部坐不住了

誰在幫馬斯克翻查選民名冊?神秘組織浮出水面,美司法部坐不住了

慕名而來只為你
2026-03-24 11:47:26
最新披露:刺殺哈梅內伊的前48小時,內塔尼亞胡如何說服特朗普

最新披露:刺殺哈梅內伊的前48小時,內塔尼亞胡如何說服特朗普

上觀新聞
2026-03-24 13:26:06
我跟你說,男人最好的春藥,壓根就不是什么枸杞海參,全是扯淡。

我跟你說,男人最好的春藥,壓根就不是什么枸杞海參,全是扯淡。

不甜的李子
2026-03-20 13:00:35
人體缺什么維生素會長白頭發(fā)呢?怎么防止白發(fā)出現?看完就明白了

人體缺什么維生素會長白頭發(fā)呢?怎么防止白發(fā)出現?看完就明白了

健康之光
2026-03-22 22:35:08
毀滅性傷?。炖锿纯啾ь^,全體球員淚目,勇士雙線計劃徹底失敗

毀滅性傷?。炖锿纯啾ь^,全體球員淚目,勇士雙線計劃徹底失敗

你的籃球頻道
2026-03-24 13:03:42
曾是一代歌王,卻淪為人盡皆知的臺獨分子,如今家破人亡下場凄涼

曾是一代歌王,卻淪為人盡皆知的臺獨分子,如今家破人亡下場凄涼

阿器談史
2026-01-27 17:49:28
“臺灣第一名媛”孫蕓蕓承認女兒未婚生子:她在孕期被男友拋棄

“臺灣第一名媛”孫蕓蕓承認女兒未婚生子:她在孕期被男友拋棄

娛慧
2026-03-24 17:22:24
越來越亂!貝克漢姆或將迎來第一個長孫,但不是兒子的親生血脈

越來越亂!貝克漢姆或將迎來第一個長孫,但不是兒子的親生血脈

她不傾國傾城
2026-02-08 15:21:22
付鵬:可能熬不了一周,市場這根弦就繃不住了(附劉煜輝、張憶東最新觀點)

付鵬:可能熬不了一周,市場這根弦就繃不住了(附劉煜輝、張憶東最新觀點)

新浪財經
2026-03-24 19:13:07
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
2:3!莊宇珊42分,回國五場261扣,體能太出色,福建女排不爭氣

2:3!莊宇珊42分,回國五場261扣,體能太出色,福建女排不爭氣

跑者排球視角
2026-03-24 23:37:54
49歲大哥每次炒菜都放生抽,去醫(yī)院體檢后,專家疑惑:平時都吃啥

49歲大哥每次炒菜都放生抽,去醫(yī)院體檢后,專家疑惑:平時都吃啥

近史談
2026-03-24 17:20:25
1986年陳永貴病逝,追悼會規(guī)格成難題,鄧小平只說了一句話,全場安靜

1986年陳永貴病逝,追悼會規(guī)格成難題,鄧小平只說了一句話,全場安靜

寄史言志
2026-01-04 16:34:31
出口暴漲138%,國產變壓器成了香餑餑,客戶主動加價20%爭著買

出口暴漲138%,國產變壓器成了香餑餑,客戶主動加價20%爭著買

瘋狂小菠蘿
2026-03-24 16:00:13
不到72小時,三國連遭以軍突襲,特朗普不敢做的事,以色列全做了

不到72小時,三國連遭以軍突襲,特朗普不敢做的事,以色列全做了

荷蘭豆愛健康
2026-03-25 00:00:42
4種粗糧已被列入傷胃名單,吃多了或傷胃!再愛吃也別貪嘴

4種粗糧已被列入傷胃名單,吃多了或傷胃!再愛吃也別貪嘴

岐黃傳人孫大夫
2026-03-22 19:05:03
長期不住的房子,物業(yè)費能少交嗎?民法典早說了,別再交冤枉錢!

長期不住的房子,物業(yè)費能少交嗎?民法典早說了,別再交冤枉錢!

老特有話說
2026-03-11 14:47:30
爭三還是保四?哈登給騎士出了一道甜蜜的難題

爭三還是保四?哈登給騎士出了一道甜蜜的難題

格斗社
2026-03-24 08:39:43
90年代二叔娶了全村第一個外地姑娘,她從不下地被全村嘲笑

90年代二叔娶了全村第一個外地姑娘,她從不下地被全村嘲笑

白云故事
2026-03-12 16:35:09
2026-03-25 03:40:49
孤獨大腦 incentive-icons
孤獨大腦
關于思考的思考
316文章數 2245關注度
往期回顧 全部

科技要聞

年僅41歲,教育名師張雪峰猝然離世

頭條要聞

張雪峰去世 猝死前身體的3個求救信號別忽視

頭條要聞

張雪峰去世 猝死前身體的3個求救信號別忽視

體育要聞

NBA最強左手射手,是個右撇子

娛樂要聞

張雪峰經搶救無效不幸去世 年僅41歲

財經要聞

特朗普再TACO 可以押注伊朗局勢降級?

汽車要聞

尚界Z7雙車預售22.98萬起 問界M6預售26.98萬起

態(tài)度原創(chuàng)

家居
本地
親子
時尚
公開課

家居要聞

智慧生活 奢享家居

本地新聞

春日吃花第一站——云南

親子要聞

拍完這條,老母親學會了好多西語單詞

豪門夢破碎后,她居然還能爆紅?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版