網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

十年前的今天，AI 用「神之一手」給人類上了一課

2026-03-11 21:25:04　來源: AppSo

廣東舉報

分享至

今天，距離改變世界的李世石大戰(zhàn)阿爾法狗（AlphaGo），已經(jīng)整整過去了十年。

多年后，李世石在接受外界采訪時，仍難以忘懷當時的感受：「輸給 AI，有種感覺是，我整個世界都塌了。」

他當初在接受邀請時，覺得那會是一次「好玩」的經(jīng)歷：「好玩的前提是我覺得會贏。我從未想過自己會輸。」

這份自信并非傲慢。圍棋長期被視為 AI 難以攻克的最后堡壘——棋盤上可能的局面數(shù)量高達 10 的 170 次方，遠超宇宙中原子的總數(shù)，傳統(tǒng)算法根本無從窮舉。

正因如此，許多專家當時預(yù)測，AI 要贏過人類頂尖棋手，至少還需要十年。然而，AlphaGo 提前了十年。

這場比賽中，有一個細節(jié)后來被反復(fù)提起：第二局的第 37 手。AlphaGo 將棋子落在了一個人類職業(yè)棋手幾乎不會考慮的位置。

現(xiàn)場解說員一度認為這是失誤，觀眾席上的棋手們面面相覷。但一百多手之后，那顆棋子恰恰處于制勝的關(guān)鍵位置——它的價值，在百步之后才得以顯現(xiàn)。

這就是著名的「第 37 步」。

今天，DeepMind 創(chuàng)始人 Demis Hassabis 在 X 平臺發(fā)文稱：

十年前，AlphaGo 在首爾的那場傳奇比賽開啟了人工智能現(xiàn)代時代的大幕。著名的「第 37 步」向我們表明，AI 技術(shù)已準備好應(yīng)對科學(xué)等領(lǐng)域中的現(xiàn)實世界問題——而這些方法所激發(fā)的新思路對于構(gòu)建通用人工智能（AGI）至關(guān)重要。

「第 37 步」也成了一個流傳至今的隱喻：它代表那些看起來不合理、卻最終被證明正確的決策；代表超出人類直覺邊界的創(chuàng)新；也代表在某個系統(tǒng)或競爭中，突然改變局面的關(guān)鍵一步。

擊敗人類后，更強的 AI 在進一步去「人味」

「我沒有辦法再去享受圍棋，所以我就退役了。」

與 AlphaGo 對戰(zhàn)的三年后，李世石正式宣布退役。對于 5 歲就開始學(xué)圍棋的他而言，圍棋不僅是競賽，更是一種藝術(shù)，是棋手個性與風格的延伸。但在 AI 時代，它卻淪為效率的游戲。

讓他更難釋懷的，是 AI 還在繼續(xù)進化，且越來越「去人化」。

2017 年，DeepMind 發(fā)布了 AlphaGo Zero。AlphaGo 的誕生，依賴神經(jīng)網(wǎng)絡(luò)對人類高手 3000 多萬手棋譜的學(xué)習；而 AlphaGo Zero 從一開始就徹底拋棄人類經(jīng)驗，訓(xùn)練期間不接觸任何棋譜，單純靠自我對弈從零生長。僅僅三天后，它便以 100:0 擊敗了 AlphaGo。

《大西洋月刊》稱其為「不需要從人類身上學(xué)習任何東西的 AI」。

DeepMind 并未止步。此后推出的 AlphaZero，在不具備任何先驗知識的前提下，僅憑規(guī)則便在數(shù)小時內(nèi)自學(xué)掌握了國際象棋，不僅擊敗了人類頂尖棋手，更超越了當時最強的專業(yè)象棋程序 Stockfish。

而象棋已被人類和計算機研究分析了數(shù)十年。連在這樣一個被反復(fù)「窮舉」過的領(lǐng)域，AlphaZero 依然走出了人類從未嘗試過的新策略。

AlphaGo 和 AlphaGo Zero 的棋譜，難以理解到被棋手們直接稱為「外星文明投下的一本神秘指南」。

美國職業(yè)棋手 Michael Redmond 于 2017 年表示，人類學(xué)習圍棋的重要方式是搭建一個故事：「那是我們溝通的方式，它是一件非常人性的事。」面對「AI 味」棋路，他說，人類棋手往往很難真正投入其中：「AlphaGo 下棋的方式，總讓人覺得很非人性。」

這也正是李世石痛苦所在。圍棋對他而言從來不只是勝負，而是表達自我的語言。而「第 37 步」恰恰說明，這門語言里，AI 已經(jīng)有了人類讀不懂的章節(jié)。

退役后，李世石開始執(zhí)迷于 AI，開設(shè)圍棋學(xué)院、出書、推出桌游之余，還開始在各地做關(guān)于 AI 的演講：「我算是很早開始面對 AI 的問題，其他人也將會經(jīng)歷。那未必會有開心大團圓結(jié)局。」

對他來說，AI 最讓人擔憂的地方，在于它可能改變?nèi)祟惖膬r值觀：「過去，人們會對創(chuàng)造力、原創(chuàng)性和創(chuàng)新充滿敬畏，但自從 AI 出現(xiàn)以來，這些很多都已經(jīng)消失了。」

人機共創(chuàng)時代

并不是所有人都同意這個講法。

「AI 毀滅了圍棋圈所有存在的秩序，然后開始重建。」康奈爾大學(xué)研究 AI 的圍棋愛好者 Jiuheng He 如此描述。

在香港一家圍棋學(xué)院里，老師 Ng Chee Man 會為學(xué)生提供 iPad 來輔助學(xué)習——每次落子，AI 都會實時給出「最佳走法」建議，并記錄下哪些步下得好，哪些不好。這種訓(xùn)練方式，正在成為全球圍棋學(xué)院的標配。

數(shù)據(jù)也印證了這一轉(zhuǎn)變。2023 年，《美國國家科學(xué)院院刊》發(fā)表了一項以 1950 至 2021 年共 580 萬手棋譜為基礎(chǔ)的研究，結(jié)論令人振奮：在 AlphaGo 擊敗李世石之前，人類棋手的判斷質(zhì)量在 66 年間幾乎沒有變化；但從 2016、2017 年起，這一數(shù)字開始明顯攀升。

換言之，人類贏不了 AI，但因為 AI，人類變得更強了。

DeepMind 首席研究科學(xué)家、AlphaGo 項目負責人 David Silver 評論道：

「看到人類棋手能如此快速地適應(yīng)，將這些新走法融入自己的方法中，正是讓人非常振奮的事。這些結(jié)果表明，人類將在 AI 發(fā)現(xiàn)的基礎(chǔ)上，大大提升自身潛力。」

事實上，早在 AlphaGo 公開亮相前，這一規(guī)律就已有跡可循。曾在不公開測試中對決 AlphaGo 的法國棋手樊麾，雖然落敗，卻說 AlphaGo 讓他以全新方式審視圍棋，技術(shù)因此飛速提升，世界排名隨之躍升。

2017 年被 AlphaGo 擊敗的柯潔，在 2023 年也坦言，自己除了正式比賽外，已經(jīng)很少與真人練習。在他看來，AI 已經(jīng)成為圍棋創(chuàng)造力的新源頭：

創(chuàng)造性必須投入實戰(zhàn)并得到檢驗。現(xiàn)在圍棋創(chuàng)新的大部分是 AI 來完成，我們想下一些和以前不一樣的棋，大概率會輸，因為 AI 通過大量實戰(zhàn)，得出了和之前不同的思維——這才是創(chuàng)造力。

這種人機協(xié)作的思維，在新生代棋手身上體現(xiàn)得最為徹底。韓國棋手申真谞，首位奪得世界冠軍的 00 后棋手，棋迷稱他「申工智能」，正是以長時間的 AI 訓(xùn)練著稱。

他曾于第 25 屆農(nóng)心杯實現(xiàn)跨賽季 16 連勝，超越前輩李昌鎬的歷史紀錄。談及與 AI 的關(guān)系，他說：「我覺得我和 AI 現(xiàn)在是朋友關(guān)系。AI 和人類的思路完全不同，它通過數(shù)學(xué)算法解決問題，借鑒 AI 的思路使我受益良多。」

從李世石的崩塌，到申真谞的崛起，恰好是同一枚硬幣的兩面：前者是第一代直面沖擊的人，后者是第一代將沖擊化為養(yǎng)分的人。「第 37 步」對他們的意義，截然不同。

十年前，「第 37 步」告訴世界：AI 能走出人類從未想到的路。十年后，圍棋這面鏡子告訴我們：真正的問題從來不是人類能否贏過 AI，而是人類如何與它一起，走向那些連 AI 也尚未到達的地方。

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」（請隨簡歷附上項目/作品或相關(guān)鏈接）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.