今天,距離改變世界的李世石大戰(zhàn)阿爾法狗(AlphaGo),已經(jīng)整整過去了十年。
多年后,李世石在接受外界采訪時,仍難以忘懷當時的感受:「輸給 AI,有種感覺是,我整個世界都塌了。」
他當初在接受邀請時,覺得那會是一次「好玩」的經(jīng)歷:「好玩的前提是我覺得會贏。我從未想過自己會輸。」
![]()
這份自信并非傲慢。圍棋長期被視為 AI 難以攻克的最后堡壘——棋盤上可能的局面數(shù)量高達 10 的 170 次方,遠超宇宙中原子的總數(shù),傳統(tǒng)算法根本無從窮舉。
正因如此,許多專家當時預(yù)測,AI 要贏過人類頂尖棋手,至少還需要十年。然而,AlphaGo 提前了十年。
![]()
這場比賽中,有一個細節(jié)后來被反復(fù)提起:第二局的第 37 手。AlphaGo 將棋子落在了一個人類職業(yè)棋手幾乎不會考慮的位置。
現(xiàn)場解說員一度認為這是失誤,觀眾席上的棋手們面面相覷。但一百多手之后,那顆棋子恰恰處于制勝的關(guān)鍵位置——它的價值,在百步之后才得以顯現(xiàn)。
這就是著名的「第 37 步」。
![]()
今天,DeepMind 創(chuàng)始人 Demis Hassabis 在 X 平臺發(fā)文稱:
十年前,AlphaGo 在首爾的那場傳奇比賽開啟了人工智能現(xiàn)代時代的大幕。著名的「第 37 步」向我們表明,AI 技術(shù)已準備好應(yīng)對科學(xué)等領(lǐng)域中的現(xiàn)實世界問題——而這些方法所激發(fā)的新思路對于構(gòu)建通用人工智能(AGI)至關(guān)重要。
「第 37 步」也成了一個流傳至今的隱喻:它代表那些看起來不合理、卻最終被證明正確的決策;代表超出人類直覺邊界的創(chuàng)新;也代表在某個系統(tǒng)或競爭中,突然改變局面的關(guān)鍵一步。
擊敗人類后,更強的 AI 在進一步去「人味」
「我沒有辦法再去享受圍棋,所以我就退役了。」
與 AlphaGo 對戰(zhàn)的三年后,李世石正式宣布退役。對于 5 歲就開始學(xué)圍棋的他而言,圍棋不僅是競賽,更是一種藝術(shù),是棋手個性與風格的延伸。但在 AI 時代,它卻淪為效率的游戲。
讓他更難釋懷的,是 AI 還在繼續(xù)進化,且越來越「去人化」。
![]()
2017 年,DeepMind 發(fā)布了 AlphaGo Zero。AlphaGo 的誕生,依賴神經(jīng)網(wǎng)絡(luò)對人類高手 3000 多萬手棋譜的學(xué)習;而 AlphaGo Zero 從一開始就徹底拋棄人類經(jīng)驗,訓(xùn)練期間不接觸任何棋譜,單純靠自我對弈從零生長。僅僅三天后,它便以 100:0 擊敗了 AlphaGo。
《大西洋月刊》稱其為「不需要從人類身上學(xué)習任何東西的 AI」。
![]()
DeepMind 并未止步。此后推出的 AlphaZero,在不具備任何先驗知識的前提下,僅憑規(guī)則便在數(shù)小時內(nèi)自學(xué)掌握了國際象棋,不僅擊敗了人類頂尖棋手,更超越了當時最強的專業(yè)象棋程序 Stockfish。
而象棋已被人類和計算機研究分析了數(shù)十年。連在這樣一個被反復(fù)「窮舉」過的領(lǐng)域,AlphaZero 依然走出了人類從未嘗試過的新策略。
![]()
AlphaGo 和 AlphaGo Zero 的棋譜,難以理解到被棋手們直接稱為「外星文明投下的一本神秘指南」。
美國職業(yè)棋手 Michael Redmond 于 2017 年表示,人類學(xué)習圍棋的重要方式是搭建一個故事:「那是我們溝通的方式,它是一件非常人性的事。」面對「AI 味」棋路,他說,人類棋手往往很難真正投入其中:「AlphaGo 下棋的方式,總讓人覺得很非人性。」
這也正是李世石痛苦所在。圍棋對他而言從來不只是勝負,而是表達自我的語言。而「第 37 步」恰恰說明,這門語言里,AI 已經(jīng)有了人類讀不懂的章節(jié)。
![]()
退役后,李世石開始執(zhí)迷于 AI,開設(shè)圍棋學(xué)院、出書、推出桌游之余,還開始在各地做關(guān)于 AI 的演講:「我算是很早開始面對 AI 的問題,其他人也將會經(jīng)歷。那未必會有開心大團圓結(jié)局。」
對他來說,AI 最讓人擔憂的地方,在于它可能改變?nèi)祟惖膬r值觀:「過去,人們會對創(chuàng)造力、原創(chuàng)性和創(chuàng)新充滿敬畏,但自從 AI 出現(xiàn)以來,這些很多都已經(jīng)消失了。」
人機共創(chuàng)時代
并不是所有人都同意這個講法。
「AI 毀滅了圍棋圈所有存在的秩序,然后開始重建。」康奈爾大學(xué)研究 AI 的圍棋愛好者 Jiuheng He 如此描述。
在香港一家圍棋學(xué)院里,老師 Ng Chee Man 會為學(xué)生提供 iPad 來輔助學(xué)習——每次落子,AI 都會實時給出「最佳走法」建議,并記錄下哪些步下得好,哪些不好。這種訓(xùn)練方式,正在成為全球圍棋學(xué)院的標配。
![]()
數(shù)據(jù)也印證了這一轉(zhuǎn)變。2023 年,《美國國家科學(xué)院院刊》發(fā)表了一項以 1950 至 2021 年共 580 萬手棋譜為基礎(chǔ)的研究,結(jié)論令人振奮:在 AlphaGo 擊敗李世石之前,人類棋手的判斷質(zhì)量在 66 年間幾乎沒有變化;但從 2016、2017 年起,這一數(shù)字開始明顯攀升。
換言之,人類贏不了 AI,但因為 AI,人類變得更強了。
DeepMind 首席研究科學(xué)家、AlphaGo 項目負責人 David Silver 評論道:
「看到人類棋手能如此快速地適應(yīng),將這些新走法融入自己的方法中,正是讓人非常振奮的事。這些結(jié)果表明,人類將在 AI 發(fā)現(xiàn)的基礎(chǔ)上,大大提升自身潛力。」
事實上,早在 AlphaGo 公開亮相前,這一規(guī)律就已有跡可循。曾在不公開測試中對決 AlphaGo 的法國棋手樊麾,雖然落敗,卻說 AlphaGo 讓他以全新方式審視圍棋,技術(shù)因此飛速提升,世界排名隨之躍升。
![]()
2017 年被 AlphaGo 擊敗的柯潔,在 2023 年也坦言,自己除了正式比賽外,已經(jīng)很少與真人練習。在他看來,AI 已經(jīng)成為圍棋創(chuàng)造力的新源頭:
創(chuàng)造性必須投入實戰(zhàn)并得到檢驗。現(xiàn)在圍棋創(chuàng)新的大部分是 AI 來完成,我們想下一些和以前不一樣的棋,大概率會輸,因為 AI 通過大量實戰(zhàn),得出了和之前不同的思維——這才是創(chuàng)造力。
這種人機協(xié)作的思維,在新生代棋手身上體現(xiàn)得最為徹底。韓國棋手申真谞,首位奪得世界冠軍的 00 后棋手,棋迷稱他「申工智能」,正是以長時間的 AI 訓(xùn)練著稱。
他曾于第 25 屆農(nóng)心杯實現(xiàn)跨賽季 16 連勝,超越前輩李昌鎬的歷史紀錄。談及與 AI 的關(guān)系,他說:「我覺得我和 AI 現(xiàn)在是朋友關(guān)系。AI 和人類的思路完全不同,它通過數(shù)學(xué)算法解決問題,借鑒 AI 的思路使我受益良多。」
從李世石的崩塌,到申真谞的崛起,恰好是同一枚硬幣的兩面:前者是第一代直面沖擊的人,后者是第一代將沖擊化為養(yǎng)分的人。「第 37 步」對他們的意義,截然不同。
十年前,「第 37 步」告訴世界:AI 能走出人類從未想到的路。十年后,圍棋這面鏡子告訴我們:真正的問題從來不是人類能否贏過 AI,而是人類如何與它一起,走向那些連 AI 也尚未到達的地方。
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關(guān)鏈接)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.