![]()
人類生活在三維世界,但探索的觸角早已延伸至更高維的數(shù)學(xué)世界。從物理理論到人工智能,高維數(shù)學(xué)正在揭示隱藏在復(fù)雜現(xiàn)象背后的結(jié)構(gòu)與規(guī)律。
撰文 | Benjamin Skuse
翻譯 | zzllrr小樂
從直覺上來說,我們能夠想象一個一維實(shí)體,它永遠(yuǎn)只能在一條無限延伸的直線上移動;或者一個二維生物,它注定只能生活在一個平坦的平面上。而三維生物無需我們刻意想象,因?yàn)檫@正是我們感知宇宙的方式。然而,驅(qū)動現(xiàn)代世界運(yùn)轉(zhuǎn)的計(jì)算能力,卻在五維、十維乃至數(shù)千維的抽象空間中蓬勃發(fā)展。高維數(shù)學(xué)究竟是如何幫助我們處理和解讀信息,又如何揭示那些支配著從生物學(xué)到人工智能等萬事萬物的隱藏規(guī)律呢?
超越感知的維度
我們不妨先區(qū)分“宇宙的維度”與“維度”的其他定義,這是一個不錯的切入點(diǎn)。如果討論的是前者,那么核心問題便是:我們是否真的生活在一個三維宇宙中?抑或這只是我們感知方式的局限所致?左與右、前與后、上與下,這是我們僅有的移動方向,也是我們感知到三維世界的原因。但阿爾伯特·愛因斯坦(Albert Einstein)的出現(xiàn)改變了這一切。他提出的狹義相對論與廣義相對論將時間納入了考量范疇。盡管我們只能感知到時間的單向流逝,其體驗(yàn)方式與三維空間維度截然不同(從數(shù)學(xué)角度而言亦是如此),但相對論將空間與時間整合為一個整體,即時空(spacetime)。
數(shù)學(xué)家赫爾曼·閔可夫斯基(Hermann Minkowski)的研究讓時空的數(shù)學(xué)表達(dá)變得具象化。他證明,若將空間與時間置于近乎平等的地位,狹義相對論便能得到簡潔優(yōu)美的闡釋。這種統(tǒng)一視角催生了閔可夫斯基空間(Minkowski space)的概念——這是一個四維空間,時間被視為第四個坐標(biāo)。
這項(xiàng)研究為將時空視為單一四維結(jié)構(gòu)奠定了基礎(chǔ)。在數(shù)學(xué)術(shù)語中,這種結(jié)構(gòu)被稱為流形(manifold),它并非一成不變,而是會受到質(zhì)量或能量的影響。當(dāng)靠近黑洞這類大質(zhì)量天體時,空間確實(shí)會被拉伸,時間亦是如此。換句話說,這個四維流形的維度會發(fā)生幾何扭曲。
一個多世紀(jì)前,相對論帶來的啟示讓人們意識到,我們所處的宇宙或許擁有三個以上的維度,并以一種深刻的方式說明,我們感知到的事物未必就是全部現(xiàn)實(shí)。但更多的突破性發(fā)現(xiàn)還在后面。

超立方體(左)與立方體(右)折疊和展開過程示意圖丨圖源:Christopher Thomas (CC-BY-SA 1.0)
在愛因斯坦向世界提出廣義相對論后不久,德國數(shù)學(xué)家特奧多爾·卡魯扎(Theodor Kaluza)與瑞典物理學(xué)家奧斯卡·克萊因(Oskar Klein)意識到,這個理論中還少了點(diǎn)什么:另一個空間維度。兩人證明,倘若宇宙是五維而非四維的,那么五維形式的愛因斯坦方程將可以分解為三組四維方程,分別是描述引力的愛因斯坦原始場方程、描述電磁力的麥克斯韋方程,以及一個全新的標(biāo)量場方程。
這個新增的第四空間維度可以蜷縮成一個極小的閉合環(huán)路,其半徑遠(yuǎn)小于任何可測量尺度——這也解釋了為何我們無法感知到它的存在。但與此同時,它卻可能對我們周遭的世界產(chǎn)生深遠(yuǎn)影響,堪稱是實(shí)現(xiàn)引力與電磁力統(tǒng)一的“秘訣”。
這便是后來著名的卡魯扎-克萊因理論(Kaluza–Klein theory),它在數(shù)學(xué)層面精妙絕倫,但在物理層面卻存在缺陷。該理論無法準(zhǔn)確預(yù)測粒子的屬性,也未能涵蓋另外兩種基本作用力(強(qiáng)核力與弱核力)以及諸多基本粒子。盡管如此,它是首次嚴(yán)肅嘗試證明,我們所感知到的基本相互作用,或許只是高維幾何結(jié)構(gòu)的一種表現(xiàn)形式。如今,這一理論的思想遺產(chǎn)依然延續(xù),催生出一系列試圖通過多個蜷縮空間維度來統(tǒng)一基本作用力與粒子的理論,例如弦理論(String theory)與M理論(M-theory)——后者由1990年菲爾茲獎得主愛德華·威滕(Edward Witten)首次提出。
四維廣義相對論、五維卡魯扎-克萊因理論,以及十維、十一維的弦理論與M理論都暗示,我們宇宙的幾何結(jié)構(gòu)或許遠(yuǎn)比我們能感知到的更為奇特。但這些理論所涉及的維度,在數(shù)學(xué)家與統(tǒng)計(jì)學(xué)家研究的高維范疇中,還處于“低維”水平。那么,為何人們要涉足這些高度抽象的領(lǐng)域呢?
定義數(shù)據(jù)
當(dāng)我們描述某個N維空間內(nèi)一個點(diǎn)的位置時,高維數(shù)學(xué)的作用就變得易于理解了。前文提到的那個在無限直線上移動的一維生物,只需一個坐標(biāo)(x)就能確定其位置;平面上的二維生物需要兩個坐標(biāo)(x,y);而我們?nèi)祟悾糁豢紤]空間位置,用三個坐標(biāo)(x,y,z)即可定位;若要同時描述時空位置,則需要四個坐標(biāo)(x,y,z,t)。
![]()
一維、二維與三維生物示意圖丨本圖在Google Gemini的協(xié)助下制作。
高維空間中的點(diǎn),其實(shí)只是擁有更多的坐標(biāo)而已。當(dāng)我們不再將維度視為宇宙的構(gòu)成要素,而是從其他角度定義維度時,高維空間的價(jià)值便凸顯出來。我們不妨將維度理解為在特定空間中被考慮的屬性或變量的數(shù)量,而非可能存在的現(xiàn)實(shí)。例如,金融模型師想要追蹤并預(yù)測某項(xiàng)資產(chǎn)的風(fēng)險(xiǎn),就可以將其視為N維風(fēng)險(xiǎn)空間(N-dimensional risk space)中的一個點(diǎn),其中N代表多種變量,如當(dāng)前價(jià)格、波動率、利率等。
另一個典型例子是人口普查數(shù)據(jù)。政府的人口普查數(shù)據(jù)庫包含數(shù)百個關(guān)于人口(年齡、性別、種族、職業(yè)等)和家庭(住房類型、產(chǎn)權(quán)狀況、臥室數(shù)量等)的變量。這樣一來,每個人就成為了數(shù)據(jù)庫這個N維空間中的一個點(diǎn),N對應(yīng)的是普查中測量的數(shù)百種不同特征。
在這兩個例子中,想要獲取有價(jià)值的洞見,關(guān)鍵在于發(fā)現(xiàn)并分析隱藏在高維數(shù)據(jù)中的低維模式與結(jié)構(gòu)。金融模型師可以運(yùn)行算法,在高維風(fēng)險(xiǎn)空間中尋找一個超平面(hyperplane),以此將安全投資與高風(fēng)險(xiǎn)投資進(jìn)行最優(yōu)劃分。統(tǒng)計(jì)學(xué)家則可以將原始變量整合為主成分(principal components)——這些主成分能夠反映不同群體在社會經(jīng)濟(jì)地位上的主要差異,進(jìn)而構(gòu)建出基于區(qū)域的貧困指數(shù)(deprivation index)。
高維數(shù)學(xué)的重要性還體現(xiàn)在一個當(dāng)下的熱門領(lǐng)域中,即大語言模型(large language models, LLMs)。這類模型的發(fā)展得益于約書亞·本吉奧(Yoshua Bengio)與楊立昆(Yann LeCun)等研究者數(shù)十年來在人工智能、機(jī)器學(xué)習(xí)與自然語言處理領(lǐng)域的深耕——兩人均是2018年圖靈獎(ACM A.M. Turing Award)得主。事實(shí)上,沒有高維數(shù)學(xué),大語言模型便無從運(yùn)轉(zhuǎn)。
![]()
約書亞·本吉奧與楊立昆分別出席2019年與2022年海德堡獲獎?wù)哒搲瓐D源:HLFF / Flemming
大語言模型中,文本完全通過向量數(shù)學(xué)(vector mathematics)處理。模型會將每個“標(biāo)記(token)”(可以是單詞、子或標(biāo)點(diǎn)符號)轉(zhuǎn)換為一個高維向量,其維度通常在512至4096之間,同時標(biāo)記在序列(句子)中的位置也會被編碼為附加向量。模型的運(yùn)算主要由自注意力機(jī)制(self-attention mechanism)驅(qū)動:通過計(jì)算高維向量之間的點(diǎn)積(dot product)來衡量所有標(biāo)記之間的語義關(guān)聯(lián),進(jìn)而生成一系列新的高維向量,這些向量包含了給定序列的上下文信息。最終生成的輸出向量會被映射到詞匯空間(vocabulary space),該空間的維度等于模型詞匯表中可能存在的標(biāo)記數(shù)量。最后,模型會通過一個函數(shù)篩選出合適的標(biāo)記,完成文本生成。
復(fù)雜性的形態(tài)
當(dāng)大型數(shù)據(jù)集包含本身就是高維向量的數(shù)據(jù)點(diǎn)時,數(shù)據(jù)分析并獲得有用信息的難度便會大幅提升。例如在單細(xì)包RNA測序技術(shù)中,每個單細(xì)胞都被表示為一個向量,其維度對應(yīng)數(shù)萬個基因的表達(dá)水平。想要理解如此龐大而稀疏的空間,需要采用一種截然不同的方法。
如果我們將這個空間視為一個巨大的數(shù)據(jù)云(data cloud),忽略其中具體的坐標(biāo)信息,就能退一步,從宏觀上把握數(shù)據(jù)的“形態(tài)”。這種方法被稱為拓?fù)鋽?shù)據(jù)分析(Topological Data Analysis, TDA),它能夠刻畫高維數(shù)據(jù)流形的全局結(jié)構(gòu)與連通性。這類分析方法源于現(xiàn)代拓?fù)鋵W(xué),其理論基礎(chǔ)包括1982年菲爾茲獎得主丘成桐(Shing-Tung Yau)關(guān)于彎曲空間的幾何分析,以及1986年菲爾茲獎得主邁克爾·弗里德曼(Michael Freedman)在流形結(jié)構(gòu)領(lǐng)域的深刻洞見。
拓?fù)鋽?shù)據(jù)分析借助持續(xù)同調(diào)(persistent homology)識別數(shù)據(jù)的拓?fù)涮卣鳌@些特征是數(shù)據(jù)形態(tài)的固有屬性,即便數(shù)據(jù)被拉伸、壓縮或進(jìn)行連續(xù)變換,它們也不會發(fā)生改變。此類結(jié)構(gòu)包括簇、環(huán)與空洞,它們的存在往往蘊(yùn)含其他方法難以發(fā)現(xiàn)的深層信息。
這一技術(shù)在癌癥基因組學(xué)中已產(chǎn)生重要影響。研究人員利用拓?fù)鋽?shù)據(jù)分析,識別出了具有特定預(yù)后的乳腺癌患者亞群,而傳統(tǒng)方法未能發(fā)現(xiàn)這一群體。這一發(fā)現(xiàn)為精準(zhǔn)治療奠定了基礎(chǔ)。此外,該方法還被用于識別可預(yù)測治療反應(yīng)與患者預(yù)后的基因組標(biāo)記物,準(zhǔn)確性較高。
無限的循環(huán)
當(dāng)我們的研究超越這些已經(jīng)極高的維度時,我們又會回到一切的起點(diǎn):探究現(xiàn)實(shí)與宇宙的本質(zhì)。在創(chuàng)立相對論的同時,愛因斯坦也是現(xiàn)代物理學(xué)另一大支柱——量子力學(xué)——的重要奠基人之一。量子力學(xué)描述了原子與亞原子尺度下物質(zhì)與光的運(yùn)行規(guī)律。在這一尺度下,對物理現(xiàn)象的數(shù)學(xué)描述需要滿足空間上的連續(xù)性,同時還要遵循疊加原理(principle of superposition),即在被觀測之前,物理系統(tǒng)(波或粒子)可以同時處于所有可能的狀態(tài)。
這些特性導(dǎo)致量子系統(tǒng)具有無窮多的潛在自由度,也就是無限維度。而這種復(fù)雜性,就需要借助泛函分析(functional analysis)這一數(shù)學(xué)分支來處理。泛函分析將函數(shù)視為無窮維空間中的點(diǎn)或向量,而希爾伯特空間(Hilbert space)正是量子態(tài)所處的一種特殊無窮維向量空間。事實(shí)上,由著名的全才型學(xué)者約翰·馮·諾依曼(John von Neumann)嚴(yán)格構(gòu)建,并經(jīng)著名數(shù)學(xué)家伊斯雷爾·蓋爾范德(Israel Gelfand)與1962年菲爾茲獎得主拉爾斯·霍爾曼德(Lars H?rmander)進(jìn)一步推廣的無窮維希爾伯特空間框架,構(gòu)成了量子力學(xué)的數(shù)學(xué)基石。倘若沒有泛函分析與希爾伯特空間理論,我們便無法準(zhǔn)確定義量子態(tài)、量化概率,也無法描述亞原子世界的連續(xù)動力學(xué)過程。
正如我們所看到的,日常感知的局限反而成為深入理解世界的起點(diǎn)。如今,我們不再局限于對三維世界的觀察,而是掌握了構(gòu)建和探索任意維度空間的數(shù)學(xué)語言,這讓我們在眾多領(lǐng)域與應(yīng)用中,都獲得了全新而深刻的認(rèn)知。
作者簡介
Benjamin Skuse是一位專注于科學(xué)領(lǐng)域的專業(yè)自由撰稿人。他早年曾從事學(xué)術(shù)研究,獲得愛丁堡大學(xué)應(yīng)用數(shù)學(xué)博士學(xué)位和科學(xué)傳播碩士學(xué)位。目前他居住在英國西鄉(xiāng)地區(qū),致力于為各類讀者創(chuàng)作通俗易懂、引人入勝且具有說服力的文章——無論主題內(nèi)容有多復(fù)雜。他的作品曾發(fā)表在New Scientist、Sky & Telescope、BBC Sky at Night Magazine和Physics World等雜志上。
本文經(jīng)授權(quán)轉(zhuǎn)自zzllrr小樂公眾號,原文譯自Benjamin Skuse,How High-Dimensional Mathematics Rules Our World,Heidelberg Laureate Forum,
https://scilogs.spektrum.de/hlf/how-high-dimensional-mathematics-rules-our-world/
注:本文封面圖片來自版權(quán)圖庫,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛。
![]()
特 別 提 示
1. 進(jìn)入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。
2.『返樸』提供按月檢索文章功能。關(guān)注公眾號,回復(fù)四位數(shù)組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.