新AI模型基于物理訓(xùn)練而非文字，它們推動著科學(xué)發(fā)現(xiàn)——Simons Foundation

2025-12-14 17:32:19　來源: 科學(xué)的歷程

湖北舉報

分享至

像ChatGPT這樣的流行AI模型是基于語言或照片訓(xùn)練的，而由熨斗（Flatiron）研究所的研究人員及 Polymathic（博學(xué)）AI 協(xié)作組的成員創(chuàng)建的新模型則是使用真實的科學(xué)數(shù)據(jù)集訓(xùn)練的。模型們已經(jīng)利用從一個領(lǐng)域?qū)W到的知識，去解決另一個領(lǐng)域看似完全不同的問題。

Walrus（海象）AI模型模擬流暢運動

海象（Walrus）/ 博學(xué)人工智能（Polymathic AI）

https://youtu.be/3iM_rd3t0_Q

作者：Elizabeth Fernandez 2025-12-9

譯者：zzllrr小樂 2025-12-13

雖然大多數(shù)AI人工智能模型——包括 ChatGPT——都是基于文本和圖像訓(xùn)練的，但一個多學(xué)科科學(xué)家團隊則有不同的目標(biāo)：物理訓(xùn)練AI。

最近，Polymathic AI https://polymathic-ai.org 合作組成員展示了兩款使用真實科學(xué)數(shù)據(jù)集訓(xùn)練的新人工智能模型，旨在解決天文學(xué)和類流體系統(tǒng)中的問題。

這些模型——被稱為 Walrus（海象） https://neurips.cc/virtual/2025/loc/san-diego/poster/119922 和 AION（永恒）-1 https://neurips.cc/virtual/2025/loc/san-diego/poster/119776 ——獨特之處在于它們能夠?qū)哪骋活愇锢硐到y(tǒng)獲得的知識應(yīng)用于看似完全不同的問題。例如，海象（Walrus）可以應(yīng)對從爆炸恒星到 Wi-Fi 信號再到細(xì)菌活動等各種系統(tǒng)。

Walrus首席開發(fā)者、Polymathic AI研究科學(xué)家 Michael McCabe（邁克爾·麥凱布）表示，這種跨學(xué)科技能組尤其令人興奮，因為它能加速科學(xué)發(fā)現(xiàn)，并在面對小樣本或小預(yù)算時賦予研究人員優(yōu)勢。

“也許你的場景里有新的物理，是你們領(lǐng)域不習(xí)慣處理的。也許你用的是實驗數(shù)據(jù)，但不太確定它屬于哪個類別。也許你根本不是機器學(xué)習(xí)研究者，不想花時間去研究所有可能符合你情景的模型，“麥凱布解釋道。“我們希望，這些更廣泛的類別訓(xùn)練能讓它更易使用，并且更有可能被這些用戶推廣，因為對他們來說，'新'的物理可能是其他領(lǐng)域已經(jīng)處理了一段時間的事情。”

加州大學(xué)伯克利分校博士生、AION-1 項目首席研究員利亞姆·帕克（Liam Parker）表示，使用跨學(xué)科模型也能在數(shù)據(jù)稀少或研究罕見事件時提升預(yù)測效果。

Polymathic AI團隊最近在arXiv.org https://arxiv.org/abs/2511.15684 發(fā)布了Walrus（海象）的預(yù)印本，并于12月5日星期五在圣地亞哥舉行的 NeurIPS https://neurips.cc 大會上展示了 AION-1。

Walrus 和 AION-1 是“基礎(chǔ)模型”，意味著它們是通過來自不同研究領(lǐng)域或?qū)嶒灁?shù)據(jù)集訓(xùn)練的https://www.simonsfoundation.org/2024/12/02/new-datasets-will-train-ai-models-to-think-like-scientists/ 。這與大多數(shù)科學(xué)中的人工智能模型不同，后者是針對特定子領(lǐng)域或問題訓(xùn)練的。基礎(chǔ)模型不是從一組基本方程開始學(xué)習(xí)特定情境的細(xì)節(jié)，而是學(xué)習(xí)物理過程的底層基礎(chǔ)。由于這些物理過程是普遍的，人工智能所學(xué)到的知識可以應(yīng)用于具有相同物理原理的各個領(lǐng)域或問題。基礎(chǔ)模型有諸多好處——從加快計算速度、在低數(shù)據(jù)環(huán)境中的良好表現(xiàn)，到發(fā)現(xiàn)跨領(lǐng)域共享的物理學(xué)。

AION（永恒）-1 是天文學(xué)的基礎(chǔ)模型。它基于本身就已龐大的天文巡天（astronomical surveys）數(shù)據(jù)進(jìn)行訓(xùn)練：巡天資產(chǎn)（Legacy Survey）https://www.legacysurvey.org 、高分辨率深場巡天（HSC，Hyper Suprime-Cam） https://www.naoj.org/Projects/HSC/ 、斯隆數(shù)字巡天（SDSS，Sloan Digital Sky Survey） https://sloan.org/programs/research/sloan-digital-sky-survey 、暗能量光譜儀（DESI，Dark Energy Spectroscopic Instrument）https://www.desi.lbl.gov 和蓋亞（Gaia） https://www.esa.int/Science_Exploration/Space_Science/Gaia_overview 。總的來說，這相當(dāng)于超過 2億次恒星、類星體和星系的觀測，總數(shù)據(jù)總量約為 100TB。AION-1 利用圖像、光譜及多種其他測量數(shù)據(jù)，盡可能多地了解天體。然后，當(dāng)科學(xué)家獲得一個星系的低分辨率圖像時，AION-1 可以從數(shù)百萬個星系的物理學(xué)中提取更多關(guān)于該星系的信息。

Walrus（海象）的領(lǐng)域是流體和類流體系統(tǒng)。Walrus 利用了 Well——一個由 Polymathic AI 團隊編制的龐大數(shù)據(jù)集，參閱：

Well的數(shù)據(jù)涵蓋了 19 個不同的場景和 63 個流體動力學(xué)領(lǐng)域。總的來說，它包含 15TB 的數(shù)據(jù)，描述了密度、速度和壓力等參數(shù)，涵蓋了從中子星合并、聲波到地球大氣層層變化等廣泛物理系統(tǒng)中的變化。

這樣的基礎(chǔ)模型可以非常強大。AION-1和Walrus可以利用物理學(xué)在不同案例中應(yīng)用，學(xué)習(xí)新事物。這類似于我們的感官。AION-1 團隊在一篇關(guān)于該項目的博客文章中解釋道：“多感官結(jié)合——而不是一次只感知一種感官——能讓你更全面地理解一次體驗，https://polymathic-ai.org/blog/aion-1/ 。“隨著時間推移，你的大腦會學(xué)會將事物的外觀、味道和嗅覺聯(lián)系起來，所以如果某個感官無法使用，你通常能從其他感官中推斷出缺失的信息。”

然后，當(dāng)科學(xué)家進(jìn)行新的實驗或觀察時，他們有一個起點——一張在類似情境下的物理表現(xiàn)的地圖。“就像看到了許多人類，”Polymathic AI的首席研究員、天體物理學(xué)家和機器學(xué)習(xí)專家 Shirley Ho 說。Shirley Ho是熨斗研究所的高級研究科學(xué)家，同時也是紐約大學(xué)的教授。當(dāng)你遇到一個新朋友，因為你之前認(rèn)識了很多人，你能在腦海中繪制地圖......這個人類會比你以前的朋友們怎么樣，“她說。

基礎(chǔ)模型通過簡化數(shù)據(jù)處理，使科學(xué)家的工作更加輕松。科學(xué)家們不再需要為每個項目或任務(wù)從零創(chuàng)建新的框架；取而代之的是，他們可以從已經(jīng)訓(xùn)練好的人工智能作為基礎(chǔ)開始。“我認(rèn)為我們對這個基礎(chǔ)模型的愿景是，它讓任何人都能從他們感興趣的數(shù)據(jù)的強大嵌入出發(fā)......并且在不必從零開始構(gòu)建整個管道的情況下，依然能實現(xiàn)最先進(jìn)的精度，“AION-1 首席研究員 Parker 說。

他們的目標(biāo)是制造科學(xué)家日常研究中可用的工具。Shirley Ho 說：“我們希望把所有這些AI智能帶給需要的科學(xué)家。”

NeurIPS 2025 會議的其他亮點

宇宙學(xué)基準(zhǔn)測試集（CosmoBench）

https://neurips.cc/virtual/2025/loc/san-diego/poster/121643

CosmoBench 是一個多視圖、多尺度、多任務(wù)的幾何深度學(xué)習(xí)宇宙學(xué)基準(zhǔn)測試集。CosmoBench 基于最先進(jìn)的宇宙學(xué)模擬，是同類中最大的基準(zhǔn)測試，擁有超過 34000 個點云和 25000 棵定向樹。CosmoBench 包含來自宇宙學(xué)和多樣化基線的具有挑戰(zhàn)性的評估任務(wù)，包括宇宙學(xué)方法、簡單線性模型和圖神經(jīng)網(wǎng)絡(luò)。該演講展示 CosmoBench 如何推動宇宙學(xué)和幾何深度學(xué)習(xí)的前沿。

迷失在潛空間（Lost in Latent Space）

https://neurips.cc/virtual/2025/loc/san-diego/poster/115208

物理學(xué)家利用對物理定律的理解，建模并預(yù)測物理系統(tǒng)的行為。然而，這些計算需要相當(dāng)大的計算能力。熨斗研究所的科學(xué)家及 Polymathic AI 合作組的其他成員研究了一種較輕負(fù)擔(dān)的計算方式是否仍能產(chǎn)生準(zhǔn)確結(jié)果。這種被稱為“潛在擴散建模”（latent diffusion modeling）的計算模型，利用人工智能以更低的計算成本生成高質(zhì)量圖像，同時準(zhǔn)確刻畫物理行為。

神經(jīng)元作為感覺動力學(xué)中相干集合的探測器（Neurons as Detectors of Coherent Sets in Sensory Dynamics）

https://neurips.cc/virtual/2025/loc/san-diego/poster/117502

我們對觸覺、味覺、視覺和疼痛的感知由將外周受體信號傳遞到大腦的神經(jīng)元介導(dǎo)。這項工作表明，這些神經(jīng)元可以被理解為檢測感官流中的“連貫集合”——即隨時間共同演化、因此共享共同過去或共同未來的刺激軌跡群。通過區(qū)分這些相干集合，一些神經(jīng)元主要編碼剛剛發(fā)生的事情，而另一些則可靠地提示接下來可能發(fā)生的事情。

因此，傳統(tǒng)的感覺神經(jīng)元分類可以被重新解釋為反映了對過去的聚焦處理與對未來的預(yù)測處理之間的分歧。理解神經(jīng)系統(tǒng)如何以這種方式分離和轉(zhuǎn)化感官輸入，可能為治療精神疾病提供新途徑，也可能指導(dǎo)生物啟發(fā)人工智能的發(fā)展。

預(yù)測部分可觀測動力系統(tǒng)（Predicting Partially Observable Dynamical Systems）

https://neurips.cc/virtual/2025/loc/san-diego/poster/118611

科學(xué)家可以通過確定性模型預(yù)測下落物體的運動或流體的演化，這些模型從過去的觀測中計算出單一的未來結(jié)果。但這種方法在物理系統(tǒng)中失效，因為大部分狀態(tài)被隱藏。一個顯著的例子是太陽：我們可以觀察到太陽表面的活動，但深處的過程大多是看不見的。沒有這些內(nèi)部條件，就沒有足夠的信息來預(yù)測一個單一的“正確”未來。

熨斗研究所的研究人員與 Polymathic AI 項目的合作者共同開發(fā)了一種概率方法，可以推斷這些隱藏的太陽過程。通過將遙遠(yuǎn)過去的信息納入基于擴散的生成模型，他們的方法生成了一個合理的未來集合，更清晰地理解過去太陽黑子活動如何塑造其未來演變。

參考資料

https://www.simonsfoundation.org/2025/12/09/these-new-ai-models-are-trained-on-physics-not-words-and-theyre-driving-discovery/

https://youtu.be/3iM_rd3t0_Q

https://polymathic-ai.org

https://neurips.cc/virtual/2025/loc/san-diego/poster/119922

https://neurips.cc/virtual/2025/loc/san-diego/poster/119776

https://arxiv.org/abs/2511.15684

https://neurips.cc

https://www.simonsfoundation.org/2024/12/02/new-datasets-will-train-ai-models-to-think-like-scientists/

https://www.legacysurvey.org

https://www.naoj.org/Projects/HSC/

https://sloan.org/programs/research/sloan-digital-sky-survey

https://www.desi.lbl.gov

https://www.esa.int/Science_Exploration/Space_Science/Gaia_overview

https://polymathic-ai.org/blog/aion-1/

https://neurips.cc/virtual/2025/loc/san-diego/poster/121643

https://neurips.cc/virtual/2025/loc/san-diego/poster/115208

https://neurips.cc/virtual/2025/loc/san-diego/poster/117502

https://neurips.cc/virtual/2025/loc/san-diego/poster/118611

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.