像ChatGPT這樣的流行AI模型是基于語言或照片訓(xùn)練的,而由熨斗(Flatiron)研究所的研究人員及 Polymathic(博學(xué))AI 協(xié)作組的成員創(chuàng)建的新模型則是使用真實的科學(xué)數(shù)據(jù)集訓(xùn)練的。模型們已經(jīng)利用從一個領(lǐng)域?qū)W到的知識,去解決另一個領(lǐng)域看似完全不同的問題。
![]()
Walrus(海象)AI模型模擬流暢運動
海象(Walrus)/ 博學(xué)人工智能(Polymathic AI)
https://youtu.be/3iM_rd3t0_Q
作者:Elizabeth Fernandez 2025-12-9
譯者:zzllrr小樂 2025-12-13
雖然大多數(shù)AI人工智能模型——包括 ChatGPT——都是基于文本和圖像訓(xùn)練的,但一個多學(xué)科科學(xué)家團隊則有不同的目標(biāo):物理訓(xùn)練AI。
最近,Polymathic AI https://polymathic-ai.org 合作組成員展示了兩款使用真實科學(xué)數(shù)據(jù)集訓(xùn)練的新人工智能模型,旨在解決天文學(xué)和類流體系統(tǒng)中的問題。
這些模型——被稱為 Walrus(海象) https://neurips.cc/virtual/2025/loc/san-diego/poster/119922 和 AION(永恒)-1 https://neurips.cc/virtual/2025/loc/san-diego/poster/119776 ——獨特之處在于它們能夠?qū)哪骋活愇锢硐到y(tǒng)獲得的知識應(yīng)用于看似完全不同的問題。例如,海象(Walrus)可以應(yīng)對從爆炸恒星到 Wi-Fi 信號再到細(xì)菌活動等各種系統(tǒng)。
Walrus首席開發(fā)者、Polymathic AI研究科學(xué)家 Michael McCabe(邁克爾·麥凱布)表示,這種跨學(xué)科技能組尤其令人興奮,因為它能加速科學(xué)發(fā)現(xiàn),并在面對小樣本或小預(yù)算時賦予研究人員優(yōu)勢。
“也許你的場景里有新的物理,是你們領(lǐng)域不習(xí)慣處理的。也許你用的是實驗數(shù)據(jù),但不太確定它屬于哪個類別。也許你根本不是機器學(xué)習(xí)研究者,不想花時間去研究所有可能符合你情景的模型,“麥凱布解釋道。“我們希望,這些更廣泛的類別訓(xùn)練能讓它更易使用,并且更有可能被這些用戶推廣,因為對他們來說,'新'的物理可能是其他領(lǐng)域已經(jīng)處理了一段時間的事情。”
加州大學(xué)伯克利分校博士生、AION-1 項目首席研究員利亞姆·帕克(Liam Parker)表示,使用跨學(xué)科模型也能在數(shù)據(jù)稀少或研究罕見事件時提升預(yù)測效果。
Polymathic AI團隊最近在arXiv.org https://arxiv.org/abs/2511.15684 發(fā)布了Walrus(海象)的預(yù)印本 ,并于12月5日星期五在圣地亞哥舉行的 NeurIPS https://neurips.cc 大會上展示了 AION-1。
Walrus 和 AION-1 是“基礎(chǔ)模型”,意味著它們是通過來自不同研究領(lǐng)域或?qū)嶒灁?shù)據(jù)集訓(xùn)練的https://www.simonsfoundation.org/2024/12/02/new-datasets-will-train-ai-models-to-think-like-scientists/ 。這與大多數(shù)科學(xué)中的人工智能模型不同,后者是針對特定子領(lǐng)域或問題訓(xùn)練的。基礎(chǔ)模型不是從一組基本方程開始學(xué)習(xí)特定情境的細(xì)節(jié),而是學(xué)習(xí)物理過程的底層基礎(chǔ)。由于這些物理過程是普遍的,人工智能所學(xué)到的知識可以應(yīng)用于具有相同物理原理的各個領(lǐng)域或問題。基礎(chǔ)模型有諸多好處——從加快計算速度、在低數(shù)據(jù)環(huán)境中的良好表現(xiàn),到發(fā)現(xiàn)跨領(lǐng)域共享的物理學(xué)。
AION(永恒)-1 是天文學(xué)的基礎(chǔ)模型。它基于本身就已龐大的天文巡天(astronomical surveys)數(shù)據(jù)進(jìn)行訓(xùn)練: 巡天資產(chǎn)(Legacy Survey)https://www.legacysurvey.org 、 高分辨率深場巡天(HSC,Hyper Suprime-Cam) https://www.naoj.org/Projects/HSC/ 、 斯隆數(shù)字巡天(SDSS,Sloan Digital Sky Survey) https://sloan.org/programs/research/sloan-digital-sky-survey 、 暗能量光譜儀(DESI,Dark Energy Spectroscopic Instrument)https://www.desi.lbl.gov 和蓋亞(Gaia) https://www.esa.int/Science_Exploration/Space_Science/Gaia_overview 。總的來說,這相當(dāng)于超過 2億次恒星、類星體和星系的觀測,總數(shù)據(jù)總量約為 100TB。AION-1 利用圖像、光譜及多種其他測量數(shù)據(jù),盡可能多地了解天體。然后,當(dāng)科學(xué)家獲得一個星系的低分辨率圖像時,AION-1 可以從數(shù)百萬個星系的物理學(xué)中提取更多關(guān)于該星系的信息。
Walrus(海象)的領(lǐng)域是流體和類流體系統(tǒng)。Walrus 利用了 Well——一個由 Polymathic AI 團隊編制的龐大數(shù)據(jù)集,參閱:
Well的數(shù)據(jù)涵蓋了 19 個不同的場景和 63 個流體動力學(xué)領(lǐng)域。總的來說,它包含 15TB 的數(shù)據(jù),描述了密度、速度和壓力等參數(shù),涵蓋了從中子星合并、聲波到地球大氣層層變化等廣泛物理系統(tǒng)中的變化。
這樣的基礎(chǔ)模型可以非常強大。AION-1和Walrus可以利用物理學(xué)在不同案例中應(yīng)用,學(xué)習(xí)新事物。這類似于我們的感官。AION-1 團隊在一篇關(guān)于該項目的博客文章中解釋道:“多感官結(jié)合——而不是一次只感知一種感官——能讓你更全面地理解一次體驗,https://polymathic-ai.org/blog/aion-1/ 。“隨著時間推移,你的大腦會學(xué)會將事物的外觀、味道和嗅覺聯(lián)系起來,所以如果某個感官無法使用,你通常能從其他感官中推斷出缺失的信息。”
然后,當(dāng)科學(xué)家進(jìn)行新的實驗或觀察時,他們有一個起點——一張在類似情境下的物理表現(xiàn)的地圖。“就像看到了許多人類,”Polymathic AI的首席研究員、天體物理學(xué)家和機器學(xué)習(xí)專家 Shirley Ho 說。Shirley Ho是熨斗研究所的高級研究科學(xué)家,同時也是紐約大學(xué)的教授。當(dāng)你遇到一個新朋友,因為你之前認(rèn)識了很多人,你能在腦海中繪制地圖......這個人類會比你以前的朋友們怎么樣,“她說。
基礎(chǔ)模型通過簡化數(shù)據(jù)處理,使科學(xué)家的工作更加輕松。科學(xué)家們不再需要為每個項目或任務(wù)從零創(chuàng)建新的框架;取而代之的是,他們可以從已經(jīng)訓(xùn)練好的人工智能作為基礎(chǔ)開始。“我認(rèn)為我們對這個基礎(chǔ)模型的愿景是,它讓任何人都能從他們感興趣的數(shù)據(jù)的強大嵌入出發(fā)......并且在不必從零開始構(gòu)建整個管道的情況下,依然能實現(xiàn)最先進(jìn)的精度,“AION-1 首席研究員 Parker 說。
他們的目標(biāo)是制造科學(xué)家日常研究中可用的工具。Shirley Ho 說:“我們希望把所有這些AI智能帶給需要的科學(xué)家。”
NeurIPS 2025 會議的其他亮點
宇宙學(xué)基準(zhǔn)測試集(CosmoBench)
https://neurips.cc/virtual/2025/loc/san-diego/poster/121643
CosmoBench 是一個多視圖、多尺度、多任務(wù)的幾何深度學(xué)習(xí)宇宙學(xué)基準(zhǔn)測試集。CosmoBench 基于最先進(jìn)的宇宙學(xué)模擬,是同類中最大的基準(zhǔn)測試,擁有超過 34000 個點云和 25000 棵定向樹。CosmoBench 包含來自宇宙學(xué)和多樣化基線的具有挑戰(zhàn)性的評估任務(wù),包括宇宙學(xué)方法、簡單線性模型和圖神經(jīng)網(wǎng)絡(luò)。該演講展示 CosmoBench 如何推動宇宙學(xué)和幾何深度學(xué)習(xí)的前沿。
迷失在潛空間(Lost in Latent Space)
https://neurips.cc/virtual/2025/loc/san-diego/poster/115208
物理學(xué)家利用對物理定律的理解,建模并預(yù)測物理系統(tǒng)的行為。然而,這些計算需要相當(dāng)大的計算能力。熨斗研究所的科學(xué)家及 Polymathic AI 合作組的其他成員研究了一種較輕負(fù)擔(dān)的計算方式是否仍能產(chǎn)生準(zhǔn)確結(jié)果。這種被稱為“潛在擴散建模”(latent diffusion modeling)的計算模型,利用人工智能以更低的計算成本生成高質(zhì)量圖像,同時準(zhǔn)確刻畫物理行為。
神經(jīng)元作為感覺動力學(xué)中相干集合的探測器(Neurons as Detectors of Coherent Sets in Sensory Dynamics)
https://neurips.cc/virtual/2025/loc/san-diego/poster/117502
我們對觸覺、味覺、視覺和疼痛的感知由將外周受體信號傳遞到大腦的神經(jīng)元介導(dǎo)。這項工作表明,這些神經(jīng)元可以被理解為檢測感官流中的“連貫集合”——即隨時間共同演化、因此共享共同過去或共同未來的刺激軌跡群。通過區(qū)分這些相干集合,一些神經(jīng)元主要編碼剛剛發(fā)生的事情,而另一些則可靠地提示接下來可能發(fā)生的事情。
因此,傳統(tǒng)的感覺神經(jīng)元分類可以被重新解釋為反映了對過去的聚焦處理與對未來的預(yù)測處理之間的分歧。理解神經(jīng)系統(tǒng)如何以這種方式分離和轉(zhuǎn)化感官輸入,可能為治療精神疾病提供新途徑,也可能指導(dǎo)生物啟發(fā)人工智能的發(fā)展。
預(yù)測部分可觀測動力系統(tǒng)(Predicting Partially Observable Dynamical Systems)
https://neurips.cc/virtual/2025/loc/san-diego/poster/118611
科學(xué)家可以通過確定性模型預(yù)測下落物體的運動或流體的演化,這些模型從過去的觀測中計算出單一的未來結(jié)果。但這種方法在物理系統(tǒng)中失效,因為大部分狀態(tài)被隱藏。一個顯著的例子是太陽:我們可以觀察到太陽表面的活動,但深處的過程大多是看不見的。沒有這些內(nèi)部條件,就沒有足夠的信息來預(yù)測一個單一的“正確”未來。
熨斗研究所的研究人員與 Polymathic AI 項目的合作者共同開發(fā)了一種概率方法,可以推斷這些隱藏的太陽過程。通過將遙遠(yuǎn)過去的信息納入基于擴散的生成模型,他們的方法生成了一個合理的未來集合,更清晰地理解過去太陽黑子活動如何塑造其未來演變。
參考資料
https://www.simonsfoundation.org/2025/12/09/these-new-ai-models-are-trained-on-physics-not-words-and-theyre-driving-discovery/
https://youtu.be/3iM_rd3t0_Q
https://polymathic-ai.org
https://neurips.cc/virtual/2025/loc/san-diego/poster/119922
https://neurips.cc/virtual/2025/loc/san-diego/poster/119776
https://arxiv.org/abs/2511.15684
https://neurips.cc
https://www.simonsfoundation.org/2024/12/02/new-datasets-will-train-ai-models-to-think-like-scientists/
https://www.legacysurvey.org
https://www.naoj.org/Projects/HSC/
https://sloan.org/programs/research/sloan-digital-sky-survey
https://www.desi.lbl.gov
https://www.esa.int/Science_Exploration/Space_Science/Gaia_overview
https://polymathic-ai.org/blog/aion-1/
https://neurips.cc/virtual/2025/loc/san-diego/poster/121643
https://neurips.cc/virtual/2025/loc/san-diego/poster/115208
https://neurips.cc/virtual/2025/loc/san-diego/poster/117502
https://neurips.cc/virtual/2025/loc/san-diego/poster/118611
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.