網易首頁 > 網易號 > 正文申請入駐

警惕你身邊做AI for Science的人

2026-03-20 14:31:01　來源: 人工智能學家

北京舉報

分享至

他們手持顯卡賬單，口稱改變人類命運，用一張模型架構圖解釋一切，用一篇Nature子刊圓所有謊言。

我先聲明，我不是反對AI，也不是反對科學。我反對的，是那種特定的人。他們活在一個由benchmarks、影響因子和投資人PPT共同構建的平行宇宙里，把AI4S當成一張萬能的免死金牌，插在任何需要解釋的地方。

這篇文章寫給所有曾經在組會上睡著、在學術會議上出神、或者在聽完某個demo之后不知道為何感到空洞的人。你的直覺是對的。

一、畫餅的藝術

他們說的話，你一定聽過。

"我們用大模型重新定義了蛋白質折疊的范式。"

"我們的模型在零樣本條件下超越了人類專家。"

"我們正在做的事，會在五年內顛覆整個XX領域。"

這些話有一個共同點，沒有時間節(jié)點，沒有可證偽的預測，沒有失敗案例，只有宏大敘事和精心修飾的圖表。他們擅長把一個很窄的任務包裝成改變文明進程的使命，把一個在受控數據集上表現尚可的模型描述成通用智能的雛形。

更精妙的是，他們學會了用復雜性和前沿性來抵御一切質疑。

你問：這個模型在真實世界里驗證過嗎？他回答：你不了解這個領域的挑戰(zhàn)性。

你問：誤差范圍是多少？他回答：這是一個新范式，傳統(tǒng)評估標準不適用。

你問：有沒有失敗的實驗？他回答：Science is hard，你懂的。

于是你沉默了，因為你不想顯得無知。

? 識別手冊第一條：凡是聲稱自己的工作無法用傳統(tǒng)標準評估的人，請重點觀察。科學的本質就是可檢驗性。拒絕被評估，不是謙遜，是護身符。

二、數據的幻覺

AI for Science最迷人的武器是圖表。一條漂亮的loss曲線，一個顏色鮮艷的attention可視化，一張蛋白質結構的三維渲染。這些東西有一種天然的視覺權威感，讓人覺得有這么多數字，肯定是真的。

但很少有人問：

測試集是怎么切分的？

訓練數據和測試數據有沒有泄漏？

那個超越人類專家的baseline，是哪個人類專家，在什么條件下做的對比？

更隱蔽的問題是，他們的模型解決的是科學問題，還是科學問題的一個極度簡化的代理任務？把一個分類任務說成理解了XX的分子機制，把一個回歸模型說成發(fā)現了XX的規(guī)律，這中間有一道巨大的鴻溝，而大多數聽眾缺乏專業(yè)背景來識別這道鴻溝的存在。

他們最怕的問題只有一個：

你的模型預測了什么，然后被實驗驗證了嗎？

三、生態(tài)與激勵

不能只怪做這件事的人。整個系統(tǒng)都在激勵這種行為。

期刊需要影響因子，影響因子需要新穎性，新穎性最簡單的來源是我們第一個把大模型用在了XX問題上。投資機構需要故事，故事需要宏大愿景，宏大愿景不需要被立即驗證。學術機構需要排名，排名需要高引用，高引用來自熱門賽道的早期入場。

于是每個人都在合理地做著不合理的事。

結果是，大量計算資源、聰明的人才、寶貴的時間，被投入到了在知名數據集上多刷兩個點這件事情上。那些真正困難的科學問題，那些沒有公開數據集、沒有清晰評估標準、需要十年才能知道對不對的問題，反而無人問津，因為它們出不了論文。

他的所有論文都在同一個數據集上驗證，且這個數據集由他自己的組發(fā)布。

他總在講未來五年，從未回顧上一個未來五年承諾了什么。

他把合作者的工作歸納進自己的敘事，但從不明確貢獻比例。

他的demo永遠在最好的條件下運行，失敗案例從不出現在PPT里。

他對質疑的標準反應是，這個問題問得很好，但你可能還不太了解這個領域。

四、我們失去了什么

最大的損失不是那些沒有被驗證的論文，不是那些燒掉的GPU時間，而是被帶跑偏的期待值和被扭曲的科學文化。

當一個領域充滿了夸大其詞的聲音，真正在做嚴肅工作的人就會被淹沒。他們沒有華麗的可視化圖，沒有可以截圖發(fā)推特的demo，只有嚴謹但枯燥的實驗記錄和誠實的誤差分析。于是他們拿不到經費，找不到學生，在下一個會議上坐在角落里聽別人講那些華而不實的工作，然后繼續(xù)默默地做真正重要的事。

當然，AI for Science并非全是泡沫。AlphaFold是真實的突破，它改變了結構生物學的工作方式，有真實的實驗驗證，有可量化的影響。問題不在于AI用于科學這件事本身，而在于AlphaFold被當成了一張可以無限復制的免費門票，仿佛只要往proposal里加上大模型+XX領域，就自動獲得了改變世界的資格。

? 給你一個簡單的測試：問他，你的工作預測了什么，然后被實驗證實了？如果他滔滔不絕地講了五分鐘還沒有給出一個具體例子，你可以禮貌地看表了。一個真正在解決科學問題的人，哪怕只有一個小小的驗證案例，也會如數家珍地告訴你。空洞，才需要宏大來掩蓋。

尾聲：我們能做什么

不要讓對方用復雜性來壓制你的常識。科學的核心邏輯，假設、實驗、驗證，是樸素的，不會因為換了一個神經網絡架構就變得不適用。

問清楚對比基線是什么，問清楚失敗案例是什么，問清楚如果這個模型是錯的，你會怎么知道。這些問題不需要任何專業(yè)背景，只需要基本的誠實。

最后說一句公道話，很多做AI for Science的人，并不是有意欺騙。他們只是生活在一個系統(tǒng)性激勵了過度樂觀主義的環(huán)境里，久而久之，連自己也信了。這不是壞人的問題，這是一個文化問題。而文化問題，需要每一個參與者、問問題的人、評審論文的人、分配經費的人、寫新聞稿的人共同去糾正。

下次有人給你看一個令人嘆為觀止的AI for Science的demo，先深吸一口氣，然后微笑著問他：

那這個結論，有沒有被濕實驗室的人重復出來過？

看他的表情，你就全明白了。

本文所描述的現象為行業(yè)普遍現象之批評，并非針對任何具體個人或機構。科學進步需要樂觀主義，但也需要誠實。兩者并不矛盾。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.