![]()
25歲的洪樂潼,最近在硅谷火了。
這個來自廣東的女孩,17歲考入MIT,三年修完數學和物理雙學位,后來又進入斯坦福深造。
按照硅谷最熟悉的那套敘事,她是“天才少女創業者”的模板人物。
但洪樂潼真正讓人記住的,不是履歷,而是她做的事太反常識。
當整個AI行業都在追逐更大的模型、更強的生成能力、更像人的表達時,她偏偏轉身去做了一件最不性感、也最難商業化的事:用數學驗證AI。
她創辦的公司叫Axiom,成立不足兩年,員工只有20多人,最近拿下2億美元A輪融資,投后估值高達16億美元,折合人民幣超110億元。
Axiom不做聊天機器人,不做文生圖,也不跟風大語言模型的熱潮。它做的是“形式化驗證”。
說白了,就是想用數學和邏輯,把AI每一步推理都變成可以檢查、可以證明、可以追責的東西。
這聽起來很冷門,但它瞄準的,卻是大模型最麻煩的軟肋——幻覺。
現在的AI最大的問題不是不夠強,而是不夠可靠。它可以把答案說得很像對的,甚至真的做對題,但你沒法確認它到底是真的推出來了,還是只是“猜對了”。而Axiom要做的,就是把這種模糊狀態,變成一種可驗證的確定性過程。
這也是為什么,當洪樂潼拿著這個想法去融資時,迎面撞上的不是掌聲,而是一個極其現實的問題:“數學怎么賺錢?”
01
迎難而上的天才少女
洪樂潼的辦公室在硅谷帕洛阿爾托大學大道,距離斯坦福大學步行只要半個小時。斯坦福是她博士生涯的起點,但學位還沒有念完,她就退學創業了。
事實上,早在博士在讀期間,洪樂潼就已經注冊了公司。公司取名Axiom,名字源自數學術語“公里”,“我想從公理出發,打造一個能夠自我改進的超級智能推理器。”
![]()
一個24歲的博士生,沒錢沒人沒產品,僅憑一個想法,她就拿下了960萬美元的種子輪投資。
憑什么?
要知道現有的大模型本質上是概率黑盒,通過海量數據學習模式,然后基于統計規律給出答案。推理過程無法被量化,所以會胡說、會出錯。
洪樂潼要做的就是用數學公理和形式化驗證,讓AI每一步推理都可證明,可以直接面向金融、軍工、芯片和自動駕駛等對可靠性要求極高的市場。
她做的事顯然擊中了AI 最大痛點,解決幻覺與可靠性的問題。
更何況,早期投資投人,她本人也是不折不扣的跨學科天才學霸。
洪樂潼從小就展現出了驚人的數學天賦。2001年,她出生于廣州市天河區,曾就讀于華南師大附中。高一時,她就在全國數學奧林匹克選拔賽中晉級,并在華羅庚杯、全國高中數學聯賽中屢獲佳績。
正是在奧數集訓中,她對研究型數學產生了興趣。
2018年,17歲的她被MIT錄取,3年就修完了數學和物理雙學位,不僅發表了9篇學術論文,還獲得全美女性數學家最高榮譽Alice T. Schafer數學獎等諸多榮譽。
此后,她獲得牛津大學羅德獎學金,她沒有繼續深耕數學,轉頭去學了神經科學,因為想“構建跨越科學領域的認知體系”。
基于這一目標,她同時在倫敦大學學院蓋茨比計算神經科學中心開展深度學習研究,該中心由“深度學習之父”杰弗里·辛頓聯合創立。也正是在此期間,她正式踏足AI領域,接觸到許多最前沿的課題。隨后她又進入斯坦福大學,攻讀數學與法律雙學科博士。
2024年,ChatGPT o3被曝光在數學測試中存在“作弊”嫌疑,全球輿論嘩然。
作為斯坦福數學博士的洪樂潼也在社交媒體上發表了看法:“OpenAI大模型在數學測試中表現優秀,大概率是因為訓練數據中提前泄題了。在一些測試中,大模型回答的準確率雖然高達96%,但一旦展示推理過程,得分率就降至5%。”
面對行業痛點,一種名為Lean的語言闖入她的視線,也讓她嗅到了創業機會。
與自然語言不同,Lean語言是一個非常神奇的、可以自驗證的數學編程語言。洪樂潼打了個比方:“如果用英語寫出數學證明,我沒辦法知道一個5000行的證明是否正確,需要找高水平的專家驗證。但Lean是自驗證的,只要跑通了就是對的。”
Lean的邏輯是把自然語言或非形式化驗證,轉成機器可檢查的形式化驗證。
那啥是形式化驗證呢?
普通的AI,你只能用它的答案來判斷它是不是理解這個問題,但你不知道它中間有沒有瞎蒙。
形式化驗證是要求你把每一步都寫成機器能檢查的邏輯鏈條。只要中間有一步跳了、糊了、偷懶了,它就不給過。
之所以形式化驗證能治大模型會幻覺,是因為形式化驗證不管你答案如何,只要你的結論是從前提里一步步合法推出來的,那答案就是對的,從而避免了模型產生幻覺。
所以Axiom做的,就是讓大模型負責猜想和搜索,讓Lean負責驗算和判斷。如果Lean檢查發現過程不對,那就退回去繼續改。
但這顯然是一條窄路。這條路冷門到什么程度?在整個AI版圖里,形式化驗證幾乎是邊緣中的邊緣,全球的商業化玩家一只手就數得過來。
顯然她并不是因為形式化驗證是下一個風口才選的,而是因為她對“困難”的定義和別人不一樣。
奧賽就像持續釋放多巴胺的快感,而研究型數學像在撞墻,充滿痛苦與煎熬。我其實特別喜歡這種挑戰感。”她曾這樣解釋自己癡迷數學的原因。
正是這種刻在骨子里的挑戰欲,讓她不愿再停留在學術研究的舒適區,渴望在更廣闊的戰場上去攻克AI領域的硬骨頭。
2024年深秋,斯坦福附近的一家咖啡館里,洪樂潼與當時Meta AI研究總監Shubho Sengupta聊了整整幾個小時,核心議題只有一個:AI能不能真正學會數學推理?
兩人一拍即合,一個退學,一個辭職,兩人一起創業。
02
一支“草根”工程師軍團
Axiom只有20多名員工,洪樂潼用了一個詞來形容團隊的氣質:草根工程師精神。
但事實上,這支團隊的成員身份一點也不草根,甚至背景堪稱豪華。
Axiom第一位成員,正是和她在咖啡館聊了好幾個小時的Meta前員工Shubho Sengupta,如今他的身份是公司的CTO。
核心科學家Fran?ois Charton,則是將Transformer架構引入數學推理領域的先驅人物。他干的活,就是把數學算式當成一種“語言”輸入進Transformer,試試看Transformer能不能像翻譯句子一樣去翻譯數學。
其他成員約半數來自Meta AI,另一半則是世界級數學家與形式化驗證先驅。
而最讓外界震驚的一位成員,是57歲的數學泰斗小野健(Ken Ono)。
他是模形式領域的頂尖學者,美國數學學會前副會長,拿過古根海姆獎、斯隆獎等榮譽。指導過的學生中有十位摩根獎得主。他還曾為美國奧運游泳隊提供數據分析,為電影《知無涯者》擔任顧問。
這位弗吉尼亞大學終身教授與洪樂潼結緣于麻省理工。彼時大一新生洪樂潼參與了他的數論項目。師生關系延續至今,角色卻已不同,2025年底,小野健辭去教職,全職加入Axiom,成為第15號員工。
曾拒絕過Google和Meta邀請的小野健,為什么愿意為一個24歲的學生“打工”?
“如果我的猜想能被機器在3天內推廣到10個維度,我愿意當一個‘標注工’。”小野健曾公開表示,他選擇幫自己的學生打工,不僅因為洪樂潼開出“不設教學、不設行政、100%科研”的合約,更關鍵的是,AI對他的“降維打擊”,讓他感到興奮。
一群頂級學者和前Meta成員,這個團隊哪里草根了?
洪樂潼的解釋是,草根,代表著始終“空杯”的心態和堅韌的品質。在創業這條路上,即使是資深“牛人”,也要從頭學起,不斷自我革新。
她自己最喜歡的不是當“精英”,而是做“草根”,做個nobody(小人物),這樣學習的坡度最陡、速度最快。
她自己也是“草根精神”的踐行者,在被問到如何帶領團隊時,洪樂潼說:“我其實不太喜歡用帶領這個詞。我希望自己是一個Individual contributor(獨立貢獻者),每個人都是,這是一群志同道合的人在一起做事。”
“我們創立Axiom,就是要無限壓縮把好奇心轉化為真理的時間”,在資本驅動的硅谷,洪樂潼的這種純粹性,對于頂尖研究者而言,或許比一份高薪offer更有吸引力。
這支不到20人的團隊,在成立后不到一年就交出了一份令人意外的答卷。
2025年12月3日,Axiom宣布其核心系統AxiomProver在無人干預的情況下,攻克了困擾數學界數十年的兩道埃爾德什難題。
同一天,洪樂潼收到了入選“福布斯30歲以下30人”榜單的消息。
同月,AxiomProver又在普特南數學競賽中斬獲滿分,12道題全對。普特南是北美最負盛名的大學生數學競賽,成績的中位數常常為零,過去近百年僅有5個人類選手拿到過滿分。
Axiom進一步印證了用形式化驗證構建可靠、可核驗、無幻覺的AI,已是行業明確的重要方向,而 AxiomProver 則在這條路徑上交出了可復現、高難度的實證。
03
賽道升溫,但挑戰剛剛開始
從行業發展來看,洪樂潼的選擇正好踩在了技術轉折點上。
2024年年底,Meta FAIR和斯坦福大學等多所機構聯合發布了一篇立場論文《Formal Mathematical Reasoning: A New Frontier in AI》。
論文給出了這樣一個判斷,過去的AI數學就是喂很多數學題,再讓模型輸出答案。這就導致數據會污染、過程會胡編,AI沒辦法自判斷對錯,并且還很難復現過程。
這顯然是路走錯了。就拿乘法口訣表來說,里面寫的是2*3得6,那么你自己也能理解3*2就也得6。這個過程就叫復現。
論文主張的是下一步要把證明助手、形式系統、自動驗證真正接進模型里來,讓AI真正懂數學。
![]()
但這也意味著這條窄路正在變得擁擠。
過去十年,AI賽道的主流敘事是“更大參數、更多數據、更快生成”,所有大公司都在這條路上狂奔。洪樂潼選擇的形式化驗證是其中冷門到幾乎沒有競爭的賽道。
今年年初,Meta也發布了半形式化推理技術,讓大語言模型能夠在不執行代碼的情況下驗證代碼補丁,準確率高達93%。競品公司Harmonic在今年1月獲得了英偉達投資,估值達14.5億美元,產品已擴展到代碼編寫和芯片設計領域。Theorem、Axiomatic AI、Cajal等一批初創公司,也在近兩年紛紛進入這個賽道。
對Axiom而言,挑戰遠不止行業競爭。
最大的挑戰在于商業模式。洪樂潼最初的設想是將產品服務于對沖基金和量化交易公司,快速解決與資產定價、股市預測相關的復雜數學問題。
但這個藍圖至今仍停留在構想階段。對高頻交易而言,比“正確”更重要的是“足夠快”,毫秒級的延遲可能比一次罕見錯誤帶來更大損失。
Axiom的絕對正確性,在追求速度的金融場景中,其實際價值目前仍需要打一個問號。另一個挑戰,則在于除了對價格不敏感的航空航天、國防軍工等少數領域,其他絕大多數企業愿意為“絕對正確”支付高溢價嗎?
洪樂潼自己也承認這一點:“數學怎么賺錢?我們從一開始就面臨這個挑戰。”但她認為,“現在,商業信號已經清晰很多,數學能創造價值,是因為它能自我驗證、自我檢查。”
另一方面,高估值本身也是一把雙刃劍。16億美元的A輪估值意味著,投資人期望的是超高速的增長和明確的退出路徑。
Axiom必須在未來一到兩年內證明其技術具備規模化商業化的可能,否則下一輪融資將面臨巨大壓力。與此同時,它需要在巨頭和強勁對手的夾擊中,用更少的資源跑出更快的速度。
Axiom的未來,更像是一場理想主義的壓力測試。 從“絕對正確”的技術理想,到“相對經濟”的商業世界,Axiom的挑戰,才剛剛開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.