網易首頁 > 網易號 > 正文申請入駐

專治AI說謊，25歲天才少女公司估值過百億

2026-04-11 12:32:53　來源: 字母榜

北京舉報

分享至

25歲的洪樂潼，最近在硅谷火了。

這個來自廣東的女孩，17歲考入MIT，三年修完數學和物理雙學位，后來又進入斯坦福深造。

按照硅谷最熟悉的那套敘事，她是“天才少女創業者”的模板人物。

但洪樂潼真正讓人記住的，不是履歷，而是她做的事太反常識。

當整個AI行業都在追逐更大的模型、更強的生成能力、更像人的表達時，她偏偏轉身去做了一件最不性感、也最難商業化的事：用數學驗證AI。

她創辦的公司叫Axiom，成立不足兩年，員工只有20多人，最近拿下2億美元A輪融資，投后估值高達16億美元，折合人民幣超110億元。

Axiom不做聊天機器人，不做文生圖，也不跟風大語言模型的熱潮。它做的是“形式化驗證”。

說白了，就是想用數學和邏輯，把AI每一步推理都變成可以檢查、可以證明、可以追責的東西。

這聽起來很冷門，但它瞄準的，卻是大模型最麻煩的軟肋——幻覺。

現在的AI最大的問題不是不夠強，而是不夠可靠。它可以把答案說得很像對的，甚至真的做對題，但你沒法確認它到底是真的推出來了，還是只是“猜對了”。而Axiom要做的，就是把這種模糊狀態，變成一種可驗證的確定性過程。

這也是為什么，當洪樂潼拿著這個想法去融資時，迎面撞上的不是掌聲，而是一個極其現實的問題：“數學怎么賺錢？”

迎難而上的天才少女

洪樂潼的辦公室在硅谷帕洛阿爾托大學大道，距離斯坦福大學步行只要半個小時。斯坦福是她博士生涯的起點，但學位還沒有念完，她就退學創業了。

事實上，早在博士在讀期間，洪樂潼就已經注冊了公司。公司取名Axiom，名字源自數學術語“公里”，“我想從公理出發，打造一個能夠自我改進的超級智能推理器。”

一個24歲的博士生，沒錢沒人沒產品，僅憑一個想法，她就拿下了960萬美元的種子輪投資。

憑什么？

要知道現有的大模型本質上是概率黑盒，通過海量數據學習模式，然后基于統計規律給出答案。推理過程無法被量化，所以會胡說、會出錯。

洪樂潼要做的就是用數學公理和形式化驗證，讓AI每一步推理都可證明，可以直接面向金融、軍工、芯片和自動駕駛等對可靠性要求極高的市場。

她做的事顯然擊中了AI 最大痛點，解決幻覺與可靠性的問題。

更何況，早期投資投人，她本人也是不折不扣的跨學科天才學霸。

洪樂潼從小就展現出了驚人的數學天賦。2001年，她出生于廣州市天河區，曾就讀于華南師大附中。高一時，她就在全國數學奧林匹克選拔賽中晉級，并在華羅庚杯、全國高中數學聯賽中屢獲佳績。

正是在奧數集訓中，她對研究型數學產生了興趣。

2018年，17歲的她被MIT錄取，3年就修完了數學和物理雙學位，不僅發表了9篇學術論文，還獲得全美女性數學家最高榮譽Alice T. Schafer數學獎等諸多榮譽。

此后，她獲得牛津大學羅德獎學金，她沒有繼續深耕數學，轉頭去學了神經科學，因為想“構建跨越科學領域的認知體系”。

基于這一目標，她同時在倫敦大學學院蓋茨比計算神經科學中心開展深度學習研究，該中心由“深度學習之父”杰弗里·辛頓聯合創立。也正是在此期間，她正式踏足AI領域，接觸到許多最前沿的課題。隨后她又進入斯坦福大學，攻讀數學與法律雙學科博士。

2024年，ChatGPT o3被曝光在數學測試中存在“作弊”嫌疑，全球輿論嘩然。

作為斯坦福數學博士的洪樂潼也在社交媒體上發表了看法：“OpenAI大模型在數學測試中表現優秀，大概率是因為訓練數據中提前泄題了。在一些測試中，大模型回答的準確率雖然高達96%，但一旦展示推理過程，得分率就降至5%。”

面對行業痛點，一種名為Lean的語言闖入她的視線，也讓她嗅到了創業機會。

與自然語言不同，Lean語言是一個非常神奇的、可以自驗證的數學編程語言。洪樂潼打了個比方：“如果用英語寫出數學證明，我沒辦法知道一個5000行的證明是否正確，需要找高水平的專家驗證。但Lean是自驗證的，只要跑通了就是對的。”

Lean的邏輯是把自然語言或非形式化驗證，轉成機器可檢查的形式化驗證。

那啥是形式化驗證呢？

普通的AI，你只能用它的答案來判斷它是不是理解這個問題，但你不知道它中間有沒有瞎蒙。

形式化驗證是要求你把每一步都寫成機器能檢查的邏輯鏈條。只要中間有一步跳了、糊了、偷懶了，它就不給過。

之所以形式化驗證能治大模型會幻覺，是因為形式化驗證不管你答案如何，只要你的結論是從前提里一步步合法推出來的，那答案就是對的，從而避免了模型產生幻覺。

所以Axiom做的，就是讓大模型負責猜想和搜索，讓Lean負責驗算和判斷。如果Lean檢查發現過程不對，那就退回去繼續改。

但這顯然是一條窄路。這條路冷門到什么程度？在整個AI版圖里，形式化驗證幾乎是邊緣中的邊緣，全球的商業化玩家一只手就數得過來。

顯然她并不是因為形式化驗證是下一個風口才選的，而是因為她對“困難”的定義和別人不一樣。

奧賽就像持續釋放多巴胺的快感，而研究型數學像在撞墻，充滿痛苦與煎熬。我其實特別喜歡這種挑戰感。”她曾這樣解釋自己癡迷數學的原因。

正是這種刻在骨子里的挑戰欲，讓她不愿再停留在學術研究的舒適區，渴望在更廣闊的戰場上去攻克AI領域的硬骨頭。

2024年深秋，斯坦福附近的一家咖啡館里，洪樂潼與當時Meta AI研究總監Shubho Sengupta聊了整整幾個小時，核心議題只有一個：AI能不能真正學會數學推理？

兩人一拍即合，一個退學，一個辭職，兩人一起創業。

一支“草根”工程師軍團

Axiom只有20多名員工，洪樂潼用了一個詞來形容團隊的氣質：草根工程師精神。

但事實上，這支團隊的成員身份一點也不草根，甚至背景堪稱豪華。

Axiom第一位成員，正是和她在咖啡館聊了好幾個小時的Meta前員工Shubho Sengupta，如今他的身份是公司的CTO。

核心科學家Fran?ois Charton，則是將Transformer架構引入數學推理領域的先驅人物。他干的活，就是把數學算式當成一種“語言”輸入進Transformer，試試看Transformer能不能像翻譯句子一樣去翻譯數學。

其他成員約半數來自Meta AI，另一半則是世界級數學家與形式化驗證先驅。

而最讓外界震驚的一位成員，是57歲的數學泰斗小野健（Ken Ono）。

他是模形式領域的頂尖學者，美國數學學會前副會長，拿過古根海姆獎、斯隆獎等榮譽。指導過的學生中有十位摩根獎得主。他還曾為美國奧運游泳隊提供數據分析，為電影《知無涯者》擔任顧問。

這位弗吉尼亞大學終身教授與洪樂潼結緣于麻省理工。彼時大一新生洪樂潼參與了他的數論項目。師生關系延續至今，角色卻已不同，2025年底，小野健辭去教職，全職加入Axiom，成為第15號員工。

曾拒絕過Google和Meta邀請的小野健，為什么愿意為一個24歲的學生“打工”？

“如果我的猜想能被機器在3天內推廣到10個維度，我愿意當一個‘標注工’。”小野健曾公開表示，他選擇幫自己的學生打工，不僅因為洪樂潼開出“不設教學、不設行政、100%科研”的合約，更關鍵的是，AI對他的“降維打擊”，讓他感到興奮。

一群頂級學者和前Meta成員，這個團隊哪里草根了？

洪樂潼的解釋是，草根，代表著始終“空杯”的心態和堅韌的品質。在創業這條路上，即使是資深“牛人”，也要從頭學起，不斷自我革新。

她自己最喜歡的不是當“精英”，而是做“草根”，做個nobody（小人物），這樣學習的坡度最陡、速度最快。

她自己也是“草根精神”的踐行者，在被問到如何帶領團隊時，洪樂潼說：“我其實不太喜歡用帶領這個詞。我希望自己是一個Individual contributor（獨立貢獻者），每個人都是，這是一群志同道合的人在一起做事。”

“我們創立Axiom，就是要無限壓縮把好奇心轉化為真理的時間”，在資本驅動的硅谷，洪樂潼的這種純粹性，對于頂尖研究者而言，或許比一份高薪offer更有吸引力。

這支不到20人的團隊，在成立后不到一年就交出了一份令人意外的答卷。

2025年12月3日，Axiom宣布其核心系統AxiomProver在無人干預的情況下，攻克了困擾數學界數十年的兩道埃爾德什難題。

同一天，洪樂潼收到了入選“福布斯30歲以下30人”榜單的消息。

同月，AxiomProver又在普特南數學競賽中斬獲滿分，12道題全對。普特南是北美最負盛名的大學生數學競賽，成績的中位數常常為零，過去近百年僅有5個人類選手拿到過滿分。

Axiom進一步印證了用形式化驗證構建可靠、可核驗、無幻覺的AI，已是行業明確的重要方向，而 AxiomProver 則在這條路徑上交出了可復現、高難度的實證。

賽道升溫，但挑戰剛剛開始

從行業發展來看，洪樂潼的選擇正好踩在了技術轉折點上。

2024年年底，Meta FAIR和斯坦福大學等多所機構聯合發布了一篇立場論文《Formal Mathematical Reasoning: A New Frontier in AI》。

論文給出了這樣一個判斷，過去的AI數學就是喂很多數學題，再讓模型輸出答案。這就導致數據會污染、過程會胡編，AI沒辦法自判斷對錯，并且還很難復現過程。

這顯然是路走錯了。就拿乘法口訣表來說，里面寫的是2*3得6，那么你自己也能理解3*2就也得6。這個過程就叫復現。

論文主張的是下一步要把證明助手、形式系統、自動驗證真正接進模型里來，讓AI真正懂數學。

但這也意味著這條窄路正在變得擁擠。

過去十年，AI賽道的主流敘事是“更大參數、更多數據、更快生成”，所有大公司都在這條路上狂奔。洪樂潼選擇的形式化驗證是其中冷門到幾乎沒有競爭的賽道。

今年年初，Meta也發布了半形式化推理技術，讓大語言模型能夠在不執行代碼的情況下驗證代碼補丁，準確率高達93%。競品公司Harmonic在今年1月獲得了英偉達投資，估值達14.5億美元，產品已擴展到代碼編寫和芯片設計領域。Theorem、Axiomatic AI、Cajal等一批初創公司，也在近兩年紛紛進入這個賽道。

對Axiom而言，挑戰遠不止行業競爭。

最大的挑戰在于商業模式。洪樂潼最初的設想是將產品服務于對沖基金和量化交易公司，快速解決與資產定價、股市預測相關的復雜數學問題。

但這個藍圖至今仍停留在構想階段。對高頻交易而言，比“正確”更重要的是“足夠快”，毫秒級的延遲可能比一次罕見錯誤帶來更大損失。

Axiom的絕對正確性，在追求速度的金融場景中，其實際價值目前仍需要打一個問號。另一個挑戰，則在于除了對價格不敏感的航空航天、國防軍工等少數領域，其他絕大多數企業愿意為“絕對正確”支付高溢價嗎？

洪樂潼自己也承認這一點：“數學怎么賺錢？我們從一開始就面臨這個挑戰。”但她認為，“現在，商業信號已經清晰很多，數學能創造價值，是因為它能自我驗證、自我檢查。”

另一方面，高估值本身也是一把雙刃劍。16億美元的A輪估值意味著，投資人期望的是超高速的增長和明確的退出路徑。

Axiom必須在未來一到兩年內證明其技術具備規模化商業化的可能，否則下一輪融資將面臨巨大壓力。與此同時，它需要在巨頭和強勁對手的夾擊中，用更少的資源跑出更快的速度。

Axiom的未來，更像是一場理想主義的壓力測試。從“絕對正確”的技術理想，到“相對經濟”的商業世界，Axiom的挑戰，才剛剛開始。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.