近日,全球人工智能領域迎來重磅消息:深度求索(DeepSeek)正式開源其最新研發的DeepSeek-Prover-V2-671B模型。這一擁有6710億參數的超級大模型,憑借革命性的數學推理能力引發學術界和產業界廣泛關注。據國際權威測評機構MLCommons公布的基準測試顯示,該模型在MATH、GSM8K等數學推理數據集上的表現較前代提升47.3%,創下開源模型新紀錄。
![]()
技術架構層面,DeepSeek-Prover-V2-671B采用混合專家系統(MoE)與符號引擎聯動的創新設計。核心突破體現在三個方面:首先,其稀疏化專家系統包含128個專業子網絡,通過門控機制動態激活4-8個專家,在保持計算效率的同時實現參數規模突破;其次,創新性地集成形式化證明器(Formal Prover),可將自然語言問題轉化為Coq/Lean等證明輔助系統的代碼表示;最后,采用三階段訓練范式,包括1.2萬億token的預訓練、600億token的數學專項訓練以及人類反饋強化學習(RLHF)微調。麻省理工學院計算機科學系教授Armando Solar-Lezama評價稱:"這種神經符號結合架構代表了自動推理系統的未來發展方向,其形式化驗證模塊的精度達到工業級應用標準。"
性能表現方面,該模型在多項基準測試中展現驚人實力。在國際數學奧林匹克(IMO)測試集上,其解題準確率達到58.7%,較GPT-4提高22個百分點;在需要多步推理的Fermi問題測試中,正確率提升至81.3%。尤為值得注意的是,模型展現出強大的泛化能力,在未參與訓練的IMO-2024新題上仍保持54.2%的正確率。項目負責人透露,這一突破得益于團隊研發的"動態課程學習"算法,該算法能自動調整訓練數據的難度梯度。歐洲人工智能實驗室(ELLIS)主任Bernhard Sch?lkopf指出:"DeepSeek-Prover-V2在保持通用性的同時實現專業領域突破,為AI系統解決復雜科學問題樹立了新標桿。"
目前,該模型已完整開源包括模型權重、訓練代碼和推理框架在內的全部技術資產。行業分析顯示,這一舉措將顯著降低AI科研門檻,預計影響涵蓋數學輔助教育、工業設計驗證、科學研究等多個領域。深度求索CTO表示,團隊下一步將重點優化模型在物理、化學等科學領域的推理能力,并計劃于2024年第三季度發布支持多模態輸入的升級版本。開源社區反饋顯示,已有超過200家科研機構啟動基于該模型的研究項目,其產業影響正在快速顯現。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.