3月18日,據新浪科技消息,日本樂天集團(Rakuten)近日高調發布了號稱“日本最大、性能最強”的7000億參數大模型Rakuten AI 3.0。該模型發布后迅速引發日本X平臺熱議,但隨后被開源社區扒出其底層架構實為中國的DeepSeek-V3,樂天僅進行了日文數據微調。
在Hugging Face開源庫中,Rakuten AI 3.0的配置文件赫然寫著架構來自DeepSeek V3。然而在官方新聞稿中,樂天僅含糊表示“融合了開源社區精華”,未提及DeepSeek相關信息。更嚴重的是,樂天在開源時刪除了DeepSeek的MIT開源協議文件,試圖以Apache 2.0協議掩蓋事實。
在被社區實錘后,樂天被迫在項目中重新補上了一份名為“NOTICE”的授權文件。
據悉,Rakuten AI 3.0擁有約7000億參數,實為671B總參數、激活37B的混合專家(MoE)模型。其首席AI官Ting Cai曾在美國Google、蘋果及微軟工作。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.