![]()
來源:揚子晚報、紫牛新聞、募格學術
近日,中國人工智能公司月之暗面(Moonshot AI)的Kimi團隊發表一篇重磅論文,極大提升了AI大模型的效率,在AI界引發震動。
![]()
這篇論文的集合了月之暗面數十名研究員的智慧,對項目貢獻最突出的三位研究員分別是陳光宇、Yu Zhang以及 Jianlin Su。其中,值得注意的是,第一作者陳廣宇是一名年僅 17 歲、加入團隊僅 5 個月的高三學生,他雖然還未高中畢業,已經擁有數段驕人經歷。
而陳廣宇表示,Kimi團隊成員對這篇論文都有貢獻,希望不要只關注個人。
![]()
月之暗面是2023年3月成立的AI企業,由清華校友楊植麟等創立,核心產品Kimi大模型在國際榜單上多次挑戰GPT-4/Claude等大模型,被譽為中國“AI四小虎”之一。
Kimi團隊的這篇論文對AI大模型的底層架構進行改進,算力效率提升1.25倍。該研究對AI界影響很大,馬斯克評論這個論文時說:“Kimi的工作令人印象深刻。”
![]()
論文第一作者陳廣宇是深圳一所國際學校的高三學生,預計今年6月畢業。其社交媒體信息顯示,他已擁有頂尖競技編程背景,參加過美國計算機奧林匹克競賽鉑金組比賽,在Kimi內部拿下48小時“黑客馬拉松”比賽冠軍。
從2025年11月至今,陳廣宇在Kimi擔任機器學習研究員,參與中國最頂尖的開源大模型的核心研發,已經從“學生”變成“一線貢獻者”。
![]()
此前,陳廣宇入選羅德信托的高潛力未來領袖計劃,這是面向全球15–17歲潛力青年的選拔計劃,他還在美國頂尖小型實驗室Tilde Research做過AI研究。
對陳廣宇而言,17歲以第一作者身份主導Kimi這樣頂級獨角獸的核心架構論文,堪稱“硅谷震動級”事件,也讓全球AI圈注意到“中國高中生已經在做前沿架構創新”。
Kimi官方和陳廣宇都強調,這項研究是一個團隊工作。
陳廣宇說,這樣的論文不太可能由一個人寫出來,kimi的成員都有投入,論文署名的前三位作者做出的都是同等貢獻。
論文鏈接:
https://github.com/MoonshotAI/Attention-Residuals/blob/master/Attention_Residuals.pdf
點擊圖片跳轉至CAIE官方公眾號,加入CAIE CLUB有償志愿者團隊
你的所知所想,賦能更多人前行
為學者在職者提供硬通貨和AI+知識賦能經管文庫,實現知識變現
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.