337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

中科院團(tuán)隊(duì)提出SparseRL,深度強(qiáng)化學(xué)習(xí)可自動(dòng)生成高性能CUDA代碼

0
分享至



如何讓 AI 不僅寫出「能跑」的代碼,還能寫出「跑得快」的代碼?這個(gè)問題困擾了 AI 系統(tǒng)研究者很久。

近日,中科院計(jì)算所團(tuán)隊(duì)提出了一種名為 SparseRL 的新框架,首次將深度強(qiáng)化學(xué)習(xí)引入稀疏 CUDA 代碼生成任務(wù)。簡單來說,就是讓 AI 學(xué)會(huì)根據(jù)稀疏矩陣的結(jié)構(gòu),自動(dòng)生成最優(yōu)的 CUDA 實(shí)現(xiàn)代碼。

實(shí)驗(yàn)顯示,在經(jīng)典的 SpMV 任務(wù)上,這種方法能讓編譯成功率提升 20%,代碼執(zhí)行速度提升 30%。

目前,該項(xiàng)成果已入選 ICLR 2026 Oral。



  • 論文地址:https://openreview.net/pdf?id=VdLEaGPYWT
  • 代碼鏈接:https://github.com/QiWu-NCIC/SparseRL

為什么稀疏代碼這么難寫?

要理解這項(xiàng)工作的價(jià)值,得先說說稀疏矩陣運(yùn)算的特殊性。

稀疏矩陣在 LLM 推理、圖神經(jīng)網(wǎng)絡(luò)、科學(xué)計(jì)算中無處不在。但和稠密矩陣不同,稀疏矩陣的非零元素分布是不規(guī)則的,這導(dǎo)致一個(gè)核心問題:最優(yōu)的 CUDA 代碼實(shí)現(xiàn)取決于矩陣的具體結(jié)構(gòu),而這個(gè)結(jié)構(gòu)只有在運(yùn)行時(shí)才能知道。

換句話說,沒有一種「萬能」的高性能實(shí)現(xiàn)能應(yīng)對(duì)所有稀疏矩陣。工程師們不得不針對(duì)不同的稀疏模式手動(dòng)調(diào)優(yōu),這個(gè)過程既耗時(shí)又依賴經(jīng)驗(yàn)。

現(xiàn)有的 AI 代碼生成方法也幫不上太大忙。原因有三:

  • 第一,傳統(tǒng)監(jiān)督學(xué)習(xí)只關(guān)心代碼「對(duì)不對(duì)」,不關(guān)心「快不快」。同一個(gè)稀疏矩陣可能有多種正確的 CUDA 實(shí)現(xiàn),但執(zhí)行速度可能相差數(shù)倍,監(jiān)督學(xué)習(xí)無法區(qū)分這種差異。
  • 第二,執(zhí)行效率這個(gè)核心指標(biāo)是「不可微」的,沒法通過傳統(tǒng)的反向傳播來優(yōu)化。
  • 第三,稀疏矩陣的輸入(行列索引序列)和 CUDA 代碼之間存在巨大的語義鴻溝,模型很難理解矩陣結(jié)構(gòu)和最優(yōu)代碼策略之間的關(guān)聯(lián)。



圖片 1:展示不同稀疏矩陣需要不同 CUDA 實(shí)現(xiàn)策略的示例

SparseRL 怎么做到的?

研究團(tuán)隊(duì)的思路很巧妙:既然執(zhí)行效率不可微,那就用強(qiáng)化學(xué)習(xí)來優(yōu)化。

SparseRL 把預(yù)訓(xùn)練語言模型當(dāng)作一個(gè)策略網(wǎng)絡(luò),每生成一個(gè) token 就是一次動(dòng)作,而代碼的編譯結(jié)果和執(zhí)行時(shí)間就是獎(jiǎng)勵(lì)信號(hào)。

整個(gè)訓(xùn)練過程分為三個(gè)階段:

  • 第一階段是預(yù)訓(xùn)練:在大量 CUDA 代碼語料上訓(xùn)練語言模型,讓它建立對(duì) GPU 編程的基礎(chǔ)認(rèn)知;
  • 第二階段是監(jiān)督微調(diào):用「稀疏矩陣 - 正確代碼」的配對(duì)數(shù)據(jù)教模型生成語法正確、功能正確的代碼;
  • 第三階段是強(qiáng)化學(xué)習(xí)優(yōu)化:這一步是關(guān)鍵 —— 引入深度強(qiáng)化學(xué)習(xí),以編譯正確性和執(zhí)行效率為獎(jiǎng)勵(lì),讓模型學(xué)會(huì)生成高性能代碼。



圖片 2:展示三階段訓(xùn)練流程的整體框架圖

為了讓模型真正「看懂」稀疏矩陣的結(jié)構(gòu),研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)關(guān)鍵技術(shù):正弦位置嵌入。

稀疏矩陣的輸入是非零元素的行列索引序列,傳統(tǒng)的 token 嵌入無法捕捉這種二維坐標(biāo)之間的空間關(guān)系。SparseRL 對(duì)行列索引分別進(jìn)行正弦 / 余弦編碼,類似于 Transformer 的位置編碼,但專門針對(duì)二維坐標(biāo)做了定制。

用通俗的話說,這就像給模型裝上了一副「坐標(biāo)眼鏡」,讓它能看見非零元素在哪里、是怎么分布的。

另一個(gè)核心創(chuàng)新是層級(jí)獎(jiǎng)勵(lì)函數(shù)。這個(gè)獎(jiǎng)勵(lì)函數(shù)同時(shí)考慮兩個(gè)層面:正確性獎(jiǎng)勵(lì)確保代碼能編譯、結(jié)果正確;效率獎(jiǎng)勵(lì)則優(yōu)化執(zhí)行速度。設(shè)計(jì)邏輯是先保證「對(duì)」,再追求「快」。

效果如何?

研究團(tuán)隊(duì)在 SpMV(稀疏矩陣 - 向量乘法)和 SpMM(稀疏矩陣 - 稠密矩陣乘法)兩個(gè)任務(wù)上驗(yàn)證了方法的有效性。

在 SpMV 任務(wù)上,SparseRL 相比傳統(tǒng)監(jiān)督學(xué)習(xí)方法,編譯成功率提升了 20%,平均執(zhí)行速度提升了 30%。更重要的是,模型能根據(jù)不同的稀疏結(jié)構(gòu)自動(dòng)選擇不同的代碼策略,在對(duì)角型、帶狀型、隨機(jī)稀疏型等多種矩陣上都有優(yōu)勢,部分場景下生成的代碼甚至接近或超越了手工調(diào)優(yōu)的水平。



圖片 3:展示 SparseRL 與基線方法的差距

團(tuán)隊(duì)還做了消融實(shí)驗(yàn)來驗(yàn)證各個(gè)組件的必要性。

結(jié)果顯示,去掉 RL 階段后性能顯著下降,說明強(qiáng)化學(xué)習(xí)確實(shí)是關(guān)鍵;去掉正弦嵌入后模型難以理解輸入結(jié)構(gòu),編譯率下降;只用正確性獎(jiǎng)勵(lì)而不用效率獎(jiǎng)勵(lì),代碼能跑但不夠快。

當(dāng)然,這個(gè)方法也有局限。論文提到,RL 訓(xùn)練需要大量的編譯 - 執(zhí)行反饋循環(huán),計(jì)算成本較高;模型是針對(duì)特定 GPU 架構(gòu)訓(xùn)練的,遷移到新硬件可能需要重新微調(diào);生成的代碼可能缺乏人類工程師的編碼風(fēng)格,可解釋性不足。

意義與展望

SparseRL 的價(jià)值在于它代表了一個(gè)范式轉(zhuǎn)變:代碼生成的目標(biāo)從「生成能運(yùn)行的代碼」轉(zhuǎn)向「生成高性能代碼」。

對(duì)于 HPC 工程師和 AI 基礎(chǔ)設(shè)施開發(fā)者來說,這項(xiàng)工作展示了一種新可能 ——讓 AI 來處理那些繁瑣的性能優(yōu)化工作,而人類可以把精力放在更高層次的設(shè)計(jì)上。

研究團(tuán)隊(duì)表示,未來計(jì)劃將方法擴(kuò)展到多 GPU 分布式稀疏計(jì)算,探索與傳統(tǒng) AutoTuning 技術(shù)的結(jié)合,并支持更多類型的稀疏算子。同時(shí),他們也在研究如何降低 RL 訓(xùn)練成本,讓這種方法更實(shí)用。

作者介紹

王耀宇,中國科學(xué)院計(jì)算技術(shù)研究所博士生(共同一作),主要研究方向?yàn)樯疃葘W(xué)習(xí)編譯優(yōu)化與高性能計(jì)算。

譚光明,中國科學(xué)院計(jì)算技術(shù)研究所研究員、博士生導(dǎo)師,主要從事高性能計(jì)算、GPU 編譯優(yōu)化與深度學(xué)習(xí)系統(tǒng)研究,在多 GPU 分布式計(jì)算、稀疏矩陣計(jì)算、深度學(xué)習(xí)編譯器等領(lǐng)域取得多項(xiàng)重要成果,發(fā)表多篇高性能計(jì)算與機(jī)器學(xué)習(xí)相關(guān)論文。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
快訊!巴鐵徹底折服了!

快訊!巴鐵徹底折服了!

達(dá)文西看世界
2026-03-25 10:02:08
心梗去世逐年增多?醫(yī)生:牢記“3不喝、2不吃、1堅(jiān)持”,別大意

心梗去世逐年增多?醫(yī)生:牢記“3不喝、2不吃、1堅(jiān)持”,別大意

袁醫(yī)生課堂
2026-01-24 17:33:06
俄國家杜馬國防委員會(huì)副主席尤里·什維特金因不明原因去世

俄國家杜馬國防委員會(huì)副主席尤里·什維特金因不明原因去世

山河路口
2026-03-24 17:13:44
越南領(lǐng)導(dǎo)層權(quán)力“大洗牌”,新任總理是哪一派人馬很關(guān)鍵

越南領(lǐng)導(dǎo)層權(quán)力“大洗牌”,新任總理是哪一派人馬很關(guān)鍵

牛鍋巴小釩
2026-03-25 16:04:26
有人提議:中國可參考俄羅斯做法,不允許日本民航飛機(jī)過境中領(lǐng)空

有人提議:中國可參考俄羅斯做法,不允許日本民航飛機(jī)過境中領(lǐng)空

南權(quán)先生
2026-03-25 15:30:44
新消息!伊朗突然宣布了!

新消息!伊朗突然宣布了!

達(dá)文西看世界
2026-03-23 20:29:16
油價(jià)一夜突變!3月25日全國油價(jià)調(diào)整后92/95汽油價(jià)格、0號(hào)柴油價(jià)格最新公布

油價(jià)一夜突變!3月25日全國油價(jià)調(diào)整后92/95汽油價(jià)格、0號(hào)柴油價(jià)格最新公布

沙雕小琳琳
2026-03-25 15:38:00
青島市市場監(jiān)督管理局原一級(jí)巡視員孫利國接受紀(jì)律審查和監(jiān)察調(diào)查

青島市市場監(jiān)督管理局原一級(jí)巡視員孫利國接受紀(jì)律審查和監(jiān)察調(diào)查

半島官網(wǎng)
2026-03-25 17:24:09
河南街頭用頭撞車事件,警方回應(yīng)后續(xù)來了!評(píng)論區(qū)徹底炸鍋

河南街頭用頭撞車事件,警方回應(yīng)后續(xù)來了!評(píng)論區(qū)徹底炸鍋

奇思妙想草葉君
2026-03-25 13:12:39
曝張雪峰3段婚姻都是閃婚,前妻緬懷滿是惋惜,瘋狂健身疑為備孕

曝張雪峰3段婚姻都是閃婚,前妻緬懷滿是惋惜,瘋狂健身疑為備孕

慢歌輕步謠
2026-03-26 00:15:02
成都世遺馬拉松一女子賽道擺拍“一字馬”,險(xiǎn)絆倒后方選手!組委會(huì):取消成績、2027年禁賽

成都世遺馬拉松一女子賽道擺拍“一字馬”,險(xiǎn)絆倒后方選手!組委會(huì):取消成績、2027年禁賽

大象新聞
2026-03-25 17:53:10
金價(jià)銀價(jià),突然飆升

金價(jià)銀價(jià),突然飆升

環(huán)球網(wǎng)資訊
2026-03-25 10:53:11
山東大勝20分!廣東狂勝42分!遼寧輸7分,上海贏32分,排名大變

山東大勝20分!廣東狂勝42分!遼寧輸7分,上海贏32分,排名大變

老吳說體育
2026-03-25 21:52:52
以色列終于破防,伊朗打出開戰(zhàn)以來最大規(guī)模傷害!

以色列終于破防,伊朗打出開戰(zhàn)以來最大規(guī)模傷害!

戰(zhàn)爭史
2026-03-24 11:40:07
曾因污言穢語被封禁的張雪峰,憑什么讓鄭大悼念,新華社發(fā)訃告?

曾因污言穢語被封禁的張雪峰,憑什么讓鄭大悼念,新華社發(fā)訃告?

觀察者海風(fēng)
2026-03-25 22:10:33
2-2泰國,2人表現(xiàn)亮眼,1人不受主帥待見,球迷:山東泰山好幸福

2-2泰國,2人表現(xiàn)亮眼,1人不受主帥待見,球迷:山東泰山好幸福

我就是一個(gè)說球的
2026-03-25 22:19:57
主場32分慘敗上海!山西主帥:這是我接隊(duì)以來,打得最差一場比賽

主場32分慘敗上海!山西主帥:這是我接隊(duì)以來,打得最差一場比賽

狼叔評(píng)論
2026-03-25 23:58:05
俄羅斯宣傳三天攻占愛沙尼亞!炮制公投,又是特別軍事行動(dòng)?

俄羅斯宣傳三天攻占愛沙尼亞!炮制公投,又是特別軍事行動(dòng)?

項(xiàng)鵬飛
2026-03-24 20:28:43
沈萬三臨終告誡:尋財(cái)無需高深本領(lǐng),牢記這三句話,輕松富甲一方

沈萬三臨終告誡:尋財(cái)無需高深本領(lǐng),牢記這三句話,輕松富甲一方

千秋文化
2026-02-10 21:02:09
美容院老板娘大實(shí)話:55歲后臉再光也沒用,脫了衣服見真章!

美容院老板娘大實(shí)話:55歲后臉再光也沒用,脫了衣服見真章!

距離距離
2026-03-25 16:53:55
2026-03-26 03:40:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12598文章數(shù) 142593關(guān)注度
往期回顧 全部

科技要聞

紅極一時(shí)卻草草收?qǐng)觯琒ora宣布正式關(guān)停

頭條要聞

伊朗:正在搜捕逃亡美軍

頭條要聞

伊朗:正在搜捕逃亡美軍

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰遺產(chǎn)分割復(fù)雜!是否立遺囑成關(guān)鍵

財(cái)經(jīng)要聞

管濤:中東局勢如何影響人民幣匯率走勢?

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實(shí)力

態(tài)度原創(chuàng)

本地
親子
手機(jī)
數(shù)碼
公開課

本地新聞

來永泰同安 赴一場春天的約會(huì)

親子要聞

11歲侄女發(fā)育過快引發(fā)關(guān)注,醫(yī)生提醒未必是好事

手機(jī)要聞

Bigme大我HiBreak Plus彩墨屏手寫手機(jī)亮相,預(yù)售價(jià)1699元

數(shù)碼要聞

英特爾發(fā)布基于第三代酷睿Ultra處理器vPro平臺(tái)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版