通信世界網消息(CWW)當AI大模型參數邁向萬億級,萬卡乃至十萬卡級智算集群成為行業標配,網絡通信不再是簡單的數據通道,而是決定算力效率的核心大動脈。
3月12日,中科曙光正式發布首款全棧自研400G無損高速網絡——scaleFabric,實現國產高端原生RDMA技術重大突破,一舉填補國內超大規模智算互聯領域的空白。
![]()
這款從底層芯片到上層軟件100%自主研發的產品,不僅性能比肩國際頂尖水平,更讓中國智算產業擺脫了高端高速網絡的“卡脖子”困境,為國家算力基礎設施安全筑牢了技術根基。
網絡成智算互聯致命短板
AI大模型的飛速發展,讓智算集群的規模不斷突破,萬卡級已成主流,十萬卡級成為未來發展方向。但一個殘酷的現實是,大規模分布式訓練中,網絡通信耗時占比已達到30-50%,網絡性能直接決定了算力系統的實際效能。
“計算決定了計算系統性能的上限,但是如果網絡系統拉垮的話,有可能會把整個性能下限歸零。”中科曙光高級副總裁李斌在發布會中直言,從邊緣計算到AI大模型訓練,行業對網絡的要求愈發苛刻,網絡已成為大規模智算集群的核心關鍵。
更嚴峻的是,高端智算集群必需的RDMA(遠程直接內存訪問)網絡技術,長期被海外廠商牢牢壟斷。作為當前全球頂級超算與AI集群的主流選擇,InfiniBand網絡(IB網絡)憑借低時延與原生無損傳輸能力占據全球約60%的高性能計算系統市場,但從高速SerDes IP、核心芯片到IB網卡、IB交換機,整條產業鏈基本被海外企業掌控。2020年邁絡思被英偉達收購后,國內市場更是面臨供貨受限、成本高昂、維保困難的三重壓力,中國的計算產業發展,已經感受到了網絡‘卡脖子’的危機。
與此同時,國內現有替代方案均存在明顯短板。傳統以太網完全無法滿足低延遲、真無損的智算需求;基于以太網嫁接RDMA技術的RoCE網絡,不僅帶寬低、時延高,還存在運維復雜、大規模組網能力弱的問題,且核心網卡仍依賴英偉達CX系列,國產化程度嚴重不足。
中國工程院院士鄔賀銓指出,高速網絡作為算力基礎設施的核心關鍵技術,其自主可控性直接關系到國家算力基礎設施的安全與發展質量。在大模型訓練和智算集群規模化部署背景下,網絡需要同時具備超低延遲、超高帶寬與無損傳輸能力,而RDMA高速網絡正是智算集群的“算力大動脈”。
全棧自研造“算力大動脈”,性能對標國際頂尖
面對行業困局,中科曙光歷時三年研發,終于打造出scaleFabric這款國產原生無損RDMA高速網絡產品,實現了從底層112G SerDes IP、交換芯片、網卡到交換機、驅動與管理軟件的全棧自研,構建起完整的自主技術體系。
“我們最開始做的時候,也沒有那么多信心能達到IB的水平,這個過程確實經歷了很多艱辛,最核心的鏈路技術終于在國家的支持下做成了。”中科曙光高速網絡互聯產品部總工程師萬偉向記者道出了研發背后的挑戰。
而這份艱辛,最終換來了比肩甚至趕超國際頂尖水平的硬核性能。在核心指標上,scaleFabric展現出強大的技術實力:scaleFabric400網卡基于PCIe5.0接口,端口帶寬達400Gbps,端到端通信時延低至0.9微秒,這和英偉達CX7在同一個水平線上。
![]()
穩定性與擴展性的突破,更是直擊行業痛點。該產品采用基于信用的無損流控機制,從根源規避擁塞丟包風險,搭配自研的112G SerDes IP,實現了業內領先的驅動能力,為鏈路穩定性筑牢基礎;鏈路故障恢復時間小于1毫秒,“時延不會隨著網絡規模的增長而增長,保障應用無感。”萬偉表示。
目前,scaleFabric已支撐近萬卡集群持續穩定運行驗證超10個月,在國家超算互聯網鄭州核心節點,更是支撐三套萬卡級scaleX智算集群上線運行,總規模達3萬卡,完成了國產最大規模的真實負載驗證。
在組網能力與成本上,scaleFabric單子網互連規模可達11.4萬卡,是傳統IB的2.33倍,“能輕松支持十萬卡級集群部署,而從萬卡到十萬卡的突破,最核心的技術正是來自互聯系統。”李斌強調;同時,相比國外同類產品,scaleFabric的網絡總成本可降低30%,在實現高性能的同時,大幅提升了產品的市場性價比。
三重賦能,夯實智算自主底座
scaleFabric的發布,不僅是一款產品的技術突破,更是我國智算產業在高端高速網絡領域的里程碑事件,為行業發展帶來三重核心賦能,更推動了國產智算生態的重構。
一是補齊產業短板,筑牢國家算力安全防線。作為國內首款原生無損RDMA高速網絡,scaleFabric打破了海外廠商在高端RDMA領域的長期壟斷,讓我國智算基礎設施實現了“算—存—網”的協同發展。“scaleFabric本身定位為超大算力規模基礎設施最重要的環節,與芯片、存儲缺一不可,是算力基礎設施的核心組成部分。”李斌在媒體群訪中明確了產品的核心定位,而這款產品的落地,也意味著我國在智算互聯這一關鍵環節形成了自主技術路徑,徹底擺脫了對海外高端高速網絡設備的依賴。
二是釋放海量算力,提升全行業研發與生產效率。網絡瓶頸的打破,讓智算集群的算力得以充分釋放。在AI大模型訓練中,scaleFabric讓典型訓練任務的網絡效率大幅提升。
在工程計算領域,更是實現了通信開銷的大幅降低,“傳統工程計算軟件的網絡通信開銷基本能達到40%以上,基于scaleFabric優化后,輻照材料分子動力學軟件的通信開銷從50%降至10%,并行效率從千卡到萬卡保持86%。”北京科技大學計算機與通信學院儲根深在發布會中分享了實際應用效果,他還表示,硬件上補齊通信性能后,應用軟件能更充分地利用計算資源,“之前算力利用率能到百分之六七十,現在能到80%、90%。”
對于高端制造、生命科學、能源勘探等需要大規模并行計算的領域,算力效率的提升直接意味著研發周期的縮短和創新效率的提高。以工業仿真為例,延遲每增加10微秒,整體效能就會下降20%,而scaleFabric的低時延特性,能最大程度保障仿真計算的效率與精度,為產業升級提供核心算力支撐。
三是推動生態共建,凝聚國產智算產業合力。曙光在打造scaleFabric的同時,始終秉持極致開放的態度,致力于推動國產高性能網絡生態的建設。發布會上,光合組織高性能計算專委會AIDC高速網絡工作組正式成立,曙光攜手聯想開天、中興通訊等眾多產業鏈伙伴,共同推動國產高速網絡的生態發展。
“未來我們會把相關的技術開放出來,建立統一標準,打造生態適配系統,聯合科研力量做好產學研用體系。”曙光信息產業(北京)有限公司副總裁李柳向記者介紹了生態建設的核心方向。
李斌也表示,曙光不會走封閉的生態路線,而是希望“把整個技術做開放,市場的蛋糕大家共享”,不僅會讓scaleFabric適配國內不同的算力芯片,還會推動芯片互聯協議的共享,與產業鏈上下游緊密合作,讓國產智算產業形成合力。而儲根深也認為,曙光scaleFabric的出現,為國產高速網絡生態建設奠定了硬件基礎,“曙光的生態建設需要大的環境和單位來支持,未來隨著更多伙伴的加入,生態會不斷發展壯大。”
國產智算邁入高速發展新階段
隨著scaleFabric的發布與落地,我國智算產業正式邁入了高端高速網絡自主可控的新階段,而這也為超大規模智算集群的建設鋪平了道路。
“去年千億級參數模型讓大家震撼,今年已經進入萬億級參數時代,未來萬卡、十萬卡集群會成為常態化的算力需求。”李柳表示,面對這樣的行業趨勢,scaleFabric的超高可靠、超高擴展特性,正是為未來的超大規模智算集群量身打造。
李斌在媒體群訪中預判,未來高速互聯市場的空間將迎來爆發式增長,“相比原來的數據中心高速網絡用量,基本上會提高10到20倍,因為現在以GPU為中心的計算節點,一臺機器會出八張或者更多的網卡,網絡端口的增量非常明顯。”而scaleFabric作為國產IB技術路線的核心產品,將在這一市場中實現對國外產品的國產化替代,“我們期待在IB的技術路線上實現技術和市場占比的雙重替代。”
同時,scaleFabric的落地也為全國一體化算力網的建設提供了核心支撐。當前國家正推進“十五五”一體化全國算力網的構建,而國家超算互聯網作為重要試點,已經納入全國一體化算力網系統。
“未來的算力網會讓算力用起來像用電、用水一樣方便,且會更貼近用戶,不是提供冷冰冰的算力,而是幫用戶解決實際問題。”李斌描繪了未來算力網的發展方向,而scaleFabric作為自主可控的“算力大動脈”,將成為連接全國算力節點的核心紐帶,推動算力資源的跨區域調度與高效利用。
從技術突破到產業落地,從生態共建到算力網支撐,中科曙光scaleFabric的發布,不僅為國產智算產業注入了全新動能,更讓中國算力擁有了屬于自己的“高速通路”。在“人工智能+”的國家戰略指引下,這款自主研發的高端高速網絡產品,將與國產算力芯片、存儲產品協同發展,共同構建起自主可控的算力底座,推動我國智算產業從跟跑到并跑、再到領跑,讓中國算力更好地跑在中國網絡上。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.