今年全國雙會(huì)期間,《“155”規(guī)劃綱要(草案)》明確提出,要加快實(shí)現(xiàn)高水平科技自立自強(qiáng),加強(qiáng)關(guān)鍵核心技術(shù)攻關(guān)。在這一頂層設(shè)計(jì)下,支撐人工智能發(fā)展的算力基礎(chǔ)設(shè)施,被視作培育新質(zhì)生產(chǎn)力的重要底座。
底座要穩(wěn),網(wǎng)絡(luò)得硬。這道必答題,國產(chǎn)算力行業(yè)最近拿出了一個(gè)硬核解法。
曙光scaleFabric正式發(fā)布。作為首款國產(chǎn)原生InfiniBand無損RDMA高速網(wǎng)絡(luò),該產(chǎn)品實(shí)現(xiàn)了全棧自研,scaleFabric400網(wǎng)卡端口帶寬達(dá)400Gbps,端到端通信時(shí)延低至0.9微秒,scaleFabric400交換機(jī)單端口帶寬達(dá)800Gbps,整機(jī)交換容量可達(dá)雙向64Tbps,交換時(shí)延約260納秒,與國際頂尖IB產(chǎn)品NVIDIA NDR性能相當(dāng)。
現(xiàn)在行業(yè)里喊“國產(chǎn)突破”的不少,但不乏攢硬件、套軟件的拼湊方案,核心芯片、底層技術(shù)還攥在別人手里,算不上真自主。行業(yè)指出:scaleFabric這款新品,走了最費(fèi)勁但最靠譜的路。
具體來看,從112G SerDes IP核,到交換芯片、網(wǎng)卡芯片,再到硬件整機(jī)、上層管理平臺(tái),沒有半點(diǎn)“拿來主義”。此舉意味著國產(chǎn)算力將核心技術(shù)牢牢握在了自己手里,進(jìn)一步擺脫供應(yīng)鏈不穩(wěn),后期迭代優(yōu)化受制于人的限制,這才是國產(chǎn)算力突破的核心意義。
更重要的是,該方案經(jīng)實(shí)測(cè),在3萬卡商用集群中典型AI訓(xùn)練任務(wù)中,鏈路故障恢復(fù)時(shí)間小于1毫秒,持續(xù)穩(wěn)定運(yùn)行驗(yàn)證超10個(gè)月,網(wǎng)絡(luò)效率顯著提升,且可大幅縮短大模型訓(xùn)練周期,以往動(dòng)輒數(shù)天數(shù)月的訓(xùn)練時(shí)長(zhǎng),如今能快速落地。
與有榮焉!國產(chǎn)算力徹底撕掉了高端網(wǎng)絡(luò)“追跑者”的標(biāo)簽,正式躋身國際第一梯隊(duì)。
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.