4月15日消息,中科曙光提供的6萬(wàn)卡科學(xué)智能(AI4S)計(jì)算集群系統(tǒng)已在位于鄭州的國(guó)家超算互聯(lián)網(wǎng)核心節(jié)點(diǎn)投入使用。據(jù)了解,該集群是截至目前國(guó)內(nèi)規(guī)模最大的AI4S計(jì)算集群,其正式運(yùn)行進(jìn)一步增強(qiáng)了國(guó)家超算互聯(lián)網(wǎng)平臺(tái)的公共算力服務(wù)能力。
![]()
全棧自主的算力底座建成
據(jù)悉,該AI4S計(jì)算集群并非簡(jiǎn)單的硬件集成,而是一個(gè)軟硬件協(xié)同設(shè)計(jì)的全棧系統(tǒng)。它在設(shè)計(jì)上具備六大技術(shù)特征。在算力規(guī)模上,實(shí)現(xiàn)了6萬(wàn)張國(guó)產(chǎn)加速卡的集群部署。在網(wǎng)絡(luò)層面,集群采用了類InfiniBand無(wú)損高速網(wǎng)絡(luò),旨在滿足高帶寬、低時(shí)延的通信需求。據(jù)介紹,該系統(tǒng)可支持從8位到64位的多種精度計(jì)算。在可靠性方面,通過應(yīng)用浸沒相變液冷與智能運(yùn)維等技術(shù),其系統(tǒng)可用性可達(dá)到99.99%。
多領(lǐng)域應(yīng)用效能顯著
在應(yīng)用層面,該集群已與高校、科研機(jī)構(gòu)及企業(yè)展開合作,并在多個(gè)科學(xué)計(jì)算場(chǎng)景中取得成效。據(jù)中科曙光介紹,在3萬(wàn)卡規(guī)模下,其蛋白質(zhì)折疊模擬的計(jì)算速度相較于傳統(tǒng)算法有了約1000倍的提升。在4.5萬(wàn)卡規(guī)模下,其實(shí)現(xiàn)的萬(wàn)億原子液態(tài)水分子動(dòng)力學(xué)模擬刷新了該領(lǐng)域的模擬規(guī)模紀(jì)錄,并使計(jì)算效率提升了數(shù)個(gè)數(shù)量級(jí)。
平臺(tái)化服務(wù)降低使用門檻
為降低科研人員使用復(fù)雜算力的門檻,該集群與國(guó)家超算互聯(lián)網(wǎng)平臺(tái)深度集成。平臺(tái)搭載了國(guó)內(nèi)首個(gè)科學(xué)大模型一站式開發(fā)平臺(tái)“OneScience”,該平臺(tái)集成了數(shù)十個(gè)AI4S領(lǐng)域的模型與數(shù)據(jù)集。用戶可通過自然語(yǔ)言與平臺(tái)上的“超級(jí)科學(xué)計(jì)算智能體”進(jìn)行交互,由其自動(dòng)拆解任務(wù)、調(diào)用模型與調(diào)度算力,從而將復(fù)雜科研任務(wù)的完成時(shí)間從天級(jí)壓縮至小時(shí)級(jí)。
此外,隨著此集群的加入,國(guó)家超算互聯(lián)網(wǎng)平臺(tái)已構(gòu)建起國(guó)內(nèi)規(guī)模最大的AI4S計(jì)算基礎(chǔ)設(shè)施。公開信息顯示,該平臺(tái)總計(jì)鏈接了超過300萬(wàn)CPU核心和20萬(wàn)GPU卡,并已接入全國(guó)一體化算網(wǎng)調(diào)度體系。企業(yè)、高校及科研院所可通過其官方網(wǎng)站的“算力市場(chǎng)”,按需選購(gòu)AI計(jì)算、高性能計(jì)算等各類算力資源。
中國(guó)科學(xué)院院士、河南省科學(xué)院院長(zhǎng)徐紅星表示,該集群的落地是我國(guó)人工智能技術(shù)與科研創(chuàng)新深度融合的一個(gè)標(biāo)志。此次大規(guī)模AI4S計(jì)算集群的部署,旨在為“人工智能+科學(xué)技術(shù)”在國(guó)內(nèi)的規(guī)模化應(yīng)用提供基礎(chǔ)算力支撐。(崔玉賢)
