![]()
2026年,中國智算市場的競賽正處在一個微妙的關(guān)鍵節(jié)點。賽道一端是巨頭主導(dǎo)的超大規(guī)模超節(jié)點集群,聚焦萬億參數(shù)模型訓(xùn)練等尖端需求;另一端是服務(wù)海量主體的中小規(guī)模算力,但傳統(tǒng)方案常受限于性能與擴(kuò)展性。而銜接兩者的中小算力超節(jié)點賽道,正成為推動AI普惠的核心突破口。
3月26日,中科曙光在北京中關(guān)村國際創(chuàng)新中心發(fā)布的世界首款無線纜箱式超節(jié)點scaleX40,正是對這一行業(yè)命題的精準(zhǔn)作答。
01
算力市場的“夾心層”,被看見了
中科曙光高級副總裁李斌指出,作為算力系統(tǒng)架構(gòu)迭代升級的產(chǎn)物,超節(jié)點在當(dāng)下的推理時代正面臨全新挑戰(zhàn):一方面,面向訓(xùn)練場景打造的數(shù)百卡/千卡級超節(jié)點,對于主流推理業(yè)務(wù)而言配置過剩,投入成本遠(yuǎn)超性能收益甜點;另一方面,市場上主流的8卡GPU服務(wù)器,即便擴(kuò)展至16卡規(guī)格,也難以匹配當(dāng)前大模型的發(fā)展需求。這兩者之間,形成了顯著的產(chǎn)品供給空白與行業(yè)認(rèn)知斷層。
![]()
中科曙光高級副總裁李斌
聚焦國內(nèi)超節(jié)點賽道的市場格局,不同算力層級的玩家布局也呈現(xiàn)出鮮明的分化特征。
![]()
目前,64卡及以上超節(jié)點賽道,已有數(shù)十家參與者入局。其中既包括中科曙光、浪潮這樣的傳統(tǒng)服務(wù)器廠商,也有阿里云等云服務(wù)廠商。這一賽道的核心特征是追求64卡乃至數(shù)百卡的極致密度集成,目標(biāo)是滿足科技巨頭與國家級科研平臺的核心算力訴求。例如華為的昇騰384超節(jié)點,以及百度計劃2026年上市的天池256、天池512超節(jié)點,均屬于這一范疇。這類方案普遍采用自研高速互聯(lián)協(xié)議、液冷散熱、高密供電等頂尖技術(shù),將數(shù)百張GPU高效協(xié)同,以規(guī)模優(yōu)勢突破算力天花板,能夠支撐萬億參數(shù)大模型訓(xùn)練、AI for Science等極致算力需求。但相應(yīng)地,當(dāng)前主流大規(guī)模超節(jié)點產(chǎn)品的門檻極高:單集群售價普遍達(dá)到億元級別,后續(xù)的運維成本、機房改造投入、電力配套支出等更是居高不下。這樣的成本規(guī)模,讓絕大多數(shù)企業(yè)望而卻步,也注定了這類產(chǎn)品只能服務(wù)于極少數(shù)頭部主體,難以實現(xiàn)規(guī)模化普惠。
再看8卡節(jié)點,其本質(zhì)是高性能服務(wù)器,屬于單臺服務(wù)器內(nèi)的多卡集成方案,是AI算力的入門級標(biāo)配,也是過去幾年中小市場的主流選擇。
![]()
過去數(shù)年里,8卡服務(wù)器堪稱AI技術(shù)普及的“功臣”——它入門門檻低、部署便捷靈活,即便在當(dāng)下,面對小規(guī)模、輕量級的推理場景,依然能滿足基礎(chǔ)算力需求。從飛騰與中國長城聯(lián)合推出的擎天GF7280V5,到佑泰信息的8卡訓(xùn)推一體機,這類產(chǎn)品憑借靈活部署、成本可控的優(yōu)勢,長期占據(jù)著特定市場空間。然而,AI產(chǎn)業(yè)的迭代速度早已超越硬件升級的節(jié)奏,8卡服務(wù)器的性能短板也隨之愈發(fā)明顯。近日爆火的 OpenClaw “小龍蝦” 智能體,恰恰暴露了中小企業(yè)的算力痛點:云端調(diào)用Token成本飆升,單月開銷動輒過萬;本地8卡服務(wù)器跑不動多實例智能體,頻繁顯存溢出、響應(yīng)卡頓;傳統(tǒng)高密度集群又被線纜拖累,算力損耗超標(biāo)的同時,還讓硬件投入打了水漂。上述現(xiàn)象正是用戶在算力選型中面臨的難題:8卡集群難以支撐大模型相關(guān)任務(wù),百卡級超節(jié)點又超出預(yù)算承受范圍——只能在“不夠用”與“用不起”之間被迫妥協(xié)。
“讓高端算力普及不是單一硬件的降價,而是要讓中小企業(yè)‘用得上、買得起、用得好’。”李斌強調(diào),曙光將以開放姿態(tài)攜手模型廠商、系統(tǒng)廠商、軟件ISV等產(chǎn)業(yè)鏈上下游伙伴,通過全棧技術(shù)協(xié)同,精準(zhǔn)填補算力市場的中間空白地帶,共同推動AI算力產(chǎn)業(yè)的普惠化發(fā)展。
02
剛需型超節(jié)點,戳中智算選型的“中間焦慮”
發(fā)布會現(xiàn)場,中科曙光展示了世界首個無線纜箱式超節(jié)點——scaleX40。
![]()
在關(guān)鍵指標(biāo)上,scaleX40單節(jié)點集成40張GPU,總算力超過28PFLOPS(FP8精度),HBM顯存容量超過5TB,訪存總帶寬超過80TB/s。采用一級互連設(shè)計,40張加速卡Scale-Up全互連,支持內(nèi)存語義、統(tǒng)一顯存編址,兼具極低延遲與超高帶寬,聚合帶寬超17TB/s;創(chuàng)新正交架構(gòu)讓計算節(jié)點和交換節(jié)點無線纜正交對接,相比銅纜模式可用性提高10倍,相比光纖連接功耗下降40%~70%;尺寸方面,scaleX40采用19英寸標(biāo)準(zhǔn)尺寸,適配主流機柜,支持單柜單Pod、單柜雙Pod的靈活擴(kuò)展方式;同時兼容主流軟件生態(tài),搭配完善的開發(fā)工具、基礎(chǔ)軟件及AI大模型與應(yīng)用,用戶可輕松完成大模型遷移,實現(xiàn)開箱即用。
![]()
傳統(tǒng)萬卡或千卡集群,采用“外置線纜+獨立交換機”的連接模式,每一張加速卡都需要通過獨立高速線纜與交換機對接,卡數(shù)越多,線纜數(shù)量呈幾何級增長。這種模式存在三大致命短板:一是通信損耗大,長距離線纜傳輸帶來信號衰減,端到端延遲居高不下,多卡協(xié)同效率大幅折損;二是部署運維難,數(shù)百根線纜梳理、調(diào)試、故障排查耗時極長,后期擴(kuò)容難度極大;三是散熱與空間浪費,線纜堆積阻礙風(fēng)道循環(huán),提升散熱壓力,同時占用大量機柜空間,降低算力密度。而scaleX40的背部設(shè)計呈現(xiàn)出極高的集成度與整潔性:機柜內(nèi)部數(shù)百根高速互聯(lián)線纜被徹底移除,發(fā)揮主要作用的,正是正交互連的結(jié)構(gòu)。該設(shè)計既消除了長距離傳輸?shù)男盘枔p耗,又大幅簡化部署運維流程;同時優(yōu)化機柜風(fēng)道設(shè)計,提升算力密度,搭配靈活擴(kuò)展與全生態(tài)兼容特性。這種“做減法”的架構(gòu)哲學(xué),實則是為了在性能上做“乘法”。
至于,為什么是40卡?
曙光信息產(chǎn)業(yè)(北京)有限公司副總裁李柳結(jié)合AI產(chǎn)業(yè)發(fā)展趨勢,深入剖析了普惠型超節(jié)點的核心邏輯與產(chǎn)品定位,其核心觀點可概括為三大關(guān)鍵判斷:
其一,算力供給需要“尖端與普惠”雙軌并行。超大規(guī)模千卡/萬卡級超節(jié)點,是支撐萬億參數(shù)大模型訓(xùn)練等尖端場景的核心力量;而AI商業(yè)化要實現(xiàn)規(guī)模化落地,更離不開適配中小企業(yè)實際需求的普惠化算力——二者互為補充、缺一不可。
其二,剛需型超節(jié)點的核心,是在多重約束中找到平衡最優(yōu)解。不同于高端超節(jié)點對極致性能的單一追求,剛需型產(chǎn)品必須兼顧性能適配、成本可控與部署便捷三大核心訴求:既要突破傳統(tǒng)8卡服務(wù)器的性能瓶頸,又要把采購、運維、機房改造等綜合成本壓到中小企業(yè)可承受范圍,同時降低部署門檻,適配現(xiàn)有基礎(chǔ)設(shè)施條件,避免“性能不夠用”或“成本用不起”的兩難。
其三,40卡規(guī)模是精準(zhǔn)填補市場空白的“算力甜點區(qū)”。經(jīng)過對千行百業(yè)AI應(yīng)用場景的深度調(diào)研與反復(fù)性能測算,40卡配置能全面覆蓋千億參數(shù)大模型微調(diào)、MoE架構(gòu)推理、垂直行業(yè)模型訓(xùn)練等主流商業(yè)化場景,既避開了8卡節(jié)點的性能短板,又無需為64卡及以上超節(jié)點的冗余算力支付額外成本,恰好命中了市場長期存在的需求空白,成為解決行業(yè)痛點的關(guān)鍵配置選擇。
03
這場“集團(tuán)軍作戰(zhàn)”,沒有一個是短板
高端算力的普及化,從來不是單一硬件的降價,而是算、存、網(wǎng)、管全鏈路的協(xié)同升級,單一環(huán)節(jié)的突破,只會形成新的木桶短板,無法真正釋放算力價值,這也是傳統(tǒng)超節(jié)點難以落地的重要原因。中科曙光深諳此道,深耕算力領(lǐng)域多年,具備全棧自研能力,為scaleX40量身打造了一套完整的技術(shù)生態(tài)體系。
ParaStor,也被稱為最懂AI的存儲。中科曙光分布式存儲產(chǎn)品部總經(jīng)理石靜表示,曙光scaleX40超節(jié)點支持三套雙路/多路擴(kuò)展配置,并且無論哪種規(guī)格,scaleX40都能靈活搭配ParaStor F9000全閃存儲節(jié)點,這些存儲節(jié)點構(gòu)成統(tǒng)一資源池,形成“存算一體化”數(shù)據(jù)底座,完美匹配scaleX40面向中小規(guī)模訓(xùn)練與推理的核心場景定位。此外,中科曙光提出“3+5”存算協(xié)同技術(shù),構(gòu)建三級強協(xié)同(scaleX40計算、scaleFabric網(wǎng)絡(luò)、ParaStor F9000存儲)與五大核心優(yōu)化(GPU顯存卸載、本地內(nèi)存加速、RDMA低延遲網(wǎng)絡(luò)、全閃存高帶寬、端到端IO鏈路)。實現(xiàn)訓(xùn)推帶寬提升2倍以上、推理TTFT降低97%,大幅提升GPU利用率,解決大模型IO瓶頸。曙光scaleX40還構(gòu)建了專屬“AI設(shè)計工廠”:從數(shù)據(jù)采集、標(biāo)注、處理到驗證,全流程嵌入存儲加速能力。通過向量數(shù)據(jù)庫集成、流水線IO加速庫等技術(shù),存儲深度參與AI業(yè)務(wù)流轉(zhuǎn),打破存力與算力的物理邊界,實現(xiàn)“以存代算、以存促算”的新模式。
SothisAI一站式平臺專為超節(jié)點架構(gòu)深度優(yōu)化,覆蓋模型訓(xùn)推全鏈路閉環(huán),更支持智能體應(yīng)用高效集成,讓AI開發(fā)從碎片化走向一體化。中科曙光高端計算總工程師解西國表示,針對大規(guī)模AI系統(tǒng)在訓(xùn)練與部署階段普遍存在的穩(wěn)定性差、部署復(fù)雜等痛點,曙光智算打造了一套極簡、智能化的運營管理體系。在資源部署層面,SothisAI實現(xiàn)了對超節(jié)點系統(tǒng)的集中式管理,涵蓋部件管理、驅(qū)動升級及模型部署等環(huán)節(jié),支持“一鍵部署、開箱即用”,極大降低了運維門檻。在全域管理層面,SothisAI實現(xiàn)了從芯片、機電、網(wǎng)絡(luò)、存儲到應(yīng)用的多維度集中管控,構(gòu)建了面向AI業(yè)務(wù)的全棧管理技術(shù)體系。面對海量監(jiān)控數(shù)據(jù)與復(fù)雜運維流程,SothisAI內(nèi)置了智能檢測算法與AI大模型,結(jié)合運維知識庫與系統(tǒng)拓?fù)浣Y(jié)構(gòu),實現(xiàn)了運維流程的自動化編排。同時,SothisAI具備故障預(yù)測、檢測與分析能力,并能與上層大模型訓(xùn)練框架聯(lián)動,有效提升了大模型在訓(xùn)練與推理全生命周期中的穩(wěn)定性與可靠性。
從核心超節(jié)點硬件,到AI專屬存儲、一站式運維平臺,這套全棧自研體系沒有冗余堆砌,每一個環(huán)節(jié)都圍繞scaleX40的普惠定位深度適配、協(xié)同優(yōu)化。
04
高端算力標(biāo)配的時代,已經(jīng)到來
scaleX40的推出,不止是一款新品的發(fā)布,更標(biāo)志著超節(jié)點行業(yè)迎來發(fā)展拐點。
當(dāng)前,智算采購早已跳出單純比拼峰值算力的窠臼。受數(shù)字化進(jìn)程提速、算力需求動態(tài)增長以及成本與運維雙重管控的多重影響,“易部署、快交付、可擴(kuò)展”已成為諸多核心客群的核心采購決策依據(jù)。而scaleX40的產(chǎn)品定位,恰好精準(zhǔn)契合這一市場需求。
scaleX40可廣泛適配六大核心應(yīng)用場景:大模型訓(xùn)練、智算中心建設(shè)、企業(yè)級推理、高校科研攻關(guān)、研發(fā)測試環(huán)境搭建及行業(yè)解決方案落地。其中,針對政企類客戶,其標(biāo)準(zhǔn)化設(shè)計無需定制改造,可快速適配現(xiàn)有機房體系的標(biāo)準(zhǔn)設(shè)施,高效落地政務(wù)數(shù)字化、智慧城市等場景,兼顧合規(guī)與效率;面向科研類客戶,模塊化架構(gòu)支持靈活彈性擴(kuò)容,降低運維門檻,讓科研團(tuán)隊專注核心研發(fā),適配多類科研計算需求;對于中小制造企業(yè),這款超節(jié)點性價比出眾,部署靈活、易擴(kuò)展,能快速適配工業(yè)仿真、數(shù)字孿生等場景,以低成本算力方案助力制造業(yè)數(shù)字化轉(zhuǎn)型,徹底破解各類客群的算力落地難題。
目前,中國AI產(chǎn)業(yè)正在從“頭部試點”走向“全域落地”的關(guān)鍵分水嶺。2025年以來,多地制定算力券、算力補貼等機制,密集出臺數(shù)據(jù)要素企業(yè)扶持政策,強化對AI產(chǎn)業(yè)的支持。從少數(shù)巨頭的技術(shù)試驗場,到萬千中小企業(yè)的轉(zhuǎn)型工具箱,AI 產(chǎn)業(yè)的成熟,需要高端算力的堅實支撐。曙光scaleX40 的問世,正是順應(yīng)這一趨勢的一次重要實踐。它以40卡“算力甜點區(qū)” 的配置,平衡了性能與成本;以全棧協(xié)同的生態(tài)體系,簡化了部署與運維。這不僅為中小企業(yè)打開了擁抱大模型等AI場景的大門,更讓算力真正成為驅(qū)動各行各業(yè)創(chuàng)新的通用生產(chǎn)力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.