中小企業(yè)的大模型門檻，被曙光scaleX40超節(jié)點踏平了

2026-03-27 20:12:09　來源: 半導(dǎo)體產(chǎn)業(yè)縱橫

北京舉報

分享至

2026年，中國智算市場的競賽正處在一個微妙的關(guān)鍵節(jié)點。賽道一端是巨頭主導(dǎo)的超大規(guī)模超節(jié)點集群，聚焦萬億參數(shù)模型訓(xùn)練等尖端需求；另一端是服務(wù)海量主體的中小規(guī)模算力，但傳統(tǒng)方案常受限于性能與擴(kuò)展性。而銜接兩者的中小算力超節(jié)點賽道，正成為推動AI普惠的核心突破口。

3月26日，中科曙光在北京中關(guān)村國際創(chuàng)新中心發(fā)布的世界首款無線纜箱式超節(jié)點scaleX40，正是對這一行業(yè)命題的精準(zhǔn)作答。

01 算力市場的“夾心層”，被看見了

中科曙光高級副總裁李斌指出，作為算力系統(tǒng)架構(gòu)迭代升級的產(chǎn)物，超節(jié)點在當(dāng)下的推理時代正面臨全新挑戰(zhàn)：一方面，面向訓(xùn)練場景打造的數(shù)百卡/千卡級超節(jié)點，對于主流推理業(yè)務(wù)而言配置過剩，投入成本遠(yuǎn)超性能收益甜點；另一方面，市場上主流的8卡GPU服務(wù)器，即便擴(kuò)展至16卡規(guī)格，也難以匹配當(dāng)前大模型的發(fā)展需求。這兩者之間，形成了顯著的產(chǎn)品供給空白與行業(yè)認(rèn)知斷層。

中科曙光高級副總裁李斌

聚焦國內(nèi)超節(jié)點賽道的市場格局，不同算力層級的玩家布局也呈現(xiàn)出鮮明的分化特征。

目前，64卡及以上超節(jié)點賽道，已有數(shù)十家參與者入局。其中既包括中科曙光、浪潮這樣的傳統(tǒng)服務(wù)器廠商，也有阿里云等云服務(wù)廠商。這一賽道的核心特征是追求64卡乃至數(shù)百卡的極致密度集成，目標(biāo)是滿足科技巨頭與國家級科研平臺的核心算力訴求。例如華為的昇騰384超節(jié)點，以及百度計劃2026年上市的天池256、天池512超節(jié)點，均屬于這一范疇。這類方案普遍采用自研高速互聯(lián)協(xié)議、液冷散熱、高密供電等頂尖技術(shù)，將數(shù)百張GPU高效協(xié)同，以規(guī)模優(yōu)勢突破算力天花板，能夠支撐萬億參數(shù)大模型訓(xùn)練、AI for Science等極致算力需求。但相應(yīng)地，當(dāng)前主流大規(guī)模超節(jié)點產(chǎn)品的門檻極高：單集群售價普遍達(dá)到億元級別，后續(xù)的運維成本、機房改造投入、電力配套支出等更是居高不下。這樣的成本規(guī)模，讓絕大多數(shù)企業(yè)望而卻步，也注定了這類產(chǎn)品只能服務(wù)于極少數(shù)頭部主體，難以實現(xiàn)規(guī)模化普惠。

再看8卡節(jié)點，其本質(zhì)是高性能服務(wù)器，屬于單臺服務(wù)器內(nèi)的多卡集成方案，是AI算力的入門級標(biāo)配，也是過去幾年中小市場的主流選擇。

過去數(shù)年里，8卡服務(wù)器堪稱AI技術(shù)普及的“功臣”——它入門門檻低、部署便捷靈活，即便在當(dāng)下，面對小規(guī)模、輕量級的推理場景，依然能滿足基礎(chǔ)算力需求。從飛騰與中國長城聯(lián)合推出的擎天GF7280V5，到佑泰信息的8卡訓(xùn)推一體機，這類產(chǎn)品憑借靈活部署、成本可控的優(yōu)勢，長期占據(jù)著特定市場空間。然而，AI產(chǎn)業(yè)的迭代速度早已超越硬件升級的節(jié)奏，8卡服務(wù)器的性能短板也隨之愈發(fā)明顯。近日爆火的 OpenClaw “小龍蝦” 智能體，恰恰暴露了中小企業(yè)的算力痛點：云端調(diào)用Token成本飆升，單月開銷動輒過萬；本地8卡服務(wù)器跑不動多實例智能體，頻繁顯存溢出、響應(yīng)卡頓；傳統(tǒng)高密度集群又被線纜拖累，算力損耗超標(biāo)的同時，還讓硬件投入打了水漂。上述現(xiàn)象正是用戶在算力選型中面臨的難題：8卡集群難以支撐大模型相關(guān)任務(wù)，百卡級超節(jié)點又超出預(yù)算承受范圍——只能在“不夠用”與“用不起”之間被迫妥協(xié)。

“讓高端算力普及不是單一硬件的降價，而是要讓中小企業(yè)‘用得上、買得起、用得好’。”李斌強調(diào)，曙光將以開放姿態(tài)攜手模型廠商、系統(tǒng)廠商、軟件ISV等產(chǎn)業(yè)鏈上下游伙伴，通過全棧技術(shù)協(xié)同，精準(zhǔn)填補算力市場的中間空白地帶，共同推動AI算力產(chǎn)業(yè)的普惠化發(fā)展。

02 剛需型超節(jié)點，戳中智算選型的“中間焦慮”

發(fā)布會現(xiàn)場，中科曙光展示了世界首個無線纜箱式超節(jié)點——scaleX40。

在關(guān)鍵指標(biāo)上，scaleX40單節(jié)點集成40張GPU，總算力超過28PFLOPS（FP8精度），HBM顯存容量超過5TB，訪存總帶寬超過80TB/s。采用一級互連設(shè)計，40張加速卡Scale-Up全互連，支持內(nèi)存語義、統(tǒng)一顯存編址，兼具極低延遲與超高帶寬，聚合帶寬超17TB/s；創(chuàng)新正交架構(gòu)讓計算節(jié)點和交換節(jié)點無線纜正交對接，相比銅纜模式可用性提高10倍，相比光纖連接功耗下降40%~70%；尺寸方面，scaleX40采用19英寸標(biāo)準(zhǔn)尺寸，適配主流機柜，支持單柜單Pod、單柜雙Pod的靈活擴(kuò)展方式；同時兼容主流軟件生態(tài)，搭配完善的開發(fā)工具、基礎(chǔ)軟件及AI大模型與應(yīng)用，用戶可輕松完成大模型遷移，實現(xiàn)開箱即用。

傳統(tǒng)萬卡或千卡集群，采用“外置線纜+獨立交換機”的連接模式，每一張加速卡都需要通過獨立高速線纜與交換機對接，卡數(shù)越多，線纜數(shù)量呈幾何級增長。這種模式存在三大致命短板：一是通信損耗大，長距離線纜傳輸帶來信號衰減，端到端延遲居高不下，多卡協(xié)同效率大幅折損；二是部署運維難，數(shù)百根線纜梳理、調(diào)試、故障排查耗時極長，后期擴(kuò)容難度極大；三是散熱與空間浪費，線纜堆積阻礙風(fēng)道循環(huán)，提升散熱壓力，同時占用大量機柜空間，降低算力密度。而scaleX40的背部設(shè)計呈現(xiàn)出極高的集成度與整潔性：機柜內(nèi)部數(shù)百根高速互聯(lián)線纜被徹底移除，發(fā)揮主要作用的，正是正交互連的結(jié)構(gòu)。該設(shè)計既消除了長距離傳輸?shù)男盘枔p耗，又大幅簡化部署運維流程；同時優(yōu)化機柜風(fēng)道設(shè)計，提升算力密度，搭配靈活擴(kuò)展與全生態(tài)兼容特性。這種“做減法”的架構(gòu)哲學(xué)，實則是為了在性能上做“乘法”。

至于，為什么是40卡？

曙光信息產(chǎn)業(yè)（北京）有限公司副總裁李柳結(jié)合AI產(chǎn)業(yè)發(fā)展趨勢，深入剖析了普惠型超節(jié)點的核心邏輯與產(chǎn)品定位，其核心觀點可概括為三大關(guān)鍵判斷：

其一，算力供給需要“尖端與普惠”雙軌并行。超大規(guī)模千卡/萬卡級超節(jié)點，是支撐萬億參數(shù)大模型訓(xùn)練等尖端場景的核心力量；而AI商業(yè)化要實現(xiàn)規(guī)模化落地，更離不開適配中小企業(yè)實際需求的普惠化算力——二者互為補充、缺一不可。

其二，剛需型超節(jié)點的核心，是在多重約束中找到平衡最優(yōu)解。不同于高端超節(jié)點對極致性能的單一追求，剛需型產(chǎn)品必須兼顧性能適配、成本可控與部署便捷三大核心訴求：既要突破傳統(tǒng)8卡服務(wù)器的性能瓶頸，又要把采購、運維、機房改造等綜合成本壓到中小企業(yè)可承受范圍，同時降低部署門檻，適配現(xiàn)有基礎(chǔ)設(shè)施條件，避免“性能不夠用”或“成本用不起”的兩難。

其三，40卡規(guī)模是精準(zhǔn)填補市場空白的“算力甜點區(qū)”。經(jīng)過對千行百業(yè)AI應(yīng)用場景的深度調(diào)研與反復(fù)性能測算，40卡配置能全面覆蓋千億參數(shù)大模型微調(diào)、MoE架構(gòu)推理、垂直行業(yè)模型訓(xùn)練等主流商業(yè)化場景，既避開了8卡節(jié)點的性能短板，又無需為64卡及以上超節(jié)點的冗余算力支付額外成本，恰好命中了市場長期存在的需求空白，成為解決行業(yè)痛點的關(guān)鍵配置選擇。

03 這場“集團(tuán)軍作戰(zhàn)”，沒有一個是短板

高端算力的普及化，從來不是單一硬件的降價，而是算、存、網(wǎng)、管全鏈路的協(xié)同升級，單一環(huán)節(jié)的突破，只會形成新的木桶短板，無法真正釋放算力價值，這也是傳統(tǒng)超節(jié)點難以落地的重要原因。中科曙光深諳此道，深耕算力領(lǐng)域多年，具備全棧自研能力，為scaleX40量身打造了一套完整的技術(shù)生態(tài)體系。

ParaStor，也被稱為最懂AI的存儲。中科曙光分布式存儲產(chǎn)品部總經(jīng)理石靜表示，曙光scaleX40超節(jié)點支持三套雙路/多路擴(kuò)展配置，并且無論哪種規(guī)格，scaleX40都能靈活搭配ParaStor F9000全閃存儲節(jié)點，這些存儲節(jié)點構(gòu)成統(tǒng)一資源池，形成“存算一體化”數(shù)據(jù)底座，完美匹配scaleX40面向中小規(guī)模訓(xùn)練與推理的核心場景定位。此外，中科曙光提出“3+5”存算協(xié)同技術(shù)，構(gòu)建三級強協(xié)同（scaleX40計算、scaleFabric網(wǎng)絡(luò)、ParaStor F9000存儲）與五大核心優(yōu)化（GPU顯存卸載、本地內(nèi)存加速、RDMA低延遲網(wǎng)絡(luò)、全閃存高帶寬、端到端IO鏈路）。實現(xiàn)訓(xùn)推帶寬提升2倍以上、推理TTFT降低97%，大幅提升GPU利用率，解決大模型IO瓶頸。曙光scaleX40還構(gòu)建了專屬“AI設(shè)計工廠”：從數(shù)據(jù)采集、標(biāo)注、處理到驗證，全流程嵌入存儲加速能力。通過向量數(shù)據(jù)庫集成、流水線IO加速庫等技術(shù)，存儲深度參與AI業(yè)務(wù)流轉(zhuǎn)，打破存力與算力的物理邊界，實現(xiàn)“以存代算、以存促算”的新模式。

SothisAI一站式平臺專為超節(jié)點架構(gòu)深度優(yōu)化，覆蓋模型訓(xùn)推全鏈路閉環(huán)，更支持智能體應(yīng)用高效集成，讓AI開發(fā)從碎片化走向一體化。中科曙光高端計算總工程師解西國表示，針對大規(guī)模AI系統(tǒng)在訓(xùn)練與部署階段普遍存在的穩(wěn)定性差、部署復(fù)雜等痛點，曙光智算打造了一套極簡、智能化的運營管理體系。在資源部署層面，SothisAI實現(xiàn)了對超節(jié)點系統(tǒng)的集中式管理，涵蓋部件管理、驅(qū)動升級及模型部署等環(huán)節(jié)，支持“一鍵部署、開箱即用”，極大降低了運維門檻。在全域管理層面，SothisAI實現(xiàn)了從芯片、機電、網(wǎng)絡(luò)、存儲到應(yīng)用的多維度集中管控，構(gòu)建了面向AI業(yè)務(wù)的全棧管理技術(shù)體系。面對海量監(jiān)控數(shù)據(jù)與復(fù)雜運維流程，SothisAI內(nèi)置了智能檢測算法與AI大模型，結(jié)合運維知識庫與系統(tǒng)拓?fù)浣Y(jié)構(gòu)，實現(xiàn)了運維流程的自動化編排。同時，SothisAI具備故障預(yù)測、檢測與分析能力，并能與上層大模型訓(xùn)練框架聯(lián)動，有效提升了大模型在訓(xùn)練與推理全生命周期中的穩(wěn)定性與可靠性。

從核心超節(jié)點硬件，到AI專屬存儲、一站式運維平臺，這套全棧自研體系沒有冗余堆砌，每一個環(huán)節(jié)都圍繞scaleX40的普惠定位深度適配、協(xié)同優(yōu)化。

04 高端算力標(biāo)配的時代，已經(jīng)到來

scaleX40的推出，不止是一款新品的發(fā)布，更標(biāo)志著超節(jié)點行業(yè)迎來發(fā)展拐點。

當(dāng)前，智算采購早已跳出單純比拼峰值算力的窠臼。受數(shù)字化進(jìn)程提速、算力需求動態(tài)增長以及成本與運維雙重管控的多重影響，“易部署、快交付、可擴(kuò)展”已成為諸多核心客群的核心采購決策依據(jù)。而scaleX40的產(chǎn)品定位，恰好精準(zhǔn)契合這一市場需求。

scaleX40可廣泛適配六大核心應(yīng)用場景：大模型訓(xùn)練、智算中心建設(shè)、企業(yè)級推理、高校科研攻關(guān)、研發(fā)測試環(huán)境搭建及行業(yè)解決方案落地。其中，針對政企類客戶，其標(biāo)準(zhǔn)化設(shè)計無需定制改造，可快速適配現(xiàn)有機房體系的標(biāo)準(zhǔn)設(shè)施，高效落地政務(wù)數(shù)字化、智慧城市等場景，兼顧合規(guī)與效率；面向科研類客戶，模塊化架構(gòu)支持靈活彈性擴(kuò)容，降低運維門檻，讓科研團(tuán)隊專注核心研發(fā)，適配多類科研計算需求；對于中小制造企業(yè)，這款超節(jié)點性價比出眾，部署靈活、易擴(kuò)展，能快速適配工業(yè)仿真、數(shù)字孿生等場景，以低成本算力方案助力制造業(yè)數(shù)字化轉(zhuǎn)型，徹底破解各類客群的算力落地難題。

目前，中國AI產(chǎn)業(yè)正在從“頭部試點”走向“全域落地”的關(guān)鍵分水嶺。2025年以來，多地制定算力券、算力補貼等機制，密集出臺數(shù)據(jù)要素企業(yè)扶持政策，強化對AI產(chǎn)業(yè)的支持。從少數(shù)巨頭的技術(shù)試驗場，到萬千中小企業(yè)的轉(zhuǎn)型工具箱，AI 產(chǎn)業(yè)的成熟，需要高端算力的堅實支撐。曙光scaleX40 的問世，正是順應(yīng)這一趨勢的一次重要實踐。它以40卡“算力甜點區(qū)” 的配置，平衡了性能與成本；以全棧協(xié)同的生態(tài)體系，簡化了部署與運維。這不僅為中小企業(yè)打開了擁抱大模型等AI場景的大門，更讓算力真正成為驅(qū)動各行各業(yè)創(chuàng)新的通用生產(chǎn)力。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.