337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

中科曙光發(fā)了個“標配版”超節(jié)點,AI推理算力的未來形態(tài)?

0
分享至

OpenClaw突然爆火,既是AI Agent賽道的一次必然出圈,也是AI推理算力市場的一場壓力測試。

在2026年中關村論壇上,中科曙發(fā)布了世界首個無線纜箱式超節(jié)點scaleX40,在此之前,超節(jié)點是動輒數(shù)百卡甚至千卡規(guī)模的龐然大物,包括中科曙光發(fā)布的scaleX640、英偉達的NVL72、華為的昇騰384等。

這些頂級超節(jié)點專為超大規(guī)模模型訓練而生,性能強悍,但部署門檻極高,定制化機柜、復雜的線纜連接、專業(yè)的運維團隊,動輒數(shù)千萬甚至上億的投資,讓它們注定只能服務于少數(shù)頭部玩家,譬如互聯(lián)網(wǎng)巨頭或者大型央國企等。

在超節(jié)點的“反面”,是推理市場上傳統(tǒng)且主流的8卡GPU服務器。這類產(chǎn)品部署靈活、成本可控,但在面對快速升級的AI推理算力需求時,性能顯得有些不足。

"8卡機在當前來看已經(jīng)遠遠落伍了,即便是把互聯(lián)規(guī)模擴展到16卡,仍然滿足不了模型推理服務發(fā)展的步伐。"中科曙光高級副總裁李斌表示,"支撐AI發(fā)展的算力基礎設施,逐漸從原來的'算力工廠'變成了'Token工廠'。算力系統(tǒng)的主要服務對象,已經(jīng)從過去支撐模型訓練為主,轉變到現(xiàn)在以服務于推理為主。"

在訓練時代,評價算力系統(tǒng)的核心指標是有多少算力;而在推理時代,更關鍵的指標變成了"能以多經(jīng)濟的成本產(chǎn)出Token"。


圖片來自AI生成

AI需求分化,推理算力遠未滿足

從當前市場需求來看,AI算力結構正在發(fā)生分層變化。根據(jù)行業(yè)機構預測,全球AI基礎設施投入仍將保持較快增長,但新增需求正逐步從超大規(guī)模集群,轉向企業(yè)級和行業(yè)應用場景。

在這一趨勢下,算力配置的重點不再單純追求規(guī)模上限,而是更加關注性能、成本與靈活性的平衡。業(yè)內普遍共識,幾十卡規(guī)模已足夠滿足大多數(shù)行業(yè)場景模型訓練、推理及開發(fā)測試的算力需求,這也是兼顧效率與投入的最大公約數(shù)區(qū)間。

但是,AI應用層的需求演化太快,包括像OpenClaw為代表的AI Agent的爆火,在改變傳統(tǒng)行業(yè)應用的同時,對當下算力供給側也帶來了系統(tǒng)重構的需求。

第一是通信的瓶頸,現(xiàn)在MoE模型讓通信成為提升算力利用率的核心卡點,尤其是專家分布的不確定性,導致大量跨卡、跨機通信,直接擊穿了傳統(tǒng)8卡服務器的算力架構。

第二是顯存的瓶頸,上下文窗口持續(xù)擴展,OpenClaw所需的長上下文記憶能力,也讓大顯存、KV Cache的需求日漸激增,這同樣是傳統(tǒng)8卡服務器難以突破的局限。

第三是算力利用率的瓶頸,算力利用率和推理落地成本近乎反比,傳統(tǒng)集群普遍存在算力利用率不足的問題,核心挑戰(zhàn)不是單純堆硬件,而是通過硬件架構創(chuàng)新,搭配配套系統(tǒng)工程、優(yōu)化工程的協(xié)同發(fā)力,實現(xiàn)系統(tǒng)效能和有效算力的雙重提升。

第四則是生態(tài)的瓶頸,國產(chǎn)算力生態(tài)體系復雜、廠商眾多、產(chǎn)業(yè)鏈漫長,產(chǎn)業(yè)協(xié)作難度不小,這就需要借助開放計算架構,打通芯片、模型、應用等全產(chǎn)業(yè)鏈上下游,打造開放易用、開箱即用、經(jīng)濟普惠的算力底座。

中科曙光希望用40卡的“標配”超節(jié)點回應市場。"40卡這個甜點區(qū),是我們跟各種客戶調研摸索出來的。"中科曙光副總裁李柳表示,當前主流模型的參數(shù)規(guī)模和使用場景,32-40卡已經(jīng)能夠覆蓋大多數(shù)行業(yè)需求,同時又能兼顧成本與性能的平衡。


scaleX40單節(jié)點集成40張GPU,總算力超過28PFLOPS(FP8精度),HBM顯存容量超過5TB,訪存帶寬超過80TB/s。系統(tǒng)可靠性提升至99.99%。

scaleX40的規(guī)模配置,既具備支持大模型訓練和推理的能力,又不會帶來過重的投入壓力,它向下可兼顧32卡,滿足中小規(guī)模訓練、推理和開發(fā)測試;向上,它可以通過擴展,組成更大規(guī)模集群。

李斌算了一筆賬:"傳統(tǒng)5臺8卡機器疊加各類成本的投入,與scaleX40基本相當,但scaleX40可以將訓練性能提升120%,推理性能最高提升至330%。"

從DeepSeek到OpenClaw,新的算力轉折點

"Token需要算力來做產(chǎn)出,但評價的維度和指標變得更多了。"李斌認為,"對于普通用戶,關注的是響應速度,問了一個問題,它能不能很快反饋回來;對于算力系統(tǒng)的運營者,要考慮能同時支撐多少用戶的并發(fā)訪問,同時滿足基本的使用體驗。"

智源研究院AI框架研發(fā)部門負責人敖玉龍也提出,"未來對算力供給方來說,關鍵指標是如何將算力轉換成有效的Token,而不是無效的Token。誰能把這個成本降下去,誰才是真正的贏家。"

scaleX40的設計圍繞這些新需求展開。144G大顯存支持長上下文窗口,多級KV Cache緩存機制滿足推理場景的大顯存需求,40卡高帶寬域的一級互聯(lián)將專家通信的out-to-out流量收攬在單個節(jié)點內。這些特性都是在控制成本的前提下,最大化單位算力的Token產(chǎn)出效率。

無線纜箱式設計也是scaleX40一個很大的差異化。傳統(tǒng)超節(jié)點的一個核心痛點在于部署復雜度。以英偉達NVL72為例,其采用銅纜連接方案,機柜之間需要大量的線纜互聯(lián),不僅對機房環(huán)境要求苛刻,部署周期長,而且后期運維的故障率也居高不下。

scaleX40的解法和英偉達于今年GTC大會公布的最新解決方案相似,通過總線技術實現(xiàn)Scale-up擴展,計算節(jié)點與交換節(jié)點采用無線纜正交架構直接對插。

這一設計帶來了多重收益,首先,總線技術性能達到傳統(tǒng)NDR網(wǎng)絡的10倍以上,支持內存語義和顯存統(tǒng)一編址;其次,一層組網(wǎng)將P2P單向時延降至百納秒以內,相比二層組網(wǎng)時延降低30%以上,故障率降低30%-50%。

其次,scaleX40采用標準19英寸箱式設計,單機高度僅16U,可以直接放入主流機柜,兼容現(xiàn)有數(shù)據(jù)中心環(huán)境,無需額外改造。

"過去很多產(chǎn)品要么柜子比較大,要么非標準化,要么機房改造非常復雜。"李柳說道,"scaleX40可以放在標準機柜里面,接標準機房的供電和冷卻設備,部署和使用門檻大大降低。"

中國電信研究院智算網(wǎng)絡技術負責人王子瀟也表示:"以超節(jié)點形態(tài)提供推理服務,性能比傳統(tǒng)單機8卡提升約2.6倍。超節(jié)點的‘開箱即用’能力顯著增強,Scale-out網(wǎng)絡的配置復雜度有數(shù)量級降低,對于整個行業(yè)規(guī)?;瘧梅浅S幸饬x。"

更深層來看,scaleX40的發(fā)布也折射出國產(chǎn)算力生態(tài)的成熟。從芯片到系統(tǒng)軟件,從存儲到網(wǎng)絡,從算子庫到通信庫,一條完整的產(chǎn)業(yè)鏈正在形成。正如李斌所言:"我們在整個國內計算AI生態(tài)里,從芯片到系統(tǒng)軟件,到上層模型和應用,在做垂直的跨層協(xié)同,通過垂直方向的耦合和協(xié)同去發(fā)揮更好的效率。"

當超節(jié)點開始以更簡單的方式被部署和使用,當千行百業(yè)都能以合理的成本獲得高端算力能力,中國AI的規(guī)模化應用,或許才真正邁出了關鍵一步。(本文作者 | 張帥,編輯 | 楊林)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
霍爾木茲海峽封鎖再升級,油價持續(xù)猛漲,石油危機將要重演?|商業(yè)微史記

霍爾木茲海峽封鎖再升級,油價持續(xù)猛漲,石油危機將要重演?|商業(yè)微史記

界面新聞
2026-03-31 11:26:11
3月30日立即執(zhí)行!不用再買墓地了,國家正式放開殯葬新選擇

3月30日立即執(zhí)行!不用再買墓地了,國家正式放開殯葬新選擇

混沌錄
2026-03-31 17:03:15
清明將至,俗話說:“墳頭三不動,一動窮三代”今年應如何祭祖?

清明將至,俗話說:“墳頭三不動,一動窮三代”今年應如何祭祖?

磊子講史
2026-03-20 16:07:07
外交部: 近日中方有三艘船舶 過航霍爾木茲海峽

外交部: 近日中方有三艘船舶 過航霍爾木茲海峽

每日經(jīng)濟新聞
2026-03-31 16:03:47
重慶一隧道發(fā)生爆炸事故,致4人死亡

重慶一隧道發(fā)生爆炸事故,致4人死亡

界面新聞
2026-03-31 08:29:34
魯山舅舅娶亡姐大結局!新華社通報調查結果,這次終于真相大白了

魯山舅舅娶亡姐大結局!新華社通報調查結果,這次終于真相大白了

離離言幾許
2026-03-30 22:39:30
鄭欽文喊球童拿毛巾事件引外網(wǎng)球迷批評:現(xiàn)在球員這么懶嗎?

鄭欽文喊球童拿毛巾事件引外網(wǎng)球迷批評:現(xiàn)在球員這么懶嗎?

籃球看比賽
2026-03-31 12:39:38
茅臺提價首日:i茅臺供不應求,多批次“光速”被搶光!

茅臺提價首日:i茅臺供不應求,多批次“光速”被搶光!

新浪財經(jīng)
2026-03-31 09:17:44
你敢信嗎?太湖底下有2.3米厚的淤泥,可上面才蓋著不到1.9米的水

你敢信嗎?太湖底下有2.3米厚的淤泥,可上面才蓋著不到1.9米的水

甜檸聊史
2026-03-29 05:31:07
亞歷山大狂砍47+5無緣今日最佳,對不起,你碰上暴走創(chuàng)紀錄的文班

亞歷山大狂砍47+5無緣今日最佳,對不起,你碰上暴走創(chuàng)紀錄的文班

體育新角度
2026-03-31 17:38:07
6月起,網(wǎng)約車司機超8小時長時間工作將結束

6月起,網(wǎng)約車司機超8小時長時間工作將結束

半島官網(wǎng)
2026-03-31 09:30:28
失聯(lián)兩個多月的28歲川大博士確認遇難,生前就讀的意大利大學發(fā)文哀悼,姐姐不敢將噩耗告知高齡爺爺奶奶

失聯(lián)兩個多月的28歲川大博士確認遇難,生前就讀的意大利大學發(fā)文哀悼,姐姐不敢將噩耗告知高齡爺爺奶奶

極目新聞
2026-03-31 19:05:12
2012年,用U型鎖砸日系車并重傷車主的蔡洋早已出獄,如今怎樣了

2012年,用U型鎖砸日系車并重傷車主的蔡洋早已出獄,如今怎樣了

談史論天地
2026-03-25 09:57:09
1980年鄧小平說:毛主席的錯誤,要毫不含糊地批評,但要實事求是

1980年鄧小平說:毛主席的錯誤,要毫不含糊地批評,但要實事求是

帝哥說史
2026-02-25 06:30:03
英國首相:無論誰施壓 英國不會被卷入中東的戰(zhàn)爭

英國首相:無論誰施壓 英國不會被卷入中東的戰(zhàn)爭

財聯(lián)社
2026-03-31 17:39:05
退休人員樂開花!2026年養(yǎng)老金調整方向敲定,尤其是這類人更受益

退休人員樂開花!2026年養(yǎng)老金調整方向敲定,尤其是這類人更受益

社保小達人
2026-03-30 10:20:07
國足0-2僅1小時,韓媒幸災樂禍!一國腳跟對方交換球衣,名字曝光

國足0-2僅1小時,韓媒幸災樂禍!一國腳跟對方交換球衣,名字曝光

侃球熊弟
2026-03-31 17:12:06
澄清!從年入百萬不夠花,到被罰1.2億,閆學晶稅務核查結論已出

澄清!從年入百萬不夠花,到被罰1.2億,閆學晶稅務核查結論已出

情感大頭說說
2026-03-31 16:31:09
玄武門之變,李淵為什么不調兵鎮(zhèn)壓李世民?他調了,但根本壓不住

玄武門之變,李淵為什么不調兵鎮(zhèn)壓李世民?他調了,但根本壓不住

千秋文化
2026-02-11 21:36:18
東歐局勢大逆轉!羅馬尼亞鐵了心對抗,俄羅斯表態(tài)關系徹底清零!

東歐局勢大逆轉!羅馬尼亞鐵了心對抗,俄羅斯表態(tài)關系徹底清零!

無情有思可
2026-03-31 19:14:00
2026-03-31 19:52:50
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
131586文章數(shù) 862039關注度
往期回顧 全部

科技要聞

尚未正式宣發(fā),國行蘋果AI半夜"意外閃現(xiàn)"

頭條要聞

張雪機車訂單已排到6月"禁止"新手購買820RR 銷售回應

頭條要聞

張雪機車訂單已排到6月"禁止"新手購買820RR 銷售回應

體育要聞

縣城修車工,用20年成為世界冠軍

娛樂要聞

《月鱗綺紀》空降 鞠婧祎卻被舉報偷稅

財經(jīng)要聞

油價暴漲 我們的生活成本會飆升多少?

汽車要聞

騰勢Z9GT到底GT在哪?

態(tài)度原創(chuàng)

房產(chǎn)
健康
教育
時尚
手機

房產(chǎn)要聞

14億!電競巨頭出手,海棠灣“超級運動綜合體”來了!

干細胞抗衰4大誤區(qū),90%的人都中招

教育要聞

4月20日開考!綿陽高三三診時間定了

媽媽們的人生,不該只有一個選項

手機要聞

國行iPhone開啟蘋果AI屬于意外!蘋果回應稱“現(xiàn)已修復”

無障礙瀏覽 進入關懷版