據(jù)外媒報道,NVIDIA新顯卡RTX Pro 6000 Blackwell的表現(xiàn)說明,在運行大型AI模型時,高端單卡有時比主流多卡方案更高效,甚至能接近甚至超過四張NVIDIA GeForce RTX 5090。
在一項測試中,使用了2300億參數(shù)模型MiniMax M2.7,在統(tǒng)一的IQ3_XXS量化、32K上下文和4096最大token設置下,對比了四種配置:
4×NVIDIA GeForce RTX 4090(96GB):71.52 tok/s,TTFT 1045ms
4×NVIDIA GeForce RTX 5090(128GB):120.54 tok/s,TTFT 725ms
1×NVIDIA RTX Pro 6000 Blackwell(96GB):118.74 tok/s,TTFT 765ms
NVIDIA DGX Spark(128GB):24.41 tok/s,TTFT 741ms
![]()
從生成速度來看,單張RTX Pro 6000幾乎追平四張5090,而明顯領先四張4090;DGX Spark則由于定位不同,性能較低。
但關鍵不只是速度,還有功耗差異:
4×4090:約1800W
4×5090:約2300W
RTX Pro 6000:約600W
DGX Spark整機:約240W
也就是說,RTX Pro 6000只用四分之一的功耗,就能接近四張5090的性能。
![]()
價格方面:
RTX 4090:約3000美元/張
RTX 5090:約3500美元/張(四張約14000美元)
RTX Pro 6000:約9500美元
DGX Spark:約4699美元
總體來看,多卡雖然能疊加顯存,但也會帶來通信開銷和效率損失;而大顯存單卡在性能、功耗和成本之間反而更均衡,尤其是在運行超大模型時優(yōu)勢明顯。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.