網易首頁 > 網易號 > 正文申請入駐

單通道400G已就緒！全棧互聯公司揭開800G AI超級網卡序幕

2026-04-16 19:50:16　來源: 芯東西

北京舉報

分享至

芯東西（公眾號：aichip001）
作者 ZeR0
編輯漠影

芯東西4月16日報道，近日，AI全棧式互聯公司奇異摩爾宣布，已成功構建800G AI超級網卡（SNIC）平臺架構，除了800Gb/s 的高帶寬，亞微秒的超低延時，其關鍵技術還涵蓋面向AI網絡的增強型RoCE v2機制，包括包噴灑，多路徑傳輸，高性能重傳，與先進的可編程擁塞控制等。基于該自研平臺架構設計的AI SNIC ASIC，已于近期完成回片，并順利通過核心RDMA架構的硅驗證，單通道吞吐量穩定在400Gbps，關鍵時延約1微秒。

在當前國產高性能網卡公開產品與產業敘事仍多集中于100/200G RDMA ASIC引擎階段的背景下，奇異摩爾正以單通道400G RDMA ASIC引擎這一實質性突破，為國產AI超級網卡快速邁向800G ASIC揭開序幕。

▲800G AI SNIC平臺架構設計的ASIC已順利通過RDMA架構的硅驗證，單通道吞吐量穩定在400Gbps

一、為什么是基于以太網的RDMA AI 原生網卡

在AI網絡興起之前，行業對智能網卡（SmartNIC）的主流劃分，并非圍繞AI訓練與推理場景，而是依據芯片架構與卸載能力深度進行區分。核心關注點在于其能夠為CPU分擔多少基礎設施工作，包括虛擬機間網絡交換、存儲、加解密，安全與遙測，壓縮與解壓縮等硬件卸載功能，典型產品如數據處理單元（DPU）網卡，并非針對大模型集群通信做專項定制優化。

進入大模型時代，隨著AI訓練從千卡向萬卡規模擴展、推理從單機部署走向大規模分布式服務，Scale-out網絡正在成為決定GPU利用率、集合通信效率和單位Token成本的關鍵基礎設施。無論是All-Reduce、Reduce-Scatter，還是All-to-All等典型集合通信，都要求網絡具備更高帶寬密度、更低時延、更低尾時延，以及更快的擁塞反應能力。

在此背景下，基于以太網的高性能RDMA路線愈發清晰：它既繼承了以太網生態開放、部署成熟、成本可控的優勢，又通過面向AI網絡的RoCE/RDMA專項優化，逐步具備支撐大規模AI集群的能力。

這一技術趨勢在國內頭部云服務提供商（CSP）的技術需求規范，以及國外超以太網聯盟（UEC）的誕生中體現得尤為明顯。就是交付一套面向AI與HPC場景的開放、高性能以太網架構，重點解決傳統以太網在大規模訓練環境下面臨的多路徑傳輸、快速擁塞響應、尾時延控制、易配置與可擴展性等問題。

換句話說，以太網不再只是“通用網絡”的代表，而是在AI時代被重新定義為承載大規模集群互聯的主航道之一。

“奇異摩爾AI 超級網卡技術路線，與頭部云服務提供商（Tier1 CSP）的需求完全一致，與UEC的規范也高度趨同。我們已構建的800G平臺架構能力，能有效支持最高800Gb/s RDMA吞吐，數百萬級消息處理能力與數百萬級隊列（QP），大大增強了RoCE v2協議棧，增加了包噴灑、亂序重組、高效重傳，高級可編程擁塞控制等AI網絡急需的增強特性。以太網的技術路線確保了產品的開放互操作性與生態兼容性，為進入頭部云服務供應商以及未來平滑融入超以太網生態、實現跨廠商協同奠定了基礎。” 奇異摩爾網絡技術VP葉棟表示。

▲800G AI SNIC 及功能描述

葉棟擁有超過20年的網絡互聯系統架構設計經驗，在AI網絡協議、RDMA、虛擬化、軟件協議棧等方面擁有豐富的專業知識。其在英特爾（中國）工作多年，曾任英特爾網絡互聯產品事業部技術總監，負責英特爾以太網、智能網卡，P4可編程交換芯片、英特爾/Google IPU相關系統架構產品的本地化研發和部署。啟動和主導了多家大型云服務提供商大規模部署的技術方案的底座。

針對網絡密集型大規模并行計算對高帶寬、低延遲數據傳輸的嚴苛需求，NVIDIA不僅推出基于IB網絡的超級網卡(SNIC)，也推出了面向以太網的SNIC，旨在為AI工廠與云數據中心提供強大的網絡支撐。NVIDIA對AI超級網卡的定義十分清晰：這是一類“專為網絡密集型、海量分布式AI計算工作負載打造的新型網絡加速器”。其價值遠不止于完成數據包的傳輸，更在于讓多GPU、多節點環境下的通信真正成為釋放算力的加速引擎。

二、對標NVIDIA ConnectX-8/9 的領先性，800G AI網卡從“接口”走向“中樞”

NVIDIA公開表示，ConnectX-8是業界首個把PCIe Gen6級交換能力與超高速網絡處理能力集成到單一器件中的超級網卡（SNIC）。它不僅服務于AI、HPC和超大規模云數據中心場景，還通過集成48 lanes 的PCIe Gen6 Switch，把原本需要獨立PCIe Switch和獨立NIC共同完成的任務，整合到一個高集成度器件中，這是一項絕無僅有的創新技術路徑。

傳統1機8卡PCIe GPU服務器普遍采用以 CPU 為根節點、PCIe Switch 向下連接 GPU 的樹形拓撲。

這種架構在通用計算時代較為成熟，但在大模型訓練場景下，其結構性性能瓶頸日益突出：GPU間通信往往需要經過PCIe Switch，跨Socket路徑還可能受到主機鏈路約束，導致時延升高、帶寬利用率下降，難以滿足All-Reduce、Reduce-Scatter、All-to-All 等高頻集合通信對低時延和高吞吐的要求。

所以ConnectX-8將PCIe Gen6交換能力與高速網絡能力整合到單一器件中，可替代傳統離散PCIe Switch，既優化GPU到GPU、GPU到NIC的數據路徑，也降低系統復雜度、功耗和總體擁有成本。

在端口形態上，ConnectX-8也已經明確邁入800G時代。NVIDIA官方顯示，ConnectX-8以太網版本具備2×400GbE的產品形態，其不僅擁有800G級總帶寬能力，也具備更靈活的雙端口組網方式，更適合未來大規模AI集群對冗余、分流、彈性擴展和復雜拓撲部署的需求。從出貨形態來說，ConnectX-8已將高速網絡能力與PCIe Gen6 Switch能力整合至單一器件之中，并以一體化集成設計形態面向平臺出貨。

三、奇異摩爾創造里程碑：國產AI SNIC從“可用”邁向“高性能”

正是在這樣的全球技術演進背景下，奇異摩爾基于自研800G AI SNIC ASIC架構構建的單通道400G引擎完成了核心RDMA ASIC 流片驗證，才顯得意義格外突出。

與FPGA方案更適合早期驗證、快速迭代不同，ASIC路線決定了一款產品是否真正具備面向大規模AI訓推集群的性能上限、功耗效率、板卡集成度和量產一致性。

奇異摩爾率先在國產陣營中實現單通道400G RDMA ASIC引擎，吞吐量穩定在400Gbps，不僅填補了國內高帶寬超級網卡芯片的空白，更充分證明了其已掌握2×400G乃至更高速率產品的核心設計能力，為下一代800G網卡奠定了堅實技術基礎。

奇異摩爾最新800G SNIC全面對標英偉達ConnectX-8/9的架構方向，采用與國際先進方案相一致的“高速網絡處理+PCIe Switch能力”一體化設計思路，在產品形態上支持 2×400G端口以太網總帶寬，在架構層面同時承擔AI服務器內部互連優化與節點間高速通信能力。

這意味著，該企業在800G產品布局不只是帶寬規格升級，更是對未來AI高性能集群互連形態的提前卡位：通過集成PCIe Switch能力，重構GPU到GPU、GPU到NIC的數據路徑，提升集合通信效率、降低系統復雜度，并增強對整機平臺和集群方案的定義能力。

奇異摩爾網絡技術VP葉棟補充道，奇異摩爾最新800G 超級網卡按計劃于年內量產，有望成為國產化在800G AI超級網絡芯片、系統集成方案以及平臺級架構能力上的重大突破，進一步增強中國廠商在未來AI高性能集群基礎設施中的產品定義權、方案協同權和產業話語權。

結語：國產化窗口已開，市場潛力加速釋放

從產業空間與政策環境來看，奇異摩爾所切入的并非小眾賽道，而是一個正在快速擴容的核心基礎設施市場。公開研究顯示，僅ConnectX-7級別的高性能AI網卡市場規模已超過百億元，并仍在持續增長。這意味著，以ConnectX-7/ ConnectX-8為代表的高性能AI網卡賽道，背后對應的是一個數百億元級、且仍在不斷放大的市場機遇。

與此同時，國家對自主可控智算底座、高速互連及國產化集群的戰略訴求正持續加強。國家發展改革委等部門已明確提出，要加快部署智能無損網絡、400G/800G等先進技術，建設高速泛在、安全可靠的全國一體化算力網，并強化自主創新技術供給能力。

奇異摩爾是一家深度聚焦AI互聯多年的全棧式解決方案提供商，以網絡+芯粒技術為底層特色，除面向Scale Out場景的AI網卡芯片，公司還提供面向Scale Up超節點的G2G IO互聯芯粒，并已在業內實現落地應用。這一不同于其他芯片廠商的技術基因構筑了差異化的競爭壁壘，也賦予了其在下一代高性能集群互聯中更強的靈活性、更廣闊的發展空間以及更深的技術縱深。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.