![]()
芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影
芯東西2月11日報道,2月10日,思科推出3nm交換芯片Silicon One G300,單設備可提供102.4Tbps的以太網交換容量,專為AI集群網絡而優化。
思科將Silicon One G300稱作“Agent時代的網絡基礎”。
G300支持1.6T以太網端口,并集成思科自研200Gbps片上SerDes,可實現低功耗、高性能和更遠的傳輸距離。它具有高達512個端口的高擴展性,能構建更“扁平化”的網絡,并將更多計算資源連接到網絡邊緣附近。
這使得運營商能夠在物理距離上更近的地方連接更多GPU,從而降低延遲、簡化網絡,并最大限度地提高AI訓練和推理工作負載的效率。
思科Silicon One G300將為全新思科N9000和思科8000系統提供動力。該系統具有創新的液冷功能,并支持高密度光學器件,以實現新的效率基準,并確保客戶充分利用GPU投資。
G300軟件開發工具包(SDK)現已發布。首批系統計劃在2026年下半年推出。
思科通過兩大戰略支柱——智能集體網絡和面向未來的基礎設施,來優化TCO,并提高網絡集群的盈利能力。
一、智能集體網絡:有效吸收突發AI流量,防止數據包丟失
Silicon One G300引入一系列智能集體網絡功能,旨在為大規模GPU集群提供更高的性能和可靠性:
(1)完全共享的數據包緩沖區:將252MB的數據包緩沖區直接嵌入芯片,允許來自任何端口的數據包占用任何可用空間。這種擴展容量可提供比業界其他方案高出2.5倍的突發流量吸收能力,有效吸收突發的AI流量,防止性能下降,并確保網絡始終以最佳狀態運行。
(2)基于路徑的負載均衡:此功能可將流量定向到所有可能的網絡路徑,并以比軟件調優快10萬倍的速度,通過硬件對瞬時擁塞事件或網絡故障做出響應。這種路徑選擇自動化無需手動優化,可以提高GPU密度,并確保即使流量模式實時變化,網絡也能保持最佳狀態。
(3)主動式網絡遙測:Silicon One G300提供豐富的可編程會話級診斷功能。這種可視性有助于客戶主動識別和解決網絡故障以及優化機會。
智能集體網絡可帶來可衡量的效益。在模擬中,與非優化路徑選擇相比,更大的數據包緩沖區使網絡吞吐量提高了33%。這使得在無需增加網絡容量、構建更大網絡或添加更多交換機的情況下,即可支持更高的GPU互連流量,從而降低了每個已部署GPU的資本支出。
此外,模擬結果表明,與高級數據包噴射實現相比,作業完成時間(JCT)減少了28%,顯著提高了AI計算效率,使AI數據中心每GPU小時產生更多的token。
最后,通過將遙測和可視化功能直接集成到交換機中,運行時所需的軟件干預極少。網絡可以無縫處理不同的工作負載,無需重新配置或重新優化。
二、面向未來的基礎設施:高度可編程,無需更換硬件就能升級
部署新的數據中心設備是一項重大的財務和運營挑戰。以往,部署具有高級功能的新硬件迫使網絡運營商做出艱難的選擇:要么將新設備的功能降級到“最低標準”,要么承擔強制淘汰舊設備的成本。
Silicon One通過自適應分組處理技術打破了這一循環。G300只是Silicon One最新一款采用P4可編程技術的芯片,具有高度可編程性,靈活性高,使運營商能夠在不更換硬件的情況下升級基礎設施。
這種可編程性有兩個主要優點:
(1)一種硬件設計可以針對多種角色進行優化。Silicon One G300可用于后端、前端以及跨數據中心的分散式擴展應用。其結果是減少了硬件SKU,簡化了庫存管理,并降低了總體開發成本。
(2)新功能可在部署后推出。這改變了以往每個周期都購買新設備的模式,轉而擴展現有基礎設施,同時確保混合世代部署的一致性。
這使得基于Silicon One的產品能夠支持新興的用例,并發揮多種網絡作用,保護長期基礎設施投資。通過將安全性融合到硬件中,客戶可以采用全面、高速的安全性來保持群集的正常運行。
三、面向AI工作負載的極端功率和熱需求,推出全新以太網系統
為了使各種規模的AI網絡構建器(超大規模到企業)能夠實現,思科宣布擴展Silicon One P200產品組合,推出全新思科8000和N9000固定式和模塊化以太網系統,并提供靈活的操作系統支持。
Silicon One P200解決方案基于Silicon One架構,可為數據中心互連(DCI)、通用脊交換機以及核心和對等路由等全新應用場景提供支持。
思科N9000和思科8000 102.4T系統由Silicon One G300提供支持,通過液冷和風冷設計,提供更出色的數據中心性能和效率。100%液冷系統可顯著提高帶寬密度,并實現近70%的能效提升,在單個系統中提供與以前需要6個上一代系統相同的帶寬。
思科還在推出創新的光學器件,以釋放更高的效率和更高的可靠性。
1.6T OSFP(八通道小型可插拔)光學提供針對1.6T交換機到NIC鏈路和1.6T、800G、400G或200G交換機到服務器鏈路的AI擴展解決方案的超高帶寬連接,為客戶提供高性能和可靠性。
800G線性可插拔光學器件(LPO)提高AI擴展網絡的效率,與重定時光學模塊相比,LPO將光學模塊的功耗降低了50%。
有了支持LPO的新N9000和8000系統,客戶可將整體開關功率降低30%,從而實現更可靠和可持續的運營。
思科還推出了新的28.8T模塊化線卡。這種P200驅動產品的擴展,結合思科800G ZR/ZR+相干可插拔光學器件,使客戶能夠在其網絡中跨多個角色部署通用架構。
該公司正在通過統一的管理平臺優化Nexus One。該平面將硅、系統、光學、軟件和可編程智能作為一個單一的集成解決方案,使企業更容易運營其AI網絡。
思科還通過AI Canvas引入AgenticOps,用于數據中心聯網,通過引導式、人際對話,使故障排除更容易,將復雜問題轉化為可操作的解決方案。
結語:推動數據中心AI網絡的前沿
AI熱潮正面臨一個新挑戰:大規模并行AI計算并不適合在“混搭”的網絡設備上運行。由于需要進行大量的互操作性測試,以及新部署的系統可能被迫回退到舊版功能,運營商正在承擔新的隱性成本。
對此,思科正在采用包括Silicon One G300在內的多代AI網絡方法,優先考慮網絡效率,并大規模降低AI部署的總擁有成本(TCO)。其靈活且集成的方法,可以實現更多的選擇、更強的安全性和更深的可觀察性,從而支持更多客戶轉向AI驅動的工作負載。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.