公眾號記得加星標??,第一時間看推送不會錯過。
有時,IT領域的創新源自超大規模數據中心和云計算。但早在這些公司從互聯網泡沫破滅的廢墟中崛起之前,創新往往來自電信和服務提供商行業,并被引入到數據處理領域。
一家名為 Eridu 的網絡初創公司也是如此,該公司剛剛結束隱身模式,并剛剛籌集了超過 2 億美元的 A 輪融資,旨在為 AI 集群創建一個非常高的基數交換系統,該系統將扁平化網絡,從而降低延遲并減少網絡成本,而網絡成本約占 AI 集群硬件總購置成本的 20% 以上。
超大規模數據中心和云構建商,更不用說高性能計算中心了,都不喜歡網絡成本占分布式計算系統成本的 10% 以上,而當他們看到這個數字上升到 30% 時,他們就更不喜歡了。這其中既包括將 GPU 和 XPU 內存連接起來組成機架級(以及未來的行級)系統的縱向擴展網絡,也包括使用幾十年前為高性能計算超級計算機開發的消息傳遞接口 (MPI) 協議的某種變體將成千上萬個機架級(以及很快的行級)系統連接成一個更松散耦合的系統所需的橫向擴展網絡。
如果要全面核算 AI 硬件的網絡成本,公司還必須加強將應用程序連接到 AI 集群的前端網絡,因為與構成 AI 集群外環或分支(取決于您使用環形拓撲、網狀拓撲還是胖樹拓撲)的橫向擴展網絡相比,這些網絡通常速度非常慢。
目前,Eridu 對其計劃的具體內容以及如何制造高基數 AI 交換系統仍然守口如瓶。當我們不斷向創始人提出我們需要一款具有無數個高速端口、超低延遲和超高帶寬的以太網交換機時,他們只是點頭大笑。
當然,我們長期以來一直對此深惡痛絕,尤其是在我們發現用于互連 GPU 的 PCI-Express 交換機端口數量不足(在網絡術語中稱為低基數)以及單通道帶寬不足(通道是組合成端口的),因此總帶寬不足以構建機架級系統——更不用說行級系統了。(如果機架是新的服務器,那么行就是新的機架,對吧?)
盡管UALink 互連規范的傳輸速率和速度足以與英偉達為其 GPU 開發的 NVSwitch 內存架構相媲美,但我們尚未看到任何保證,有人會制造出能夠突破該規范極限、在內存架構領域與英偉達匹敵甚至超越的 UALink 交換機 ASIC。理論上,UALink 交換機能夠在單層網絡環境下支持 1024 個 GPU 或 XPU 在共享內存域中運行,這遠遠超過當前 NVSwitch 3 的 72 個 GPU 以及英偉達“Blackwell” GPU 上的 NVLink 5 端口。公平地說,英偉達理論上可以在多層 NVSwitch 3 架構中支持多達 288 個 GPU 插槽,但這并未得到商業支持,并且會顯著增加 GPU 之間內存架構跳轉的延遲。
在深入探討我們對 Eridu 的了解之前,先來了解一下它的三位創始人的背景很重要,因為這能展現他們在電信和服務提供商領域取得的巨大成功,甚至可以追溯到互聯網誕生之初。當然,過去的業績并不能保證未來的表現,但它確實能很好地預測新理念進入市場并最終實現商業化的潛力。
Eridu聯合創始人德魯·珀金斯 是一位連續創業者,從業已有45年。珀金斯于1986年畢業于卡內基梅隆大學,獲得電氣工程、計算機工程和數學學士學位。在卡內基梅隆大學就讀期間及畢業后,他參與了多個項目,包括IP協議的開發以及點對點協議的創建——該協議最終被廣泛應用于眾多互聯網應用中。1987年,他創立了Entelechy公司,并設計了他認為的首款多端口以太網交換機,但該產品未能成功實現商業化。
1990年,珀金斯聯合創立了InterStream公司,該公司是網絡附加存儲(NAS)領域的早期供應商。然而,一次意外讓他的人生跌入谷底:他被一名酒駕司機駕駛的卡車撞倒,住院兩年多才康復。在重新學會走路、身上植入的金屬部件比“無敵金剛”還多之后,珀金斯加入了Fore Systems公司,這是一家為早期商業互聯網提供ATM骨干網的供應商。他擔任首席架構師,負責編寫ATM交換機軟件棧。1998年,珀金斯聯合創立了Lightera Networks公司,并擔任首席技術官。該公司開發的CoreDirector光交換機,促使Ciena公司在一年多后以5.5億美元的價格收購了Lightera Networks。之后,珀金斯在OnFiber Communications公司擔任同樣的職務。OnFiber Communications公司為美國都市地區提供互聯網光纖服務,并于2001年5月被Quest公司收購。珀金斯隨即加入Infinera公司,擔任聯合創始人兼首席技術官。據他所說,Infinera開發了世界上第一款硅光子集成電路。 Infinera 于 2007 年上市,并于 2024 年 6 月被諾基亞以 23 億美元收購。
頗具史蒂夫·奧斯汀式的風格,也與《少數派報告》和《黑鏡》的情節有幾分詭異的相似之處:2014年,珀金斯因雙眼白內障接受了人工晶體植入手術,之后他利用休假時間創立了Mojo Vision公司。該公司致力于通過“智能隱形眼鏡”進行圖像增強,并將增強后的圖像直接投射到視網膜上,從而為所有人打造仿生眼。2023年3月,珀金斯卸任Mojo Vision首席執行官一職,創立了Eridu公司。
這家網絡初創公司的另外兩位聯合創始人分別是首席產品官奧馬爾·哈森(Omar Hassen) 和首席業務拓展及市場營銷官邁克·卡普阿諾(Mike Capuano)。哈森此前曾擔任RISC-V 服務器芯片制造商 Ventana Systems的業務拓展高級副總裁。在此之前,他負責 Arm 服務器芯片初創公司 AppliedMicro 的產品開發,該公司的 Arm 服務器 CPU 業務為 Ampere Computing(現為軟銀旗下公司)奠定了基礎,而其光網絡和收發器芯片業務則被 Macom 收購。哈森在 International Rectifier、Marvell 和 Broadcom 等公司擁有豐富的部門和團隊管理經驗,其職業生涯可以追溯到互聯網泡沫破滅時期。
Capuano 一直在科技公司的市場營銷和銷售部門工作,1992 年從摩托羅拉開始,幾年后在 Juniper Networks 被收購后加入該公司,之后在思科系統和 Infinera 工作了十多年,之后在 Pluribus Networks 工作了一段時間,Pluribus Networks 是一家服務器交換機混合型產品制造商,于 2022 年被 Arista Networks 收購。
以上是它的出身背景。現在,讓我們來數數它融到的錢。
珀金斯告訴The Next Platform,該公司迄今為止已籌集超過2億美元的資金。網絡上的傳言稱,種子輪融資約為3000萬美元,A輪融資超過2億美元。這是一筆相當可觀的資金,如果你想在人工智能領域挑戰英偉達NVSwitch和Spectrum-X,并與博通、思科系統、Marvell以及其他一些為人工智能系統構建縱向擴展和橫向擴展網絡專用集成電路(ASIC)的公司競爭,那么這筆資金必不可少。
Eridu 的 A 輪融資由 Socratic Partners、John Doerr(曾任 Kleiner Perkins 的技術顧問,并早期投資了 Compaq、Netscape、Sun Microsystems、Google 和 Amazon 等公司而聞名)、Hudson River Trading、Capricorn Investment Group 和 Matter Venture Partners 領投。SBVA、Bosch Ventures、TDK Ventures、Eclipse Capital 和 VentureTech Alliance 也參與了此次融資。
從現在到本十年末,人工智能硬件支出預計將達到3萬億至5萬億美元,具體數額取決于你詢問的對象以及你對可能性或趨勢的判斷。這意味著網絡領域蘊藏著巨大的商機。例如,網絡領域的投資額可能在6000億美元到1.5萬億美元之間,具體取決于你如何界定。如此巨大的收入足以推動創新、促進競爭,并最終確保英偉達在2030年繼續保持其在人工智能系統計算和網絡領域的領先地位。
至于如何進行這種高基數轉換,珀金斯和哈森只是笑著說,不愿透露太多細節。他們提供了以下圖表:
![]()
我們假設上述對比使用的是 51.2 Tb/秒以太網交換機 ASIC,而不是已經曝光、可能在今年晚些時候或明年年初開始出現在產品中的 102.4 Tb/秒設備,并將其與 Eridu 正在研發的產品進行比較。但如果對比對象是 102.4 Tb/秒設備,那將會更有意思。
“眾所周知,GPU插槽的性能和功耗正以驚人的速度提升10倍,但網絡性能卻沒有,”珀金斯解釋道。他補充說,這種數量級的提升涵蓋了所有技術手段,包括降低數據和計算精度、優化軟件棧以及底層硬件。“網絡性能并沒有跟上步伐,每個芯片節點(也就是每兩到三年)的性能才翻一番。我們認為這樣的速度遠遠不夠,而Eridu的創立正是為了解決這個問題。”
“我們希望將網絡性能提升一個數量級,因為這些GPU必須互連,”珀金斯繼續說道。“單個GPU固然不錯,但當數量達到數十萬甚至數百萬時,你就能擁有真正足以構建人工智能的計算能力。但網絡速度必須足夠快才能跟上這些計算。否則,GPU就會閑置。而GPU三分之二的時間都處于閑置狀態,因為網絡速度不夠快,無法及時將數據傳輸到它們。”
噓,別告訴英偉達或AMD的GPU用戶……
我們不知道埃里都究竟在做什么,但我們知道一些事情。
首先,埃利都位于如今伊拉克南部,是蘇美爾帝國最古老的城市,它建于約7500年前,并繁榮了數個世紀。它南臨波斯灣,北接幼發拉底河,距離烏爾下游僅15英里。埃利都曾是智慧、工藝和淡水之神恩基的都城,他的神廟名為阿布祖,意為“深水之屋”。這在美國或許可以稱作“靜水”,正如“靜水流深”所言。這又以一種有趣的方式將我們帶回到了智能的話題。進一步延伸這個比喻,埃利都存在于大洪水之前——沒錯,就是美索不達米亞和基督教經典中都記載的那場大洪水——或許我們也正處于一場屬于我們自己的人工智能大洪水之前。的確,這都是深水。
上圖清晰地表明,Eridu 公司希望開發一種新的交換機 ASIC 架構和新的交換機系統設計,以便在縱向擴展網絡中互連數千個 GPU 和 XPU,并在橫向擴展配置中互連數百萬個這樣的計算引擎。Eridu 的這項計劃成本高昂,但使用對溫度敏感的光收發器連接以太網脊交換機和葉交換機(或直接驅動銅纜或銅背板的 NVSwitch)同樣成本不菲。
我們來做一個思想實驗。
假設上述 Clos 架構中的交換機有 64 個端口,運行速度為 800 Gb/s,那么葉脊網絡可以將 1280 個端口互連到 1280 個 GPU。因此,有幾種方法可以從看似單個設備中實現 1280 個端口。第一種方法是構建一個帶有獨立背板和互連結構的模塊化交換機。但這成本很高,這也是為什么我們看到超大規模數據中心和云平臺構建商在葉脊架構中首先使用普通交換機的原因。
你可以制造一個超大型交換機插槽,就像我們明年即將推出的帶有四個或更多互連計算引擎的超大型 GPU 和 XPU 插槽一樣。這種“大插槽”方案在網絡應用方面的問題在于,它存在“前沿區域與實際處理區域”的矛盾。隨著交換機數據包處理引擎面積的增加,能夠部署 SerDes 與外部通信的邊緣節點數量與數據包處理能力的比值會下降。此外,在達到一定程度后,交換機插槽的直通延遲也會變得過大。所以,這很糟糕。
但哈森在我抱怨這件事之后說,這種受限于十字線的芯片混合方法的缺點還不止于此。
“這是次要問題,”他指出。“首要問題是,如果你把交換芯片粘在一起,數據包就必須經過多個地方,而且必須被存儲。所以你真的必須從一張白紙開始,承認你不會把東西粘在一起,你構建的交換架構必須有一定的適用范圍。”
當我們仔細考慮這個問題時,我們想到了一種晶圓級交換機專用集成電路(ASIC),但珀金斯和哈森都對此既不承認也不否認。盡管存在我前面提到的面積與前端帶寬的問題,但這種方案仍然很有道理。使用小型芯片組可以極大地提高良率,但由于芯片間的互連,也會增加功耗。如果想要徹底解決這個問題,可以在晶圓級數據包處理引擎的邊緣堆疊SerDes,以彌補前端帶寬的減少。或者,可以使用非常大的SRAM緩存(這對于管理復雜大型系統中的數據流非常有用),以保持數據包處理能力和SerDes帶寬的平衡。
我可能會試試這個方法。我們得等到今年晚些時候——也許是在Hot Chips大會上,也許是在其他某個活動上——才能知道結果,因為埃里都現在對此事不予置評。
該公司確認,無論最終方案如何,都將采用以太網,并運行適用于內存架構和橫向擴展網絡的相應協議。在與 Perkins 和 Hassen 深入交談后,我們感覺它并非像谷歌用于其網絡骨干(包括其最新四代 TPU 集群)的光路交換機。
我得到的另一條提示是:
![]()
首個 Eridu 行級交換系統的單域似乎可以在單跳網絡中支持多達 5120 個 GPU 或 XPU,并在兩層網絡中支持超過 100 萬個計算引擎。目前尚不清楚內存原子操作能否在這種規模下正常工作,但如果它對 AI 模型開發者有用,我們不妨抱有希望。
從這張圖表中還可以看出,盡管 Eridu 聲稱可以將交換機數量減少 30 倍,但它實際上只試圖將交換基礎設施的成本降低 40%,同時將網絡功耗降低 70%。換句話說,Eridu 認為這是一條通往巨額利潤的捷徑。
https://www.nextplatform.com/connect/2026/03/11/eridu-cuts-to-the-ai-networking-chase-with-high-radix-switch-system/5208996
(來源:編譯自nextplatform)
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4343內容,歡迎關注。
加星標??第一時間看推送
求推薦
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.