![]()
在上周舉辦的中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE)上,一項(xiàng)以O(shè)CS(光路交換)重塑智算網(wǎng)絡(luò)架構(gòu)的最新成果,宣告落地。
上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊發(fā)布了“光躍超節(jié)點(diǎn)128卡商用版”,實(shí)現(xiàn)長(zhǎng)期穩(wěn)定訓(xùn)練狀態(tài),帶動(dòng)模型訓(xùn)練性能顯著提升,傳輸延遲相較傳統(tǒng)電交換降低90%以上。
該超節(jié)點(diǎn)以曦智科技全球首創(chuàng)的硅光OCS光交換芯片為核心,最初在去年7月的WAIC大會(huì)上發(fā)布,僅用半年多時(shí)間,便實(shí)現(xiàn)從概念驗(yàn)證到實(shí)際商用的跨越。這也是國(guó)內(nèi)首個(gè)端到端OCS批量部署方案。
此外,這一方案成功了適配階躍星辰、DeepSeek等多個(gè)國(guó)產(chǎn)大模型,驗(yàn)證了其成為高性?xún)r(jià)比、高能效國(guó)產(chǎn)算力解決方案的潛力。
面對(duì)大模型訓(xùn)練中傳統(tǒng)電交換網(wǎng)絡(luò)日益嚴(yán)峻的功耗和延遲困境,擁有低功耗、低延遲和調(diào)度靈活性的OCS技術(shù),正成為突破算力效能天花板的關(guān)鍵抓手。
首先要承認(rèn)一個(gè)事實(shí),當(dāng)前在數(shù)據(jù)中心中,傳統(tǒng)的電分組交換(Packet Switch)仍然是主流。這主要是因?yàn)槠浼夹g(shù)成熟、生態(tài)完善。
從原理上來(lái)看,在交換數(shù)據(jù)時(shí),電分組交換機(jī)首先將來(lái)自光纖鏈路的光信號(hào)通過(guò)光模塊轉(zhuǎn)換為電信號(hào),然后在交換芯片中對(duì)數(shù)據(jù)包進(jìn)行解析與轉(zhuǎn)發(fā),最后再通過(guò)光模塊將電信號(hào)重新轉(zhuǎn)換為光信號(hào)并發(fā)送。
整個(gè)過(guò)程依賴(lài)“光-電-光”(O-E-O)的轉(zhuǎn)換與電子交換芯片完成數(shù)據(jù)處理,光模塊把光信號(hào)轉(zhuǎn)換為電信號(hào),由交換芯片完成讀取、緩存與路由,再通過(guò)光模塊重新轉(zhuǎn)回光信號(hào)繼續(xù)發(fā)送。
可以把它理解為一個(gè)繁忙的鐵路貨運(yùn)站。當(dāng)滿(mǎn)載數(shù)據(jù)的列車(chē)到達(dá)時(shí),必須進(jìn)站停車(chē),將貨物卸下、分揀、重新編組到另一列車(chē)上,再發(fā)車(chē)出站。列車(chē)在站內(nèi)的每一次停頓、裝卸設(shè)備的持續(xù)運(yùn)轉(zhuǎn),都帶來(lái)更高的延遲與能耗。
以此類(lèi)網(wǎng)絡(luò)中常見(jiàn)的400G光模塊(光電轉(zhuǎn)換器件)為例,其功耗大約為10W左右,傳輸1比特(bit)數(shù)據(jù)所消耗的能量大約為25皮焦耳(pJ)。再加上交換機(jī)內(nèi)部負(fù)責(zé)處理信號(hào)的SerDes芯片本身的功耗,總能耗可輕松超過(guò)30 pJ/bit。更先進(jìn)的800G模塊雖然在能效上有所提升,但單位能耗仍維持在15–20 pJ/bit的量級(jí)。
在超大規(guī)模數(shù)據(jù)中心中,這種能耗將迅速累積,不僅顯著增加運(yùn)營(yíng)成本,也給散熱和系統(tǒng)設(shè)計(jì)帶來(lái)巨大壓力。
這正是OCS(Optical Circuit Switch)能發(fā)揮價(jià)值的場(chǎng)景。
OCS可以在物理層直接改變光信號(hào)的傳播路徑。當(dāng)數(shù)據(jù)流到達(dá)交換節(jié)點(diǎn)時(shí),無(wú)需像電交換那樣經(jīng)歷復(fù)雜切換過(guò)程,只需要調(diào)整方向,就能把光信號(hào)直接引導(dǎo)到目標(biāo)鏈路上,從而建立一條端到端的光通路。
它更像是在鐵路網(wǎng)絡(luò)中部署了一套智能道岔系統(tǒng)。光列車(chē)無(wú)需進(jìn)站停車(chē),直接切換軌道方向,保持高速直通狀態(tài)。雖然維持這個(gè)“道岔”系統(tǒng)的運(yùn)行仍需要能量,但與O-E-O轉(zhuǎn)換相比,其能耗降低了幾個(gè)數(shù)量級(jí),理論上能做到fj/bit(1000fj=1pj)量級(jí)。
除了能耗與延遲之外,OCS還在帶寬、可靠性、兼容性方面具有優(yōu)勢(shì)。它不受電子交換芯片端口速率和SerDes速率的限制,可更輕松地支持高帶寬的數(shù)據(jù)傳輸;也不依賴(lài)于特定的數(shù)據(jù)傳輸協(xié)議,可無(wú)縫兼容不同廠(chǎng)商使用的互連協(xié)議,消除生態(tài)鎖閉風(fēng)險(xiǎn)。
同時(shí),OCS可以在物理層快速重新建立光路。當(dāng)某條鏈路或設(shè)備出現(xiàn)故障時(shí),網(wǎng)絡(luò)能夠在幾秒內(nèi)通過(guò)重新配置光通路繞過(guò)故障路徑,從而提高網(wǎng)絡(luò)的整體穩(wěn)定性和容錯(cuò)能力。
OCS的優(yōu)勢(shì)明顯,但其技術(shù)門(mén)檻高、涉及多學(xué)科交叉。不同廠(chǎng)商和研究機(jī)構(gòu)正基于各自的技術(shù)積累與產(chǎn)業(yè)生態(tài)進(jìn)行探索:有的延續(xù)傳統(tǒng)光通信中的MEMS光開(kāi)關(guān)路徑,有的嘗試基于硅光波導(dǎo)實(shí)現(xiàn)高度集成化的光交換,還有一些方案則采用液晶、壓電陶瓷等光學(xué)調(diào)控技術(shù)。
在這些技術(shù)路徑中,MEMS(微機(jī)電系統(tǒng))OCS是目前相對(duì)成熟的一類(lèi)方案。該方案通過(guò)微型可動(dòng)反射鏡陣列改變光束傳播方向,實(shí)現(xiàn)端口之間的光路重構(gòu)。
谷歌是全球范圍內(nèi)唯一完成OCS大規(guī)模量產(chǎn)部署的公司,已有10年左右的研發(fā)經(jīng)驗(yàn),其方案基于MEMS。結(jié)合谷歌開(kāi)發(fā)的全棧軟件,這一方案極大提高了TPU訓(xùn)練集群的數(shù)據(jù)交換效率。
![]()
谷歌的MEMS光交換方案
MEMS方案的優(yōu)勢(shì)在于端口規(guī)模大、光學(xué)性能穩(wěn)定;但其也存在一定局限,例如機(jī)械結(jié)構(gòu)帶來(lái)的切換速度限制(目前為毫秒級(jí))、器件體積較大以及系統(tǒng)封裝復(fù)雜度較高、價(jià)格昂貴等。
另一條備受關(guān)注的路線(xiàn)是硅光(Silicon Photonics)OCS。該方案利用硅基波導(dǎo)等器件在芯片上實(shí)現(xiàn)光信號(hào)的路由與切換。相比MEMS依賴(lài)微機(jī)械結(jié)構(gòu)的方式,硅光方案沒(méi)有機(jī)械運(yùn)動(dòng),切換速度可達(dá)微秒甚至納秒級(jí)。
![]()
硅光OCS還能夠依托成熟的CMOS制造工藝實(shí)現(xiàn)規(guī)模化生產(chǎn),并具備更好的集成度和潛在的成本優(yōu)勢(shì)。但在光損耗控制以及熱串?dāng)_問(wèn)題等方面,還有優(yōu)化空間。
除了MEMS和硅光之外,OCS領(lǐng)域還存在一些其他技術(shù)路線(xiàn),例如基于液晶材料調(diào)控光路的方案,以及利用壓電陶瓷驅(qū)動(dòng)光學(xué)結(jié)構(gòu)改變傳播路徑的方案等。這些技術(shù)各有特點(diǎn),在切換速度、穩(wěn)定性或成本方面提供了不同的工程權(quán)衡。
總體而言,OCS領(lǐng)域正處于“多路線(xiàn)并行探索”的階段,各種技術(shù)在端口規(guī)模、切換速度、能效與可制造性之間不斷尋找平衡,尚未出現(xiàn)絕對(duì)主導(dǎo)路線(xiàn),未來(lái)很可能會(huì)在不同應(yīng)用場(chǎng)景中形成多種技術(shù)并存的格局。
而結(jié)合國(guó)內(nèi)當(dāng)前的發(fā)展階段與技術(shù)環(huán)境,依托成熟半導(dǎo)體制造體系的硅光路線(xiàn),在產(chǎn)業(yè)鏈協(xié)同和規(guī)模化制造方面具備一定現(xiàn)實(shí)優(yōu)勢(shì),也因此成為曦智等國(guó)內(nèi)企業(yè)重點(diǎn)探索的方向之一。
在智東西與曦智科技CEO沈亦晨的溝通中,我們了解到,過(guò)去半年,曦智科技從軟件和硬件兩個(gè)方面雙管齊下,推動(dòng)光互連光交換超節(jié)點(diǎn)的商用落地。
研發(fā)過(guò)程中,團(tuán)隊(duì)面臨了巨大的工程挑戰(zhàn)。比如,在初期他們遇到了光信號(hào)連接不穩(wěn)定、傳輸切換不如理論預(yù)期順暢等問(wèn)題。為了解決這些問(wèn)題,曦智科技聯(lián)合GPU廠(chǎng)商和服務(wù)器廠(chǎng)商,組建了龐大的技術(shù)團(tuán)隊(duì),通過(guò)大量的調(diào)優(yōu),最終實(shí)現(xiàn)了穩(wěn)定部署的質(zhì)變。
此外,曦智開(kāi)發(fā)了光交換相關(guān)的配套軟件,并與GPU和服務(wù)器廠(chǎng)商等生態(tài)伙伴一道完善配套軟件生態(tài)。
對(duì)于“銅退光進(jìn)”的演進(jìn),業(yè)界已經(jīng)形成了基本共識(shí)。2025年底,市場(chǎng)調(diào)研公司Cignal AI發(fā)布了最新的OCS市場(chǎng)報(bào)告,這份報(bào)告的核心是:隨著超大規(guī)模數(shù)據(jù)中心和AI算力中心部署,OCS的角色從驗(yàn)證逐漸過(guò)渡到大規(guī)模試點(diǎn)與商用,其部署范圍擴(kuò)展至谷歌以外的更多廠(chǎng)商、更多應(yīng)用場(chǎng)景,OCS的總市場(chǎng)規(guī)模到2029年將至少達(dá)到25億美元。
英偉達(dá)這樣的頭部玩家正在用行動(dòng)投票。本月,英偉達(dá)分別向Lumentum(MEMS路徑)和Coherent(液晶路徑)這兩家專(zhuān)注于OCS技術(shù)的企業(yè)投資了20億美元,并簽署了多年數(shù)十億美元的采購(gòu)承諾和未來(lái)產(chǎn)能優(yōu)先獲取權(quán),體現(xiàn)出其對(duì)OCS的長(zhǎng)期看好。
我們也與沈亦晨聊到了英偉達(dá)在OCS賽道的這一大動(dòng)作。沈亦晨稱(chēng):“2-3年前,曦智便做出判斷,未來(lái)數(shù)據(jù)中心30%的芯片都會(huì)是光芯片,英偉達(dá)也一定會(huì)全面擁抱光芯片。”這次英偉達(dá)的押注,其實(shí)是因?yàn)楣庑酒磳⒃谄洚a(chǎn)品中“快速起量”,因此需對(duì)供應(yīng)鏈進(jìn)行提前布局。
至于不同技術(shù)路徑的選擇,沈亦晨保持了開(kāi)放的態(tài)度。在他看來(lái),不同OCS技術(shù)路徑雖有具體指標(biāo)的差異,但核心功能共性高達(dá)80%-90%。現(xiàn)階段的首要任務(wù)是將光交換集群從概念變?yōu)楝F(xiàn)實(shí),落地部署大規(guī)模光互連光交換集群。
此外,硬件落地是軟件優(yōu)化的前提。只有先擁有一套實(shí)體的光交換集群,軟件和系統(tǒng)才能針對(duì)其特性進(jìn)行優(yōu)化。從“電交換”改為“光交換”是軟件層面最重要的變革環(huán)節(jié),在光交換體系內(nèi)部,后續(xù)對(duì)軟件層面的優(yōu)化屬于“邊際收益(marginal gain)”。
沈亦晨類(lèi)比道:“與其現(xiàn)在糾結(jié)于用哪一種技術(shù)路線(xiàn)的電機(jī),不如先讓一輛電動(dòng)車(chē)上路。車(chē)能上路,配套設(shè)施自然就會(huì)建起來(lái)。”
OCS技術(shù)正以前所未有的方式重塑AI算力基礎(chǔ)設(shè)施。它不僅在能耗、延遲和帶寬上帶來(lái)質(zhì)的飛躍,也為下一代超大規(guī)模大模型的訓(xùn)練、推理和廣泛落地,提供了堅(jiān)實(shí)支撐。
而在OCS加速落地的進(jìn)程中,以曦智科技為代表的中國(guó)企業(yè),正憑借硅光OCS芯片、光躍超節(jié)點(diǎn)等創(chuàng)新實(shí)踐,探索一條自主可控、兼具高性能與高能效的國(guó)產(chǎn)算力路線(xiàn)。
沈亦晨透露,未來(lái),除了在訓(xùn)練側(cè)支撐千卡、萬(wàn)卡級(jí)別集群之外,曦智也計(jì)劃擴(kuò)展128卡商用版本超節(jié)點(diǎn)在推理側(cè)的應(yīng)用。而在今年的WAIC大會(huì)上,曦智將會(huì)公開(kāi)下一代光交換集群的方案。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.