公眾號(hào)記得加星標(biāo)??,第一時(shí)間看推送不會(huì)錯(cuò)過(guò)。
隨著人工智能數(shù)據(jù)中心對(duì)帶寬和功率的需求不斷增長(zhǎng),網(wǎng)絡(luò)規(guī)模必須從電信號(hào)傳輸向光信號(hào)傳輸轉(zhuǎn)型,但共封裝光器件中卻一直缺少一個(gè)關(guān)鍵組件:激光器本身。這種情況即將改變。上個(gè)月,Tower Semiconductor和Scintil Photonics宣布推出全球首款用于人工智能基礎(chǔ)設(shè)施的單芯片 DWDM 光引擎。DWDM(密集波分復(fù)用)技術(shù)可在單根光纖上傳輸多個(gè)光信號(hào),從而在連接數(shù)十個(gè)GPU 的同時(shí),大幅降低功耗和延遲。
Scintil Photonics的首席執(zhí)行官 Matt Crowley表示,光復(fù)用技術(shù)并非新概念。事實(shí)上,它與互聯(lián)網(wǎng)本身一樣古老。上世紀(jì) 90 年代,電信公司在街道上鋪設(shè)了大量光纖,當(dāng)時(shí)他們認(rèn)為每根光纖傳輸一個(gè)波長(zhǎng)最終會(huì)成為標(biāo)準(zhǔn)做法。然而,當(dāng)電信行業(yè)意識(shí)到可以通過(guò)復(fù)用技術(shù)在單根光纖上傳輸數(shù)十個(gè)波長(zhǎng)時(shí),整個(gè)行業(yè)發(fā)生了革命性的變化。
DWDM技術(shù)尚未在專(zhuān)門(mén)用于人工智能應(yīng)用的數(shù)據(jù)中心部署的原因在于,該技術(shù)目前還無(wú)法滿足成本和需求的擴(kuò)展性要求。“人工智能數(shù)據(jù)中心內(nèi)部傳輸?shù)臄?shù)據(jù)量相當(dāng)于大規(guī)模擴(kuò)展一臺(tái)超級(jí)計(jì)算機(jī),”克勞利說(shuō)道。具體而言,挑戰(zhàn)在于縱向擴(kuò)展網(wǎng)絡(luò),即直接連接機(jī)架或集群內(nèi)的加速器——這與橫向擴(kuò)展網(wǎng)絡(luò)(連接數(shù)據(jù)中心內(nèi)的不同集群)截然不同。要使數(shù)十個(gè)GPU和內(nèi)存作為一個(gè)整體協(xié)同工作,需要無(wú)縫的帶寬和極低的延遲。
為了提高人工智能數(shù)據(jù)中心的帶寬、降低延遲并提升能源效率,網(wǎng)絡(luò)工程師一直在橫向擴(kuò)展網(wǎng)絡(luò)中用光纖鏈路取代銅纜鏈路。現(xiàn)在,所有人的目光都轉(zhuǎn)向了縱向擴(kuò)展網(wǎng)絡(luò),通過(guò)將光組件集成到與處理器相同的封裝中,使光纖鏈路更靠近處理器本身——這種概念被稱(chēng)為共封裝光器件(CPO)。
克勞利表示:“大型芯片公司生產(chǎn)的所有產(chǎn)品都涉及將光芯片鍵合到其GPU上。” CPO(光耦合光耦合器)成為處理器的輸入/輸出芯片。但是,如果沒(méi)有可擴(kuò)展的方法將激光器本身集成到同一硅工藝流程中,就無(wú)法將多個(gè)波長(zhǎng)的光通過(guò)每根光纖傳輸?shù)絾蝹€(gè)芯片上。
面向人工智能網(wǎng)絡(luò)的集成光子學(xué)
Scintil公司的“SHIP”(Scintil異質(zhì)集成光子學(xué))技術(shù)將激光器、光電二極管、調(diào)制器和其他組件集成到大規(guī)模生產(chǎn)的硅晶圓上。“這是我們版本的CMOS技術(shù),”克勞利說(shuō),但我們采用了一些技巧來(lái)克服將光增益材料綁定到硅上的固有挑戰(zhàn)。
該工藝首先使用Tower Semiconductors公司提供的標(biāo)準(zhǔn)300毫米硅光子晶圓,該晶圓包含無(wú)源光學(xué)元件。接下來(lái),將晶圓翻轉(zhuǎn),露出其埋入式氧化層。將微小的未圖案化InP/III-V族半導(dǎo)體芯片精確鍵合到該氧化層上,并精確地定位到每個(gè)激光器所需的位置,從而最大限度地減少昂貴半導(dǎo)體材料的用量。最后,利用光刻工具蝕刻衍射光柵,形成八個(gè)分布式反饋激光器。
克勞利說(shuō):“我們并非在重新發(fā)明激光。” 而是說(shuō),先進(jìn)的光刻技術(shù)能夠比傳統(tǒng)制造工藝在硅晶圓上實(shí)現(xiàn)更精確的間距和更穩(wěn)定的波長(zhǎng)。
最終產(chǎn)品是“ LEAF Light ”光子集成電路,這是一款集成了兩組八個(gè)分布式反饋陣列的芯片。每個(gè)光纖端口可提供八個(gè)或十六個(gè)波長(zhǎng),通道間隔為100或200吉赫茲,以確保無(wú)重疊或模式跳變。第二個(gè)專(zhuān)用集成電路芯片(ASIC)則承載了控制和監(jiān)測(cè)激光陣列所需的所有電子元件。
利用多波長(zhǎng)激光器推進(jìn)CPO技術(shù)
克勞利表示:“這是將激光器集成到CPO芯片上。”英偉達(dá)和博通已經(jīng)部署了每根光纖使用一個(gè)波長(zhǎng)的CPO,證明了其在橫向擴(kuò)展網(wǎng)絡(luò)中的可行性。“我們正在為縱向擴(kuò)展網(wǎng)絡(luò)實(shí)現(xiàn)下一代CPO。”
通過(guò)單根光纖傳輸多個(gè)波長(zhǎng),推動(dòng)業(yè)界朝著理想的“慢速寬帶寬”架構(gòu)邁進(jìn)。例如,LEAF Light芯片并非在單個(gè)通道(或波長(zhǎng))上傳輸400 Gb/s的數(shù)據(jù),而是將50 Gb/s的數(shù)據(jù)分布在8個(gè)通道上,從而顯著提升了單根光纖的數(shù)據(jù)容量和整體能效。該設(shè)計(jì)可在單根光纖中實(shí)現(xiàn)高達(dá)1.6 Tbps的數(shù)據(jù)傳輸速率,而英偉達(dá)最近的路線圖顯示,未來(lái)的DWDM互連技術(shù)最終有望實(shí)現(xiàn)低于1皮焦耳/比特的功耗。
克勞利認(rèn)為,最重要的優(yōu)勢(shì)或許在于延遲。“我需要保持GPU之間的低延遲,”他說(shuō)道。如果任何一個(gè)處理器運(yùn)行速度超過(guò)整個(gè)網(wǎng)絡(luò)的速度,GPU就會(huì)一直等待數(shù)據(jù)位進(jìn)行處理——在擁有數(shù)十甚至數(shù)百個(gè)GPU的大規(guī)模網(wǎng)絡(luò)中,這個(gè)問(wèn)題會(huì)被放大。在高帶寬信道上進(jìn)行前向處理和糾錯(cuò)會(huì)增加延遲過(guò)高的概率。“GPU的利用率會(huì)急劇下降,”克勞利說(shuō)道。使用低帶寬的DWDM連接多個(gè)GPU可以將利用率提高一倍。
Scintil 和 Tower 計(jì)劃在 2026 年底前向客戶提供數(shù)萬(wàn)臺(tái)設(shè)備,并計(jì)劃明年將產(chǎn)量提高一個(gè)數(shù)量級(jí)。到 2028 年,當(dāng)客戶計(jì)劃在規(guī)模化網(wǎng)絡(luò)中部署 DWDM 時(shí),供應(yīng)鏈將準(zhǔn)備就緒。“我們對(duì)它可能帶來(lái)的各種可能性感到興奮,”Crowley 表示。
若您對(duì)硅光SiGe技術(shù)及流片相關(guān)話題有更多探討需求,歡迎添加微信深入交流。
(來(lái)源:編譯自IEEE)
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4350內(nèi)容,歡迎關(guān)注。
加星標(biāo)??第一時(shí)間看推送
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.