昨天,一則新聞刷爆了朋友圈:中國科學院上海光學精密機械研究所空天激光技術與系統部謝鵬研究員團隊在解決“光芯片上高密度信息并行處理”難題上取得突破,研制出超高并行光計算集成芯片“流星一號”,該芯片首次在50GHz光學主頻下驗證了并行度>100的片上光信息交互與計算。
![]()
那么問題來了,這個芯片到底是做什么的,光計算又是什么?
研究的內容是啥?
現在計算機都是圍繞電子學而展開,所謂光子計算,就是圍繞光子學而設計的計算芯片。
早在1979年,我國科學家錢學森就看好光子學,并圍繞光子學提出了光子工業的概念。在論文中,錢學森就提到了光子計算機:“光子技術的一個肯定要推進的方面是光子計算機。現在已經開始了一些集成光路的基礎工作,將來可能是繼電子計算機之后,超過電子計算機的光子計算機。從原理上估計,光子計算機的運算能力可以為電子計算機的百倍、千倍以至萬倍。”
這幾年,錢學森提出的理論已經成為了現實,光計算已經擁有了諸多突破。目前,光學神經網絡、神經形態計算、通用處理器等技術已得到展示。然而,可擴展性仍然是一個關鍵問題,因為更高的光計算能力需要更多的片上元件。例如,大多數片上可編程光子單元尺寸約為10至100微米,一個4英寸晶圓最多只能容納10000個。進一步增大光子芯片尺寸會導致累積計算誤差、更高成本、調制不同步以及封裝風險,從而限制了系統的可擴展性。因此,可擴展的片上光計算技術需求迫切,但目前仍在開發中。為了利用光子的固有自由度,并行光計算得到了探索。
在眾多光計算技術中,基于馬赫-曾德爾干涉儀(MZI)網格的光計算支持使用僅空間編碼矢量的可編程矩陣乘法,這有望通過有效整合更多維度(如頻率通道)來實現并行光計算。然而,能夠通過結合頻率和空間自由度進行并行矩陣-矩陣計算的光學張量核心仍未得到充分探索。本研究則提出并演示了一種由孤子微梳源和MZI網絡驅動的并行光計算架構。
根據研究團隊的敘述,針對光計算高密度寬譜數據信號色散誤差問題、高密度信道串擾問題、光學矩陣高精度驅動問題,研究團隊從底層物理機制出發,建立了并行光計算物理模型,提出了一種適用于片上信息并行處理的糾錯方法,將多波長并行計算一致性提升至90%以上;團隊系統性地設計了與波分復用兼容的多波長光源,配合系統調制頻率需求,抑制了通道間信息串擾;面向并行光計算器件大帶寬需求,團隊通過逆向設計方法,提升器件帶寬與魯棒性,使光計算芯片帶寬>40nm,滿足了系統需求。
換句話說,這個研究解決了并行架構一些挑戰,為提升光計算性能開辟了新途徑,為發展低功耗、低時延、大算力、高速率的“超級光子計算機”帶來了可能性。
![]()
并行光計算輸出光譜一致性
具體到芯片層面來看,就是研究團隊自主研制的核心光芯片“流星一號”,具體為孤子微梳源和MZI網絡驅動的并行光計算架構,而該芯片的最大亮點就是并行度>100上。
該集成芯片采用90nm CMOS兼容工藝在絕緣體上硅(SOI)平臺上制造。MZI結構由兩個分束器和兩個相移器組成。MZI中的分束器采用寬帶MMI。MZI中的相移器通過在波導層頂部圖案化的電阻加熱器實現。為了減輕熱串擾,每個相移器的驅動功率保持在毫瓦級,并采用了額外的熱隔離結構。
芯片系統包含了集成微腔光頻梳,作為芯片級多波長光源子系統;大帶寬、低時延、可重構光計算芯片,作為高性能并行計算核心;高精度、大規模、可擴展的驅動芯片,作為光學矩陣驅動子系統;基于該系統,驗證了并行度>100的片上光子信息交互與計算原型,在50GHz光學主頻下,單芯片理論峰值算力>2560TOPS,功耗比>3.2TOPS/W。
![]()
超高并行光計算架構
光計算之所以這么受歡迎,不僅僅是因為性能強,更重要在于功耗低。謝鵬也在最近采訪中表示:“‘流星一號’的突破不僅在于算力提升,更在于其低功耗特性,未來可大幅降低數據中心能耗,助力綠色計算。”
光計算到底是啥?
伴隨ChatGPT、DeepSeek為代表的人工智能革命性成果的誕生,隨之而來的就是4~6個月翻倍一次的算力需求,但目前摩爾定律正在逐步放緩,傳統納米電子計算架構面臨物理極限(如功耗、散熱和尺寸限制),算力越來越難以追趕AI的增長速度。
當前,解決電子芯片的“功耗墻”“存儲墻”的路徑包括三類路徑:一是通過先進制程繼續縮小電子邏輯器件,包括光刻、封裝、材料多方面,如極紫外(EUV)光刻機、GAAFET、CFET、二維材料晶體管等;二是通過3D封裝互連和Chiplet實現多芯片異質集成;三是直接舍棄傳統路線,如碳基計算、量子計算(光量子也屬于其中一環)、光計算,其中,光計算或光電混合計算是當前距離產業最近的路線。
光計算作為非馮?諾伊曼結構代表,具有可擴展、低功耗、超高速、寬帶寬、高并行度的天然優勢,是后摩爾時代破解高維張量運算、復雜圖像處理等大規模數據快速計算的關鍵技術之一。
![]()
眾所周知,光具有波粒二象性,其中利用波動性可以實現光經典計算,利用粒子性可以實現光量子計算。光量子計算目前也在不斷迭代中,不過相比來說,光經典計算走得更快一些。
細分到光計算,也有許多路線,包括數字路線和模擬路線,不過其中只有基于光學神經網絡(ONN)的光計算技術是受關注度較高、產業化應用前景較好的兩大類技術路線。
![]()
線性矩陣計算是ONN的基礎,其實現方式主要分為基于空間光學和基于片上集成光學兩種路線。非線性激活函數有兩種實現方案:一是“光-電-光”的轉換方案,二就是“全光”方案。
基于空間光學的方案在自由空間中的傳播特性進行計算,具有天然的并行性優勢,包括光學4f成像、空間光衍射、Fabry-Perot 激光器、偏振光束分裂器、波分復用系統等。
片上集成將光學元件集成到芯片上,以實現更小尺寸、更高集成度和更穩定性能的ONN。包括MZI干涉結構、MRM波分結構、亞波長衍射結構等方案。目前,MZI路線最大的有點是成熟、可以量產、并且比較穩定;MRM這個工藝的穩定性和成熟度還不是很好;衍射方的優點在于功耗可以更低,但它可能會犧牲可編程性。總之,過去三年MZI是落地最快的一個場景。而此次的超高并行光計算芯片也選擇了MZI路線。
![]()
誰在做光計算?
目前,光計算領域初創企業聚焦在ONN,全球范圍內,中國和歐美在光計算領域基本處于并跑狀態。
在多數媒體宣傳中,普遍將光計算描繪為比GPU高1000倍以上的一種技術。光子作為信息載體確實具有獨特的優勢,有實現千倍算力提升的潛力,但顯然目前肯定實現不了這樣的效果。
在這種情況下,如何突破現有算力生態的瓶頸,真正把光的“能量”帶到產業中去,才是企業當下需要考慮的問題。從初創企業的動作來看,大部分也在推出性能高出現有電子芯片幾倍或者十幾倍的芯片,提升幅度也許不是很大,但能夠真正進入行業。
國內方面:
上海曦智科技:成立于2018年,是中國最早進行光計算產業化的公司之一,其技術源于麻省理工學院,公司創始人沈亦晨博士是MZI干涉方案代表性論文的第一作者。其圍繞光子矩陣計算(oMAC)、片上光網絡(oNOC)和片間光網絡(oNET)三大核心技術開發產品,目前最新推出的曦智天樞光子矩陣規模達到128x128,采用“OPU光學處理單元+ASIC光電混合處理器”,是曦智上一代產品等效光算力的4倍,是一個當下即可落地,實現單位算力能耗快速提升的實用解決方案。軟件層面,曦智科技同樣構建了完整的開發工具鏈以實現光計算芯片的實用化。智規劃明年底完成的256x256光子矩陣產品樣片,2027年正式發布。
蘇州光本位科技:成立于2022年,其技術源于牛津大學,采用MRR波分系統與相變材料(PCM)結合的方案,公司稱之為“PCM+Crossbar方案”,光本位科技則在光芯片的技術路線中選擇了一條特殊路線——光本位采用硅光+相變材料的異質集成以及獨有的Crossbar光子矩陣計算結構,成為首家實現光計算芯片存算一體的商業化公司。主要產品是光計算板卡,目前正在調試矩陣規模為128×128的光計算板卡,預期峰值算力可超過1000 TOPS,算力密度已超越先進工藝的電芯片,預計在今年推出商業化光計算板卡產品。
北京芯算科技:成立于2023年,技術源于麻省理工學院,采用MRR波分系統與相變材料(PCM)結合的方案,創始人楊文強畢業于中國科學院光所,2023年推出高維光計算芯片和光電混合計算原型板卡,該板卡集成了片上多波長光源芯片、光子矩陣運算芯片、波分復用模組和光電轉換模組等,算力已突破100 TOPS。
北京光子芯力:成立于2024年,技術源于清華大學,采用亞波長衍射結構方案。“光子芯力”的產品是一款光電融合計算芯片,團隊開創性地采用全波計算技術路徑,第一代光芯片已經流片完成,目前正與多家客戶合作開發落地方案。
國外企業:
Lightmatter:成立于2017年,總部位于美國加利福尼亞州,技術源于麻省理工學院。創始人尼古拉斯·哈里斯是MZI干涉方案代表性論文的共同作者。產品線包括光子計算平臺(Envise)、芯片互連產品(Passage)、適配軟件(Idiom。
Luminous Computing:成立于2018年,總部位于美國加利福尼亞州,CTO Mitchell Nahmias博士期間專注于光學AI芯片研究,技術源于普林斯頓大學Paul Prucnal課題組的MRR方案。2023年,公司展示了O波段TRX光子鏈路芯片,該芯片使用45nm工藝,具有16個通道,能在112Gbps下工作,功耗約為4.3pJ/bit(不含激光器功耗)。
Optalysys:成立于2013年,總部位于英國利茲,技術源于劍橋大學,2019年推出了商用分立光學處理系統FT:X2000,該產品基于空間光傳輸可等效于卷積操作的原理,通過集成微透鏡實現器件小型化,可用于處理高分辨圖像和視頻。目前,Optalysys的產品聚焦在光計算安全加密領域。
Lighton:成立于2016年,總部位于法國巴黎。2020年推出了基于離軸光全息技術的空間光學計算系統,主要應用于機器學習、衛星圖像分析和自然語言處理等智能計算領域。2021年,成功將“Appliance”光學處理單元(OPU)集成到法國Jean Zay超級計算機上,能夠在超大規模上加速隨機算法,并可與標準硅處理器和NVIDIA的A100 GPU技術協同工作。
Fathom Computing:成立于2014年,總部位于美國加利福尼亞州,其光子原型計算機在2014年時識別手寫數字的準確率約為30%,到2018年已超過90%。然而,該公司近年來并未公開更多進展。
目前光電融合可以解決很多問題
目前,突破算力限制有兩條創新路線:第一條是存算一體路線,本質有近存計算和存內計算兩類方式,通過將存儲單元放在計算邏輯芯片上,解決存儲與計算之間帶寬和數據搬運的問題;第二是通過非GPU架構,如美國Sambanova的流式計算架構、谷歌TPU專用的ASIC架構,通過將芯片上的晶體管重新排列,提高晶體管在計算時的利用率。
很顯然,兩種路線都不能解決數字芯片最根本的晶體管數量問題。并不是說兩條路線不好,而是未來兩條路線最終一定還會繞回晶體管密度這個問題上。所以,通過將光子和電子混合在一起,就能解決這根本性的問題。與此同時,近存計算或流式架構同樣適用于光電混合計算芯片上,從而實現更大的底層突破。
之所以晶體管很難進一步提高單位面積的絕對計算密度,是因為登納德縮放比例失效,如果把晶體管繼續做小會產生量子極限的隧穿效應,而如果以兩倍的主頻運行會同時帶來兩倍的熱量,單位面積芯片如果不能把這些熱量散發出去就會導致芯片融化。這兩個問題的本質都在于銅導線存在電阻,晶體管收放電都會產生熱量,而光則不會產生熱量,因此可以通過提高其主頻或復用波長數量進一步增加單位面積的絕對算力。
總體來說,當前光計算產品主要以“光電融合”方式實現,芯片內部包含光芯片、電芯片及其他外圍器件,光芯片進行整數運算,電芯片負責浮點運算。不過,目前光計算產業鏈仍處于發展起步階段,成熟度較低。但已有一些性能功耗比不錯的產品,成為GPU的重要互補。
隨著全球人工智能產業高速發展,光計算芯片正迎來新一輪增長機遇。預計到2027年,全球光芯片市場規模將達到56億美元。引用行業一句話:“當電子芯片還在2納米懸崖邊徘徊時,光計算芯片已點燃新的火炬。”
參考文獻
[1]Yu, X., Wei, Z., Sha, F.et al. Parallel optical computing capable of 100-wavelength multiplexing. eLight 5, 10 (2025). https://doi.org/10.1186/s43593-025-00088-8
[2]錢學森. 光子學、光子技術、光子工業[J]. 中國激光, 1979, 6(1): 1. 錢學森. [J]. Chinese Journal of Lasers, 1979, 6(1): 1.
[3]信熹資本:https://mp.weixin.qq.com/s/6uUf-AO91dt1Zv6QQrVodw
[4]維科網光通訊:https://mp.weixin.qq.com/s/yPWRxbijBxx8R81I5zr2wQ
[5]集成光學PIC:https://mp.weixin.qq.com/s/VV6BNY9GdIn4YSeWs6zZng
歡迎將我們設為“星標”,這樣才能第一時間收到推送消息。
關注EEWorld旗下訂閱號:“機器人開發圈”
回復“DS”領取《DeepSeek:從入門到精通》完整版
掃碼添加小助手回復“機器人”
進群和電子工程師們面對面交流經驗
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.