(本文編譯自Electronic Design)
英偉達的爆發(fā)式發(fā)展及對其圖形處理器(GPU)的海量需求,推動全球AI處理器領(lǐng)域迎來發(fā)展熱潮。但專注于研發(fā)專用AI芯片的初創(chuàng)公司浪潮,已然觸頂,或已距頂峰咫尺之遙。
2016年以來,全球AI處理器初創(chuàng)企業(yè)的數(shù)量已翻倍不止,截至2025年底,該領(lǐng)域獨立運營的企業(yè)數(shù)量激增至146家,這一數(shù)字已處于難以為繼的水平。迄今,投資者受AI處理器市場的前景吸引,已向這些企業(yè)投入高達280億美元的巨額資金。據(jù)估算,2026年全球AI處理器市場規(guī)模將突破4940億美元,硬件出貨量的增長主要由云端及本地AI推理,以及從可穿戴設(shè)備到個人電腦的邊緣端部署所驅(qū)動,市場營收的增長則主要依托AI訓(xùn)練場景及超大規(guī)模數(shù)據(jù)中心客戶的需求。
盡管英偉達的技術(shù)背后,有著深厚、完善且?guī)捉y以撼動的軟件生態(tài)體系,以及一套完整的數(shù)據(jù)中心硬件基礎(chǔ)設(shè)施作為支撐,但這一切似乎并未被投資者放在眼里。只要宣稱能研發(fā)出速度更快、性能更優(yōu)、成本更低的AI處理器,幾乎都會獲得投資者的青睞與資金支持。
不出所料,絕大多數(shù)初創(chuàng)企業(yè)的研發(fā)重心均聚焦于數(shù)據(jù)中心或邊緣端的AI推理領(lǐng)域。AI訓(xùn)練領(lǐng)域的資金投入門檻依舊極高,多數(shù)初創(chuàng)企業(yè)已選擇退守,將這一市場拱手讓給英偉達。
分析機構(gòu)Jon Peddie Research表示,未來一到兩年,獨立AI處理器供應(yīng)商的數(shù)量將減少40%,實際情況甚至可能比這更糟。
然而,成功的窗口期正逐步向絕大多數(shù)的這些初創(chuàng)企業(yè)關(guān)閉。行業(yè)創(chuàng)業(yè)高峰出現(xiàn)在2018年,彼時75%的相關(guān)初創(chuàng)企業(yè)已成立。值得關(guān)注的是,初創(chuàng)企業(yè)數(shù)量的增長浪潮早于英偉達業(yè)務(wù)爆發(fā)式增長便已開啟,這一現(xiàn)象也曾讓科技行業(yè)為之震驚。
人們或許會認為,是英偉達的成功引來了一眾入局者的蜂擁而至,但事實上,多達58%的初創(chuàng)企業(yè)在英偉達崛起前就已啟動運營。2022年以來,該領(lǐng)域年均發(fā)生7起收購案;2020年至今,已有17家相關(guān)初創(chuàng)企業(yè)完成首次公開募股。
人工智能芯片初創(chuàng)企業(yè)的復(fù)雜格局
從基礎(chǔ)層面來看,人工智能處理器是一款經(jīng)過特殊優(yōu)化的芯片,它通過完成海量張量運算,同時最大限度減少數(shù)據(jù)移動,實現(xiàn)神經(jīng)網(wǎng)絡(luò)工作負載的高速、高效運行。這類處理器的產(chǎn)品形態(tài)涵蓋GPU、神經(jīng)網(wǎng)絡(luò)處理器(NPU)、存算一體芯片(CIM/PIM)、神經(jīng)形態(tài)處理器,以及矩陣/張量引擎等。
CPU和FPGA雖也被用于運行人工智能工作負載,但由于二者具備通用計算屬性,無法依據(jù)功能進行細分,因此通常被排除在規(guī)模達850億美元的人工智能芯片市場之外,進行單獨評估。不過,搭載向量擴展或單指令多數(shù)據(jù)引擎的CPU(目前市面上的CPU基本均具備該特性),同樣歸屬于人工智能處理器的范疇。CPU、SoC與ASIC之間的范疇重疊,也讓整個市場格局顯得錯綜復(fù)雜(如圖1所示)。
![]()
圖1:用于人工智能訓(xùn)練和推理的CPU、SoC及ASIC之間復(fù)雜的范疇重疊問題。
從基礎(chǔ)架構(gòu)來看,人工智能處理器由多個核心組件構(gòu)成(如圖2所示):
計算單元:大位寬單指令多數(shù)據(jù)/單指令多線程核心(GPU架構(gòu))、張量/矩陣引擎、NPU向量單元、激活函數(shù)單元。
存儲層級:靠近計算單元、容量小且速度快的SRAM;位于處理器外部或同封裝內(nèi)、容量更大的HBM/DDR;高速緩存/便簽式存儲器;預(yù)取器/DMA(CIM大致歸屬于這一范疇)。
互連單元:片上網(wǎng)絡(luò)(NOC)與片外互連鏈路,包括但不限于PCIe、CXL、英偉達NVLink和以太網(wǎng)。
控制單元:用于核心程序/集合通信的指令處理器、調(diào)度器及微碼。
![]()
圖2:典型人工智能芯片的核心組件,包括計算、存儲與互連模塊。
人工智能處理器的應(yīng)用版圖覆蓋云服務(wù)、數(shù)據(jù)中心芯片、嵌入式IP及神經(jīng)形態(tài)硬件領(lǐng)域。創(chuàng)業(yè)者與工程師們著力彌補CPU和GPU的技術(shù)短板,包括優(yōu)化內(nèi)存管理、實現(xiàn)小批量任務(wù)的高利用率、在嚴苛的功耗預(yù)算下達成時延目標,以及保障規(guī)模化部署下的穩(wěn)定吞吐性能。
這些企業(yè)主要從兩大維度布局產(chǎn)品研發(fā):一是工作負載類型,涵蓋訓(xùn)練、推理及傳感器級信號處理;二是部署層級,從超大規(guī)模數(shù)據(jù)中心,到電池供電設(shè)備與可穿戴設(shè)備均有覆蓋。
絕大多數(shù)技術(shù)研發(fā)工作聚焦于內(nèi)存與執(zhí)行控制領(lǐng)域。CIM和模擬計算技術(shù)通過在存儲陣列內(nèi)完成運算、將部分和數(shù)據(jù)就近存儲的方式減少數(shù)據(jù)傳輸,這也催生出數(shù)據(jù)流架構(gòu)設(shè)計思路。晶圓級芯片將激活值存儲在本地SRAM中,并為長序列任務(wù)實現(xiàn)權(quán)重的流式傳輸。
可重構(gòu)架構(gòu)可在編譯階段調(diào)整數(shù)據(jù)流與分塊策略,實現(xiàn)多層網(wǎng)絡(luò)的利用率優(yōu)化。訓(xùn)練芯片側(cè)重提升互連帶寬與集合通信能力,而推理芯片則將重點放在單批次任務(wù)時延優(yōu)化、Transformer模型的鍵值緩存技術(shù)、邊緣端功耗效率上,同時追求云獨立部署能力以降低時延,這一點在智能體機器人應(yīng)用中尤為關(guān)鍵。
人工智能處理器的市場落地,取決于企業(yè)的商業(yè)化策略與生態(tài)體系支撐。云服務(wù)提供商正將加速芯片集成至托管服務(wù)與模型推理框架中;IP供應(yīng)商則與手機、汽車及工業(yè)領(lǐng)域的系統(tǒng)級芯片研發(fā)團隊展開合作,提供配套工具鏈、模型方案及集成密度演進路線圖。
此外,邊緣計算領(lǐng)域的專精企業(yè)會推出專用軟件開發(fā)工具包,對模型進行壓縮、量化至8位整數(shù)甚至更低精度,將算子映射至稀疏計算單元或模擬計算單元,同時保障模型精度達標。神經(jīng)形態(tài)計算領(lǐng)域的研發(fā)團隊則針對脈沖神經(jīng)網(wǎng)絡(luò)推出專屬編譯器,重點優(yōu)化事件流處理的能效與時延表現(xiàn)。在實際應(yīng)用中,編譯器、核心程序集和可觀測性工具的優(yōu)化升級,其價值往往超過峰值每秒萬億次運算指標。
市場競爭的核心維度隨部署層級不同而有所差異(見圖3)。訓(xùn)練芯片的競爭聚焦于單模型訓(xùn)練成本,需綜合考量網(wǎng)絡(luò)、存儲及編譯器的各項約束條件;推理芯片則以單位token/單幀處理成本為核心目標,同時滿足時延限制,緩存管理與精度量化是實現(xiàn)這一目標的關(guān)鍵手段;邊緣設(shè)備的競爭圍繞單次推理功耗(毫瓦級)及工具鏈的可移植性展開;IP供應(yīng)商的競爭則集中在流片周期、功耗-性能-面積綜合指標及驗證技術(shù)支持能力上。科研項目則需要在市場化落地速度與技術(shù)實驗探索之間尋求平衡,這類實驗或會改變存儲、計算與通信三者間的原有取舍邏輯。
![]()
圖3:人工智能芯片企業(yè)的市場細分分布。
在整個研發(fā)與落地過程中,各研發(fā)團隊會根據(jù)具體需求定制芯片設(shè)計,適配的需求維度包括注意力機制深度、參數(shù)量、激活值規(guī)模、稀疏性及精度策略等。當(dāng)企業(yè)實現(xiàn)芯片、編譯器與部署工具的協(xié)同開發(fā)時,不僅能降低集成成本,還能加快從模型研發(fā)到高吞吐率落地的轉(zhuǎn)化效率。
此時客戶擁有多種選擇:在云端進行算力擴容、通過晶圓級系統(tǒng)實現(xiàn)算力升級、將NPU集成至SoC中,或是利用模擬芯片和神經(jīng)形態(tài)芯片讓計算單元更貼近傳感器端。這筆280億美元的投資,正流向上述海量的研發(fā)與落地工作;而這些技術(shù)的布局與成果,也讓一眾初創(chuàng)企業(yè)成為極具吸引力的收購標的(見圖4)。
![]()
圖4:人工智能芯片初創(chuàng)企業(yè)按處理器類型的分布情況。
人工智能芯片初創(chuàng)企業(yè)的爆發(fā)式增長將落幕
但這場人工智能芯片初創(chuàng)企業(yè)的“寒武紀大爆發(fā)”,或許已行至終點。2025年末,市場首次出現(xiàn)投資者對超大規(guī)模企業(yè)、各國政府及私營機構(gòu)的巨額算力設(shè)備投入感到擔(dān)憂的跡象,這也在由人工智能熱潮主導(dǎo)的股市中引發(fā)了連鎖反應(yīng)(見圖5)。媒體上充斥著關(guān)于該市場存在泡沫的討論,以及對泡沫破裂時間的預(yù)判。
![]()
圖5:全球人工智能處理器供應(yīng)商數(shù)量分布。
人工智能芯片供應(yīng)商領(lǐng)域的泡沫破裂已在暗流涌動,畢竟沒有哪個行業(yè)能支撐146家供應(yīng)商共存。
市場上已出現(xiàn)多起企業(yè)收購與倒閉案例(截至2025年底已有21起),后續(xù)還將有更多案例出現(xiàn)。但風(fēng)險投資機構(gòu)仍在賭概率,大概率是六家融資額超10億美元的企業(yè)將存活下來,其余百余家初創(chuàng)企業(yè)則需尋找37家處于收購窗口期的上市公司作為歸宿。Jon Peddie Research咨詢公司的預(yù)測顯示,未來一到兩年,獨立人工智能芯片供應(yīng)商的數(shù)量將減少40%,而實際情況可能會更糟。
盡管多數(shù)初創(chuàng)企業(yè)終將被收購或走向倒閉,但被收購的企業(yè)會帶來免費的IP,而這筆成本早已由熱情樂觀的風(fēng)險投資機構(gòu)買單。280億美元足以支撐大量的研發(fā)工作,尤其是這些初創(chuàng)企業(yè)的平均員工數(shù)還不足10人。反觀英偉達,目前員工規(guī)模約為3.6萬人,雙方的競爭本就并非一場公平的較量。
這些收購案的背后,難免有人為錯失的發(fā)展可能感到惋惜。但如果創(chuàng)業(yè)的初衷只是“造出更優(yōu)秀的處理器,客戶便會紛至沓來”,那么這份惋惜其實并無必要。
英偉達的行業(yè)主導(dǎo)地位,不僅依托其人工智能GPU的性能優(yōu)勢和完善的軟件生態(tài),更在于其始終聚焦于打造全套數(shù)據(jù)中心硬件基礎(chǔ)設(shè)施,這一布局讓它始終保持著行業(yè)領(lǐng)先。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.