AI處理器初創(chuàng)企業(yè)已至生死關(guān)頭？

2026-02-04 08:06:36　來源: TechSugar

上海舉報

分享至

（本文編譯自Electronic Design）

英偉達的爆發(fā)式發(fā)展及對其圖形處理器（GPU）的海量需求，推動全球AI處理器領(lǐng)域迎來發(fā)展熱潮。但專注于研發(fā)專用AI芯片的初創(chuàng)公司浪潮，已然觸頂，或已距頂峰咫尺之遙。

2016年以來，全球AI處理器初創(chuàng)企業(yè)的數(shù)量已翻倍不止，截至2025年底，該領(lǐng)域獨立運營的企業(yè)數(shù)量激增至146家，這一數(shù)字已處于難以為繼的水平。迄今，投資者受AI處理器市場的前景吸引，已向這些企業(yè)投入高達280億美元的巨額資金。據(jù)估算，2026年全球AI處理器市場規(guī)模將突破4940億美元，硬件出貨量的增長主要由云端及本地AI推理，以及從可穿戴設(shè)備到個人電腦的邊緣端部署所驅(qū)動，市場營收的增長則主要依托AI訓(xùn)練場景及超大規(guī)模數(shù)據(jù)中心客戶的需求。

盡管英偉達的技術(shù)背后，有著深厚、完善且?guī)捉y以撼動的軟件生態(tài)體系，以及一套完整的數(shù)據(jù)中心硬件基礎(chǔ)設(shè)施作為支撐，但這一切似乎并未被投資者放在眼里。只要宣稱能研發(fā)出速度更快、性能更優(yōu)、成本更低的AI處理器，幾乎都會獲得投資者的青睞與資金支持。

不出所料，絕大多數(shù)初創(chuàng)企業(yè)的研發(fā)重心均聚焦于數(shù)據(jù)中心或邊緣端的AI推理領(lǐng)域。AI訓(xùn)練領(lǐng)域的資金投入門檻依舊極高，多數(shù)初創(chuàng)企業(yè)已選擇退守，將這一市場拱手讓給英偉達。

分析機構(gòu)Jon Peddie Research表示，未來一到兩年，獨立AI處理器供應(yīng)商的數(shù)量將減少40%，實際情況甚至可能比這更糟。

然而，成功的窗口期正逐步向絕大多數(shù)的這些初創(chuàng)企業(yè)關(guān)閉。行業(yè)創(chuàng)業(yè)高峰出現(xiàn)在2018年，彼時75%的相關(guān)初創(chuàng)企業(yè)已成立。值得關(guān)注的是，初創(chuàng)企業(yè)數(shù)量的增長浪潮早于英偉達業(yè)務(wù)爆發(fā)式增長便已開啟，這一現(xiàn)象也曾讓科技行業(yè)為之震驚。

人們或許會認為，是英偉達的成功引來了一眾入局者的蜂擁而至，但事實上，多達58%的初創(chuàng)企業(yè)在英偉達崛起前就已啟動運營。2022年以來，該領(lǐng)域年均發(fā)生7起收購案；2020年至今，已有17家相關(guān)初創(chuàng)企業(yè)完成首次公開募股。

人工智能芯片初創(chuàng)企業(yè)的復(fù)雜格局

從基礎(chǔ)層面來看，人工智能處理器是一款經(jīng)過特殊優(yōu)化的芯片，它通過完成海量張量運算，同時最大限度減少數(shù)據(jù)移動，實現(xiàn)神經(jīng)網(wǎng)絡(luò)工作負載的高速、高效運行。這類處理器的產(chǎn)品形態(tài)涵蓋GPU、神經(jīng)網(wǎng)絡(luò)處理器（NPU）、存算一體芯片（CIM/PIM）、神經(jīng)形態(tài)處理器，以及矩陣/張量引擎等。

CPU和FPGA雖也被用于運行人工智能工作負載，但由于二者具備通用計算屬性，無法依據(jù)功能進行細分，因此通常被排除在規(guī)模達850億美元的人工智能芯片市場之外，進行單獨評估。不過，搭載向量擴展或單指令多數(shù)據(jù)引擎的CPU（目前市面上的CPU基本均具備該特性），同樣歸屬于人工智能處理器的范疇。CPU、SoC與ASIC之間的范疇重疊，也讓整個市場格局顯得錯綜復(fù)雜（如圖1所示）。

圖1：用于人工智能訓(xùn)練和推理的CPU、SoC及ASIC之間復(fù)雜的范疇重疊問題。

從基礎(chǔ)架構(gòu)來看，人工智能處理器由多個核心組件構(gòu)成（如圖2所示）：

計算單元：大位寬單指令多數(shù)據(jù)/單指令多線程核心（GPU架構(gòu)）、張量/矩陣引擎、NPU向量單元、激活函數(shù)單元。
存儲層級：靠近計算單元、容量小且速度快的SRAM；位于處理器外部或同封裝內(nèi)、容量更大的HBM/DDR；高速緩存/便簽式存儲器；預(yù)取器/DMA（CIM大致歸屬于這一范疇）。
互連單元：片上網(wǎng)絡(luò)（NOC）與片外互連鏈路，包括但不限于PCIe、CXL、英偉達NVLink和以太網(wǎng)。
控制單元：用于核心程序/集合通信的指令處理器、調(diào)度器及微碼。

圖2：典型人工智能芯片的核心組件，包括計算、存儲與互連模塊。

人工智能處理器的應(yīng)用版圖覆蓋云服務(wù)、數(shù)據(jù)中心芯片、嵌入式IP及神經(jīng)形態(tài)硬件領(lǐng)域。創(chuàng)業(yè)者與工程師們著力彌補CPU和GPU的技術(shù)短板，包括優(yōu)化內(nèi)存管理、實現(xiàn)小批量任務(wù)的高利用率、在嚴苛的功耗預(yù)算下達成時延目標，以及保障規(guī)模化部署下的穩(wěn)定吞吐性能。

這些企業(yè)主要從兩大維度布局產(chǎn)品研發(fā)：一是工作負載類型，涵蓋訓(xùn)練、推理及傳感器級信號處理；二是部署層級，從超大規(guī)模數(shù)據(jù)中心，到電池供電設(shè)備與可穿戴設(shè)備均有覆蓋。

絕大多數(shù)技術(shù)研發(fā)工作聚焦于內(nèi)存與執(zhí)行控制領(lǐng)域。CIM和模擬計算技術(shù)通過在存儲陣列內(nèi)完成運算、將部分和數(shù)據(jù)就近存儲的方式減少數(shù)據(jù)傳輸，這也催生出數(shù)據(jù)流架構(gòu)設(shè)計思路。晶圓級芯片將激活值存儲在本地SRAM中，并為長序列任務(wù)實現(xiàn)權(quán)重的流式傳輸。

可重構(gòu)架構(gòu)可在編譯階段調(diào)整數(shù)據(jù)流與分塊策略，實現(xiàn)多層網(wǎng)絡(luò)的利用率優(yōu)化。訓(xùn)練芯片側(cè)重提升互連帶寬與集合通信能力，而推理芯片則將重點放在單批次任務(wù)時延優(yōu)化、Transformer模型的鍵值緩存技術(shù)、邊緣端功耗效率上，同時追求云獨立部署能力以降低時延，這一點在智能體機器人應(yīng)用中尤為關(guān)鍵。

人工智能處理器的市場落地，取決于企業(yè)的商業(yè)化策略與生態(tài)體系支撐。云服務(wù)提供商正將加速芯片集成至托管服務(wù)與模型推理框架中；IP供應(yīng)商則與手機、汽車及工業(yè)領(lǐng)域的系統(tǒng)級芯片研發(fā)團隊展開合作，提供配套工具鏈、模型方案及集成密度演進路線圖。

此外，邊緣計算領(lǐng)域的專精企業(yè)會推出專用軟件開發(fā)工具包，對模型進行壓縮、量化至8位整數(shù)甚至更低精度，將算子映射至稀疏計算單元或模擬計算單元，同時保障模型精度達標。神經(jīng)形態(tài)計算領(lǐng)域的研發(fā)團隊則針對脈沖神經(jīng)網(wǎng)絡(luò)推出專屬編譯器，重點優(yōu)化事件流處理的能效與時延表現(xiàn)。在實際應(yīng)用中，編譯器、核心程序集和可觀測性工具的優(yōu)化升級，其價值往往超過峰值每秒萬億次運算指標。

市場競爭的核心維度隨部署層級不同而有所差異（見圖3）。訓(xùn)練芯片的競爭聚焦于單模型訓(xùn)練成本，需綜合考量網(wǎng)絡(luò)、存儲及編譯器的各項約束條件；推理芯片則以單位token/單幀處理成本為核心目標，同時滿足時延限制，緩存管理與精度量化是實現(xiàn)這一目標的關(guān)鍵手段；邊緣設(shè)備的競爭圍繞單次推理功耗（毫瓦級）及工具鏈的可移植性展開；IP供應(yīng)商的競爭則集中在流片周期、功耗-性能-面積綜合指標及驗證技術(shù)支持能力上。科研項目則需要在市場化落地速度與技術(shù)實驗探索之間尋求平衡，這類實驗或會改變存儲、計算與通信三者間的原有取舍邏輯。

圖3：人工智能芯片企業(yè)的市場細分分布。

在整個研發(fā)與落地過程中，各研發(fā)團隊會根據(jù)具體需求定制芯片設(shè)計，適配的需求維度包括注意力機制深度、參數(shù)量、激活值規(guī)模、稀疏性及精度策略等。當(dāng)企業(yè)實現(xiàn)芯片、編譯器與部署工具的協(xié)同開發(fā)時，不僅能降低集成成本，還能加快從模型研發(fā)到高吞吐率落地的轉(zhuǎn)化效率。

此時客戶擁有多種選擇：在云端進行算力擴容、通過晶圓級系統(tǒng)實現(xiàn)算力升級、將NPU集成至SoC中，或是利用模擬芯片和神經(jīng)形態(tài)芯片讓計算單元更貼近傳感器端。這筆280億美元的投資，正流向上述海量的研發(fā)與落地工作；而這些技術(shù)的布局與成果，也讓一眾初創(chuàng)企業(yè)成為極具吸引力的收購標的（見圖4）。

圖4：人工智能芯片初創(chuàng)企業(yè)按處理器類型的分布情況。

人工智能芯片初創(chuàng)企業(yè)的爆發(fā)式增長將落幕

但這場人工智能芯片初創(chuàng)企業(yè)的“寒武紀大爆發(fā)”，或許已行至終點。2025年末，市場首次出現(xiàn)投資者對超大規(guī)模企業(yè)、各國政府及私營機構(gòu)的巨額算力設(shè)備投入感到擔(dān)憂的跡象，這也在由人工智能熱潮主導(dǎo)的股市中引發(fā)了連鎖反應(yīng)（見圖5）。媒體上充斥著關(guān)于該市場存在泡沫的討論，以及對泡沫破裂時間的預(yù)判。

圖5：全球人工智能處理器供應(yīng)商數(shù)量分布。

人工智能芯片供應(yīng)商領(lǐng)域的泡沫破裂已在暗流涌動，畢竟沒有哪個行業(yè)能支撐146家供應(yīng)商共存。

市場上已出現(xiàn)多起企業(yè)收購與倒閉案例（截至2025年底已有21起），后續(xù)還將有更多案例出現(xiàn)。但風(fēng)險投資機構(gòu)仍在賭概率，大概率是六家融資額超10億美元的企業(yè)將存活下來，其余百余家初創(chuàng)企業(yè)則需尋找37家處于收購窗口期的上市公司作為歸宿。Jon Peddie Research咨詢公司的預(yù)測顯示，未來一到兩年，獨立人工智能芯片供應(yīng)商的數(shù)量將減少40%，而實際情況可能會更糟。

盡管多數(shù)初創(chuàng)企業(yè)終將被收購或走向倒閉，但被收購的企業(yè)會帶來免費的IP，而這筆成本早已由熱情樂觀的風(fēng)險投資機構(gòu)買單。280億美元足以支撐大量的研發(fā)工作，尤其是這些初創(chuàng)企業(yè)的平均員工數(shù)還不足10人。反觀英偉達，目前員工規(guī)模約為3.6萬人，雙方的競爭本就并非一場公平的較量。

這些收購案的背后，難免有人為錯失的發(fā)展可能感到惋惜。但如果創(chuàng)業(yè)的初衷只是“造出更優(yōu)秀的處理器，客戶便會紛至沓來”，那么這份惋惜其實并無必要。

英偉達的行業(yè)主導(dǎo)地位，不僅依托其人工智能GPU的性能優(yōu)勢和完善的軟件生態(tài)，更在于其始終聚焦于打造全套數(shù)據(jù)中心硬件基礎(chǔ)設(shè)施，這一布局讓它始終保持著行業(yè)領(lǐng)先。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.