網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

曦望獲超10億融資：國(guó)內(nèi)首家估值超百億純推理GPU獨(dú)角獸

2026-04-20 22:02:49　來(lái)源: IPO早知道

湖南舉報(bào)

分享至

躋身國(guó)內(nèi)GPU賽道最大單筆融資行列，迄今已累計(jì)融資額達(dá)約40億元

據(jù)IPO早知道消息，4月20日，國(guó)內(nèi)全棧自研AI推理GPU企業(yè)曦望（Sunrise）宣布完成新一輪超10億元人民幣融資，由多家產(chǎn)業(yè)方戰(zhàn)投、地方國(guó)資及頭部財(cái)務(wù)機(jī)構(gòu)共同參與。

曦望表示，募得資金將主要用于推進(jìn)新一代S3推理GPU的規(guī)模化量產(chǎn)交付、全棧軟件生態(tài)建設(shè)，以及S4/S5后續(xù)芯片的研發(fā)迭代。

這是2026年AI產(chǎn)業(yè)全面邁入“推理落地、智能體普及”時(shí)代后，國(guó)內(nèi)GPU賽道誕生的最大單筆融資之一。一年多的曦望已累計(jì)完成七輪融資，總?cè)谫Y額約40億元，成為國(guó)內(nèi)首家估值超百億的純推理GPU獨(dú)角獸。

“AI算力基建的重心已徹底切換。”曦望董事長(zhǎng)徐冰表示，“2026年AI推理計(jì)算需求將達(dá)到訓(xùn)練需求的4-5倍，推理算力租賃價(jià)格半年漲幅近40%。”

不同于行業(yè)主流的“訓(xùn)推一體”路線，曦望從成立之初起就堅(jiān)定All-in推理賽道，以用戶真實(shí)的Token成本、單位能耗和服務(wù)穩(wěn)定性為芯片設(shè)計(jì)核心。

目前公司已推進(jìn)三代推理GPU迭代、數(shù)萬(wàn)顆GPU量產(chǎn)落地，實(shí)現(xiàn)了從芯片研發(fā)、產(chǎn)品量產(chǎn)到解決方案交付的完整閉環(huán)，并保持“芯片均實(shí)現(xiàn)一次性流片成功、流片后性能符合設(shè)計(jì)預(yù)期”的行業(yè)一流標(biāo)準(zhǔn)。

杭州資本表示：“本次投資是杭州資本緊扣杭州‘296X’先進(jìn)制造業(yè)集群建設(shè)戰(zhàn)略、深耕人工智能萬(wàn)億級(jí)產(chǎn)業(yè)賽道的重要布局。曦望‘All-in 推理’的戰(zhàn)略選擇具備行業(yè)前瞻性，其在技術(shù)創(chuàng)新和產(chǎn)品商業(yè)化方面的能力，是我們決定投資的重要原因。作為長(zhǎng)期資本，我們更看重企業(yè)在關(guān)鍵技術(shù)方向上的持續(xù)投入與落地能力。”

普華資本表示，“曦望是國(guó)內(nèi)少數(shù)真正理解推理場(chǎng)景、并能提供全棧自主可控解決方案的企業(yè)。我們看好公司'不做訓(xùn)推一體跟隨者，只做推理賽道領(lǐng)跑者'的戰(zhàn)略選擇。”

重構(gòu)推理原生架構(gòu)，啟望S3押中結(jié)構(gòu)性機(jī)遇

2026年1月，曦望正式發(fā)布新一代旗艦產(chǎn)品啟望S3推理GPU。這是國(guó)內(nèi)首款搭載LPDDR6且兼容LPDDR5X內(nèi)存的推理GPU，沒(méi)有盲目照搬高端訓(xùn)練GPU的HBM顯存路線，而是基于Agent推理的本質(zhì)需求，從AI Core計(jì)算架構(gòu)到內(nèi)存IO系統(tǒng)進(jìn)行了全鏈路重構(gòu)。

以O(shè)penClaw為代表的智能體推理，“感知—規(guī)劃—執(zhí)行—反饋”高頻循環(huán)，帶來(lái)了對(duì)KV-cache密集訪問(wèn)的全新計(jì)算負(fù)載，成為S3押注的結(jié)構(gòu)性機(jī)會(huì)——放棄訓(xùn)練能力，專為大模型推理做原生深度定制。

在計(jì)算層，S3通過(guò)計(jì)算層的深度定制，解決了通用GPU“算力用不滿”的核心痛點(diǎn)，推理性能較上一代S2提升5倍，目標(biāo)實(shí)現(xiàn)Token成本下降90%。

這一突破不僅令算子利用率逼近物理極限，同時(shí)實(shí)現(xiàn)了Agent原生的指令集與微架構(gòu)，并原生支持FP4全鏈路低精度運(yùn)算，吞吐量較FP16提升3-4倍，直接轉(zhuǎn)化為客戶側(cè)的毛利空間和價(jià)格彈性。

在系統(tǒng)層，S3創(chuàng)新性集成了三大先進(jìn)高速接口技術(shù)，從內(nèi)存和IO兩個(gè)推理時(shí)代最核心的瓶頸入手，解決了智能體三大核心瓶頸——通過(guò)LPDDR6內(nèi)存接口技術(shù)解決了智能體的“顯存生死線”；通過(guò)高速SerDes+SUE融合互聯(lián)技術(shù)解決了智能體的“多模型協(xié)同瓶頸”；通過(guò)PCIe Gen6接口技術(shù)，解決了智能體的“資源碎片化”問(wèn)題。

打破「不可能三角」，搶占差異化領(lǐng)跑地位

“S3不是簡(jiǎn)單的性能升級(jí)，而是一次對(duì)AI推理成本曲線的重構(gòu)。”徐冰表示，“我們的目標(biāo)是將推理成本降至‘百萬(wàn)Token一分錢’，讓AI像水電一樣成為普惠基礎(chǔ)設(shè)施。”

多家機(jī)構(gòu)預(yù)測(cè)，未來(lái)五年推理算力市場(chǎng)規(guī)模將超越訓(xùn)練側(cè)數(shù)倍，其中Agent類負(fù)載將貢獻(xiàn)最主要的增量。這意味著，從產(chǎn)業(yè)周期看，訓(xùn)練側(cè)格局已相對(duì)固化，而推理側(cè)正隨Agentic AI放量進(jìn)入指數(shù)級(jí)增長(zhǎng)通道。

而曦望S3同時(shí)具備三個(gè)難以共存的要素，即推理原生的架構(gòu)前瞻性、實(shí)現(xiàn)98–99%算子利用率的頂尖工程能力、以及完整的生態(tài)適配能力。通過(guò)打破這一“不可能三角”，曦望成功確立了其在國(guó)產(chǎn)推理芯片領(lǐng)域的差異化領(lǐng)跑者地位，并重新定義了推理算力的經(jīng)濟(jì)模型。

公開(kāi)資料顯示，目前曦望團(tuán)隊(duì)規(guī)模已增長(zhǎng)至400人，研發(fā)人員占比超80%，匯聚了來(lái)自英偉達(dá)、AMD、華為海思等國(guó)內(nèi)外頂尖芯片企業(yè)的核心人才，碩士及以上學(xué)歷占比超80%。

曦望透露，目前公司已完成S4高性能推理GPU和S5安全可控推理GPU的技術(shù)路線規(guī)劃，并持續(xù)加碼近存計(jì)算、光電共封等前沿技術(shù)探索。2026年，公司將繼續(xù)圍繞“落地、兌現(xiàn)、增長(zhǎng)”核心原則，全力推進(jìn)S3芯片量產(chǎn)交付，完成與國(guó)內(nèi)外主流大模型、多模態(tài)模型和Agent框架的全面適配，為中國(guó)AI發(fā)展鑄造堅(jiān)實(shí)算力底座。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.