![]()
躋身國(guó)內(nèi)GPU賽道最大單筆融資行列,迄今已累計(jì)融資額達(dá)約40億元
據(jù)IPO早知道消息,4月20日,國(guó)內(nèi)全棧自研AI推理GPU企業(yè)曦望(Sunrise)宣布完成新一輪超10億元人民幣融資,由多家產(chǎn)業(yè)方戰(zhàn)投、地方國(guó)資及頭部財(cái)務(wù)機(jī)構(gòu)共同參與。
曦望表示,募得資金將主要用于推進(jìn)新一代S3推理GPU的規(guī)模化量產(chǎn)交付、全棧軟件生態(tài)建設(shè),以及S4/S5后續(xù)芯片的研發(fā)迭代。
這是2026年AI產(chǎn)業(yè)全面邁入“推理落地、智能體普及”時(shí)代后,國(guó)內(nèi)GPU賽道誕生的最大單筆融資之一。一年多的曦望已累計(jì)完成七輪融資,總?cè)谫Y額約40億元,成為國(guó)內(nèi)首家估值超百億的純推理GPU獨(dú)角獸。
“AI算力基建的重心已徹底切換。”曦望董事長(zhǎng)徐冰表示,“2026年AI推理計(jì)算需求將達(dá)到訓(xùn)練需求的4-5倍,推理算力租賃價(jià)格半年漲幅近40%。”
不同于行業(yè)主流的“訓(xùn)推一體”路線,曦望從成立之初起就堅(jiān)定All-in推理賽道,以用戶真實(shí)的Token成本、單位能耗和服務(wù)穩(wěn)定性為芯片設(shè)計(jì)核心。
目前公司已推進(jìn)三代推理GPU迭代、數(shù)萬(wàn)顆GPU量產(chǎn)落地,實(shí)現(xiàn)了從芯片研發(fā)、產(chǎn)品量產(chǎn)到解決方案交付的完整閉環(huán),并保持“芯片均實(shí)現(xiàn)一次性流片成功、流片后性能符合設(shè)計(jì)預(yù)期”的行業(yè)一流標(biāo)準(zhǔn)。
杭州資本表示:“本次投資是杭州資本緊扣杭州‘296X’先進(jìn)制造業(yè)集群建設(shè)戰(zhàn)略、深耕人工智能萬(wàn)億級(jí)產(chǎn)業(yè)賽道的重要布局。曦望‘All-in 推理’的戰(zhàn)略選擇具備行業(yè)前瞻性,其在技術(shù)創(chuàng)新和產(chǎn)品商業(yè)化方面的能力,是我們決定投資的重要原因。作為長(zhǎng)期資本,我們更看重企業(yè)在關(guān)鍵技術(shù)方向上的持續(xù)投入與落地能力。”
普華資本表示,“曦望是國(guó)內(nèi)少數(shù)真正理解推理場(chǎng)景、并能提供全棧自主可控解決方案的企業(yè)。我們看好公司'不做訓(xùn)推一體跟隨者,只做推理賽道領(lǐng)跑者'的戰(zhàn)略選擇。”
重構(gòu)推理原生架構(gòu),啟望S3押中結(jié)構(gòu)性機(jī)遇
2026年1月,曦望正式發(fā)布新一代旗艦產(chǎn)品啟望S3推理GPU。這是國(guó)內(nèi)首款搭載LPDDR6且兼容LPDDR5X內(nèi)存的推理GPU,沒(méi)有盲目照搬高端訓(xùn)練GPU的HBM顯存路線,而是基于Agent推理的本質(zhì)需求,從AI Core計(jì)算架構(gòu)到內(nèi)存IO系統(tǒng)進(jìn)行了全鏈路重構(gòu)。
以O(shè)penClaw為代表的智能體推理,“感知—規(guī)劃—執(zhí)行—反饋”高頻循環(huán),帶來(lái)了對(duì)KV-cache密集訪問(wèn)的全新計(jì)算負(fù)載,成為S3押注的結(jié)構(gòu)性機(jī)會(huì)——放棄訓(xùn)練能力,專為大模型推理做原生深度定制。
在計(jì)算層,S3通過(guò)計(jì)算層的深度定制,解決了通用GPU“算力用不滿”的核心痛點(diǎn),推理性能較上一代S2提升5倍,目標(biāo)實(shí)現(xiàn)Token成本下降90%。
這一突破不僅令算子利用率逼近物理極限,同時(shí)實(shí)現(xiàn)了Agent原生的指令集與微架構(gòu),并原生支持FP4全鏈路低精度運(yùn)算,吞吐量較FP16提升3-4倍,直接轉(zhuǎn)化為客戶側(cè)的毛利空間和價(jià)格彈性。
在系統(tǒng)層,S3創(chuàng)新性集成了三大先進(jìn)高速接口技術(shù),從內(nèi)存和IO兩個(gè)推理時(shí)代最核心的瓶頸入手,解決了智能體三大核心瓶頸——通過(guò)LPDDR6內(nèi)存接口技術(shù)解決了智能體的“顯存生死線”;通過(guò)高速SerDes+SUE融合互聯(lián)技術(shù)解決了智能體的“多模型協(xié)同瓶頸”;通過(guò)PCIe Gen6接口技術(shù),解決了智能體的“資源碎片化”問(wèn)題。
打破「不可能三角」,搶占差異化領(lǐng)跑地位
“S3不是簡(jiǎn)單的性能升級(jí),而是一次對(duì)AI推理成本曲線的重構(gòu)。”徐冰表示,“我們的目標(biāo)是將推理成本降至‘百萬(wàn)Token一分錢’,讓AI像水電一樣成為普惠基礎(chǔ)設(shè)施。”
多家機(jī)構(gòu)預(yù)測(cè),未來(lái)五年推理算力市場(chǎng)規(guī)模將超越訓(xùn)練側(cè)數(shù)倍,其中Agent類負(fù)載將貢獻(xiàn)最主要的增量。這意味著,從產(chǎn)業(yè)周期看,訓(xùn)練側(cè)格局已相對(duì)固化,而推理側(cè)正隨Agentic AI放量進(jìn)入指數(shù)級(jí)增長(zhǎng)通道。
而曦望S3同時(shí)具備三個(gè)難以共存的要素,即推理原生的架構(gòu)前瞻性、實(shí)現(xiàn)98–99%算子利用率的頂尖工程能力、以及完整的生態(tài)適配能力。通過(guò)打破這一“不可能三角”,曦望成功確立了其在國(guó)產(chǎn)推理芯片領(lǐng)域的差異化領(lǐng)跑者地位,并重新定義了推理算力的經(jīng)濟(jì)模型。
公開(kāi)資料顯示,目前曦望團(tuán)隊(duì)規(guī)模已增長(zhǎng)至400人,研發(fā)人員占比超80%,匯聚了來(lái)自英偉達(dá)、AMD、華為海思等國(guó)內(nèi)外頂尖芯片企業(yè)的核心人才,碩士及以上學(xué)歷占比超80%。
曦望透露,目前公司已完成S4高性能推理GPU和S5安全可控推理GPU的技術(shù)路線規(guī)劃,并持續(xù)加碼近存計(jì)算、光電共封等前沿技術(shù)探索。2026年,公司將繼續(xù)圍繞“落地、兌現(xiàn)、增長(zhǎng)”核心原則,全力推進(jìn)S3芯片量產(chǎn)交付,完成與國(guó)內(nèi)外主流大模型、多模態(tài)模型和Agent框架的全面適配,為中國(guó)AI發(fā)展鑄造堅(jiān)實(shí)算力底座。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.