![]()
4月20日,南都N視頻了解獲悉,國內全棧自研AI推理GPU企業曦望(Sunrise)完成了新一輪超10億元融資,由多家產業方戰投、地方國資及頭部財務機構共同參與。這也是2026年AI產業全面邁入“推理落地、智能體普及”時代后,國內GPU賽道誕生的最大單筆融資之一。
![]()
據曦望方面介紹,本輪融資資金將主要用于新一代S3推理GPU的規模化量產交付、全棧軟件生態建設,以及S4/S5后續芯片的研發迭代。公開資料介紹,曦望成立于2020年,前身為商湯科技大芯片部門,于2024年底完成分拆。如今,分拆獨立僅一年多,其已累計完成七輪融資,總融資額約40億元,成為國內首家估值超百億的純推理GPU獨角獸。
從技術路徑來看,據介紹,不同于行業主流的“訓推一體”路線,曦望從成立第一天起就堅定All-in推理賽道,以用戶真實的Token成本、單位能耗和服務穩定性為芯片設計核心。目前,其已推進三代推理GPU迭代、數萬顆GPU量產落地,實現了從芯片研發、產品量產到解決方案交付的完整閉環。
2026年1月,曦望正式發布新一代旗艦產品啟望S3推理GPU,作為國內首款搭載LPDDR6且兼容LPDDR5X內存的推理GPU,沒有盲目照搬高端訓練GPU的HBM顯存路線,而是基于Agent推理的本質需求,從AI Core計算架構到內存IO系統進行了全鏈路重構。
![]()
2026年被業內稱為“AI智能體元年”。隨著大模型從“會聊天”進化為“會思考、會執行”的數字員工,推理需求迎來爆發式增長。英偉達GTC 2026大會正式宣告AI產業全面邁入“推理落地、智能體普及”的新時代,將“每瓦Token吞吐量”定義為AI時代的核心競爭力,這與曦望的核心戰場相契合。
從產業周期看,訓練側格局已相對固化,而推理側正隨Agentic AI放量進入指數級增長通道,多家機構預測,未來五年推理算力市場規模將超越訓練側數倍,其中Agent類負載將貢獻最主要的增量。“AI算力基建的重心已徹底切換。”曦望董事長徐冰表示,“2026年AI推理計算需求將達到訓練需求的4-5倍,推理算力租賃價格半年漲幅近40%。”
近期,OpenClaw的爆火也掀起全民“養龍蝦”熱潮,對此,曦望方面認為,以OpenClaw為代表的智能體推理,“感知—規劃—執行—反饋”高頻循環,帶來了對KV-cache密集訪問的全新計算負載,通用GPU面向訓練優化,推理實際算力利用率往往遠低于峰值——推理側的效率瓶頸已不再是“算力不夠”,而是“算力用不滿”。
據悉,S3通過計算層的深度定制,解決了通用GPU“算力用不滿”的核心痛點,推理性能較上一代S2提升5倍,目標實現Token成本下降90%。“S3不是簡單的性能升級,而是一次對AI推理成本曲線的重構。”徐冰表示,“我們的目標是將推理成本降至‘百萬Token一分錢’,讓AI像水電一樣成為普惠基礎設施。”
采寫:南都N視頻記者 朱可軒
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.