網易首頁 > 網易號 > 正文申請入駐

杭州GPU獨角獸曦望獲超10億元融資，推進算力成本降九成

2026-04-20 17:36:10　來源: 南方都市報

廣東舉報

分享至

4月20日，南都N視頻了解獲悉，國內全棧自研AI推理GPU企業曦望（Sunrise）完成了新一輪超10億元融資，由多家產業方戰投、地方國資及頭部財務機構共同參與。這也是2026年AI產業全面邁入“推理落地、智能體普及”時代后，國內GPU賽道誕生的最大單筆融資之一。

據曦望方面介紹，本輪融資資金將主要用于新一代S3推理GPU的規模化量產交付、全棧軟件生態建設，以及S4/S5后續芯片的研發迭代。公開資料介紹，曦望成立于2020年，前身為商湯科技大芯片部門，于2024年底完成分拆。如今，分拆獨立僅一年多，其已累計完成七輪融資，總融資額約40億元，成為國內首家估值超百億的純推理GPU獨角獸。

從技術路徑來看，據介紹，不同于行業主流的“訓推一體”路線，曦望從成立第一天起就堅定All-in推理賽道，以用戶真實的Token成本、單位能耗和服務穩定性為芯片設計核心。目前，其已推進三代推理GPU迭代、數萬顆GPU量產落地，實現了從芯片研發、產品量產到解決方案交付的完整閉環。

2026年1月，曦望正式發布新一代旗艦產品啟望S3推理GPU，作為國內首款搭載LPDDR6且兼容LPDDR5X內存的推理GPU，沒有盲目照搬高端訓練GPU的HBM顯存路線，而是基于Agent推理的本質需求，從AI Core計算架構到內存IO系統進行了全鏈路重構。

2026年被業內稱為“AI智能體元年”。隨著大模型從“會聊天”進化為“會思考、會執行”的數字員工，推理需求迎來爆發式增長。英偉達GTC 2026大會正式宣告AI產業全面邁入“推理落地、智能體普及”的新時代，將“每瓦Token吞吐量”定義為AI時代的核心競爭力，這與曦望的核心戰場相契合。

從產業周期看，訓練側格局已相對固化，而推理側正隨Agentic AI放量進入指數級增長通道，多家機構預測，未來五年推理算力市場規模將超越訓練側數倍，其中Agent類負載將貢獻最主要的增量。“AI算力基建的重心已徹底切換。”曦望董事長徐冰表示，“2026年AI推理計算需求將達到訓練需求的4-5倍，推理算力租賃價格半年漲幅近40%。”

近期，OpenClaw的爆火也掀起全民“養龍蝦”熱潮，對此，曦望方面認為，以OpenClaw為代表的智能體推理，“感知—規劃—執行—反饋”高頻循環，帶來了對KV-cache密集訪問的全新計算負載，通用GPU面向訓練優化，推理實際算力利用率往往遠低于峰值——推理側的效率瓶頸已不再是“算力不夠”，而是“算力用不滿”。

據悉，S3通過計算層的深度定制，解決了通用GPU“算力用不滿”的核心痛點，推理性能較上一代S2提升5倍，目標實現Token成本下降90%。“S3不是簡單的性能升級，而是一次對AI推理成本曲線的重構。”徐冰表示，“我們的目標是將推理成本降至‘百萬Token一分錢’，讓AI像水電一樣成為普惠基礎設施。”

采寫：南都N視頻記者朱可軒

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.