3月17日,在2026華為數據存儲新春發布會上,華為正式發布針對AI推理場景的全新AI數據基礎設施,包含面向中心推理場景的AI數據平臺,和面向分支邊緣推理場景的FusionCube A1000 AI超融合一體機,旨在推動AI推理體驗全面升級,并顯著降低推理部署門檻,加速AI商業正循環。
過去幾年,AI歷經多輪演進,已邁入了以推理為核心的全新階段。當下,企業正面臨兩大變化:一是數據類型與規模持續擴展,從文本為主轉向多模態格式混合,體量從TB級躍升至EB級;二是企業核心資產從“數據”轉變為“知識”與“記憶”,被實時調用以支撐智能體自主決策。這些正全面重塑AI數據基礎設施,成為AI行業化落地的關鍵。
面向中心推理場景,華為推出AI數據平臺
為解決推理業務中知識質量不足、長序列推理體驗差以及推理記憶缺失的三大瓶頸,華為發布AI數據平臺,整合知識庫、KV Cache加速和記憶庫,并結合UCM技術實現調度與管理,破除企業AI的數據門檻,加速智能體應用落地。
![]()
華為存儲產品線副總裁、閃存領域總裁 謝黎明
- 知識庫:實時生成知識、高精度檢索知識
企業數據在不斷變化與更新,如果知識轉化不及時,會導致模型的推理決策結果不精準。華為AI數據平臺采用端到端的解析優化、表征優化與檢索優化,提供一個可敏銳捕捉源端數據變化的AI數據管道,并通過多模無損解析、Token級編碼等方式,將文本、圖片、視頻等資源轉化成海量細顆粒度的知識,結合多維度檢索與重排序,實現超95%知識檢索精度。
- KV Cache加速:容納海量歷史數據,加速推理響應
在長文本長序列、多用戶多并發的推理過程中,大量的KV Cache數據存不下、系統響應遲緩,導致推理體驗惡化。華為AI數據平臺針對性提供了全局分層緩存能力,讓記憶數據在On-chip memory、DRAM、外置SSD存儲三層間按需流動,顯著擴充KV Cache存儲池,同時融合多種稀疏注意力算法,避免重復計算,大幅擴展上下文窗口,實現首Token時延降低90%。
- 記憶庫:高效管理上下文記憶,讓模型越用越聰明
當前,大模型普遍缺乏持久的記憶,會遺忘多步驟的中間結果和長期沉淀的歷史經驗,無法真正實現自我進化。華為AI數據平臺提供精準的記憶萃取與召回能力,實現上下文狀態保持、信息凝練。記得越多,推理就越精準,模型應用才能“越用越聰明”。
本次發布的AI數據平臺可提供一體化和獨立式兩大部署模式。一體化部署以OceanStor A800為全棧一體機底座;獨立式部署采用“數據引擎節點+OceanStor Dorado”架構,可在現有存儲系統上新增數據引擎節點,保護歷史投資,支撐業務平滑轉型。
面向分支邊緣推理場景,華為發布FusionCube A1000 AI超融合一體機
如今,大量的數據是在分支邊緣場景產生的,針對傳統分支邊緣場景進行智能化改造過程中所面臨的部署復雜、成本高昂、效率低下等問題,華為推出FusionCube A1000 AI超融合一體機,通過集成化與智能化交付,助力AI快速部署與高效運行。
![]()
華為存儲產品線副總裁、虛擬化領域總裁 張偉力
FusionCube A1000采用通算與智算融合一體化架構,實現AI部署“開箱即用”。其內置的AI平臺預集成了數據處理、模型訓練與推理全流程能力,基礎設施部署與應用上線周期顯著縮短80%。同時,FusionCube A1000具備統一運維、安全運營的能力,實現全棧管理、健康監測、故障快速定位定界,為智能體穩定高效地運行提供安全保障。
此外,FusionCube A1000支持邊緣與中心協同運行,打破數據孤島,形成智能體從感知到自主決策的閉環。分支邊緣側產生的數據將回傳至中心,在中心側不斷豐富語料、完成模型增訓,模型更新后可一鍵下發至邊緣側,實現模型能力的持續優化與共享。同時,FusionCube A1000支持算力的動態切分與調度,可同時運行多個不同的AI模型,并依據業務優先級智能分配資源,單卡算力利用率提升約30%。其內置平臺還支持知識庫與記憶庫的協同構建,數據飛輪無感運轉,持續提升AI模型輸出的準確性與實用性。
此次發布的華為AI數據平臺與FusionCube A1000,實現了從中心到邊緣的AI推理全場景覆蓋,為AI技術廣泛行業化落地注入新動能。華為數據存儲將持續深耕創新,賦能AI全路徑,助力企業兌現AI商業價值。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.