智能時代的故事話題,是有鄙視鏈的。
如果你能脫口而出CPU、GPU、ASIC、FPGA的區別(中央處理器、圖形處理器、專用集成電路、現場可編程門陣列),一定讓人側目。如果能講清楚存算一體應對AI算力瓶頸,聽眾都得夸句懂行。這時有人問你,算力大家都懂,但存儲為什么要叫存力?
如果這時候你還能答出來,才叫真牛。
數據存儲的叫法演變,從storage到存儲再到存力,直觀傳遞出地位的變化。就像群演終于登上了電影謝幕的演職表,數據存儲被視作一股“力量”,正式登上智能時代的舞臺中央。
現在,一直在引領“存力”這個概念發展的中國存儲巨頭曙光存儲,開始以“先進存力中心”為范式,打通中國存儲產業資源,并聯合IDC發布了白皮書《構建面向智能化時代的先進存力中心》。了解這種實踐,不但讓你對存力有更直觀的認識,也對其產業價值會產生新的思考。
——導語
01
存力時代
從存儲到存力,雖然只有一字之差,但卻是數字化進程的歷史突破。
目前所謂的存力概念,廣義上包括內存,但多數語境下是指的外存儲器,也就是我們的數據的主要承載體。
回到開篇提出的那個有趣問題,存儲這個詞用了很久,為何要升級為存力?
![]()
在漢語里,“存”和“儲”其實是同義詞,它們都更偏向于“儲存數據”這個相對來說比較靜態的運用維度。
我訪問過的一位院士也曾經談及——存儲長期以來是個配角,它有價值但不是主力;只要不成為系統的瓶頸,不危及數據的安全,人們就較少關注它;它一直在默默的發展,但很少走到舞臺中央。
但就是這種“默默無聞”的配角身份,使人們常常忽視存儲子系統的價值,以至于產生了兩種有失偏頗的認知——
第一種偏頗,是沒有正確的看待存儲對于整個系統的價值,投資比例失調。
倪光南院士就多次、多場合的提及,中國在算力建設中常常存在存算比不合理的問題——國內高度重視投資算力,而輕于投資存儲,最終反而使得系統存在短板。
一個經常被引用的數字是,在某些發達國家,存算比投資達到1:1,也就是一塊錢投向算力,就有一塊錢投向存儲。
而中國的存算比約為0.4:1,也就是1塊錢投給算力,只有4毛錢投向存儲,如果聯系歷史數據,這個值可能更低。
這導致了一個結果,就是目前國內很多算力中心的算力利用率不高。雖然,這是一個系統性的問題,不能簡單歸因于存儲,但存儲性能肯定是諸多短板中較短的一塊。
第二種偏頗,就是簡單的把“存儲”和“數據”混同為一體。
我曾和一位業內專家激辯,原因是他認為無須提出“存力”這個概念。他認為,在AI的“黃金三角”也就是“算法、算力、數據”中,數據就等于存儲,而存儲不需要獨立派生出一個“存力”的概念。
這個觀點,在上一次AI浪潮中可能是成立的。
但在目前以深度學習為主線、大模型為主要應用場景的生成式AI的競爭格局中,在動輒萬卡、十萬卡的大集群場景中,預訓練數據集的體量和質量, 訓練過程中數據的加載和檢查點的建立,直接關系大模型的訓練結果——這種新的模式,頭一次把數據存儲—數據應用—訓練結果緊密的聯系在一起,也讓傳統的存儲子系統的短板驟然暴露。
這種暴露,是人類遇到的百年不遇的技術架構大變局——智能化,與傳統存儲體系之間存在的天然矛盾被放大了。
其中的核心邏輯是——當人類發明智能手機后,僅僅十年就在全球一共有了43億用戶,是有史以來唯一達到這一量級的數字化工具。而且,這是一種全時在線、實時生產數據的工具。這也就決定了,人類迎來了歷史性的數據大爆炸。現在的人類,每年產生100多個ZB的數據,一年的數據增量就幾乎相當于自有計算機以來產生的全部數據,而這一切都需要海量存儲來承載。
有了大量的數據后,人類開始有大數據的概念,大數據進而滋養了AI的發展。在我們還沒有反應過來的時候,數據已經成為和能源、土地、貨幣等同一個層次的頂級經濟要素。
而直到這一刻,人們才發現,原本夠用而且也還算便宜的存儲系統,開始跟不上時代的節奏。
傳統存儲體系面臨的天然困難是,夠快的介質不夠便宜,夠便宜的介質不夠快,又快還比較便宜的介質的軟件算法還不夠好——在我和一位院士的交談中,他指出——傳統上為了解決成本問題而存在的對數據進行冷熱分層的做法(給越常用的數據搭配越快的介質),實際上極大的增加了計算的成本。以至于大量的CPU的工作不是在處理數據,“而是淪為了數據搬運機”。
而IDC中國區副總裁周震剛則直接預言說:我覺得這種趨勢會越演越烈,很可能在未來的智能計算中,CPU的運算作用越來越小,而“數據搬運”的工作量越來越重,GPU則更專注于推理運算。”
![]()
IDC中國區副總裁周震剛
在另外一個我們常見的語境中,存力、算力、運力,被認為是共同構成了數字基礎設施的核心底座。
但事實上,在“存力”這個概念里,相對于“存儲”的重點拓展——就是“存力”的概念中天然的包括了一部分“運力”的因素,特別是在分布式存儲越來越受到重視的當下,存儲體系的分布式架構中很重要的一個概念就是數據傳輸,這和傳統意義上的“運力”既有重合又有些微的沖突,從另一個側面體現了從“存儲”向“存力”過渡的過程中,一些固有的觀念將受到挑戰。
事實上,存力不僅僅包括靜態的“存”和動態的“運”,而“先進存力”更包含了“海量、高效、融合、綠色、安全”等多元要素——這也決定了,存儲和存力雖然只有一字之差,但背后卻是許多領域固有觀念的打破和跨領域的融合。
一邊,是隨著IT基礎設施的建設熱潮,人們看到了傳統“存儲”概念的局促性和“存力”概念的良好擴展性;另一邊,是云計算、AI等技術應用的火爆,推動存力地位上行。
那么,存力時代真的到來了么?
02
先進存力的實踐階梯
作為業內首個提出“先進存力”概念的廠商,曙光對此的表述似乎更為完整——中科曙光高級副總裁關宏明曾重點解讀過“先進存力”的概念,即落地打造具備‘一平臺多協議、應用親和、全域數據流動、安全可靠與綠色節能’五大優勢的先進存力中心,以全面滿足市場對數據存儲的容量、性能、安全與產業化多重需求。”
可以說,“先進存力”一直存在于曙光存儲的腦海中,但在不同時代,各自有各自的主要場景和載體。
如果從先進存力自身進化的角度來說,在過去十幾年中,以曙光存儲為例,可以看到爬升了三個階梯。
而爬升的一個前提則是,曙光存儲從2009年開始自研的分布式存儲系統ParaStor已經基本成熟,具有了一切主流、高端的分布式存儲的技術特性,并且有了大量的產業實踐,多年在國內軟件定義存儲市場(一般認為即指分布式存儲)處于數一數二的位置。
在這個基礎上,曙光存儲發展先進存力的第一個階段,叫產品化。所謂的產品化,就是把成熟的底層存儲能力,和特定的場景結合,開發出具有很強的針對性的產品。
![]()
這里面既包括“智存”,也就是經典分布式存儲產品——ParaStor全閃存儲針對AI場景的優化,進而具備五級數據加速技術,搭配全路徑AI親和機制,最高可以提升全平臺整體表現20倍+。
當然也有“強存”,曙光存儲今年發布的FlashNexus系列,不僅是全球首個億級IOPS集中式全閃存儲,還是業界唯一有百控級擴展能力的集中式存儲產品,穩定性保障首次突破7個9,綜合性能領先同類產品50%以上。
但是,產品線化只是相對于曙光自身的進化,更高的一級臺階,我們稱之為“方案化”。可以說,如果“強存”、“智存”主要是根據場景來設定,那“方案化”就是針對更細分的領域推出專屬產品,例如針對AI大模型、自動駕駛、智算中心、具身智能等等行業推出專有的解決方案。
曙光存儲總裁何振就指出,方案化的前提,是和用戶的高度交互,是“從用戶需求來打造產品”這個觀念的實踐,當然也是曙光具有代碼級優化能力的底蘊才能發揮的作用。
然而,無論是產品線化,還是解決方案化,都屬于常規賽。曙光存儲真正令人刮目相看的是,是提出了“先進存力中心”的概念。
我們知道,在科技行業,提出概念很容易,但踐行概念并推廣成功很難。
這就像喬布斯2007年拿出初代iPhone時,世界上已經有很多叫“智能手機”的設備,但iPhone的魅力就是能讓人們認為“這就是智能手機”。從而,全世界的研究者也都把“iPhone時刻”當作移動互聯網時代降臨的元年。
“先進存力中心”是否能成為先進存力行業的“iPhone時刻”,只有時間能檢驗。但從它目前展現的一些特質上來說,可以說每個特性都是擊中當下存力發展痛點后的解決方案。
例如,在前文中我們曾經談到過,為了做到成本和性能的平衡而產生的冷熱分層機制,反而成為了吃掉算力的“重勞動”。
“我們建立的先進存力中心,會自動地篩選數據的冷、溫、熱”,曙光存儲副總裁郭照斌說:“例如,對于熱數據,我們一定是提供最先進的高效的數據能力。但這個工作不是由用戶在他們的業務層實現,而是我們能夠做到在大數據中智能識別,是我們的存儲技術本身去識別數據的各個熱度層級的變化,并主動地推送到業務端。讓業務人員感受到他什么時候想用都是最快的”。
“這說明一個問題,那就是目前的存儲系統的性能瓶頸還不是閃存介質本身,而是軟件工程上的問題”,周震剛說:“這也意味著分布式閃存還有很大的發展空間,我們觀察到的趨勢是,如果分布式全閃算作一種先進存力,那么它越來越明顯的開始從適配高性能、高需求的大場景,開始滲透向小集群、小場景,這就讓基于全閃的分布式存儲還有很高的天花板。”
郭照斌提及的另一個先進存力中心的重要特性,是良好的融合性。
“我們以前覺得用不上的數據太多,到現在覺得數據不夠用,是因為智能化時代重新激發了存量數據的價值。但由此就帶來一個問題,以前即使在同一個體系內,存儲數據的方式也是煙囪式的、彼此不兼容的”,郭照斌說。
而曙光的先進存力中心創造了這樣一種可能性,無論這些數據是對象協議訪問的、跨協議方式的、文件方式的、塊存儲方式的,都可以自動、快速的完成數據匯聚,并且同時自動識別哪些是要近期訪問的,哪些是需要長期冷存儲的,“這樣就不僅僅解決了匯聚的問題,而且把數據利用前的一切準備工作都加工好了,就好比以前提供的是食材,現在直接提供的是凈菜。這樣極大的降低了用戶的負擔,讓數據的應用者更能把精力集中在發現、利用數據的價值上,而不用把太多精力放在數據本身的處理和存儲上,這也是明顯超越當前主流形態的新特性。”
當然,先進存力中心在性能、安全性和綠色屬性上,還有許多內容需要展開。但限于文章篇幅,我們只選擇最具代表性的兩個特點。
![]()
而什么叫最具代表性,答案一定是——用戶最普遍認為是痛點的。
03
落地進行時
我們前面說過,先進存力的概念很好,但先進存力中心的落地很難。
但是,最難的第一步已經走出了。
西部(重慶)科學城先進數據中心(以下簡稱“先進數據中心”)是東數西算工程成渝樞紐節點示范項目,也是全國一體化大數據中心的“協同創新體系示范工程”。
這個由中科曙光承建的數據中心,其實就是曙光版“先進存力中心”的落地樣板。而且,因采用多種創新技術,使其成為東數西算項目中整體國產化率、綠色節能技術等位居前列的先進數據中心。
例如我們前面未及展開的“綠色”方面,重慶先進數據中心就采取了曙光獨家的浸沒式液冷技術、余熱回收、綠色建筑等多種節能技術方案,不僅解決了散熱,還可以充分的釋放芯片的潛能。
“存算一體是近年來的一個新概念,它受到了人的大腦神經元既可以存儲信息,又可以處理信息的啟發,以此為靈感實現了存算一體化。雖然,這可能不是存算一體的終極方案,但也可以被稱為是這一領域具有較強先進性的領先實踐”,郭照斌說:“除了存算一體化,這里還包含有場景融合一體化、數據聯邦一體化、生命周期一體化、數據服務一體化等多個一體化方案,目的仍然是讓用戶可以心無旁騖的把注意力集中在業務上,而較少甚至無感于‘存力’的存在”。
而把先進存力中心放在重慶,除了其地理位置要素外,和其產業集中度也有關系。例如,重慶有全國最大的汽車摩托車產業集群,而曙光在先進數據中心已經為國內一家新勢力車企構建了一個超過100PB的底層存力平臺,通過存力平臺可以實現用戶的自動駕駛業務數據的錄入、預處理,以及仿真、分析業務的導出,提供全流程支持。
顯然,先進存力中心不止有一種方案,但曙光提出的范式,越早落地,就越早有機會遇到現實的挑戰和問題,也就有機會先于其他企業遇到這些問題和解決這些問題,而這又將反哺曙光的行業領先地位。
事實上,今年曙光存儲可謂亮點頻頻,例如發布了全球首個億級集中式存儲、打榜xxx成功等等,但這一切,都不如站在重慶中心城區西部槽谷的高點,鳥瞰西部(重慶)科學城的全貌時,那樣讓人心潮起伏。
可以說,這個先進存力中心是中國企業級存儲行業發展到今天的最新、最高水平的體現。從整體的體系性能力來說,它比最先進的集中式閃存、分布式閃存的單點產品突破還更有意義。
可以說,集中式、分布式閃存是目前最高光的兩類存儲產品,但產品如果不和具體的場景結合,就是無法落地的。而存力中心決定了存力的運用方式,讓各種集中、分布式存儲產品成為了構筑先進存力中心的基石。
這里,或許將會是中國存儲出發趕超世界頂級存儲產業的出發地。
中國企業級存儲經過幾十年的風雨,從追趕到PK,再到今天的局部領先。其中一個最大的背景,就是中國是全球最大的單一互聯網國家(從網民數量級這個維度來看)。
這個龐大的體系和其中的千行百業,給了中國存儲產業最好的發展沃土,加之中國目前已經成為全球唯二的人工智能創新策源地,可謂AI的浪頭才剛剛興起,大規模落地已是躍躍欲試。客觀說,這種場景,放眼全球,可能只有美國和中國具備。而中國的產業規模、網民人口、設備數量、核心需求,都更大也更迫切。
可以想像,在中國在競爭全球AI高地的過程中,會和時代的需求互相奔赴,發展到一個引領全球應用范式的新境界。而存力作為其中的核心支撐,也會在頂級的需求的催迫下,走到一個新的高度。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.