![]()
“西部數(shù)據(jù)的策略:從11碟HDD出發(fā),重塑AI存儲底座。
讓我們來試想這樣一個場景:凌晨3點,某大模型云服務(wù)平臺的日志系統(tǒng)依然在高速寫入。
用戶剛剛在一個智能體平臺上發(fā)起了一次多輪對話請求——表面上只是一個簡單的金融問詢,但背后,調(diào)度了3個子模型、20多次跨服務(wù)交互、超2萬token的上下文流轉(zhuǎn)。模型的響應(yīng)不過幾百毫秒,但系統(tǒng)中每一輪交互、每一次召回、每一段中間推理路徑,都被如實記錄下來,寫入歸檔。
問題是,每天都有TB級的推理日志、對話記錄、embedding緩存、agent調(diào)用歷史等“溫冷數(shù)據(jù)”生成,怎么存?存在哪兒?存多久?成本能不能承受?
西部數(shù)據(jù)在2024年10月推出的UltrastarTM DC HC690數(shù)據(jù)中心硬盤是一項適合的選擇。這是全球首款商用11碟UltraSMR HDD,在標(biāo)準(zhǔn)3.5英寸結(jié)構(gòu)下,實現(xiàn)了32TB超高容量,融合了經(jīng)市場驗證的成熟設(shè)計與前沿創(chuàng)新技術(shù),助力數(shù)據(jù)中心在現(xiàn)有基礎(chǔ)設(shè)施內(nèi)實現(xiàn)更高存儲密度。
![]()
那么,在AI時代,HDD將扮演什么樣的角色,西部數(shù)據(jù)的技術(shù)產(chǎn)品又有什么不一樣?為了回答這些問題,數(shù)據(jù)猿采訪了西部數(shù)據(jù)的高級銷售總監(jiān)文芳。
![]()
AI時代的數(shù)據(jù)存儲
面臨三大結(jié)構(gòu)性需求
如果說算力決定了AI跑多快,數(shù)據(jù)就決定了它跑多遠(yuǎn)。
但這個“跑遠(yuǎn)”的代價,正在變得越來越沉重。
2025年,大模型和智能體進(jìn)入商用部署的新階段,“一企一模型”“一行一垂類”的趨勢拉開,隨之而來的,是以PB乃至EB為單位的數(shù)據(jù)暴漲。從訓(xùn)練數(shù)據(jù)、微調(diào)數(shù)據(jù),到推理日志、模型版本、Agent調(diào)用記錄,數(shù)據(jù)不只是多了,還存在結(jié)構(gòu)性特征。
1.數(shù)據(jù)爆炸,熱溫冷分層成為常態(tài)
根據(jù)國家數(shù)據(jù)局?jǐn)?shù)據(jù),2024年中國AI企業(yè)數(shù)量同比增長36%,高質(zhì)量數(shù)據(jù)集增長27.4%,數(shù)據(jù)中心對更高強(qiáng)度AI應(yīng)用的支持需求正在迅速攀升。
這背后,是企業(yè)在構(gòu)建自己專屬知識庫、Agent能力池、領(lǐng)域微調(diào)集時,對數(shù)據(jù)的深度依賴——而且,這些數(shù)據(jù)的生命周期越來越復(fù)雜。
“熱溫冷”三層數(shù)據(jù)結(jié)構(gòu),已經(jīng)成為AI業(yè)務(wù)系統(tǒng)的事實標(biāo)準(zhǔn)。這些數(shù)據(jù)分別都是什么呢?
·熱數(shù)據(jù):實時調(diào)用、頻繁讀寫,典型如token緩存、任務(wù)隊列、模型權(quán)重更新;
·溫數(shù)據(jù):中頻訪問、周期性分析,如推理中間結(jié)果、Embedding向量庫、用戶行為日志;
·冷數(shù)據(jù):歸檔、合規(guī)、歷史記錄,如原始訓(xùn)練集、版本歷史、監(jiān)管審計記錄。
在AI工作負(fù)載中,“溫冷數(shù)據(jù)”的占比越來越高,它們既不夠熱,也不能徹底冰封;既要求長周期保存,又不能犧牲訪問可用性。
這使得數(shù)據(jù)分層策略不再只是“性能-價格”之間的折中權(quán)衡,而是事關(guān)業(yè)務(wù)架構(gòu)穩(wěn)定性與成本可控性的“戰(zhàn)略設(shè)計”。
2.TCO(總體擁有成本),成為重要的決策標(biāo)準(zhǔn)
與以往“按性能買硬件”的時代不同,AI時代的數(shù)據(jù)中心在做存儲決策時,關(guān)注的問題變了。
除了追求“速度有多快”,還要考慮“容量單價是多少?”“擴(kuò)展之后會不會不兼容?”“這筆錢值不值得花在這批溫數(shù)據(jù)上?”
這正是TCO(Total Cost of Ownership)概念成為核心指標(biāo)的原因。
從存儲容量單價、能源效率、空間密度,到可預(yù)測的擴(kuò)展性與維護(hù)成本,AI系統(tǒng)的底層架構(gòu)越來越傾向于做“長期賬”,而非只做“性能賬”。
比如,同樣是部署一個2PB的數(shù)據(jù)系統(tǒng),如果能夠降低20%的能耗、減少25%的服務(wù)器數(shù)量,那么哪怕讀寫速度略有差距,這筆投資依然是值得的。
這就是“總體擁有成本”導(dǎo)向下的存儲觀——“能長期用、用得起、未來還能升級”。
文芳提及,這正是大容量機(jī)械硬盤(HDD)發(fā)揮戰(zhàn)略作用的關(guān)鍵所在——它們能提供具有規(guī)模化成本效益的存儲容量,為PB/EB級AI存儲環(huán)境帶來卓越的總體擁有成本(TCO)優(yōu)勢。
既然HDD這么重要,那么,下一個問題就變成——誰能把HDD這張牌打好,誰能把它做得更大、更強(qiáng)、更節(jié)能?
西部數(shù)據(jù)的策略:
從11碟HDD出發(fā),重塑AI存儲底座
編者認(rèn)為,AI時代對HDD提出了兩個新要求:更大的容量,更長的周期。這不僅僅是一次性的性能突破,更是一次關(guān)于“長期信賴”關(guān)系的重構(gòu)。
在這個背景下,西部數(shù)據(jù)以UltrastarTM DC HC690數(shù)據(jù)中心硬盤為代表的新一代大容量HDD的重要性愈發(fā)凸顯。
1.數(shù)據(jù)底座:更優(yōu)TCO+長期信賴
在AI驅(qū)動的數(shù)據(jù)中心架構(gòu)中,HDD是不可替代的底座。因為它能帶來規(guī)模化成本效益。尤其是在溫、冷數(shù)據(jù)歸檔這類場景中,HDD的高存儲密度和具有優(yōu)勢的每TB成本,構(gòu)成了AI規(guī)模化部署的現(xiàn)實基礎(chǔ)。
在今天的超大規(guī)模云平臺中,HDD承擔(dān)著絕大多數(shù)溫冷數(shù)據(jù)的存儲任務(wù),占據(jù)了整個數(shù)據(jù)中心大部分的物理存儲空間和主要數(shù)據(jù)留存容量。而隨著AI的深入落地,這一比例還在持續(xù)提升。
可以說,HDD已經(jīng)成為AI時代的數(shù)據(jù)基礎(chǔ)設(shè)施支柱。西部數(shù)據(jù)在保證可靠性的基礎(chǔ)上,讓客戶能夠“預(yù)測成本、信任擴(kuò)展、安心使用”。
2.產(chǎn)品亮點:UltrastarTM DC HC690
據(jù)文芳介紹,UltrastarTM DC HC690這款產(chǎn)品上采用了多項關(guān)鍵技術(shù),具備以下優(yōu)勢:
·32TB容量,全球首款商用11碟UltraSMR HDD,封裝于標(biāo)準(zhǔn)3.5英寸結(jié)構(gòu)中;
·協(xié)同技術(shù)加持:包括ePMR(能量輔助垂直磁記錄)、UltraSMR、HelioSealTM、OptiNANDTM;
·功耗表現(xiàn)優(yōu)秀:即使磁碟數(shù)量增加,單位容量能效依舊維持在與10碟產(chǎn)品幾乎相當(dāng)水平。
每一項技術(shù)是為了實現(xiàn)一件事,在不增加占用空間的前提下,提升容量密度,同時保持穩(wěn)定與節(jié)能。
如何在3.5英寸的空間內(nèi)放下11碟磁盤,而不犧牲穩(wěn)定性和散熱?這并不是簡單的堆疊問題,而是一次結(jié)構(gòu)性的優(yōu)化。
在UltrastarTM DC HC690的設(shè)計中,工程團(tuán)隊圍繞以下關(guān)鍵點進(jìn)行多項創(chuàng)新:
·縮小磁碟間距:在保持碟片厚度以保障制造效率的同時,提升單位硬盤容量;
·微調(diào)磁頭懸掛裝置構(gòu):確保磁頭在高密度條件下依然精準(zhǔn)定位;
·PCB板避讓設(shè)計:通過重新布局電路板走線,為碟片結(jié)構(gòu)讓出空間;
這些細(xì)節(jié)的集合,構(gòu)成了“不升尺寸而升容量”的技術(shù)解法——讓HDD真正成為數(shù)據(jù)中心架構(gòu)中可持續(xù)演進(jìn)的一部分,而不是“一次性采購品”。
需要指出的是,西部數(shù)據(jù)的目標(biāo)不僅是32TB,而是一個更長周期的路線圖——同步推進(jìn)ePMR/UltraSMR的商業(yè)化與HAMR的工程驗證。預(yù)計2027年,西部數(shù)據(jù)將實現(xiàn)HAMR產(chǎn)品的量產(chǎn),同時保持與現(xiàn)有產(chǎn)品的兼容演進(jìn)。2030年后,西部數(shù)據(jù)計劃按路線圖發(fā)展50TB+級別的HDD(說明:關(guān)于未來產(chǎn)品規(guī)劃和技術(shù)路線的表述均為前瞻性陳述,可能因技術(shù)、市場或供應(yīng)鏈等因素發(fā)生調(diào)整)。
而且,西部數(shù)據(jù)旨在構(gòu)建一條“可預(yù)測、可平滑遷移、可長期信賴”的技術(shù)路徑,致力于降低系統(tǒng)演進(jìn)過程中的架構(gòu)調(diào)整與風(fēng)險評估復(fù)雜度。這是對客戶的長期關(guān)系戰(zhàn)略——構(gòu)建“存儲信賴路徑”,幫助客戶把其數(shù)據(jù)底座變成護(hù)城河。
構(gòu)建“可持續(xù)AI存儲架構(gòu)”的核心支柱
做大規(guī)模AI應(yīng)用的“護(hù)城河”
真正的技術(shù)護(hù)城河,從來不是某個指標(biāo)的領(lǐng)先,而是能不能在長期系統(tǒng)里反復(fù)證明自己:穩(wěn)定、可擴(kuò)展、可信賴。
對企業(yè)而言,這種價值是寫在每一張電費賬單、每一臺服務(wù)器、每一次擴(kuò)容的采購周期中。
以西部數(shù)據(jù)的HC690為例,在部署同樣2PB容量的場景下,相比傳統(tǒng)24TB HDD,客戶可以減少約25%的服務(wù)器數(shù)量,節(jié)省機(jī)架空間;降低約20%的整體能耗,同時降低基礎(chǔ)設(shè)施與維護(hù)成本。
從資源利用角度看,這是一種“結(jié)構(gòu)性節(jié)省”。大規(guī)模部署下單位TB的成本更低,幫助客戶更快達(dá)成可持續(xù)目標(biāo)。系統(tǒng)擴(kuò)容路徑更可預(yù)測,無須大幅調(diào)整部署架構(gòu)。對于AI推理數(shù)據(jù)、歸檔數(shù)據(jù)、訓(xùn)練歷史數(shù)據(jù)等體量巨大的“冷/溫數(shù)據(jù)”,這類大容量HDD,正是當(dāng)前可規(guī)模化落地的經(jīng)濟(jì)可行方案。
此外,在落地路徑上,西部數(shù)據(jù)顯然也不是“只賣設(shè)備”這么簡單。他們在本地化方面,也進(jìn)行了諸多努力。比如,其在亞太設(shè)有SIT實驗室(Storage Integration Test),為本地客戶提供產(chǎn)品開發(fā)規(guī)劃與部署、新產(chǎn)品測試驗證、產(chǎn)品認(rèn)證與導(dǎo)入等服務(wù)。他們還與超大規(guī)模客戶進(jìn)行聯(lián)合開發(fā),在早期就參與戰(zhàn)略協(xié)同,降低部署風(fēng)險,并提供貫穿產(chǎn)品全生命周期的持續(xù)工程支持。對于中國本地客戶,這意味著更快的支持響應(yīng)、更穩(wěn)的產(chǎn)品迭代、更長的生命周期保障。
展望未來,數(shù)據(jù)的爆炸性增長,正重塑“存儲”的產(chǎn)業(yè)角色。
根據(jù)中國信通院數(shù)據(jù)顯示,2024年中國云計算市場已達(dá)8288億元,同比增長34.4%。預(yù)計到2030年,該市場將突破3萬億,成為AI、工業(yè)互聯(lián)網(wǎng)、視頻流平臺等數(shù)據(jù)密集型行業(yè)的底層依托。
這不是一個線性增長市場,而是一個“被AI放大的廣闊空間”。每一個多模態(tài)模型的推理調(diào)用、每一個Agent系統(tǒng)的上下文記錄,每一次大語言模型的“記憶保存”,都是對存儲底座的“微小索取”。
而當(dāng)這些“微小索取”累計到PB/EB級規(guī)模時,編者認(rèn)為,誰能成為高規(guī)模化經(jīng)濟(jì)效益、低功耗、高可擴(kuò)展的數(shù)據(jù)承載方,誰就將在未來云基礎(chǔ)設(shè)施中具備更強(qiáng)的話語權(quán)。
這正是HDD發(fā)揮重要作用的底層邏輯——AI不僅改變了數(shù)據(jù)量,更改變了對“存儲”的定義。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.