也讓 SSD 性能第一次經(jīng)得起質(zhì)疑
在硅谷工程師圈子里,衡量一個(gè)人是否“足夠優(yōu)秀”,往往有一套默認(rèn)標(biāo)準(zhǔn):
是否參與過標(biāo)準(zhǔn)制定?
是否擁有足夠多的專利?
是否站在技術(shù)金字塔的上層?
![]()
Sandisk(閃迪)企業(yè)級(jí)SSD架構(gòu)團(tuán)隊(duì)的工程師Steven Sprouse,這些條件幾乎全部滿足
但他并不怎么認(rèn)同硅谷的這套評(píng)價(jià)體系,
“工程師真正的價(jià)值,不在于獎(jiǎng)項(xiàng),而在于你是否讓整個(gè)系統(tǒng)運(yùn)轉(zhuǎn)得更好。”
這句話的真諦最終落在了一個(gè)聽起來(lái)并不有趣,但極其關(guān)鍵的工程問題上—-SSD預(yù)處理(Preconditioning)
什么是SSD預(yù)處理
在SSD出廠之前,廠商必須對(duì)SSD經(jīng)歷一輪又一輪的測(cè)試,
其中最基礎(chǔ),也是最耗時(shí)的一步,叫做預(yù)處理。
簡(jiǎn)單來(lái)說(shuō)它的目的只有一個(gè):
讓SSD進(jìn)入“真實(shí)使用狀態(tài)”后,再去測(cè)試性能。
測(cè)試過SSD的玩家都知道,一塊全新的SSD和用了一段時(shí)間的SSD,在性能表現(xiàn)上是完全不同的,
![]()
在預(yù)處理的過程中閃存需要經(jīng)歷寫入、擦除,
控制器需要分配預(yù)留空間(OP),
垃圾回收、磨損均衡才會(huì)真正啟動(dòng)。
換言之做預(yù)處理之后得到的性能結(jié)果才是我們?nèi)粘J褂肧SD性能的真實(shí)表現(xiàn),
而空盤跑出來(lái)的性能數(shù)據(jù)看起來(lái)很好,但實(shí)際毫無(wú)意義。
問題是:SSD容量變大,“測(cè)試速度”沒跟上
過去,容量在8TB、16TB級(jí)別的SSD通過順序?qū)憹M,再隨機(jī)寫耗時(shí)幾小時(shí)到十幾小時(shí),這套流程還能勉強(qiáng)運(yùn)轉(zhuǎn),至少時(shí)間上還能接受。
但現(xiàn)在情況變了,
企業(yè)級(jí)SSD已經(jīng)進(jìn)入32TB、64TB甚至企業(yè)需求定制更高容量的時(shí)代,但是寫入帶寬并沒有線性的增長(zhǎng)。
![]()
結(jié)果也顯而易見:
SSD本身不慢,慢的是“能在較短的時(shí)間內(nèi)測(cè)到穩(wěn)態(tài)”。
Steven Sprouse表示如今一塊32TB的SSD采用傳統(tǒng)預(yù)處理需要160小時(shí)以上,如果是更大容量的SSD預(yù)處理時(shí)間將按照周來(lái)計(jì)算。
這對(duì)于大容量SSD出廠檢測(cè)來(lái)說(shuō)意味著從運(yùn)行、報(bào)錯(cuò)到最終修復(fù)的工程循環(huán),已經(jīng)無(wú)法在一天內(nèi)完成。
工程效率漸漸被物理容量拖垮了。
SPRandom:不是寫的快,而是“寫的聰明”
SPRandom的核心,并不是通過暴力加速寫入來(lái)縮短預(yù)處理的時(shí)間,而是通過改變“寫入順序的邏輯”。
簡(jiǎn)單來(lái)說(shuō)就是,既然穩(wěn)態(tài)是結(jié)果,就用不同的數(shù)學(xué)公式去倒逼。
SPRandom將SSD劃分為多個(gè)重疊區(qū)域,每個(gè)區(qū)域?qū)?yīng)不同階段的預(yù)留空間分布,
![]()
容量和超額配置(OP)數(shù)據(jù)
通過偽隨機(jī)算法,確保每個(gè)地址至少被寫入一次,追求真實(shí)使用的“覆蓋真實(shí)狀態(tài)”,
![]()
偽隨機(jī)性決定物理容量和 OP 分布
在一次物理寫入周期內(nèi)完成穩(wěn)態(tài)構(gòu)建,這樣就不再需要順序+隨機(jī)兩輪暴力寫操作。
![]()
在一次周期內(nèi)即可達(dá)到穩(wěn)定狀態(tài)
在改變了“數(shù)學(xué)公式”之后,32TB SSD的預(yù)處理時(shí)間從160小時(shí)縮短到6小時(shí),64TB以上也能實(shí)現(xiàn)基于“數(shù)學(xué)公式”的工程可控。
選擇開源
從商業(yè)角度來(lái)說(shuō),這套算法完全可以申請(qǐng)專利、轉(zhuǎn)變?yōu)樗接泄ぞ哌M(jìn)而增加內(nèi)部的壁壘,
顯然Steven Sprouse選擇踐行“開放工程”的精神,
把SPRandom集成進(jìn)開源工具fio。
理由也很簡(jiǎn)單,Steven Sprouse從fio獲益良多,為什么不讓整個(gè)行業(yè)一起受益呢?
![]()
我非常敬重Steven Sprouse開源的選擇,他的選擇會(huì)讓整個(gè)行業(yè)測(cè)試更真實(shí),參數(shù)膨脹和虛假性能就會(huì)越來(lái)越少,真正扎實(shí)的產(chǎn)品最終獲利的還是我們終端消費(fèi)者。
![]()
通常博主和發(fā)燒友在對(duì)SSD進(jìn)行測(cè)試時(shí),或多或少會(huì)受到網(wǎng)絡(luò)噴子們的問候,
說(shuō)穿了就是因?yàn)闆]有人能確定你拿到的這塊SSD真實(shí)的性能到底如何,
SPRandom的出現(xiàn)可以完全打消那些質(zhì)疑,
性能參數(shù)更接近我們?nèi)粘J褂脿顟B(tài),穩(wěn)態(tài)掉速更早暴露而不是交付后才發(fā)現(xiàn),企業(yè)級(jí)驗(yàn)證邏輯同時(shí)也會(huì)反向影響消費(fèi)級(jí)產(chǎn)品的成熟度。
簡(jiǎn)單來(lái)說(shuō),你買的SSD,對(duì)它的實(shí)際性能已經(jīng)知根知底,真實(shí)的性能變得更值得信賴。
工程正在走向“開放驗(yàn)證”
如果簡(jiǎn)單理解SPRandom的意義只是縮短了SSD的預(yù)處理的時(shí)間,那它的價(jià)值未免被低估了,
![]()
更重要的信號(hào)在于,越來(lái)越多原本被視為“工程經(jīng)驗(yàn)”的環(huán)節(jié),正在被拆解、公開,并接受行業(yè)級(jí)的復(fù)現(xiàn)實(shí)證。任何品牌的SSD都可以通過fio來(lái)使用Sprandom。
從存儲(chǔ)領(lǐng)域的fio、SPDK,到AI領(lǐng)域的MLPerf,從數(shù)據(jù)中心的OCP硬件骨ifan,到軟件工程中的可觀測(cè)性與復(fù)現(xiàn)構(gòu)建,工程正在從封閉、自證的頑固體系,轉(zhuǎn)向開放、可審計(jì)、可重復(fù)的驗(yàn)證模式。
SPRandom證實(shí)了,當(dāng)系統(tǒng)規(guī)模不斷擴(kuò)大、復(fù)雜度指數(shù)級(jí)上升,任何無(wú)法被外部驗(yàn)證的“性能承諾”,都會(huì)迅速失效,開放驗(yàn)證,已經(jīng)成為下一代工程體系的默認(rèn)選項(xiàng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.