AI時(shí)代,如何用服務(wù)器存儲如何升級?
一邊是基于Darkmont的至強(qiáng)6+蓄勢待發(fā),另一邊是基于Zen 6的EPYC Venice摩拳擦掌,海量GPU并行計(jì)算的AI服務(wù)器正在醞釀一輪全新的升級,以更高的密度、吞吐量和效能支持AI負(fù)載和新應(yīng)用挑戰(zhàn)。無論是CXL與內(nèi)存擴(kuò)展技術(shù)的落地,還是PCIe 5.0和PCIe 6.0與AI數(shù)據(jù)密集型應(yīng)用推動(dòng)的本地高速存儲,都將企業(yè)級固態(tài)硬盤推向了非常重要角色。存儲已經(jīng)從系統(tǒng)的配套設(shè)施,變身成新平臺性能釋放的關(guān)鍵。
相對于HBM、GDDR和DRAM,企業(yè)級SSD優(yōu)勢在于彌補(bǔ)了數(shù)據(jù)供給速度與計(jì)算速度之間的巨大鴻溝,特別是全新的CPU、GPU在算力、核心數(shù)量、AI吞吐量井噴式的增長,以往的低速存儲很容易造成計(jì)算單元空轉(zhuǎn),造成數(shù)據(jù)饑餓,進(jìn)而影響到企業(yè)的時(shí)間與支出成本。
PCIe 5.0規(guī)范在企業(yè)級平臺中的普及已經(jīng)能夠很好的解決很多問題。例如新平臺單路有機(jī)會提供多大128條PCIe 5.0通道,進(jìn)而并行掛載8到16塊企業(yè)級SSD,聚合帶寬輕松突破100 GB/s,與內(nèi)存子系統(tǒng)形成二級存儲池,為AI訓(xùn)練、實(shí)時(shí)分析提供高速數(shù)據(jù)洪流。
隨著模型體積不斷增大,AI大模型、OLAP數(shù)據(jù)庫的工作經(jīng)常超出物理內(nèi)存已經(jīng)成為日常,把熱數(shù)據(jù)緩存到企業(yè)級SSD也已經(jīng)成為未來趨勢。以近段時(shí)間發(fā)布的鎧俠LC9為例,不僅支持PCIe 5.0,NVMe 2.0和NVMe-MI 1.2c,以及OCP v2.5規(guī)范,單盤容量更是一步到位達(dá)到了245.76TB,能夠以更高的存儲密度,遠(yuǎn)低于DRAM的存儲成本為AI提供數(shù)據(jù)流支持,同時(shí)響應(yīng)性能還能保持在微秒級。
隨著NVMe over RoCE v2和CXL 3.0的進(jìn)一步推廣,本地SSD還可以池化為軟件定義內(nèi)存,實(shí)現(xiàn)跨節(jié)點(diǎn)共享,特別企業(yè)級SSD或者數(shù)據(jù)中心級SSD與高性能AI服務(wù)器集群聯(lián)合,把數(shù)PB高速閃存當(dāng)作全局地址空間,內(nèi)存容量得以彈性擴(kuò)容,讓數(shù)據(jù)中心、AIGC訓(xùn)練集群突破單機(jī)內(nèi)存墻。
由鎧俠BiCS8 TLC打造的CM9系列為高性能計(jì)算集群提供了充足的存儲支持,具備雙端口設(shè)計(jì),為多平臺存儲方案提供更多可能性能。同時(shí)CM9系列擁有強(qiáng)勁的性能表現(xiàn),順序讀取性能高達(dá)14.8GB/s,釋放PCIe 5.0潛能,且提供U.2和E3.S規(guī)格可選,滿足不同的存儲方案需求,且最高容量可達(dá)61.44TB。
鎧俠CD9P同樣由BiCS8 TLC打造,最高容量同樣可達(dá)61.44TB,且旨在幫助數(shù)據(jù)中心優(yōu)化TCO,同時(shí)兼顧高吞吐量、低延遲等諸多特性,為AI加速、機(jī)器學(xué)習(xí)、云端服務(wù)等應(yīng)用提供更多可能性。
數(shù)據(jù)就像糧草,算力再強(qiáng),也需要數(shù)據(jù)跟上。鎧俠企業(yè)級SSD和數(shù)據(jù)中心級SSD以高速、穩(wěn)定、可靠的表現(xiàn),將數(shù)據(jù)洪流穩(wěn)定地送到計(jì)算單元,成為新平臺中性能釋放的關(guān)鍵部件,也是數(shù)據(jù)存儲的保險(xiǎn)栓,為AI應(yīng)用落地提供堅(jiān)實(shí)的保障。





