NVIDIA 推出 BlueField-4 STX 存儲架構(gòu),獲業(yè)界廣泛采用
新聞?wù)?
? 全新 NVIDIA STX 參考架構(gòu)可提升高達(dá) 5 倍的 Token 吞吐量,能效提升高達(dá) 4 倍,數(shù)據(jù)攝取速度提升 2 倍。
? 率先將 STX 用于上下文記憶存儲的廠商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、Oracle Cloud Infrastructure(OCI)和 Vultr。
? 多家存儲廠商與制造合作伙伴正在基于 NVIDIA 模塊化參考設(shè)計來構(gòu)建基礎(chǔ)設(shè)施,以推進(jìn)代理式 AI 的發(fā)展,包括 AIC、Cloudian、DDN、戴爾科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、Supermicro、Quanta Cloud Technology(QCT)、VAST Data 和 WEKA。
加利福尼亞州圣何塞 —— GTC —— 太平洋時間 2026 年 3 月 16 日 ——NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模塊化參考架構(gòu),該架構(gòu)可助力企業(yè)、云計算及 AI 服務(wù)商輕松部署加速存儲基礎(chǔ)設(shè)施,以滿足代理式 AI 所需的長上下文推理能力。
傳統(tǒng)數(shù)據(jù)中心提供大容量通用存儲,但難以滿足與跨多步驟、多工具和多輪會話的 AI 智能體無縫交互所需的響應(yīng)速度。代理式 AI 需要實時訪問數(shù)據(jù)和上下文工作記憶,以確保對話和多任務(wù)的快捷性和連貫性。隨著上下文規(guī)模的不斷擴(kuò)大,傳統(tǒng)存儲和數(shù)據(jù)路徑可能會降低 AI 推理的速度,并降低 GPU 利用率。
NVIDIA STX 助力存儲廠商構(gòu)建數(shù)據(jù)就近并可大規(guī)模訪問的基礎(chǔ)設(shè)施,從而使代理式 AI 工廠能夠在推理、訓(xùn)練和分析方面提供更高的吞吐量和響應(yīng)速度。
首個機架級部署方案集成了全新的 NVIDIA CMX? 上下文記憶存儲平臺。通過引入高性能的上下文層來擴(kuò)展 GPU 內(nèi)存,從而實現(xiàn)可擴(kuò)展的推理和代理式系統(tǒng)。與傳統(tǒng)存儲相比,每秒可處理的 Token 提升高達(dá) 5 倍。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“代理式 AI 正在重新定義軟件的能力,必須重塑其背后的計算基礎(chǔ)設(shè)施才能跟上這一步伐。能夠基于海量上下文進(jìn)行推理并持續(xù)學(xué)習(xí)的 AI 系統(tǒng),需要新的存儲方案。NVIDIA STX 重新定義了存儲堆棧,為 AI 原生基礎(chǔ)設(shè)施提供了模塊化基礎(chǔ),確保 AI 工廠始終保持峰值性能高效運行?!?
STX 由 NVIDIA Vera Rubin 平臺提供加速,集成了針對存儲進(jìn)行優(yōu)化的全新 NVIDIA BlueField-4 處理器。該處理器將 NVIDIA Vera CPU、NVIDIA ConnectX® -9 SuperNIC 相結(jié)合,并配合 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)、NVIDIA DOCA? 以及 NVIDIA AI Enterprise 軟件共同運行。
與傳統(tǒng) CPU 架構(gòu)相比,STX 架構(gòu)的能效提升高達(dá) 4 倍,從而實現(xiàn)高性能存儲,并且在處理企業(yè)級 AI 數(shù)據(jù)時,每秒可處理的內(nèi)存頁數(shù)提升 2 倍。
眾多存儲廠商合作伙伴正在基于 NVIDIA STX 共同設(shè)計新一代 AI 基礎(chǔ)架構(gòu),包括 Cloudian、DDN、戴爾科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、VAST Data 和 WEKA。
正在構(gòu)建基于 STX 系統(tǒng)的制造合作伙伴包括 AIC、Supermicro 和 Quanta Cloud Technology(QCT)。
計劃采用 STX 進(jìn)行上下文記憶存儲的主要 AI 實驗室和云服務(wù)提供商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、OCI 和 Vultr。
基于 STX 的平臺將于今年下半年由合作伙伴推出。





