NVIDIA 推出 Vera CPU,專為代理式 AI 打造
新聞?wù)?
· NVIDIA Vera CPU 較傳統(tǒng) CPU 在效率上提升 2 倍,速度提升 50%。
· 與 NVIDIA 合作部署 Vera CPU 的客戶包括阿里巴巴、字節(jié)跳動(dòng)、Meta、Oracle Cloud Infrastructure、CoreWeave、Lambda、Nebius 和 Nscale。
· 已采用 Vera CPU 的制造商合作伙伴包括戴爾科技、HPE、聯(lián)想和 Supermicro,以及華碩、Compal、Foxconn、技嘉、Pegatron、Quanta Cloud Technology(QCT)、Wistron 和 Wiwynn。
加利福尼亞州圣何塞 —— GTC —— 太平洋時(shí)間 2026 年 3 月 16 日 —— NVIDIA 今日發(fā)布 NVIDIA Vera CPU,這是全球首款專為代理式 AI 與強(qiáng)化學(xué)習(xí)時(shí)代打造的處理器,其效率是傳統(tǒng)機(jī)架級(jí) CPU 的 2 倍,速度提升 50%
隨著推理和代理式 AI 的發(fā)展,規(guī)模、性能和成本越來(lái)越取決于支撐模型的基礎(chǔ)設(shè)施,這些模型負(fù)責(zé)規(guī)劃任務(wù)、運(yùn)行工具、與數(shù)據(jù)交互、運(yùn)行代碼并驗(yàn)證結(jié)果。
NVIDIA Vera CPU 基于 NVIDIA Grace? CPU 的成功經(jīng)驗(yàn)打造而成,助力各行業(yè)、各種規(guī)模的組織都能構(gòu)建 AI 工廠,大規(guī)模釋放代理式 AI 的潛力。憑借卓越的單線程性能和每核心帶寬,Vera 重新定義了 CPU。它能提供更高的 AI 吞吐量、響應(yīng)速度和效率,從而支持大規(guī)模 AI 服務(wù),例如編程助手以及面向消費(fèi)者和企業(yè)的智能體應(yīng)用。
與 NVIDIA 合作部署 Vera 的頭部超大規(guī)模企業(yè)包括阿里巴巴、CoreWeave、Meta 和 Oracle Cloud Infrastructur,以及戴爾科技、HPE、聯(lián)想和 Supermicro 等全球系統(tǒng)制造商。這一廣泛采用使 Vera 成為面向開(kāi)發(fā)者、初創(chuàng)公司、公共和私營(yíng)機(jī)構(gòu)及企業(yè)最重視的 AI 工作負(fù)載的新型 CPU 標(biāo)準(zhǔn),有助于讓更多人平等地使用 AI 并加速創(chuàng)新。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“AI 正邁向一個(gè)轉(zhuǎn)折點(diǎn),Vera 應(yīng)勢(shì)而來(lái)。隨著智能變得具有能動(dòng)性——能夠推理并采取行動(dòng)——重心就轉(zhuǎn)移到了編排這些工作的系統(tǒng)。CPU 不再只是支持模型,而是開(kāi)始驅(qū)動(dòng)模型。憑借突破性的性能與能效,Vera 助力 AI 系統(tǒng)實(shí)現(xiàn)更快的運(yùn)算速度和更廣的擴(kuò)展能力。”
為各類數(shù)據(jù)中心提供靈活配置
NVIDIA 發(fā)布了全新的 Vera CPU 機(jī)架,集成了 256 個(gè)液冷 Vera CPU,能夠持續(xù)支持超過(guò) 22,500 個(gè)并發(fā)的 CPU 環(huán)境,每個(gè)環(huán)境均可以全性能獨(dú)立運(yùn)行。AI 工廠可在單個(gè)機(jī)架內(nèi)快速部署并擴(kuò)展至數(shù)萬(wàn)個(gè)并發(fā)實(shí)例和智能體工具。
全新的 Vera 機(jī)架采用 NVIDIA MGX? 模塊化參考架構(gòu),并獲得了全球 80 家生態(tài)合作伙伴的支持。
作為 NVIDIA Vera Rubin NVL72 平臺(tái)的一部分,Vera CPU 還可通過(guò) NVIDIA NVLink?-C2C 互連技術(shù)與 NVIDIA GPU 配對(duì),提供高達(dá) 1.8 TB / s 的相干帶寬,是 PCIe Gen 6 帶寬的 7 倍,從而實(shí)現(xiàn) CPU 與 GPU 之間的高速數(shù)據(jù)共享。此外,NVIDIA 還推出了新的參考設(shè)計(jì):將 Vera 用作 NVIDIA HGX? Rubin NVL8 系統(tǒng)的主機(jī) CPU,負(fù)責(zé)協(xié)調(diào) GPU 加速工作負(fù)載的數(shù)據(jù)搬運(yùn)和系統(tǒng)控制。
Vera 系統(tǒng)的合作伙伴正推出支持雙路和單路 CPU 服務(wù)器配置,非常適合強(qiáng)化學(xué)習(xí)、智能體式推理、數(shù)據(jù)處理、系統(tǒng)編排、存儲(chǔ)管理、云應(yīng)用以及高性能計(jì)算等場(chǎng)景。
在所有配置中,Vera 系統(tǒng)均與 NVIDIA ConnectX® SuperNIC 網(wǎng)卡和 NVIDIA BlueField®-4 DPU 集成,以實(shí)現(xiàn)加速網(wǎng)絡(luò)、存儲(chǔ)和安全性能,這些對(duì)代理式 AI 至關(guān)重要。這使客戶能夠針對(duì)其特定工作負(fù)載進(jìn)行優(yōu)化,同時(shí)在整個(gè) NVIDIA 平臺(tái)上保持統(tǒng)一的軟件堆棧。
專為智能體擴(kuò)展而設(shè)計(jì)
通過(guò)結(jié)合高性能、高能效的 CPU 核心、高帶寬內(nèi)存子系統(tǒng)以及第二代 NVIDIA 可擴(kuò)展一致性互連架構(gòu)(NVIDIA Scalable Coherency Fabric),Vera 能夠在代理式 AI 與強(qiáng)化學(xué)習(xí)常見(jiàn)的極端利用率環(huán)境下,實(shí)現(xiàn)更快速的智能體響應(yīng)。
Vera 搭載 88 個(gè)由 NVIDIA 專門(mén)設(shè)計(jì)的 Olympus 核心,可為涉及編譯器、運(yùn)行時(shí)引擎、分析流水線、智能體工具和編排服務(wù)的工作負(fù)載提供高性能支持。每個(gè)核心可通過(guò) NVIDIA Spatial Multithreading 技術(shù)同時(shí)運(yùn)行兩個(gè)任務(wù),以提供一致且可預(yù)測(cè)的性能,非常適合需要同時(shí)處理多項(xiàng)作業(yè)的多租戶 AI 工廠。
為進(jìn)一步提升能效,Vera 引入了 NVIDIA 第二代低功耗內(nèi)存子系統(tǒng),采用 LPDDR5X 內(nèi)存,可提供高達(dá) 1.2 TB / s 的帶寬。與通用 CPU 相比,其帶寬提升了 2 倍,而功耗僅為其一半。
廣泛的生態(tài)系統(tǒng)支持
AI 原生軟件開(kāi)發(fā)領(lǐng)域的創(chuàng)新企業(yè) Cursor 正采用 NVIDIA Vera,以提升其 AI 編程智能體的性能。
Cursor 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Michael Truell 表示:“我們很高興能使用 NVIDIA Vera CPU 來(lái)提升整體吞吐量和效率,從而為我們的客戶提供更快速、響應(yīng)更靈敏的編程智能體體驗(yàn)?!?
領(lǐng)先的流數(shù)據(jù)與 AI 平臺(tái) Redpanda 正在采用 Vera,以顯著提升系統(tǒng)性能。
Redpanda 創(chuàng)始人兼首席執(zhí)行官 Alex Gallego 表示:“Redpanda 最近測(cè)試了運(yùn)行 Apache Kafka 兼容工作負(fù)載的 NVIDIA Vera,發(fā)現(xiàn)其性能遠(yuǎn)超我們此前測(cè)試過(guò)的其他系統(tǒng),延遲最高可降低至原來(lái)約 18%。Vera 代表了 CPU 架構(gòu)發(fā)展的新方向,每顆核心擁有更大內(nèi)存和更低單核成本,使我們的客戶能夠?qū)?shí)時(shí)流媒體工作負(fù)載擴(kuò)展到前所未有的規(guī)模,并解鎖全新的 AI 與智能體應(yīng)用。”
計(jì)劃部署 Vera CPU 的國(guó)家級(jí)實(shí)驗(yàn)室包括 Leibniz Supercomputing Centre、Los Alamos National Laboratory、National Energy Research Scientific Computing Center(隸屬于 Lawrence Berkeley National Laboratory)和 Texas Advanced Computing Center(TACC)。
TACC 高性能計(jì)算總監(jiān) John Cazes 表示:“在 TACC,我們最近測(cè)試了 NVIDIA Vera CPU 平臺(tái),準(zhǔn)備在即將推出的 Horizon 系統(tǒng)中進(jìn)行部署。在運(yùn)行六個(gè)科學(xué)應(yīng)用時(shí),早期結(jié)果令人矚目。Vera 在單核性能和內(nèi)存帶寬方面的表現(xiàn),代表著科學(xué)計(jì)算邁出了一大步。我們期待在今年晚些時(shí)候,為 Horizon 的 CPU 用戶提供基于 Vera 的節(jié)點(diǎn)?!?
計(jì)劃部署 Vera CPU 的領(lǐng)先云服務(wù)提供商包括阿里巴巴、字節(jié)跳動(dòng)、Cloudflare、CoreWeave、Crusoe、Lambda、Nebius、Nscale、Oracle Cloud Infrastructure、Together.AI 和 Vultr。
采用 Vera CPU 的領(lǐng)先基礎(chǔ)設(shè)施提供商包括 Aivres、ASRock Rack、華碩、Compal、思科、戴爾、Foxconn、技嘉、HPE、Hyve、Inventec、聯(lián)想、MiTAC、MSI、Pegatron、Quanta Cloud Technology(QCT)、Supermicro、Wistron 和 Wiwynn。





