數(shù)據(jù)中心:英偉達的下一個戰(zhàn)場
如果你僅僅因為AMD準備明年推出“Navi”GPU,以及英特爾也在開發(fā)明年交付的Xe GPU,就期待英偉達很快就會開始談論它未來用于特斯拉加速計算的“Einstein”GPU,那么你可能得再等一段時間了。英偉達仍有資金推出基于“Turing”和“Volta”架構(gòu)的特斯拉T4和V100加速器。
人們正在對英偉達、AMD和英特爾之間的加速計算之爭做出預期,不久之后,英偉達的聯(lián)合創(chuàng)始人兼首席執(zhí)行官黃仁勛就會拿出GPU路線圖,展示英偉達未來的工作方向。我們預計這大約會發(fā)生在明年春天的GPU技術(shù)會議期間,屆時AMD和英特爾也將大談他們的GPU計算。
現(xiàn)在每個人都熱切渴望。這是因為新技術(shù)加速了新市場的發(fā)展。過去10年,英偉達的新一代特斯拉GPU加速器的快速節(jié)奏讓IT行業(yè)的高性能計算和人工智能領域習慣了每隔幾年就會看到新的計算引擎。在加速計算的早期,英偉達對其雄心勃勃的GPU路線圖非常開放,但隨著它在數(shù)據(jù)中心的地位越來越穩(wěn)固,它對未來的計劃也變得更加守口如瓶。隨著在其選擇的參與領域占據(jù)主導地位,并擁有當前的產(chǎn)品,這種保守很自然。從過去兩年的AI基準測試中可以明顯看出,在T4和V100 GPU上運行的軟件堆棧的改進可以獲得很多性能,此處會有大部分容易摘到的果實;與此同時,英偉達需要實際開始談論Einstein GPU,除了前進到臺積電7nm工藝之外,一切皆有可能。
不管計劃是什么,本周華爾街分析師對英偉達截至7月的2020財年第二季度財務業(yè)績進行審查的電話會議上,黃仁勛并沒有透露太多。
黃仁勛解釋說:
“數(shù)據(jù)中心基礎設施確實必須正確規(guī)劃,擴建需要時間。我們希望Volta在明年取得成功。軟件仍在繼續(xù)改進。在短短一年內(nèi),我們就將Volta的AI性能提高了近2倍,達到約80%。你必須想象構(gòu)建在Volta之上的軟件的數(shù)量——所有Tensor內(nèi)核、所有與NVLink連接的GPU,以及連接到構(gòu)建超級計算機的大量節(jié)點。構(gòu)建這些大型系統(tǒng)的軟件非常非常困難。這就是為什么你聽到人們談論芯片,但它們從來沒有出現(xiàn)的原因之一,因為構(gòu)建軟件是一項巨大的事業(yè)。我們公司的軟件工程師數(shù)以千計,我們得益于在這個架構(gòu)之上構(gòu)建了超過15年。因此,當我們能夠以如此快速地部署數(shù)據(jù)中心時,我認為我們有點忽略了首先要做到這一點有多難。上一次進入數(shù)據(jù)中心的新處理器是X86,你無需頻繁或容易地將處理器帶入數(shù)據(jù)中心。因此,我對Volta的看法是,它肯定正處于全盛時期,而且明年還會繼續(xù)表現(xiàn)出色。”
將新的處理器架構(gòu)引入數(shù)據(jù)中心正是如此。它可能是一座玻璃房子,但你需要一塊很大的石頭才能砸進去。這與大型企業(yè)的保守主義背道而馳,他們不能承擔像快速打破和快速移動大型數(shù)據(jù)中心用戶那樣的風險,發(fā)明自己所有的軟件棧。
對英偉達來說,好消息是,在為各種形式的GPU計算播種了十年的新市場之后,例如HPC中的傳統(tǒng)模擬和建模、人工智能中的機器學習、少量的數(shù)據(jù)庫加速,以及補充這些更成熟行業(yè)的不斷擴大的數(shù)據(jù)科學領域,它在數(shù)據(jù)中心領域擁有一個持續(xù)發(fā)展的業(yè)務基線,伴隨著高性能計算中心、超大規(guī)模用戶和云構(gòu)建者的常見支出起伏。
第二季度,英偉達的總收入下降了21.1%,至25.8億美元,凈利潤下降了一半,至5.52億美元,原因是該公司在明年推出GPU之前對未來的GPU進行了投資。研發(fā)支出在本季度增長了17.5%,達到7.04億美元,其中可能包括分配給Einstein GPU的資金,以及對NVSwitch互連及其相關(guān)NVLink 3.0協(xié)議的支持,以及與臺積電為完善7nm芯片蝕刻和隨后向5nm工藝的遷移所做的工作。毫無疑問,研發(fā)支出的增加對凈收入產(chǎn)生了影響,但這是科技行業(yè)的賭注。
2020財年第二季度的營收和凈收入沒有受到即將以69億美元收購Mellanox Technologies的影響,該公司剛剛獲得美國監(jiān)管機構(gòu)的批準,但仍需獲得歐洲和中國監(jiān)管機構(gòu)的批準,才能完成交易。
與此同時,英偉達的數(shù)據(jù)中心業(yè)務沒有整體業(yè)務收縮得那么厲害,因為整體業(yè)務受到了渠道中GPU過剩的影響,這些GPU主要面向游戲玩家和專業(yè)顯卡用戶的GeForce和Quadro設備。第二季度數(shù)據(jù)中心銷售額下降13.8%,至6.55億美元,其中不僅包括來自特斯拉GPU加速器和NVSwitch ASIC的收入,還包括英偉達直接銷售給客戶的整個DGX-1和DGX-2系統(tǒng)的收入。目前尚不清楚有多少收入來自系統(tǒng),但我們的猜測是,在過去12個月中,英偉達的數(shù)據(jù)中心業(yè)務獲得的26.7億美元收入中,約有20%來自DGX系統(tǒng)。它非常重要,它使英偉達成為了世界上最大的超級計算機供應商之一。
請思考一分鐘。
雖然英偉達沒有透露細節(jié),但黃仁勛重申,推理計算業(yè)務正在增長,這在很大程度上是由于在圖靈架構(gòu)中成功使用了相同的Tensors核心單元,這些單元是其用于超大規(guī)模計算、云和內(nèi)部基礎設施中推理引擎的游戲和渲染的動態(tài)光線跟蹤的關(guān)鍵組件。這種推理業(yè)務現(xiàn)在是數(shù)據(jù)中心業(yè)務的“兩位數(shù)”部分——在接下來的12個月里,它的價值在3億到4億美元之間。這也是一項重要的業(yè)務,這是因為Tesla T4加速器具有推理性能,并且能夠與迄今主導著機器學習推理的CPU和FPGA競爭。
順便說一句,F(xiàn)PGA和CPU不會不戰(zhàn)而退,而且在很多方面,英偉達將不得不在展開更激烈的競爭。英偉達已經(jīng)擁有了更強大的GPU機器學習訓練,除非有某些架構(gòu)能夠同時進行訓練和推理,否則英偉達很可能會保持其在機器學習訓練方面的遙遙領先地位。尤其是同時從事高性能計算和人工智能以及數(shù)據(jù)科學和分析的商家。更通用的解決方案將在云計算和企業(yè)中勝出,雖然它的成本更高,但它的實用性更廣。畢竟,這就是英特爾一直在數(shù)據(jù)中心使用Xeon芯片所做的事情,直到AMD用新的“Rome” Epyc 7002系列CPU部署了可靠且有競爭力的處理器。英偉達在部署可靠的GPU方面將面臨與AMD和英特爾一樣的壓力,但它們必須將它們的軟件結(jié)合起來,與特斯拉加速器和CUDA并行編程環(huán)境的強大組合競爭。
英偉達的數(shù)據(jù)中心業(yè)務連續(xù)增長3%,由于超大規(guī)模計算和云構(gòu)建商支出疲軟已經(jīng)在2019年上半年傷害了所有系統(tǒng)供應商。數(shù)據(jù)中心業(yè)務實際上在2020財年第二季度相對容易比較,因為2018年早些時候,英偉達為橡樹嶺國家實驗室的“Summit”超級計算機和勞倫斯利弗莫爾國家實驗室的“Sierra”超級計算機出貨了數(shù)萬個Volta GPU。如果泡沫發(fā)生在前一年的第二季度,那將是一個非常艱難的比較?,F(xiàn)在,隨著各個公司安裝這些IBM系統(tǒng)的初代版本、英偉達的DGX Iron,以及各種OEM和ODM供應商的克隆產(chǎn)品,英偉達將從數(shù)據(jù)中心獲得穩(wěn)定的收入。我們預計不會出現(xiàn)過去幾年那種爆炸式的增長,而是會出現(xiàn)更為漸進的增長,這是更為成熟但仍令人興奮的市場領域的典型表現(xiàn)。英偉達有足夠的空間將數(shù)據(jù)中心業(yè)務翻倍、翻三倍甚至翻四倍,但這不可能一夜之間實現(xiàn)。
而且明年肯定不會出現(xiàn)一套令人印象深刻的Einstein Tesla GPU加速器來阻止AMD,英特爾和賽靈思。





