當(dāng)前位置：首頁(yè) > 芯聞號(hào) > 充電吧

7nm Vega20香歸香，但AMD更需要新架構(gòu)！

時(shí)間：2018-11-14 09:50:02

關(guān)鍵字： 7nm AMD vega20

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]消息，作為今天凌晨Next Horizon活動(dòng)的一部分，AMD正式公布了基于7nm Vega20 GPU的兩款加速卡，分別為Radeon Instinct MI60和Radeon Instinct M

消息，作為今天凌晨Next Horizon活動(dòng)的一部分，AMD正式公布了基于7nm Vega20 GPU的兩款加速卡，分別為Radeon Instinct MI60和Radeon Instinct MI50，主要針對(duì)企業(yè)加速器市場(chǎng)，AMD希望在從HPC到機(jī)器學(xué)習(xí)的各個(gè)方面顯著提高其性能競(jìng)爭(zhēng)力。

這兩款加速卡都是基于AMD的7nm Vega20 GPU，盡管我們此前已經(jīng)得知了如Vega20基于第5代GCN架構(gòu)、是AMD現(xiàn)有Vega10架構(gòu)的改進(jìn)版本等部分消息，但此次Next Horizon活動(dòng)上AMD再次公布了其他一些細(xì)節(jié)。

從芯片的功能模塊而言，7nm Vega20實(shí)際上與現(xiàn)有的14nm Vega 10 GPU非常接近，它們都具有64個(gè)CU（4096流處理器），都使用HBM2顯存。Vega20的核心頻率為1800MHz，單精度浮點(diǎn)（FP32）性能為14.7TFlops，半精度浮點(diǎn)（FP16）性能為29.5TFlpos。

二者的差異主要在于額外的加速器功能，AMD為Vega20增加了加速器市場(chǎng)所必需的以計(jì)算為中心的功能。在加速器功能方面，Vega20 GPU以及MI60/MI50加速卡在幾個(gè)關(guān)鍵領(lǐng)域上與Vega 10及MI25不同， Vega20的雙精度浮點(diǎn)運(yùn)算性能是單精度浮點(diǎn)的一半，為7.4TFlops，而Vega 10只有1/16。

此外Vega20也支持INT8和INT4等對(duì)于機(jī)器學(xué)習(xí)推理特別有用的低精度數(shù)據(jù)類型，其INT8性能是FP16性能的2倍，為58.9Tops，INT4性能是FP16性能的4倍，達(dá)到118Tops。不過從AMD的演示中尚無(wú)法弄清這些新數(shù)據(jù)類型的靈活性以及它們可以使用的指令，這對(duì)于理解新GPU的全部功能非常重要。

AMD還增強(qiáng)了Vega20的顯存系統(tǒng)，為GPU增加了另外一對(duì)HBM2顯存控制器，顯存位寬恢復(fù)至Fiji時(shí)代的4096bit，同時(shí)顯存頻率也提升到2Gbps，使GPU的顯存帶寬達(dá)到1TB/s，這甚至超過了NVIDIA旗艦產(chǎn)品GV100 GPU，為AMD帶來(lái)了優(yōu)勢(shì)。

同時(shí)由于這是一款專注于企業(yè)的GPU，它提供了端到端的ECC校驗(yàn)?zāi)芰σ约翱煽啃?、可訪問性和可維護(hù)性（RAS）技術(shù)，這對(duì)于大規(guī)模HPC計(jì)算結(jié)果的準(zhǔn)確性至關(guān)重要，也標(biāo)志著AMD GPU幾年來(lái)首次提供完整的ECC支持。

另外了解到，Vega20還支持AMD MxGPU技術(shù)，這是業(yè)界唯一基于硬件的GPU虛擬化解決方案，基于行業(yè)標(biāo)準(zhǔn)的SR-IOV（單根I/O虛擬化）技術(shù)，使黑客難以進(jìn)行硬件級(jí)別的攻擊，有助于為虛擬化云部署提供安全性。

在PCI-E通道方面，AMD已經(jīng)透露Vega20支持最新的PCI-E 4.0標(biāo)準(zhǔn)，在同為x16配置下帶寬可比PCI-E 3.0提升一倍，達(dá)到32GB/s。除此之外，AMD還為Vega20設(shè)計(jì)了一對(duì)片外Infinity Fabric鏈路，允許Radeon Instinct卡通過相干鏈路直接相互連接，每條鏈路均為100GB/s的全雙工帶寬。

值得注意的是，由于每個(gè)GPU只有2條鏈路，因此AMD的拓?fù)溥x項(xiàng)僅限于環(huán)上的變化，4路配置的GPU不能全部直接相互通信。另外，AMD仍堅(jiān)持使用PCI-E顯卡的形式，沒有像NVIDIA一樣的定制夾層式卡，所以這些卡需要通過頂部的橋接器連接。

得益于7nm工藝，雖然Vega20集成了132.2億晶體管，比目前Vega10的125億個(gè)晶體管增加了6.4％，但面積僅為331 mm2，反而要比Vega10的484 mm2要小很多。MI60和MI50的TDP均為300瓦，在同等功耗下的性能提升超過25％，同等頻率下功耗降低50％，不過AMD表示新計(jì)算卡的真正威力在于它們的新功能，而不是與現(xiàn)有MI25計(jì)算卡競(jìng)逐傳統(tǒng)FP16/FP32算力。

“傳統(tǒng)的GPU架構(gòu)限制了人們處理和分析現(xiàn)代云數(shù)據(jù)中心不斷變化的巨大數(shù)據(jù)集的需求。”AMD Radeon技術(shù)集團(tuán)工程高級(jí)副總裁David Wang說(shuō)，“AMD全新Radeon Instinct加速卡結(jié)合了世界頂尖的性能和靈活性，配合業(yè)界領(lǐng)先的開放式軟件生態(tài)系統(tǒng)ROCm，將助力于解決當(dāng)今和未來(lái)最困難的云計(jì)算挑戰(zhàn)。”

AMD一并公布了用于加速計(jì)算的全新ROCm 2.0開放軟件平臺(tái)，專為大規(guī)模集群而設(shè)計(jì)，允許用戶在開放環(huán)境中部署高性能、高能效的異構(gòu)計(jì)算系統(tǒng)。除了支持新的Radeon Instinct 加速器和AMD Infinity Fabric Link GPU互連技術(shù)外，還為新的DLOPS提供了更新的數(shù)學(xué)庫(kù)；支持CentOS、RHEL和Ubuntu等64位Linux操作系統(tǒng)；支持TensorFlow 1.11和PyTorch（Caffe2）等最流行的深度學(xué)習(xí)框架的最新版本。

谷歌TensorFlow的工程總監(jiān)Rajat Monga說(shuō)：“谷歌相信開源對(duì)每個(gè)人都有好處，我們已經(jīng)看到它對(duì)開源機(jī)器學(xué)習(xí)技術(shù)有多大幫助，很高興看到AMD接受它。通過ROCm開放軟件平臺(tái)，TensorFlow用戶將受益于GPU加速和更強(qiáng)大的開源機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)?！?/p>

回想此前的Vega10，在與上代Fiji架構(gòu)同為4096流處理器的情況下，顯存從4096bit反砍一刀降至2048bit，晶體管數(shù)量從89億暴增至125億，但其對(duì)應(yīng)的游戲顯卡Vega 64居然打不過僅有72億晶體管的GP104核心（GTX1080），同頻效能相比Fiji核心的Fury X甚至毫無(wú)提升，使得許多人戲稱AMD“在Vega10里塞了36億電爐絲”。

認(rèn)為，AMD此次公布的Vega20雖然依然保持4096流處理器的規(guī)模，但補(bǔ)完了半速雙精度、INT8、INT4和ECC等HPC加速卡所需的關(guān)鍵元素，讓Vega20方才算是Vega架構(gòu)初次顯露出其真正形態(tài)。

不過，AMD依然需要清晰的認(rèn)識(shí)到，與在CPU領(lǐng)域同Intel的競(jìng)爭(zhēng)一樣，NVIDIA的領(lǐng)先使其有能力從架構(gòu)以及指令集等方面占據(jù)優(yōu)勢(shì)。近兩年來(lái)AMD在性能、功耗、面積三方面上一直無(wú)法兼顧，長(zhǎng)期處于舍去其一再田忌賽馬的狀況中，Vega20所取得的進(jìn)步成績(jī)完全吃的是7nm制程的紅利。

從目前展示的數(shù)據(jù)來(lái)看，Vega20的性能相比Vega10大約提升了20%，很可能依然不及NVIDIA上代16nm、120億晶體管的GP102核心（1080Ti），300瓦的TDP也不算低，唯一有明顯優(yōu)勢(shì)的也就只有新制程帶來(lái)的面積縮減了。

反觀NVIDIA，在2014年半導(dǎo)體制程受困于28nm節(jié)點(diǎn)時(shí)，AMD的GPU止步不前，NVIDIA則拿出了堪稱黑科技的全新Maxwell架構(gòu)。在晶體管數(shù)量從71億縮減至52億、流處理器從2880個(gè)減少至2048個(gè)、TDP從250瓦降低至165瓦的情況下，GM204核心的GTX980性能依然勝過了上代Kelper架構(gòu)GK110核心的GTX780Ti，再次強(qiáng)調(diào)：二者同為28nm。

在NVIDIA如此恐怖的架構(gòu)設(shè)計(jì)面前，AMD這樣依賴制程紅利不但不是長(zhǎng)久之計(jì)，更不如說(shuō)是無(wú)異于飲鴆止渴。如果AMD再繼續(xù)固守老舊的GCN架構(gòu)修修補(bǔ)補(bǔ)，而不研發(fā)高能效的全新架構(gòu)，一旦NVIDIA也使用了7nm工藝，完全可以如Intel一樣將AMD再次一招打回解放前。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除（郵箱：macysun@21ic.com ）。

換一批

7nm Vega20香歸香，但AMD更需要新架構(gòu)！

7nm Vega20香歸香，但AMD更需要新架構(gòu)！