日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 芯聞號 > 充電吧
[導讀]AMD的推土機架構公布之時絕對讓人震驚,被譽為自X86體系確立以來架構變化最大的一次,模塊化的設計思路很新穎,當時一片叫好之聲??上Ю硐牒茇S滿,現實太骨感,等到真正的推土機上市時,推土機帶給人們的只是失望。

AMD推土機架構公布之時絕對讓人震驚,被譽為自X86體系確立以來架構變化最大的一次,模塊化的設計思路很新穎,當時一片叫好之聲。可惜理想很豐滿,現實太骨感,等到真正的推土機上市時,推土機帶給人們的只是失望。

實際性能上推土機不僅比不過Intel Sdandy Bridge架構,甚至不如自家上一代Phenom II,而功耗和發(fā)熱又大幅超出,推土機沒有帶給AMD復興的榮耀,反倒成了滑鐵盧。時至今日,AMD官方多次用CPU性能過剩來安慰自己和客戶,這話不無道理,但是AMD在CPU性能上暫時無力跟Intel爭雄了,最簡單的例子就是國內外各大IT媒體的評測平臺基本上都是Intel CPU和主板了。

▲圖片來源于Techreport

即便過去了這么久,推土機性能不濟一事依然沒有準確合理的解釋,各方總結起來的原因主要有以下幾點:

1.GlobalFoundries工藝不成熟

雖然FX-8150的默認頻率已經達到3.6GHz,Turbo頻率4.2GHz,但是這仍然低于AMD預期,而且GlobalFoundries并不成熟的32nm SOI工藝使得推土機的功耗和發(fā)熱巨大,進一步限制了CPU性能提升。

2.軟件優(yōu)化不到位

推土機模塊化的設計需要系統(tǒng)和軟件的優(yōu)化,否則難以發(fā)揮真正的性能。這方面微軟已經推出了任務調度補丁,根據我們的測試,性能確實有一定提升,但是比率非常小,并不足以改變推土機的命運。

3.推土機架構的緩存延遲太高

還是推土機獨特的架構所致,因為它也使用了長管線設計,被稱為AMD版的Pentium 4,延遲周期太高,有人認為這是性能失利的主要原因,但是從媒體測試Trinity APU的表現來看,即便是做了改進的Piledriver(二代推土機架構)的IPC性能也沒有改變多少。

其他理由還有很多,但是這都不是主要原因。Anandtech網站近日撰文分析了推土機架構兵敗的原因,原文很長,這里只摘錄結論來看。

首先他們也認為推土機的高延遲對桌面應用有一定影響,但是這并非導致性能受影響的主要原因,因為Intel首次使用4周期延遲的Nehalem并不比上一代Penryn架構快多少。

▲主流CPU架構的L2分支預測延遲

尋找元兇:分支預測誤預測懲罰及指令緩存命中率

在經過對比測試之后,Anandtech認為影響推土機性能更嚴重的是其分支誤預測(Branch Misprediction)帶來的后果以及指令緩存命中率(Instruction Cache Hit Rate)問題,這才是主要影響因素。

▲分支預測性能測試

推土機跟Sady Bridge一樣都是長管線設計,但是后者針對可能的分支誤預測做了補救措施,有專門的μop緩存以減少預取和解碼過程中的延遲。性能低于預期的SAP、SQL Server以及更嚴重的SPEC CPU2006測試中都表明了推土機在分支誤預測上有嚴重問題。

前面的測試證明了AMD推土機工程師在分支預測性能上做的不錯,但是分支誤預測上就不如Intel SNB架構了,即便是Trinity APU使用的Piledriver也沒有明顯改進,性能變化只有1%左右。

不知AMD是否會在未來的架構設計中也增加μop緩存,它可以減少分支誤預測帶來的懲罰,節(jié)省能耗,并給解碼單元減少負擔,看起來是很完美的設計。

另一個問題是L1指令緩存似乎并不能適應雙線程操作,測試中只要在2-way 64KB L1指令緩存中進行雙線程操作,命中率就明顯下降,看來推土機的模塊化設計中緩存的結關聯性還是太低,而Intel的做法是雙線程應用中使用8-way關聯性緩存。

桌面性能以及服務器性能的平衡

文章最后還談到了推土機的設計思路,這是AMD為什么采用這樣的設計的出發(fā)點,因為推土機并非面向桌面應用設計,服務器負載才是重點。

桌面應用要求更高的IPC性能,對分支預測敏感,但是對線程數量要求比較低,這些恰好不是推土機的強項,AMD只能使用提高CPU頻率以及Turbo頻率的做法來滿足高端玩家的需要,原本的目標是同功耗下頻率至少要高20-30%,但是最終的結果是只高了10%,而且功耗也大幅飆升。

▲服務器應用是推土機架構特性發(fā)揮比較好的領域

服務器應用才是推土機架構最擅長的領域,SPEC CPU2006的測試中推土機表現就很好,這里對CPU IPC性能不慎敏感,就算CPU的命中失誤比較高,延遲方面所受的影響也比較小,但是它對CPU并行、內存占用要求比較高,因此推土機高延遲但是大容量的L2緩存在測試中表現就很好。

無論那種理由或者缺陷導致了推土機桌面性能不濟,目前的現實就是除非架構有較大變化,否則基于推土機架構演變而來的AMD處理器依然難以跟Intel相提并論。在這一代失利中,不知AMD心里是否真的不在意CPU性能了,因為他們的重心轉向了APU這樣的全功能、低成本處理器。

從實際應用上看AMD的CPU性能過剩論確實很有道理,隨便一顆3GHz左右的雙核或者四核都可以滿足目前的軟件和游戲需要,但是仍然不希望也不愿看到CPU領域是Intel一家獨大,只是推土機架構的CPU路線圖已經延伸到了2015年,未來兩三年內都不會看到AMD有新架構CPU發(fā)布,前景實在難料。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀
關閉