怎么讓FPGA產(chǎn)生“質(zhì)變”?
到2020年,將有500萬臺終端實現(xiàn)聯(lián)網(wǎng)。每個終端將會源源不斷地產(chǎn)生數(shù)據(jù),這些數(shù)據(jù)匯聚起來就是海量的數(shù)據(jù)。除了物聯(lián)網(wǎng),還有機(jī)器人、5G通信、人工智能等,對芯片數(shù)據(jù)處理能力提出巨大的需求:強(qiáng)大的運算能力,更快的計算速度,更小的延時,同時還要保持低功耗等等。
面對計算需求的指數(shù)級增長,當(dāng)前業(yè)界出現(xiàn)多種不同的FPGA解決路徑;在滿足數(shù)據(jù)時代需求的同時,也推動了FPGA的煥發(fā)新生。
01【英特爾】推出CPU+FPGA異構(gòu)組合架構(gòu) 針對傳統(tǒng)應(yīng)用和新應(yīng)用
面對需求挑戰(zhàn),英特爾在平臺架構(gòu)上進(jìn)行了創(chuàng)新,推出CPU+FPGA(+專用加速器ASSP和ASIC等)的異構(gòu)組合架構(gòu)。在這個異構(gòu)組合架構(gòu)中,英特爾表示,F(xiàn)GPA在其中扮演著加速器的角色。
其中,F(xiàn)PGA在異構(gòu)計算中有兩種加速形式,一是旁路加速,可以將重度計算功能轉(zhuǎn)移到FPGA上,從而釋放處理器去處理其他功能;二是內(nèi)建加速。如果時延比較重要,則可以進(jìn)行內(nèi)建加速,從而通過FPGA的多功能性帶來更好的存儲和計算的加速。
英特爾的FPGA解決方案針對傳統(tǒng)應(yīng)用和新應(yīng)用,比如在無人機(jī)、傳感器融合、機(jī)器學(xué)習(xí)、高性能計算、數(shù)據(jù)分析等領(lǐng)域。
目前,英特爾最新的Stratix 10高端芯片已經(jīng)有樣片,Arria 10產(chǎn)品已經(jīng)在全面生產(chǎn),而Cyclone 10和Max 10已可大量出貨。而英特爾下一代 FPGA——Falcon Mesa也將問世,F(xiàn)alcon Mesa是 Altera 并入之后第一代使用了英特爾10nm制程的FPGA。新產(chǎn)品會支持下一代HBM,轉(zhuǎn)換速率達(dá)112Gbps,還支持PCIe 4x16,意味著支持的帶寬能夠達(dá)到16TB。
英特爾FPGA上的根基源于當(dāng)年收購Altera,加上自身的代工實力,實現(xiàn)了FPGA方面的大跨越。
02【Efinix】FPGA布線方面革新 滿足傳統(tǒng)應(yīng)用和新應(yīng)用
Efinix公司在布線方面實現(xiàn)FPGA的革新,顛覆了過去FPGA的基本架構(gòu)。即,拋棄具有專用功能的每個電路板格的基礎(chǔ)上,每一個電路板格都可以根據(jù)特定目的被編程。通過布線上的突破,可使芯片尺寸縮小75%,而且能耗只有傳統(tǒng)芯片的一半,結(jié)構(gòu)比以往更簡單。
在應(yīng)用上,Efinix的FPGA方案適用于傳統(tǒng)應(yīng)用和新興應(yīng)用。包括工業(yè)、醫(yī)學(xué)、廣播等傳統(tǒng)應(yīng)用,以及IoT 、移動終端、無人機(jī)、自動駕駛汽車、邊緣計算等新興應(yīng)用。
據(jù)半導(dǎo)體行業(yè)觀察的分析,在與傳統(tǒng)FPGA的關(guān)系上,從產(chǎn)品技術(shù)應(yīng)用上看,Efinix的Quantum FPGA將有可能替代傳統(tǒng)FPGA,在設(shè)計驗證和異構(gòu)計算等場合得到應(yīng)用。在異構(gòu)計算領(lǐng)域,由于Quantum FPGA在性能上比傳統(tǒng)FPGA有不少優(yōu)勢,因此可望能實現(xiàn)基于FPGA的異構(gòu)計算方案的進(jìn)一步普及。
在解決方案上,Efinix的Quantum FPGA與英特爾的方雜是不同的解決路徑,沒有直接的可比性。不過,在市場上將會有重疊部分,今后兩家公司在搶占市場上將有可能形成競爭關(guān)系。
除了傳統(tǒng)FPGA的市場之外,Efinix在嵌入式FPGA市場也有布局。而目前在嵌入式FPGA市場,已有一匹黑馬ACHRONIX公司,該公司已推出相關(guān)解決方案,已收到市場很好的客戶反饋,并進(jìn)一步推出新的eFPGA解決方案。(下一環(huán)節(jié)重點分析這家公司在嵌入式FPGA中方案)
03【Achronix】嵌入式FPGA市場的黑馬 定制單元塊實現(xiàn)性能、芯片面積和功耗的優(yōu)化
嵌入式FPGA(eFPGA)IP產(chǎn)品可以被嵌入到一款A(yù)SIC或者SoC之中,從而實現(xiàn)ASIC或SOC靈活的工作方式。
在嵌入式FPGA領(lǐng)域,近期有了新的技術(shù)推進(jìn)。Achronix公司通過定制單元塊,可使客戶獲得ASIC級的效率并同時保持FPGA的靈活性,從而帶來了一種可以將功耗和面積降至最低、同時將數(shù)據(jù)流通量最大化的高效實現(xiàn)方式。
Achronix是一家采用無晶圓廠模式的半導(dǎo)體公司,總部位于美國加利福尼亞州圣克拉拉市。該公司開發(fā)了自己的FPGA技術(shù),該技術(shù)是Speedster22i FPGA及Speedcore eFPGA產(chǎn)品的基礎(chǔ)。在2017年Achronix銷售收入增長7倍。其中Speedcore是Achronix增速最快的產(chǎn)品,2015年,Speedcore開始參與客戶項目評估;2016年第三季度實現(xiàn)了向首批客戶供貨。其集成電路工藝技術(shù)采用TSMC16nm已量產(chǎn),采用TSMC 7nm的產(chǎn)品將在2018年上半年完成測試芯片和首批設(shè)計。
Speedcore eFPGA提供了性能極高而成本極低的硬件加速,而現(xiàn)在借助Speedcore custom blocks定制單元模塊,可以面向最高性能和最小片芯面積這些目標(biāo)進(jìn)行優(yōu)化。從以下案例可以了解詳情:
1. 通過為矩陣乘法運算優(yōu)化數(shù)字信號處理器(DSP)和存儲單元塊,基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的YOLO目標(biāo)識別算法的芯片面積被縮減了超過40%。
2. 如果用Speedcore custom blocks定制單元塊來實現(xiàn),需要并行比較器陣列的大型字符串搜索功能的片芯面積可以縮減超過90%。
3. 桶形移位器(Barrel shifter)和二進(jìn)制位處理結(jié)構(gòu)也可以在Speedcore custom blocks定制單元塊中完全實現(xiàn),從而在同樣的面積中實現(xiàn)更大的、更精妙的應(yīng)用,提升了可獲得的頻率。
4. 一個運行在800MHz的400Gbps包處理數(shù)據(jù)通道的核心功能也可以用Speedcore custom blocks定制單元塊來實現(xiàn),其可編程邏輯管理分析和控制功能。今天的FPGA獨立芯片不能為包處理應(yīng)用提供這么高的數(shù)據(jù)吞吐量。
在應(yīng)用方面,Achronix市場營銷副總裁Steve Mensor指出,Achroni嵌入式FPGA主要應(yīng)用在可加速數(shù)據(jù)密集的人工智能(AI)/機(jī)器學(xué)習(xí)、5G移動通信、汽車先進(jìn)駕駛員輔助系統(tǒng)(ADAS)、數(shù)據(jù)中心和網(wǎng)絡(luò)應(yīng)用等新應(yīng)用領(lǐng)域中。
在與傳統(tǒng)FPGA的關(guān)系中,“eFPGA解決方案不會替代傳統(tǒng)FPGA,兩者之前將是一種互補(bǔ)的關(guān)系。” Steve Mensor表示。





