日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 工業(yè)控制 > 工控開發(fā)板
[導(dǎo)讀] 在之前的OpenPOWER歐洲峰會(huì)上,我們推出了全新的框架,旨在便于開發(fā)者開始采用CAPI加速其應(yīng)用開發(fā)。CAPI存儲(chǔ)、網(wǎng)絡(luò)和分析編程框架,或者簡稱為CAPI SNAP,通過OpenPOWER成

在之前的OpenPOWER歐洲峰會(huì)上,我們推出了全新的框架,旨在便于開發(fā)者開始采用CAPI加速其應(yīng)用開發(fā)。CAPI存儲(chǔ)、網(wǎng)絡(luò)和分析編程框架,或者簡稱為CAPI SNAP,通過OpenPOWER成員的多家公司共同協(xié)作努力開發(fā)而成,如今將與多家前期應(yīng)用合作伙伴展開內(nèi)部測試。

但是CAPI SNAP到底是什么呢?為了回答這個(gè)問題,我希望為各位深入介紹一下CAPI SNAP的運(yùn)行原理。該框架通過簡化API(對(duì)加速功能的調(diào)用)和加速功能的編碼,從而可以擴(kuò)展CAPI技術(shù)。利用CAPI SNAP,通過FPGA加速可以提高您的應(yīng)用性能,因?yàn)橛?jì)算資源與海量數(shù)據(jù)的關(guān)系更加密切。
 

簡潔的API

ISV尤其關(guān)注這個(gè)框架的編程支持功能。該框架API可以支持應(yīng)用調(diào)用加速功能。創(chuàng)新的FPGA框架邏輯可以實(shí)施所有計(jì)算工程接口邏輯、數(shù)據(jù)移動(dòng)、高速緩存和預(yù)取工作——讓程序員只專注于加速器功能的開發(fā)。

沒有框架,應(yīng)用程序員必須創(chuàng)建運(yùn)行時(shí)加速庫,執(zhí)行如圖1所示的任務(wù)。

但現(xiàn)在借助CAPI SNAP,應(yīng)用僅僅需要如圖2所示的那樣的調(diào)用功能。這種簡潔的API擁有源數(shù)據(jù)(地址/位置),可以執(zhí)行的特定加速操作,以及發(fā)送結(jié)果數(shù)據(jù)的目標(biāo)(地址/位置)。


圖2:使用CAPI SNAP調(diào)用加速功能該框架能夠?qū)?shù)據(jù)移動(dòng)到加速器,并儲(chǔ)存結(jié)果。

拉近計(jì)算與數(shù)據(jù)的距離
API參數(shù)的簡潔性兼具出色和強(qiáng)大的特點(diǎn)。源地址和目標(biāo)地址不僅是凝聚系統(tǒng)內(nèi)存單元,他們也是附加存儲(chǔ)、網(wǎng)絡(luò)或內(nèi)存地址。例如,如果框架卡具有附加存儲(chǔ),應(yīng)用可能會(huì)通過存儲(chǔ)獲得一個(gè)大型模塊(或多個(gè)模塊)的數(shù)據(jù),對(duì)FPGA中的數(shù)據(jù)執(zhí)行搜索、交叉或合并這樣的操作,并將搜索結(jié)果發(fā)送給主系統(tǒng)內(nèi)存的指定目標(biāo)地址。與圖3所示的標(biāo)準(zhǔn)軟件方法相比,這種方法具有更大的性能優(yōu)勢。


圖3:軟件中的應(yīng)用搜索功能(無加速框架)

圖4所示為源數(shù)據(jù)通過QSFP+端口流入加速器的方式,其中FPGA執(zhí)行搜索功能。該框架然后會(huì)將搜索結(jié)果轉(zhuǎn)發(fā)給系統(tǒng)內(nèi)存。


圖4:采用加速框架搜索引擎的應(yīng)用

該框架的性能優(yōu)勢提高了兩倍:
1. 通過拉近計(jì)算與數(shù)據(jù)之間的距離(在這種情況下,即指搜索),F(xiàn)PGA可以提高訪問存儲(chǔ)的帶寬。
2. FPGA的加速搜索比軟件搜索速度更快。

表1的數(shù)據(jù)對(duì)比了兩種方法,表明性能提高了3倍。通過拉近計(jì)算與數(shù)據(jù)之間的距離,與將整體數(shù)據(jù)移動(dòng)到系統(tǒng)內(nèi)存這種方法相比,F(xiàn)PGA提高了輸入(或輸出)速度。


POWER+CAPI SNAP框架

只有軟件

輸入100GB的數(shù)據(jù)

兩個(gè)100Gb/s端口:4秒

一個(gè)PCI-E Gen3&TImes;8 NIC:12.5秒

執(zhí)行搜索

<1微秒

<100微秒

發(fā)送結(jié)果到系統(tǒng)內(nèi)存

<400納秒

0

總時(shí)間

4.0000014秒

12.50001秒

簡化加速操作的編程
編程API不僅是CAPI SNAP的唯一簡化功能。該框架還簡化了FPGA中“操作碼”的編程。該框架能夠檢索源數(shù)據(jù)(無論是在系統(tǒng)內(nèi)存、存儲(chǔ)、網(wǎng)絡(luò)等),并將結(jié)果發(fā)送到指定目標(biāo)。使用高級(jí)語言(如C/C++或Go)編程的程序員只需要專注其數(shù)據(jù)轉(zhuǎn)換或“操作”即可。與框架兼容的編譯器可將高級(jí)語言轉(zhuǎn)化為Verilog,然后利用Xilinx的Vivado工具集加以合成。

開源版本將會(huì)包括多種全功能實(shí)例加速器,為用戶提供所需的起點(diǎn)和全端口聲明,以便接收源數(shù)據(jù)并返回目標(biāo)數(shù)據(jù)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀

中國,上?!?026年3月26日——低功耗可編程領(lǐng)域的領(lǐng)導(dǎo)者,萊迪思半導(dǎo)體(NASDAQ: LSCC)今日宣布正式加入英偉達(dá)(NVIDIA) Halos AI系統(tǒng)檢測實(shí)驗(yàn)室生態(tài)體系。該實(shí)驗(yàn)室是首個(gè)獲得美國國家標(biāo)準(zhǔn)協(xié)會(huì)認(rèn)...

關(guān)鍵字: 物理人工智能 傳感器 FPGA

在工業(yè)自動(dòng)化的“神經(jīng)網(wǎng)絡(luò)”中,EtherCAT憑借其獨(dú)特的“飛過處理”機(jī)制,已成為實(shí)時(shí)控制領(lǐng)域的王者。不同于傳統(tǒng)以太網(wǎng)的存儲(chǔ)轉(zhuǎn)發(fā),EtherCAT數(shù)據(jù)幀在經(jīng)過每個(gè)從站時(shí),硬件直接從中提取數(shù)據(jù)并插入響應(yīng),這種“邊飛邊修”的...

關(guān)鍵字: EtherCAT FPGA 總線

在復(fù)雜的SoC芯片設(shè)計(jì)流程中,硬件與軟件的“割裂”往往是導(dǎo)致項(xiàng)目延期的元兇。當(dāng)RTL代碼還在仿真階段時(shí),軟件團(tuán)隊(duì)只能基于指令集模擬器(ISS)進(jìn)行開發(fā),不僅速度慢如蝸牛,且無法捕捉真實(shí)硬件的時(shí)序細(xì)節(jié)。此時(shí),F(xiàn)PGA原型驗(yàn)...

關(guān)鍵字: SoC 硬件加速 FPGA

在工業(yè)4.0浪潮中,邊緣計(jì)算網(wǎng)關(guān)正成為連接物理世界與數(shù)字世界的核心樞紐。面對(duì)多路傳感器產(chǎn)生的海量數(shù)據(jù)洪流,傳統(tǒng)單芯片架構(gòu)已難以滿足實(shí)時(shí)性與算力的雙重需求。NVIDIA Jetson與FPGA的異構(gòu)組合,通過"前端FPGA...

關(guān)鍵字: 邊緣計(jì)算 NVIDIA Jetson FPGA

在高速網(wǎng)絡(luò)通信領(lǐng)域,F(xiàn)PGA憑借其并行處理能力成為實(shí)現(xiàn)以太網(wǎng)MAC(媒體訪問控制)層的理想平臺(tái)。然而,面對(duì)1G甚至10Gbps的線速流量,傳統(tǒng)的“軟件式”逐包處理早已力不從心。構(gòu)建高效的包處理流水線(Packet Pro...

關(guān)鍵字: 以太網(wǎng) MAC FPGA

在FPGA實(shí)現(xiàn)數(shù)字信號(hào)處理(DSP)算法時(shí),DSP Slice作為專用硬件資源,其利用效率直接影響系統(tǒng)性能與成本。本文聚焦乘加運(yùn)算(MAC)的優(yōu)化實(shí)現(xiàn),分享流水線設(shè)計(jì)與資源復(fù)用的實(shí)用技巧,幫助開發(fā)者在有限資源下實(shí)現(xiàn)更高吞...

關(guān)鍵字: FPGA DSP

在異構(gòu)計(jì)算的浪潮中,F(xiàn)PGA憑借其可重構(gòu)特性與高能效比,成為突破算力瓶頸的“利刃”。然而,當(dāng)我們試圖通過OpenCL將FPGA納入統(tǒng)一計(jì)算平臺(tái)時(shí),一個(gè)巨大的幽靈始終盤旋在系統(tǒng)上方——內(nèi)存帶寬瓶頸。PCIe總線的有限帶寬與...

關(guān)鍵字: OpenCL FPGA

將成熟的ASIC設(shè)計(jì)遷移至FPGA平臺(tái),絕非簡單的“復(fù)制粘貼”。ASIC設(shè)計(jì)追求極致的能效比和定制化物理布局,而FPGA受限于固定的邏輯單元(LUT、FF、DSP、BRAM)架構(gòu),直接移植往往導(dǎo)致資源利用率低下甚至?xí)r序收...

關(guān)鍵字: ASIC FPGA

在高性能FPGA設(shè)計(jì)中,DSP48E2 Slice絕非僅僅是一個(gè)簡單的乘法單元。若將其僅視為“硬件乘法器”,將極大浪費(fèi)其潛在的算力。作為Xilinx UltraScale+架構(gòu)的核心算術(shù)引擎,DSP48E2集成了預(yù)加器、...

關(guān)鍵字: DSP48E2 FPGA

在浩瀚宇宙中,高能粒子如隱形的子彈,時(shí)刻轟擊著航天器的電子核心。對(duì)于FPGA而言,單粒子翻轉(zhuǎn)(SEU)可能導(dǎo)致邏輯狀態(tài)突變,引發(fā)災(zāi)/難性后果。此時(shí),三模冗余(TMR)技術(shù)便成為守護(hù)系統(tǒng)可靠的“神盾”,它通過硬件代價(jià)換取極...

關(guān)鍵字: 抗輻射加固設(shè)計(jì) FPGA 三模冗余
關(guān)閉