日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 廠商動態(tài) > 米爾電子
[導(dǎo)讀]在全球半導(dǎo)體制程限制和高端 GPU 受限的大環(huán)境下,F(xiàn)PGA 成為了中國企業(yè)發(fā)展的重要路徑之一。它可支持靈活的 AIoT 應(yīng)用,其靈活性與可編程性使其可以在國內(nèi)成熟的 28nm 工藝甚至更低節(jié)點的制程下實現(xiàn)高效的硬件加速。

Tip:學習如何在 MYIR 的 ZU3EG FPGA 開發(fā)板上部署 Tiny YOLO v4,對比 FPGA、GPU、CPU 的性能,助力 AIoT 邊緣計算應(yīng)用。(文末有彩蛋)

一、 為什么選擇 FPGA:應(yīng)對 7nm 制程與 AI 限制

在全球半導(dǎo)體制程限制和高端 GPU 受限的大環(huán)境下,F(xiàn)PGA 成為了中國企業(yè)發(fā)展的重要路徑之一。它可支持靈活的 AIoT 應(yīng)用,其靈活性與可編程性使其可以在國內(nèi)成熟的 28nm 工藝甚至更低節(jié)點的制程下實現(xiàn)高效的硬件加速。

米爾的 ZU3EG 開發(fā)板憑借其可重構(gòu)架構(gòu)為 AI 和計算密集型任務(wù)提供了支持,同時避免了 7nm 工藝對國產(chǎn)芯片設(shè)計的制約。通過在 ZU3EG 上部署 Tiny YOLO v4,我們可以為智能家居、智慧城市等 AIoT 應(yīng)用提供高效的解決方案。

CPU GPU FPGA 架構(gòu)對比

二、 了解 Tiny YOLO 模型及其適用性

YOLO(You Only Look Once)是一種實時物體檢測模型,它通過一次性掃描整個圖像,實現(xiàn)高效的對象識別。

而其簡化版 Tiny YOLO v4 更適合嵌入式設(shè)備,具有較少的層數(shù)和參數(shù)。其輕量化特性更適合在資源受限的設(shè)備上運行,尤其在低功耗、實時檢測的邊緣計算設(shè)備中表現(xiàn)出色。

相比傳統(tǒng) GPU,F(xiàn)PGA 能在小面積和低功耗下實現(xiàn)類似的推理性能,非常契合 AIoT 應(yīng)用。像米爾 ZU3EG 這樣的 FPGA 開發(fā)板,通過底板和豐富接口的載板設(shè)計,非常適合高效的嵌入式低功耗數(shù)據(jù)處理。

Yolo V4 網(wǎng)絡(luò)結(jié)構(gòu)圖

Tiny Yolo V4 網(wǎng)絡(luò)結(jié)構(gòu)圖

(通過優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),保持較高檢測精度的同時,降低模型的計算量和內(nèi)存占用)

三、 獲取數(shù)據(jù)集和模型

可下載開源訓練集或預(yù)訓練模型。為了確保兼容性,建議將模型轉(zhuǎn)換為 ONNX 格式,以便后續(xù)能在 FPGA 上完成優(yōu)化。

1. 下載 Tiny YOLO v4 模型:從 Darknet 的 GitHub 倉庫 獲取 Tiny YOLO 的預(yù)訓練權(quán)重,或者在 COCO 等數(shù)據(jù)集上自行訓練模型。自定義的模型適用于特定應(yīng)用場景(如車輛檢測、人臉檢測等)。

2. 數(shù)據(jù)準備:若要自定義模型,可使用 LabelImg 等工具對數(shù)據(jù)集進行標注,將數(shù)據(jù)轉(zhuǎn)為 YOLO 格式。之后,可將 YOLO 格式轉(zhuǎn)換為 ONNX 格式,以便兼容 FPGA 優(yōu)化工具鏈。

Tiny YOLO 在 Darknet 上訓練的截圖

四、 通過 Vivado HLS 為 FPGA 準備模型

要將模型部署到 FPGA,需要將神經(jīng)網(wǎng)絡(luò)操作轉(zhuǎn)換為硬件級描述。使用 Xilinx 的 Vitis HLS(高級綜合)可以將 Tiny YOLO v4 的 C++ 模型代碼的轉(zhuǎn)化為 Verilog RTL(寄存器傳輸級)代碼,從而將模型從軟件世界帶入硬件實現(xiàn)。

詳細步驟:

1. 模型層映射和優(yōu)化:

? 將 YOLO 的每一層(如卷積層、池化層)映射為硬件友好的 C/C++ 結(jié)構(gòu)。例如,將卷積映射為乘累加(MAC)數(shù)組,通過流水線實現(xiàn)并行化。

2. 算子加速與指令優(yōu)化:

? 流水線(Pipelining):利用流水線來處理多項操作并行,減少延遲。

? 循環(huán)展開(Loop Unrolling):展開循環(huán),以每周期處理更多數(shù)據(jù),尤其在卷積操作中有效。

? 設(shè)置 DATAFLOW 指令,使層間獨立處理。

3. 量化與位寬調(diào)整:

? 將激活值和權(quán)重量化為定點精度(例如 INT8),而非浮點數(shù)。這在維持準確度的同時顯著降低計算量,尤其適合 FPGA 的固定點運算支持。

Tiny YOLO 模型在 Vivado HLS 中的層層轉(zhuǎn)化流程圖

五、 使用 Vivado 綜合與部署 Verilog 到 米爾的ZU3EG FPGA開發(fā)板

當 HLS 生成的 RTL 代碼準備就緒后,可以使用 Vivado 將模型部署到 FPGA。

1. Vivado 中的設(shè)置:

? 將 HLS 輸出的 RTL 文件導(dǎo)入 Vivado。

? 在 Vivado 中創(chuàng)建模塊設(shè)計,包括連接AXI 接口與 ZU3EG 的 ARM 核連接。

2. I/O 約束與時序:

? 定義 FPGA 的 I/O 引腳約束,以匹配 ZU3EG 板的特定管腳配置。配置時鐘約束以滿足合適的數(shù)據(jù)速率(如視頻數(shù)據(jù) 100-200 MHz)。

? 進行時序分析,確保延遲和響應(yīng)速度達到實時要求。

3. 生成比特流并下載到 ZU3EG:

? 生成的比特流可以直接通過 JTAG 或以太網(wǎng)接口下載到 ZU3EG。

將 Tiny YOLO 處理模塊連接到 米爾ZU3EG開發(fā)板 的外設(shè)和接口

六、 在 FPGA 上測試并運行推理

現(xiàn)在 Tiny YOLO 已部署,可以驗證其實時對象檢測性能。

1. 數(shù)據(jù)采集:

? 通過連接的相機模塊捕捉圖像或視頻幀,或者使用存儲的測試視頻。

? 使用 ZU3EG 的 ARM 核上的 OpenCV 對幀進行預(yù)處理,再將它們傳入 FPGA 預(yù)處理后進行推理。

2. 后處理與顯示:

? 模型檢測對象后,輸出邊框和類別標簽。使用 OpenCV 將邊框映射回原始幀,并在每個檢測到的對象周圍顯示類別和置信度。

3. 性能測試:

? 測量幀速率(FPS)和檢測準確度。微調(diào)量化位寬或數(shù)據(jù)流參數(shù),以優(yōu)化實時需求。

Tiny YOLO 模型在 ZU3EG 上顯示檢測結(jié)果的實時輸出,視頻幀中標注了檢測到的對象

七、 性能優(yōu)化與調(diào)試技巧

為提高性能,可以進行以下調(diào)整:

? 內(nèi)存訪問:設(shè)計數(shù)據(jù)存儲方式,最大限度利用緩存并減少數(shù)據(jù)傳輸,降低內(nèi)存瓶頸。

? 降低延遲:重新評估關(guān)鍵路徑延遲。若延遲過高,調(diào)整 Vitis HLS 中的流水線深度,并驗證層間的數(shù)據(jù)依賴性。

? 量化改進:嘗試 INT8 量化。Xilinx 的 Vitis AI 可幫助微調(diào)量化參數(shù),以平衡準確性與速度。

不同優(yōu)化配置對資源使用的影響

圖:米爾MYC-CZU3EG/4EV/5EV-V2核心板及開發(fā)板

在MYIR 的 ZU3EG 開發(fā)平臺上提供了一種高效的解決方案。利用 FPGA 獨特的靈活性和低功耗優(yōu)勢,助力未來 AIoT 設(shè)備的普及和智能升級。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉