當(dāng)前位置：首頁(yè) > 廠商動(dòng)態(tài) > 米爾電子

米爾入門級(jí)i.MX6UL開發(fā)板的神經(jīng)網(wǎng)絡(luò)框架ncnn移植與測(cè)試

時(shí)間：2023-02-17 16:59:10

關(guān)鍵字：米爾電子嵌入式神經(jīng)網(wǎng)絡(luò)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]米爾 MYD-Y6ULX-V2 開發(fā)板，基于 NXP i.MX6UL/i.MX6ULL處理器，該開發(fā)板被米爾稱之為經(jīng)典王牌產(chǎn)品。本次測(cè)試目標(biāo)是在此開發(fā)板上進(jìn)行神經(jīng)網(wǎng)絡(luò)框架ncnn的移植與測(cè)試開發(fā)，測(cè)試ncnn在此開發(fā)板上的性能與應(yīng)用測(cè)試。

米爾 MYD-Y6ULX-V2 開發(fā)板，基于 NXP i.MX6UL/i.MX6ULL處理器，該開發(fā)板被米爾稱之為經(jīng)典王牌產(chǎn)品。本次測(cè)試目標(biāo)是在此開發(fā)板上進(jìn)行神經(jīng)網(wǎng)絡(luò)框架ncnn的移植與測(cè)試開發(fā)，測(cè)試ncnn在此開發(fā)板上的性能與應(yīng)用測(cè)試。

01.什么是ncnn

ncnn 是騰訊優(yōu)圖推出的在手機(jī)端極致優(yōu)化的高性能神經(jīng)網(wǎng)絡(luò)前向計(jì)算框架。也能夠在移動(dòng)設(shè)備上的高性能神經(jīng)網(wǎng)絡(luò)前向計(jì)算框架。ncnn 從設(shè)計(jì)之初深刻考慮移動(dòng)端的部署和使用。無第三方依賴，跨平臺(tái)，其中手機(jī)端 cpu的速度快于目前所有已知的開源框架?；趎cnn，能夠?qū)⑸疃葘W(xué)習(xí)算法輕松移植到手機(jī)端和移動(dòng)設(shè)備上高效執(zhí)行，開發(fā)人工智能應(yīng)用。以騰訊內(nèi)部應(yīng)用為例，ncnn目前已在QQ，Qzone，微信，天天P圖等上得到應(yīng)用。ncnn支持大部分常用的CNN 網(wǎng)絡(luò)：Classical CNN: VGG AlexNetGoogleNet Inception …Practical CNN: ResNetDenseNet SENet FPN …Light-weight CNN:SqueezeNet MobileNetV1/V2/V3 ShuffleNetV1/V2 MNasNet …Detection: MTCNNfacedetection …Detection: VGG-SSDMobileNet-SSD SqueezeNet-SSD MobileNetV2-SSDLite …Detection: Faster-RCNNR-FCN …Detection: YOLOV2 YOLOV3MobileNet-YOLOV3 …Segmentation: FCN PSPNetUNet …騰訊優(yōu)圖實(shí)驗(yàn)室是主要研究計(jì)算機(jī)視覺技術(shù)，ncnn的許多應(yīng)用方向也都在圖像方面，如人像自動(dòng)美顏，照片風(fēng)格化，超分辨率，物體識(shí)別。騰訊優(yōu)圖ncnn提供的資料顯示：對(duì)比目前已知的同類框架，ncnn是cpu框架中最快的，安裝包體積最小，跨平臺(tái)兼容性中也是最好的。以蘋果主推的CoreML為例，CoreML是蘋果主推的 iOS gpu計(jì)算框架，速度非常快，但僅支持 iOS11以上的 iphone手機(jī)受眾太狹窄。非開源也導(dǎo)致開發(fā)者無法自主擴(kuò)展功能。

02.ncnn功能簡(jiǎn)介

ncnn支持卷積神經(jīng)網(wǎng)絡(luò)，支持多輸入和多分支結(jié)構(gòu)，可計(jì)算部分分支無任何第三方庫(kù)依賴，不依賴 BLAS/NNPACK 等計(jì)算框架純 C++ 實(shí)現(xiàn)，跨平臺(tái)，支持 android ios 等ARM NEON 匯編級(jí)良心優(yōu)化，計(jì)算速度極快精細(xì)的內(nèi)存管理和數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)，內(nèi)存占用極低支持多核并行計(jì)算加速，ARM big.LITTLE cpu 調(diào)度優(yōu)化。支持基于全新低消耗的 vulkan api GPU 加速整體庫(kù)體積小于 700K，并可輕松精簡(jiǎn)到小于 300K可擴(kuò)展的模型設(shè)計(jì)，支持 8bit 量化和半精度浮點(diǎn)存儲(chǔ)，可導(dǎo)入 caffe/pytorch/mxnet/onnx 模型支持直接內(nèi)存零拷貝引用加載網(wǎng)絡(luò)模型可注冊(cè)自定義層實(shí)現(xiàn)并擴(kuò)展。ncnn與同類框架對(duì)比

03.在i.MX 6ull上移植編譯ncnn

工程地址：

從工程的readme文件看，該工程已經(jīng)支持很多嵌入式CPU的架構(gòu)，其中就有arm 32位版本。

既然支持arm32位，那么ixm6ull處理器也應(yīng)該支持，即著手編譯米爾i.MX6UL/i.MX6UL開發(fā)板上的版本。1.從github 上拉取ncnn源碼在主機(jī)上執(zhí)行命令：

可見是一個(gè) cmake工程，那么嘗試cmake 編譯。2.初次使用camke編譯先進(jìn)入ixml6ull的SDK下，切換到交叉編譯環(huán)境，然后創(chuàng)建 build 目錄，進(jìn)入build目錄下，執(zhí)行cmake命令cmake ../從輸出信息上看 cmake失敗，查看cmake 日志，發(fā)現(xiàn)錯(cuò)誤原因是cmake在生成開發(fā)板的makefile文件時(shí)，需要指定使用的編譯工具鏈。3.添加imx6ull開發(fā)板的編譯配置根據(jù)腳本的過程，在toolchains目錄下，有很多其它開發(fā)板的編譯配置文件，參照其它開發(fā)板的配置文件，添加一個(gè)i.MX6UL開發(fā)板的配置文件。文件名：arm-poky-linux-gnueabi.cmake內(nèi)容如下：

set(CMAKE_SYSTEM_NAME Linux)set(CMAKE_SYSTEM_PROCESSOR arm)set(CMAKE_C_COMPILER "arm-poky-linux-gnueabi-gcc")set(CMAKE_CXX_COMPILER "arm-poky-linux-gnueabi-g++")set(CMAKE_FIND_ROOT_PATH_MODE_PROGRAM NEVER)set(CMAKE_FIND_ROOT_PATH_MODE_LIBRARY ONLY)set(CMAKE_FIND_ROOT_PATH_MODE_INCLUDE ONLY)

set(CMAKE_C_FLAGS "-march=armv7-a -mfloat-abi=hard -mfpu=neon --sysroot=/home/lutherluo/workspace/fsl-imx-fb/5.10-gatesgarth/sysroots/cortexa7t2hf-neon-poky-linux-gnueabi")

set(CMAKE_CXX_FLAGS "-march=armv7-a -mfloat-abi=hard -mfpu=neon --sysroot=/home/lutherluo/workspace/fsl-imx-fb/5.10-gatesgarth/sysroots/cortexa7t2hf-neon-poky-linux-gnueabi")

# cache flagsset(CMAKE_C_FLAGS "${CMAKE_C_FLAGS}" CACHE STRING "c flags")set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS}" CACHE STRING "c++ flags")

4.再使用cmake生成編譯文件添加完i.MX6UL/i.MX6ULL開發(fā)板的編譯工具鏈后，就可以使用cmake來生成編譯所需的makefile文件了。在cmake時(shí)，可以指定除了編譯ncnn庫(kù)外，還可以編譯ncnn例子程序。命令如下：cmake-DCMAKE_BUILD_TYPE=Release -DNCNN_SIMPLEOCV=ON-DCMAKE_TOOLCHAIN_FILE=../toolchains/arm-poky-linux-gnueabi.cmake-DNCNN_BUILD_EXAMPLES=ON ..

查看目錄下，已經(jīng)順利地生成了 Makefile文件。5.使用make編譯文件然后可以正式編譯ncnn庫(kù)和測(cè)試樣例程序了。直接執(zhí)行make –j4就開始愉快地編譯了。

編譯libncnn庫(kù)文件成功，會(huì)繼續(xù)自動(dòng)編譯 examples 下的例子文件。

大約10多分鐘，順利地全部編譯完成。在編譯測(cè)試用例時(shí)，會(huì)出現(xiàn)庫(kù)格式錯(cuò)誤的提示，此時(shí)需要設(shè)置一下交叉編譯環(huán)境下的庫(kù)歸檔工具，系統(tǒng)默認(rèn)使用的是arm-poky-linux-gnueabi-ar 工具，這個(gè)工具產(chǎn)生的 .a文件有問題，經(jīng)過測(cè)試使用 arm-poky-linux-gnueabi-gcc-ar 即可。只需要在執(zhí)行切換交叉環(huán)境腳本后，再單獨(dú)執(zhí)行一下以下命令即可修改該問題：export ar=arm-poky-linux-gnueabi-gcc-ar再進(jìn)行編譯即可。6.查看編譯結(jié)果編譯完成后，在build目錄下，可以看到 benchmark 目錄，該目錄下就是ncnn的基準(zhǔn)測(cè)試工具，可以看到目標(biāo)板執(zhí)行文件已經(jīng)編譯出來。

再進(jìn)入到 build/example 下，可以看到所有例程也編譯出來了。

04.板上運(yùn)行測(cè)試ncnn

編譯完成把可執(zhí)行文件與模型文件復(fù)制到i.MX6UL/i.MX6ULL開發(fā)板里進(jìn)行測(cè)試。

把 build/benchmark 下的benchmark 復(fù)制到開發(fā)板/home/root/ncnn 目錄下，同時(shí)把工程根目錄下的benchmark 目錄下所有文件也復(fù)制到i.MX6UL/i.MX6ULL開發(fā)板 /home/root/ncnn目錄下，

然后就可以執(zhí)行 benchmark 執(zhí)行文件來測(cè)試i.MX6UL/i.MX6ULL開發(fā)板的人工神經(jīng)網(wǎng)絡(luò)的計(jì)算能力。

先把開發(fā)環(huán)境下目標(biāo)文件系統(tǒng)arm目錄下/usr/lib下的libgomp.so.1文件復(fù)制到開發(fā)板的/usr/lib下，這個(gè)文件是并行計(jì)算庫(kù)，ncnn編譯時(shí)用到了這個(gè)庫(kù)，這個(gè)庫(kù)在多核處理器上能夠支持執(zhí)行并行計(jì)算。然后再在i.MX6UL/i.MX6ULL開發(fā)板執(zhí)行benchmark，執(zhí)行輸出結(jié)果如下圖：

可見大部分的模型能夠跑通了，有部分模型運(yùn)行出現(xiàn)異常。

從拋出的分值可以評(píng)估該開發(fā)板的神經(jīng)網(wǎng)絡(luò)推理計(jì)算能力了。

這個(gè)分值是一個(gè)模型推理一次的耗時(shí)，所以數(shù)值越小意味著算力越強(qiáng)。考慮到這個(gè)開發(fā)板是一個(gè)arm v7入門級(jí)的開發(fā)板，這樣的性能已經(jīng)超乎預(yù)料了。

05.測(cè)試基于ncnn的應(yīng)用

這里在i.MX6UL/i.MX6ULL開發(fā)板上測(cè)試ncnn的應(yīng)用例子，這里就用ncnn下的例程來做測(cè)試，在上面編譯完example后，在build目錄下會(huì)產(chǎn)生example的目標(biāo)板的可執(zhí)行文件。編譯出來的例子程序如下,把他們?nèi)總鞯介_發(fā)板上。

需要注意的是，除了ncnn的應(yīng)用執(zhí)行文件，在這些例子執(zhí)行的時(shí)候，還需要模型和測(cè)試的資源文件，而這些文件體積都比較大，因此不能傳送到開發(fā)板的系統(tǒng)目錄上，需要單獨(dú)存在擴(kuò)展的存儲(chǔ)空間上。

經(jīng)過觀察板上的文件系統(tǒng)，發(fā)現(xiàn)有3.1G的空間沒有使用，此時(shí)可以使用fdisk 來格式化該空間，格式化成 ext4 格式，重啟板子后，就可以看到這部分空間了，然后把ncnn的所有測(cè)試執(zhí)行文件和資源文件傳到該目錄下，這樣就夠用了。

在板上執(zhí)行各個(gè)測(cè)試?yán)?，?huì)提示缺少相關(guān)模型文件和參數(shù)文件，這些模型和參數(shù)文件在這個(gè)github上面，下載相應(yīng)的文件到當(dāng)前目錄下就可以。

1. 測(cè)試圖片分類器

準(zhǔn)備被測(cè)試圖片,test,jpg ,傳到上ncnn當(dāng)前目錄下

并且下載好 squeezenet_v1.1.param和 squeezenet_v1.1.bin 文件到 ncnn當(dāng)前目錄下，然后執(zhí)行一下命令：

./squeezenet./test.jpg

很快就輸出識(shí)別結(jié)果，輸出結(jié)果如下圖

輸出結(jié)果前面的編號(hào)和分類號(hào)，具體可以參考：

mageNet20121000分類名稱和編號(hào)

但不知本測(cè)試模型所用分類的版本是否和這個(gè)一致。

2 測(cè)試圖片內(nèi)容多目標(biāo)識(shí)別

測(cè)試圖片內(nèi)容識(shí)別，先用上面的圖，再使用 squeezenetssd 來執(zhí)行。執(zhí)行前先下載 squeezenet_ssd_voc.bin和 squeezenet_ssd_voc.param 到板上ncnn當(dāng)前目錄下，然后執(zhí)行：

./squeezenetssd./test.jpg

大約3秒左右輸出結(jié)果如圖：

輸出的分類編號(hào)，可見代碼的定義：

同時(shí)輸出了識(shí)別結(jié)果圖：

再測(cè)試另外一張圖;

執(zhí)行結(jié)果如下：

輸出識(shí)別結(jié)果圖：

上面的識(shí)別，因?yàn)檩敵龅牡诙€(gè)目標(biāo)被第三個(gè)目標(biāo)遮蓋，第二個(gè)識(shí)別為“Dog”，所以識(shí)別準(zhǔn)確度還是比較高的。

再測(cè)試了一張圖：

輸出：

識(shí)別效果也比較理想。

06.ncnn移植測(cè)試總結(jié)

經(jīng)過在米爾i.MX6UL/i.MX6ULL開發(fā)板上，進(jìn)行這次的ncnn移植測(cè)試，總體非常順利，在移植中只需要針對(duì)開發(fā)板的編譯器，修改添加相應(yīng)的編譯腳本即可順利的編譯ncnn庫(kù)和所有例程。并不需要對(duì)代碼做任何改動(dòng)或者調(diào)整，因此過程很快，短暫的時(shí)間就可以完成ncnn這樣一個(gè)神經(jīng)網(wǎng)絡(luò)框架在本開發(fā)板上運(yùn)行起來。

對(duì)ncnn的benchmark的性能測(cè)試來看，因?yàn)楸鹃_發(fā)板僅為arm v7單核處理器，處于入門級(jí)的一款開發(fā)板，能跑出這樣的成績(jī)已經(jīng)出乎意料。

在對(duì)實(shí)際圖像分類和圖像內(nèi)容識(shí)別測(cè)試中，其中圖像分類僅百十毫秒就出結(jié)果，對(duì)多目標(biāo)識(shí)別單張圖在2秒左右，這對(duì)一些靜態(tài)的環(huán)境下已經(jīng)能夠達(dá)到業(yè)務(wù)使用的需求了，再綜合其硬件性能，可見效能比是非常高的。同時(shí)工程里還帶有一些各種其它框架模型轉(zhuǎn)化ncnn的工具，方便將其它模型轉(zhuǎn)化到ncnn上來使用，非常方便。

同時(shí)也測(cè)試出ncnn的良好的可移植性和對(duì)不同嵌入式硬件的支持較好，其它任何一個(gè)神經(jīng)網(wǎng)絡(luò)框架恐怕無法在這樣一個(gè)系統(tǒng)上運(yùn)行，因此也為這樣一個(gè)有效的國(guó)產(chǎn)開源神經(jīng)網(wǎng)絡(luò)項(xiàng)目點(diǎn)贊。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅(qū)動(dòng)方式相比，共陰恒流驅(qū)動(dòng)在能效有哪些優(yōu)勢(shì)

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字：驅(qū)動(dòng)電源

[電源]

工業(yè)電機(jī)驅(qū)動(dòng)電源設(shè)計(jì)：反電動(dòng)勢(shì)抑制與過流保護(hù)的集成方案

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下，工業(yè)電機(jī)作為核心動(dòng)力設(shè)備，其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動(dòng)勢(shì)抑制與過流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié)，集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字：工業(yè)電機(jī) 驅(qū)動(dòng)電源

[電源]

如何解決 LED 驅(qū)動(dòng)電源的易損壞問題

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而，在實(shí)際應(yīng)用中，LED 驅(qū)動(dòng)電源易損壞的問題卻十分常見，不僅增加了維護(hù)成本，還影響了用戶體驗(yàn)。要解決這一問題，需從設(shè)計(jì)、生...

關(guān)鍵字：驅(qū)動(dòng)電源照明系統(tǒng) 散熱

[電力電工電路]

LED設(shè)計(jì)中LED驅(qū)動(dòng)電源的公式

根據(jù)LED驅(qū)動(dòng)電源的公式，電感內(nèi)電流波動(dòng)大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字： LED 設(shè)計(jì) 驅(qū)動(dòng)電源

[汽車電子]

EV主驅(qū)IGBT隔離驅(qū)動(dòng)電源方案選擇問題探討

電動(dòng)汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件，其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字：電動(dòng)汽車新能源驅(qū)動(dòng)電源

[電源]

合理的驅(qū)動(dòng)電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設(shè)中，街道及停車場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分，其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步，高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關(guān)鍵字：發(fā)光二極管驅(qū)動(dòng)電源 LED

[消費(fèi)電子]

AC-DC電源轉(zhuǎn)換拓?fù)浣Y(jié)構(gòu)設(shè)計(jì)

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn)，如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字： LED 驅(qū)動(dòng)電源功率因數(shù)校正

[電源]

針對(duì)于LED照明驅(qū)動(dòng)電源技術(shù)中的電磁干擾其中的三大硬件問題措施

在LED照明技術(shù)日益普及的今天，LED驅(qū)動(dòng)電源的電磁干擾(EMI)問題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作，還可能對(duì)周圍電子設(shè)備造成不利影響，甚至引發(fā)系統(tǒng)故障。因此，采取有效的硬件措施來解決L...

關(guān)鍵字： LED照明技術(shù) 電磁干擾驅(qū)動(dòng)電源

[電源]

LED驅(qū)動(dòng)電源的核心部分“開關(guān)管”和“變換器”設(shè)計(jì)技巧

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字： LED 驅(qū)動(dòng)電源開關(guān)電源

[電源]

最全LED驅(qū)動(dòng)電源及散熱設(shè)計(jì)方案介紹

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器，通常情況下：LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字： LED 隧道燈驅(qū)動(dòng)電源