日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 廠商動態(tài) > 米爾電子
[導讀]米爾 MYD-Y6ULX-V2 開發(fā)板,基于 NXP i.MX6UL/i.MX6ULL處理器,該開發(fā)板被米爾稱之為經(jīng)典王牌產(chǎn)品。本次測試目標是在此開發(fā)板上進行神經(jīng)網(wǎng)絡框架ncnn的移植與測試開發(fā),測試ncnn在此開發(fā)板上的性能與應用測試。

米爾 MYD-Y6ULX-V2 開發(fā)板,基于 NXP i.MX6UL/i.MX6ULL處理器,該開發(fā)板被米爾稱之為經(jīng)典王牌產(chǎn)品。本次測試目標是在此開發(fā)板上進行神經(jīng)網(wǎng)絡框架ncnn的移植與測試開發(fā),測試ncnn在此開發(fā)板上的性能與應用測試。

01.什么是ncnn

ncnn 是騰訊優(yōu)圖推出的在手機端極致優(yōu)化的高性能神經(jīng)網(wǎng)絡前向計算框架。也能夠在移動設備上的高性能神經(jīng)網(wǎng)絡前向計算框架。ncnn 從設計之初深刻考慮移動端的部署和使用。無第三方依賴,跨平臺,其中手機端 cpu的速度快于目前所有已知的開源框架?;趎cnn,能夠將深度學習算法輕松移植到手機端和移動設備上高效執(zhí)行,開發(fā)人工智能應用。以騰訊內(nèi)部應用為例,ncnn目前已在QQ,Qzone,微信,天天P圖等上得到應用。ncnn支持大部分常用的CNN 網(wǎng)絡:Classical CNN: VGG AlexNetGoogleNet Inception …Practical CNN: ResNetDenseNet SENet FPN …Light-weight CNN:SqueezeNet MobileNetV1/V2/V3 ShuffleNetV1/V2 MNasNet …Detection: MTCNNfacedetection …Detection: VGG-SSDMobileNet-SSD SqueezeNet-SSD MobileNetV2-SSDLite …Detection: Faster-RCNNR-FCN …Detection: YOLOV2 YOLOV3MobileNet-YOLOV3 …Segmentation: FCN PSPNetUNet …騰訊優(yōu)圖實驗室是主要研究計算機視覺技術,ncnn的許多應用方向也都在圖像方面,如人像自動美顏,照片風格化,超分辨率,物體識別。騰訊優(yōu)圖ncnn提供的資料顯示:對比目前已知的同類框架,ncnn是cpu框架中最快的,安裝包體積最小,跨平臺兼容性中也是最好的。以蘋果主推的CoreML為例,CoreML是蘋果主推的 iOS gpu計算框架,速度非???,但僅支持 iOS11以上的 iphone手機受眾太狹窄。非開源也導致開發(fā)者無法自主擴展功能。

02.ncnn功能簡介

ncnn支持卷積神經(jīng)網(wǎng)絡,支持多輸入和多分支結構,可計算部分分支無任何第三方庫依賴,不依賴 BLAS/NNPACK 等計算框架純 C++ 實現(xiàn),跨平臺,支持 android ios 等ARM NEON 匯編級良心優(yōu)化,計算速度極快精細的內(nèi)存管理和數(shù)據(jù)結構設計,內(nèi)存占用極低支持多核并行計算加速,ARM big.LITTLE cpu 調(diào)度優(yōu)化。支持基于全新低消耗的 vulkan api GPU 加速整體庫體積小于 700K,并可輕松精簡到小于 300K可擴展的模型設計,支持 8bit 量化和半精度浮點存儲,可導入 caffe/pytorch/mxnet/onnx 模型支持直接內(nèi)存零拷貝引用加載網(wǎng)絡模型可注冊自定義層實現(xiàn)并擴展。ncnn與同類框架對比

03.在i.MX 6ull上移植編譯ncnn

工程地址:

從工程的readme文件看,該工程已經(jīng)支持很多嵌入式CPU的架構,其中就有arm 32位版本。

既然支持arm32位,那么ixm6ull處理器也應該支持,即著手編譯米爾i.MX6UL/i.MX6UL開發(fā)板上的版本。1.從github 上拉取ncnn源碼在主機上執(zhí)行命令:

可見是一個 cmake工程,那么嘗試cmake 編譯。2.初次使用camke編譯先進入ixml6ull的SDK下,切換到交叉編譯環(huán)境,然后創(chuàng)建 build 目錄,進入build目錄下,執(zhí)行cmake命令cmake ../從輸出信息上看 cmake失敗,查看cmake 日志,發(fā)現(xiàn)錯誤原因是cmake在生成開發(fā)板的makefile文件時,需要指定使用的編譯工具鏈。3.添加imx6ull開發(fā)板的編譯配置根據(jù)腳本的過程,在toolchains目錄下,有很多其它開發(fā)板的編譯配置文件,參照其它開發(fā)板的配置文件,添加一個i.MX6UL開發(fā)板的配置文件。文件名:arm-poky-linux-gnueabi.cmake內(nèi)容如下:

set(CMAKE_SYSTEM_NAME Linux)set(CMAKE_SYSTEM_PROCESSOR arm)set(CMAKE_C_COMPILER "arm-poky-linux-gnueabi-gcc")set(CMAKE_CXX_COMPILER "arm-poky-linux-gnueabi-g++")set(CMAKE_FIND_ROOT_PATH_MODE_PROGRAM NEVER)set(CMAKE_FIND_ROOT_PATH_MODE_LIBRARY ONLY)set(CMAKE_FIND_ROOT_PATH_MODE_INCLUDE ONLY)

set(CMAKE_C_FLAGS "-march=armv7-a -mfloat-abi=hard -mfpu=neon --sysroot=/home/lutherluo/workspace/fsl-imx-fb/5.10-gatesgarth/sysroots/cortexa7t2hf-neon-poky-linux-gnueabi")

set(CMAKE_CXX_FLAGS "-march=armv7-a -mfloat-abi=hard -mfpu=neon --sysroot=/home/lutherluo/workspace/fsl-imx-fb/5.10-gatesgarth/sysroots/cortexa7t2hf-neon-poky-linux-gnueabi")

# cache flagsset(CMAKE_C_FLAGS "${CMAKE_C_FLAGS}" CACHE STRING "c flags")set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS}" CACHE STRING "c++ flags")

4.再使用cmake生成編譯文件添加完i.MX6UL/i.MX6ULL開發(fā)板的編譯工具鏈后,就可以使用cmake來生成編譯所需的makefile文件了。在cmake時,可以指定除了編譯ncnn庫外,還可以編譯ncnn例子程序。命令如下:cmake-DCMAKE_BUILD_TYPE=Release -DNCNN_SIMPLEOCV=ON-DCMAKE_TOOLCHAIN_FILE=../toolchains/arm-poky-linux-gnueabi.cmake-DNCNN_BUILD_EXAMPLES=ON ..

查看目錄下,已經(jīng)順利地生成了 Makefile文件。5.使用make編譯文件然后可以正式編譯ncnn庫和測試樣例程序了。直接執(zhí)行make –j4就開始愉快地編譯了。

編譯libncnn庫文件成功,會繼續(xù)自動編譯 examples 下的例子文件。

大約10多分鐘,順利地全部編譯完成。在編譯測試用例時,會出現(xiàn)庫格式錯誤的提示,此時需要設置一下交叉編譯環(huán)境下的庫歸檔工具,系統(tǒng)默認使用的是arm-poky-linux-gnueabi-ar 工具,這個工具產(chǎn)生的 .a文件有問題,經(jīng)過測試使用 arm-poky-linux-gnueabi-gcc-ar 即可。只需要在執(zhí)行切換交叉環(huán)境腳本后,再單獨執(zhí)行一下以下命令即可修改該問題:export ar=arm-poky-linux-gnueabi-gcc-ar再進行編譯即可。6.查看編譯結果編譯完成后,在build目錄下,可以看到 benchmark 目錄,該目錄下就是ncnn的基準測試工具,可以看到目標板執(zhí)行文件已經(jīng)編譯出來。

再進入到 build/example 下,可以看到所有例程也編譯出來了。

04.板上運行測試ncnn

編譯完成把可執(zhí)行文件與模型文件復制到i.MX6UL/i.MX6ULL開發(fā)板里進行測試。

把 build/benchmark 下的benchmark 復制到開發(fā)板/home/root/ncnn 目錄下,同時把工程根目錄下的benchmark 目錄下所有文件也復制到i.MX6UL/i.MX6ULL開發(fā)板 /home/root/ncnn目錄下,

然后就可以執(zhí)行 benchmark 執(zhí)行文件來測試i.MX6UL/i.MX6ULL開發(fā)板的人工神經(jīng)網(wǎng)絡的計算能力。

先把開發(fā)環(huán)境下目標文件系統(tǒng)arm目錄下/usr/lib下的libgomp.so.1文件復制到開發(fā)板的/usr/lib下,這個文件是并行計算庫,ncnn編譯時用到了這個庫,這個庫在多核處理器上能夠支持執(zhí)行并行計算。然后再在i.MX6UL/i.MX6ULL開發(fā)板執(zhí)行benchmark,執(zhí)行輸出結果如下圖:

可見大部分的模型能夠跑通了,有部分模型運行出現(xiàn)異常。

從拋出的分值可以評估該開發(fā)板的神經(jīng)網(wǎng)絡推理計算能力了。

這個分值是一個模型推理一次的耗時,所以數(shù)值越小意味著算力越強。考慮到這個開發(fā)板是一個arm v7入門級的開發(fā)板,這樣的性能已經(jīng)超乎預料了。

05.測試基于ncnn的應用

這里在i.MX6UL/i.MX6ULL開發(fā)板上測試ncnn的應用例子,這里就用ncnn下的例程來做測試,在上面編譯完example后,在build目錄下會產(chǎn)生example的目標板的可執(zhí)行文件。編譯出來的例子程序如下,把他們?nèi)總鞯介_發(fā)板上。

需要注意的是,除了ncnn的應用執(zhí)行文件,在這些例子執(zhí)行的時候,還需要模型和測試的資源文件,而這些文件體積都比較大,因此不能傳送到開發(fā)板的系統(tǒng)目錄上,需要單獨存在擴展的存儲空間上。

經(jīng)過觀察板上的文件系統(tǒng),發(fā)現(xiàn)有3.1G的空間沒有使用,此時可以使用fdisk 來格式化該空間,格式化成 ext4 格式,重啟板子后,就可以看到這部分空間了,然后把ncnn的所有測試執(zhí)行文件和資源文件傳到該目錄下,這樣就夠用了。

在板上執(zhí)行各個測試例子,會提示缺少相關模型文件和參數(shù)文件,這些模型和參數(shù)文件在這個github上面,下載相應的文件到當前目錄下就可以。

1. 測試圖片分類器

準備被測試圖片,test,jpg ,傳到上ncnn當前目錄下

并且下載好 squeezenet_v1.1.param和 squeezenet_v1.1.bin 文件到 ncnn當前目錄下,然后執(zhí)行一下命令:

./squeezenet./test.jpg

很快就輸出識別結果,輸出結果如下圖

輸出結果前面的編號和分類號,具體可以參考:

mageNet20121000分類名稱和編號

但不知本測試模型所用分類的版本是否和這個一致。

2 測試圖片內(nèi)容多目標識別

測試圖片內(nèi)容識別,先用上面的圖,再使用 squeezenetssd 來執(zhí)行。執(zhí)行前先下載 squeezenet_ssd_voc.bin和 squeezenet_ssd_voc.param 到板上ncnn當前目錄下,然后執(zhí)行:

./squeezenetssd./test.jpg

大約3秒左右輸出結果如圖:

輸出的分類編號,可見代碼的定義:

同時輸出了識別結果圖:

再測試另外一張圖;

執(zhí)行結果如下:

輸出識別結果圖:

上面的識別,因為輸出的第二個目標被第三個目標遮蓋,第二個識別為“Dog”,所以識別準確度還是比較高的。

再測試了一張圖:

輸出:

識別效果也比較理想。

06.ncnn移植測試總結

經(jīng)過在米爾i.MX6UL/i.MX6ULL開發(fā)板上,進行這次的ncnn移植測試,總體非常順利,在移植中只需要針對開發(fā)板的編譯器,修改添加相應的編譯腳本即可順利的編譯ncnn庫和所有例程。并不需要對代碼做任何改動或者調(diào)整,因此過程很快,短暫的時間就可以完成ncnn這樣一個神經(jīng)網(wǎng)絡框架在本開發(fā)板上運行起來。

對ncnn的benchmark的性能測試來看,因為本開發(fā)板僅為arm v7單核處理器,處于入門級的一款開發(fā)板,能跑出這樣的成績已經(jīng)出乎意料。

在對實際圖像分類和圖像內(nèi)容識別測試中,其中圖像分類僅百十毫秒就出結果,對多目標識別單張圖在2秒左右,這對一些靜態(tài)的環(huán)境下已經(jīng)能夠達到業(yè)務使用的需求了,再綜合其硬件性能,可見效能比是非常高的。同時工程里還帶有一些各種其它框架模型轉化ncnn的工具,方便將其它模型轉化到ncnn上來使用,非常方便。

同時也測試出ncnn的良好的可移植性和對不同嵌入式硬件的支持較好,其它任何一個神經(jīng)網(wǎng)絡框架恐怕無法在這樣一個系統(tǒng)上運行,因此也為這樣一個有效的國產(chǎn)開源神經(jīng)網(wǎng)絡項目點贊。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據(jù)LED驅動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質(zhì)量和效率直接關系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉