如何實現(xiàn) YOLO 模型的實時性能

時間：2026-01-21 16:07:56

關鍵字： Python 邊緣計算 YOLOv8

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]一款針對 4GB Jetson Orin Nano 設備進行物體檢測的高性能 C++ 實現(xiàn)。對 YOLOv8(成功)與 YOLOv26(挑戰(zhàn))進行基準測試

在資源有限的邊緣設備(例如 4GB 的 Jetson Orin Nano)上部署現(xiàn)代對象檢測模型時，總是要在準確性與速度之間進行權衡。雖然像 ultralytics 這樣的 Python 框架非常適合用于訓練，但在推理過程中它們往往會引入較大的開銷。

在這個項目中，我嘗試突破 Jetson Orin Nano 的性能限制，放棄了使用 Python，轉而采用純 C++ 語言并結合 NVIDIA TensorRT 進行實現(xiàn)。我的目標有兩個方面：

?實現(xiàn) YOLO 模型的實時性能(幀率超過 30 幀/秒)。

?將新發(fā)布的 YOLOv26 與穩(wěn)定的 YOLOv8 進行對比測試，以查看“端到端”架構在嚴格的 TensorRT 環(huán)境中是否依然適用。

挑戰(zhàn)：在邊緣計算領域，Python 與 C++ 的較量

我在 Jetson Orin Nano(4GB 內(nèi)存)上進行的 Python 代碼初步測試遇到了瓶頸。內(nèi)存使用量很高，而 Python 的全局解釋器鎖(GIL)加上其他開銷使得保持穩(wěn)定的高幀率變得困難。為了解決這個問題，我構建了一個自定義的 C++ 推理管道，該管道負責處理：

?媒體輸入/輸出：OpenCV(在可能的情況下啟用硬件加速)。

?預處理：CUDA 函數(shù)(縮放、歸一化、CHW 轉換)。

?推斷：TensorRT 引擎(16 位浮點精度)

?后處理：NMS 和坐標映射的 C++ 實現(xiàn)。

深入探究：YOLOv26 的“奧秘”

該項目的核心實驗之一是嘗試部署實驗性的 YOLOv26 算法。然而，我遇到了一個重大難題：置信度不一致問題。

雖然 YOLOv8 在轉換為 TensorRT 時表現(xiàn)完美，但 YOLOv26 在 C++ 中卻出現(xiàn)了邊界框漂移和置信度分數(shù)不準確的問題。為了解其原因，我分析了這兩個模型的 ONNX 圖(與 YOLOv10 進行對比)。

模型架構差異

YOLOv10 / v8(優(yōu)化版)：ONNX 導出包含完整的后處理子圖(TopK 和 Gather 操作)。輸出形狀通常為 1x300x6，能夠實現(xiàn)真正的端到端無 NMS 的推理。

YOLOv26(默認導出)：導出的 v26 模型輸出尺寸為 1x84x8400。它缺少內(nèi)置的端到端后處理子圖。

結論：v26 版本所宣傳的“無 NMS 處理”功能依賴于特定的 Python 側處理方式或特定的導出參數(shù)，而這些參數(shù)目前尚未成為標準配置。在純 TensorRT C++ 環(huán)境中，這種轉而采用傳統(tǒng)輸出格式的做法導致與標準后處理流程的兼容性出現(xiàn)問題。

注意：為了保證該項目代碼發(fā)布的穩(wěn)定性，我已將 YOLOv8n 設為默認模型，因為它能提供最穩(wěn)定的工業(yè)級性能。

性能基準測試

我針對三種不同的配置對推理流程進行了測試。測試結果清楚地表明，在邊緣硬件上，C++ TensorRT 方法具有明顯的優(yōu)勢。

1. Mac Mini(M 系列芯片)

CPU 推理：約 21.4 幀每秒

MPS(GPU)推理：約 20.5 幀每秒

要點：在 macOS 系統(tǒng)中，MPS 后端的即時幀率較高，但存在同步延遲問題，導致其視頻流的平均幀率低于 CPU 的幀率。

MPS(GPU)推理：約 20.5 幀每秒

洞察：在 macOS 系統(tǒng)上，MPS 后端的即時幀率較高，但存在同步延遲問題，導致其視頻流的平均幀率低于 CPU。

2. Jetson Orin Nano (Python + ONNX)

ONNX 運行時：約 16.0 幀每秒

Python 運行時環(huán)境和 ONNX 解釋過程所產(chǎn)生的開銷限制了其性能。

ONNX 運行時：約 16.0 幀每秒由于 Python 運行時和 ONNX 解釋過程的存在，其開銷限制了性能。

3. Jetson Orin Nano (C++ + TensorRT)- 勝利者

視頻推理(不顯示畫面)：33.2 幀每秒

延遲：約 12 毫秒(端到端)

吞吐量：約 90 幀每秒(使用 trtexec 進行的原始基準測試)

通過改用 C++ 和 TensorRT，與在相同硬件上使用 Python 實現(xiàn)相比，我們的性能提升了約 100%，這使得其能夠適用于實時機器人應用。

如何運行代碼

步驟 1：導出模型

您可以使用我的腳本將 YOLOv8 模型導出為 ONNX 格式。請注意，我們使用 opset=18 以實現(xiàn)最大程度的兼容性。

Python

第 2 步：構建引擎

使用 trtexec 工具將 ONNX 模型轉換為高度優(yōu)化的 TensorRT 引擎(對于 Orin Nano 來說，建議使用 FP16 精度)。

Bash

第 3 步：編譯并運行

導航至 C++ 項目目錄，并使用 CMake 進行構建。

Bash

未來工作

雖然當前的系統(tǒng)運行著 YOLOv8 沒有出現(xiàn)任何問題，但解決 YOLOv26 的導出問題將是接下來的工作重點。我計劃：

?檢查自定義的 ONNX 導出腳本，以強制包含 v26 版本中的 TopK 層。

?將這個感知模塊整合到一個 ROS 2 節(jié)點中，用于我的 RoboCup 救援模擬項目。

?如果您對嵌入式人工智能的前沿領域感興趣，歡迎自行克隆該代碼庫并進行貢獻!

本文編譯自hackster.io

本站聲明：本文章由作者或相關機構授權發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權益，請及時聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅動方式相比，共陰恒流驅動在能效有哪些優(yōu)勢

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字：驅動電源

[電源]

工業(yè)電機驅動電源設計：反電動勢抑制與過流保護的集成方案

在工業(yè)自動化蓬勃發(fā)展的當下，工業(yè)電機作為核心動力設備，其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié)，集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字：工業(yè)電機驅動電源

[電源]

如何解決 LED 驅動電源的易損壞問題

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而，在實際應用中，LED 驅動電源易損壞的問題卻十分常見，不僅增加了維護成本，還影響了用戶體驗。要解決這一問題，需從設計、生...

關鍵字：驅動電源照明系統(tǒng) 散熱

[電力電工電路]

LED設計中LED驅動電源的公式

根據(jù)LED驅動電源的公式，電感內(nèi)電流波動大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字： LED 設計驅動電源

[汽車電子]

EV主驅IGBT隔離驅動電源方案選擇問題探討

電動汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件，其性能直接影響到電動汽車的動力性能和...

關鍵字：電動汽車新能源驅動電源

[電源]

合理的驅動電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設中，街道及停車場照明作為基礎設施的重要組成部分，其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步，高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關鍵字：發(fā)光二極管驅動電源 LED

[消費電子]

AC-DC電源轉換拓撲結構設計

LED通用照明設計工程師會遇到許多挑戰(zhàn)，如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字： LED 驅動電源功率因數(shù)校正

[電源]

針對于LED照明驅動電源技術中的電磁干擾其中的三大硬件問題措施

在LED照明技術日益普及的今天，LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作，還可能對周圍電子設備造成不利影響，甚至引發(fā)系統(tǒng)故障。因此，采取有效的硬件措施來解決L...

關鍵字： LED照明技術電磁干擾驅動電源

[電源]

LED驅動電源的核心部分“開關管”和“變換器”設計技巧

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字： LED 驅動電源開關電源

[電源]

最全LED驅動電源及散熱設計方案介紹

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器，通常情況下：LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字： LED 隧道燈驅動電源

如何實現(xiàn) YOLO 模型的實時性能

與傳統(tǒng)的驅動方式相比，共陰恒流驅動在能效有哪些優(yōu)勢

工業(yè)電機驅動電源設計：反電動勢抑制與過流保護的集成方案

如何解決 LED 驅動電源的易損壞問題

LED設計中LED驅動電源的公式

EV主驅IGBT隔離驅動電源方案選擇問題探討

合理的驅動電源方案成為大功率區(qū)域照明的主流選擇

AC-DC電源轉換拓撲結構設計

針對于LED照明驅動電源技術中的電磁干擾其中的三大硬件問題措施

LED驅動電源的核心部分“開關管”和“變換器”設計技巧

最全LED驅動電源及散熱設計方案介紹

常用的LED驅動電源有哪些？工作原理是什么？

LED驅動電源的類型可分為有哪些？

解散全部員工！深圳又一電子大廠宣布停產(chǎn)結業(yè)

崧盛股份：大功率LED驅動電源行業(yè)門檻高，新進入者面臨三大壁壘

關于LED驅動電源的分類以及特點解析，你了解嗎？

你知道常見的LED驅動電源種類以及它們有哪些特點嗎？

關于LED驅動電源特點以及在設計時需要注意的關鍵點

多路 LED 驅動電源技術的開發(fā)與可靠性研究分析

值得大家學習的LED驅動電源的特點以及工作原理概述

Cree宣布徹底告別LED和照明行業(yè)