隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像分類、目標(biāo)檢測(cè)等領(lǐng)域取得了顯著成果。然而,CNN的高計(jì)算復(fù)雜度對(duì)硬件平臺(tái)提出了嚴(yán)峻挑戰(zhàn)。針對(duì)這一問(wèn)題,本文提出了一種基于指令驅(qū)動(dòng)的通用CNN加速器架構(gòu),通過(guò)模塊化設(shè)計(jì)實(shí)現(xiàn)了高效能、可擴(kuò)展的硬件解決方案。