在深度學習興起之前(2012年AlexNet出現(xiàn)之前),計算機視覺領域的特征提取技術以傳統(tǒng)手工設計特征為主,其核心邏輯是“研究者基于專業(yè)經(jīng)驗,設計特定的特征描述子,從原始圖像中提取淺層視覺特征”,本質是“人工定義特征規(guī)則,機器執(zhí)行特征提取”。這類技術的核心優(yōu)勢是計算量小、部署門檻低,無需海量標注數(shù)據(jù)和強大的算力支撐,但其局限性也十分明顯——特征的表達能力有限,無法捕捉目標的深層語義信息,泛化能力和抗干擾能力較弱,難以適配復雜場景的應用需求。
傳統(tǒng)特征提取技術主要分為三大類:邊緣特征提取、紋理特征提取、角點與輪廓特征提取,每類技術都有其專屬的核心原理和經(jīng)典算法,以下詳細拆解各類技術的原理及應用場景。
邊緣是圖像中最基礎、最直觀的特征,是圖像中灰度值、色彩值發(fā)生劇烈變化的區(qū)域,也是區(qū)分不同目標、不同區(qū)域的重要標志——例如,人臉的五官輪廓、車輛的車身邊緣、物體與背景的分界線等,都屬于邊緣特征。邊緣特征提取的核心原理是:通過設計特定的卷積算子(濾波核),對原始圖像進行卷積運算,檢測圖像中灰度值的突變區(qū)域,從而提取出邊緣輪廓,剔除灰度值平穩(wěn)的冗余區(qū)域。
傳統(tǒng)邊緣特征提取的經(jīng)典算法主要有四種,其原理各有側重,適配不同的場景需求:
1. Sobel算子:核心原理是利用梯度計算檢測邊緣,通過設計水平和垂直兩個方向的3×3卷積算子,分別對原始圖像進行卷積運算,計算圖像在水平方向(x軸)和垂直方向(y軸)的灰度梯度值,梯度值越大,說明該區(qū)域的灰度變化越劇烈,大概率為邊緣區(qū)域;最后通過梯度幅值和梯度方向,確定邊緣的位置和走向。Sobel算子的優(yōu)勢是抗噪聲能力較強,能夠有效抑制圖像噪聲對邊緣提取的干擾,計算量小,速度快,廣泛應用于實時性要求較高的場景,如監(jiān)控圖像的邊緣檢測、工業(yè)零件的輪廓初步檢測等;局限性是提取的邊緣不夠細膩,存在一定的模糊性,難以檢測到細小花邊、細微缺陷等精細邊緣。
2. Canny算子:目前應用最廣泛的邊緣提取算法,其原理比Sobel算子更復雜,分為四個步驟:第一步,對原始圖像進行高斯濾波,利用高斯函數(shù)平滑圖像,剔除噪聲干擾,為后續(xù)邊緣檢測奠定基礎;第二步,計算圖像的梯度幅值和梯度方向,采用Sobel算子的梯度計算方法,確定邊緣的大致位置和走向;第三步,非極大值抑制,遍歷梯度圖像,剔除邊緣上的冗余像素,只保留梯度幅值最大的像素點,使邊緣變得細膩、清晰,解決Sobel算子邊緣模糊的問題;第四步,雙閾值檢測與邊緣連接,設置高閾值和低閾值,梯度幅值大于高閾值的區(qū)域確定為強邊緣,小于低閾值的區(qū)域剔除,介于兩者之間的區(qū)域若與強邊緣相連,則確定為弱邊緣并連接,最終形成完整的邊緣輪廓。Canny算子的優(yōu)勢是提取的邊緣細膩、準確,抗噪聲能力強,能夠檢測到精細邊緣,廣泛應用于醫(yī)療影像邊緣檢測(如病灶邊緣檢測)、精細零件質檢、人臉五官輪廓提取等場景;局限性是計算量比Sobel算子大,實時性略差。
3. Laplacian算子:核心原理是利用二階導數(shù)檢測邊緣,通過設計二階差分卷積算子,對原始圖像進行卷積運算,檢測圖像中灰度值的二階突變(即灰度值的拐點),從而確定邊緣位置。Laplacian算子的優(yōu)勢是對邊緣的定位精度高,能夠檢測到細微的邊緣變化,無需計算梯度方向,原理簡單;局限性是抗噪聲能力極弱,圖像中的噪聲會被放大,導致提取的邊緣出現(xiàn)大量冗余,甚至出現(xiàn)虛假邊緣,因此通常需要先對圖像進行高斯濾波,再使用Laplacian算子進行邊緣檢測,主要應用于對邊緣定位精度要求極高、噪聲干擾較小的場景,如醫(yī)學影像的細微病灶邊緣檢測、衛(wèi)星圖像的細節(jié)邊緣提取等。
4. Prewitt算子:與Sobel算子原理類似,同樣采用梯度計算檢測邊緣,設計水平和垂直兩個方向的3×3卷積算子,通過卷積運算計算圖像的梯度幅值和梯度方向,確定邊緣位置。Prewitt算子的優(yōu)勢是計算量小,速度快,對灰度漸變的邊緣檢測效果較好;局限性是抗噪聲能力比Sobel算子弱,提取的邊緣不夠細膩,主要應用于噪聲干擾較小、對實時性要求較高、對邊緣細膩度要求不高的場景,如普通圖像的輪廓提取、簡單場景的目標分割等。