SVM 分類器在 HOG+SVM 算法中承擔 “分類器” 角色,其核心功能是學習 HOG 特征與 “目標 / 非目標” 標簽之間的映射關系,實現(xiàn)對輸入特征的類別判斷。SVM 的核心邏輯是 “間隔最大化”—— 在高維特征空間中尋找一個最優(yōu)分類超平面,使該超平面與距離最近的正樣本(目標,如行人)和負樣本(非目標,如背景、樹木)之間的距離(即 “間隔”)最大化。這種間隔最大化的特性賦予了 SVM 兩大優(yōu)勢:一是對高維特征的適應性,HOG 特征向量通常為數(shù)千維,傳統(tǒng)分類器(如邏輯回歸)易因 “維度災難” 導致過擬合,而 SVM 通過核函數(shù)(如線性核、RBF 核)將高維特征映射到更適合分類的空間,無需直接計算高維空間中的復雜運算,在 HOG 特征的處理中表現(xiàn)出優(yōu)異的穩(wěn)定性;二是對小樣本數(shù)據(jù)的魯棒性,SVM 的分類性能僅依賴于 “支持向量”—— 即距離分類超平面最近的樣本點,這些樣本點是區(qū)分目標與非目標的關鍵,少量支持向量即可確定分類邊界,因此在訓練樣本有限的場景下,SVM 仍能保持較高的分類精度。在 HOG+SVM 的訓練過程中,首先需構建標注樣本集:正樣本為包含目標的圖像區(qū)域(如裁剪后的行人圖像),負樣本為不包含目標的圖像區(qū)域(如街道背景、建筑墻面);將所有樣本的 HOG 特征與對應標簽(正樣本為 1,負樣本為 - 1)輸入 SVM,通過梯度下降等優(yōu)化算法調(diào)整分類超平面參數(shù),直至間隔最大化;訓練完成后,SVM 即可對新輸入的 HOG 特征向量進行預測,輸出該特征對應的類別標簽,判斷其是否為目標。
HOG+SVM 算法的實現(xiàn)流程遵循 “預處理 - 特征提取 - 模型訓練 - 目標檢測” 的經(jīng)典路徑,每個環(huán)節(jié)的參數(shù)選擇與操作細節(jié)直接影響最終檢測性能。在預處理階段,除灰度化與高斯濾波外,部分場景還需進行圖像尺寸歸一化 —— 將輸入圖像(或檢測窗口)調(diào)整為固定尺寸(如行人檢測常用 64×128 像素),確保 HOG 特征向量的維度一致性,避免因目標尺寸差異導致的特征不匹配;對于存在明顯光照不均的場景,還可通過直方圖均衡化增強局部對比度,進一步提升梯度計算的準確性。特征提取階段的參數(shù)選擇需結合目標特性:細胞單元大小需平衡細節(jié)捕捉與計算效率 ——8×8 像素的細胞單元能捕捉更精細的邊緣(如行人的手指輪廓),但會增加特征維度與計算量;塊單元大小通常選擇 2×2 或 3×3 個細胞單元,確保歸一化范圍能覆蓋局部光照變化;梯度方向區(qū)間數(shù)量一般為 9 或 12,既能區(qū)分不同方向的梯度,又避免區(qū)間過多導致的統(tǒng)計稀疏性。模型訓練階段需注意樣本均衡與參數(shù)調(diào)優(yōu):若正樣本數(shù)量遠少于負樣本,易導致 SVM 偏向預測負樣本,需通過負樣本挖掘(如從初步檢測結果中篩選誤判的非目標區(qū)域作為新負樣本)平衡樣本分布;SVM 的核函數(shù)選擇需根據(jù)特征特性 ——HOG 特征具有較強的線性可分性,線性核通常能滿足需求且計算速度快,而對于復雜背景下的目標檢測(如行人與相似服飾的背景混淆),RBF 核可通過非線性映射提升分類精度,但會增加計算成本。目標檢測階段采用 “滑動窗口” 策略:以固定尺寸的窗口遍歷整幅圖像,對每個窗口提取 HOG 特征,輸入訓練好的 SVM 進行分類;為處理不同尺寸的目標,需構建多尺度窗口金字塔 —— 將圖像按不同比例縮放,在每個尺度下進行滑動窗口檢測,再通過非極大值抑制(NMS)去除重疊的檢測框,保留置信度最高的檢測結果,最終實現(xiàn)對整幅圖像中目標的定位與識別。





