經(jīng)過圖像采集環(huán)節(jié)得到的原始數(shù)字圖像,往往存在各種“瑕疵”,就像人類肉眼看到的模糊畫面、強(qiáng)光下的光斑、傾斜的視角一樣,這些瑕疵會(huì)干擾機(jī)器的識(shí)別與分析,導(dǎo)致后續(xù)特征提取不準(zhǔn)確、識(shí)別率下降。因此,圖像預(yù)處理環(huán)節(jié)的核心作用,就是對(duì)原始圖像進(jìn)行“凈化”與“優(yōu)化”,去除噪聲、修正失真、統(tǒng)一標(biāo)準(zhǔn),讓圖像更符合機(jī)器算法的處理需求,相當(dāng)于為后續(xù)技術(shù)處理“掃清障礙”,這也是整個(gè)技術(shù)鏈路中不可或缺的“優(yōu)化環(huán)節(jié)”。
圖像預(yù)處理并非單一操作,而是一套組合式的技術(shù)流程,根據(jù)原始圖像的瑕疵類型,針對(duì)性地開展處理,核心操作主要包括四大類,每一類操作都有明確的目標(biāo)和常用方法,具體拆解如下:
其一,噪聲去除。原始圖像中往往存在隨機(jī)的“雜點(diǎn)”(即噪聲),比如監(jiān)控?cái)z像頭在夜間采集到的圖像上的雪花點(diǎn)、工業(yè)相機(jī)采集到的圖像上的灰塵雜點(diǎn)、光線干擾產(chǎn)生的光斑雜點(diǎn)等。這些噪聲會(huì)破壞圖像的細(xì)節(jié)信息,干擾機(jī)器對(duì)特征的捕捉,因此噪聲去除是預(yù)處理的首要任務(wù)。常用的去噪方法主要有高斯濾波、中值濾波、雙邊濾波等,各自適用不同的噪聲類型:高斯濾波主要用于去除高斯噪聲(如光線均勻干擾產(chǎn)生的雜點(diǎn)),原理是通過加權(quán)平均的方式,用周邊像素的灰度值替換噪聲像素,讓圖像變得平滑,同時(shí)保留圖像輪廓;中值濾波主要用于去除椒鹽噪聲(如雪花點(diǎn)、灰塵雜點(diǎn)),原理是取像素鄰域內(nèi)的中值替換當(dāng)前像素,能有效去除孤立雜點(diǎn),避免圖像模糊;雙邊濾波則兼顧去噪與保邊,在去除噪聲的同時(shí),能更好地保留物體的邊緣細(xì)節(jié),適用于需要精準(zhǔn)提取邊緣的場(chǎng)景(如醫(yī)療影像、工業(yè)質(zhì)檢)。
其二,圖像增強(qiáng)。當(dāng)采集到的原始圖像亮度不足、對(duì)比度太低、細(xì)節(jié)模糊時(shí),機(jī)器很難捕捉到有效的視覺信息,此時(shí)需要通過圖像增強(qiáng)技術(shù),提升圖像的視覺質(zhì)量和可識(shí)別性。圖像增強(qiáng)的核心是“突出有用信息、抑制無用信息”,常用方法主要有直方圖均衡化、亮度/對(duì)比度調(diào)整、伽馬校正等:直方圖均衡化通過調(diào)整圖像的灰度分布,讓圖像的亮部與暗部對(duì)比更明顯,適用于昏暗環(huán)境下采集的圖像;亮度/對(duì)比度調(diào)整則直接調(diào)節(jié)圖像的整體亮度和像素灰度差,讓圖像細(xì)節(jié)更清晰,就像我們調(diào)節(jié)手機(jī)照片的亮度、對(duì)比度一樣;伽馬校正主要用于修正圖像的亮度失真,解決因光線反射、鏡頭感光偏差導(dǎo)致的圖像偏亮或偏暗問題,廣泛應(yīng)用于戶外監(jiān)控、衛(wèi)星影像等場(chǎng)景。
其三,幾何校正。由于采集角度、設(shè)備擺放位置、鏡頭畸變等原因,原始圖像可能會(huì)出現(xiàn)傾斜、拉伸、畸變等幾何失真問題——比如從側(cè)面拍攝的正方形,在圖像中會(huì)呈現(xiàn)出梯形;鏡頭魚眼效應(yīng)導(dǎo)致的圖像邊緣拉伸變形;設(shè)備擺放傾斜導(dǎo)致的圖像整體傾斜等。幾何失真會(huì)導(dǎo)致機(jī)器誤判物體的實(shí)際大小、形狀和位置,因此需要通過幾何校正技術(shù),修正這些失真,讓圖像恢復(fù)真實(shí)的幾何形態(tài)。常用的幾何校正方法包括圖像旋轉(zhuǎn)、平移、縮放、畸變校正等:對(duì)于傾斜的圖像,通過旋轉(zhuǎn)算法調(diào)整圖像角度,使其水平或垂直;對(duì)于鏡頭畸變,通過標(biāo)定鏡頭參數(shù),利用畸變校正算法修正圖像邊緣的拉伸變形;對(duì)于不同尺寸的圖像,通過縮放算法統(tǒng)一圖像比例,為后續(xù)處理提供統(tǒng)一標(biāo)準(zhǔn)。
其四,圖像歸一化。在實(shí)際應(yīng)用中,不同采集設(shè)備、不同場(chǎng)景下采集到的圖像,往往存在尺寸、像素格式、灰度標(biāo)準(zhǔn)不一致的問題——比如有的圖像是1080P分辨率,有的是720P分辨率;有的圖像是RGB彩色格式,有的是灰度格式;有的圖像灰度范圍是0-255,有的是0-1023。這種不一致會(huì)給后續(xù)的算法處理(如特征提取、模型訓(xùn)練)帶來麻煩,導(dǎo)致算法無法統(tǒng)一識(shí)別。圖像歸一化的核心作用,就是將所有預(yù)處理后的圖像,統(tǒng)一調(diào)整為相同的尺寸、相同的像素格式、相同的灰度標(biāo)準(zhǔn),確保后續(xù)技術(shù)處理的統(tǒng)一性。比如,將所有圖像統(tǒng)一縮放至640×480像素,統(tǒng)一轉(zhuǎn)換為灰度格式,統(tǒng)一將灰度范圍調(diào)整為0-255,相當(dāng)于將所有“原材料”加工成統(tǒng)一規(guī)格,方便后續(xù)“加工處理”。
經(jīng)過上述預(yù)處理操作后,原始圖像的噪聲被去除、細(xì)節(jié)被增強(qiáng)、幾何失真被修正、標(biāo)準(zhǔn)被統(tǒng)一,已經(jīng)具備了后續(xù)特征提取的條件。可以說,圖像預(yù)處理環(huán)節(jié)的優(yōu)化程度,直接影響著整個(gè)計(jì)算機(jī)視覺系統(tǒng)的識(shí)別準(zhǔn)確率和處理效率,是連接圖像采集與特征提取的“關(guān)鍵橋梁”。