O 引言
計算機人臉識別是模式識別和人工智能領域的一個前沿課題,有著十分廣泛的應用前景。人臉自動識別系統主要包括人臉檢測和定位,人臉特征的提取和識別兩個主要部分。
數學形態(tài)學是一種基于集合論的非線性理論,是格理論在空間結構上的應用,其基本思想是基于像素間的邏輯關系而非代數關系。這種處理方式有利于對圖像的幾何描述,不同于其它基于代數的線性圖像處理理論,具有不模糊圖像邊界及細節(jié)的特點,是一種用于圖像處理的新理論和新方法。
1 膚色區(qū)域檢測
一般情況下圖像是以RGB形式存放的,但是RGB表示方法不適合于皮膚模型。在RGB空問,三基色(r,g,b)不僅代表了顏色,還表示了亮度。由于周圍環(huán)境光照的改變,亮度可能使人臉的檢測變的更加復雜,在皮膚的分割過程中是不可靠的。為了利用膚色在色度空間的聚類性,需要把顏色表達式中的色度信息與亮度信息分開。將RGB轉換為色度與亮度分開的色彩表達空間就可以達到這個目的。在實驗中選用YCbCr空間經行膚色區(qū)域檢測。Cb和Cr分量分別表示藍色和紅色的色度,這兩種色度在光照改變時是穩(wěn)定的,Y代表容易被改變的亮度信息。該顏色空間可以從RGB格式線性變換得到,轉換公式為
亞洲人和歐美人的人臉膚色的色調一般介于紅和黃之間。為了確定人臉膚色在各個顏色分量上具有較強代表性的取值范圍,Douglas Chai在實驗中選取臉上除去眼睛、嘴唇、等區(qū)域,并且選取分別在不同光照、環(huán)境、分辨率下得到的人臉,最終得到的膚色分布范圍如圖(1)所示在左邊的Cb圖中,可以看出膚色信息集中分布在橫坐標[112,133]內;右邊的Cr圖中,膚色信息集中分布在[140,175]內,所以可以得到人臉膚色的判斷公式:
在我們的研究中使用這個門限進行膚色分割,從而得到人臉區(qū)域的二值化圖像。
2 膚色區(qū)域處理
2.1 數學形態(tài)學基本定義
數學形態(tài)學中二值圖像的形態(tài)變換是針對集合的處理,其形態(tài)學算子的實質是表達物體或形態(tài)的集合與結構元素間的相互作用,因此結構元素的形態(tài)就決定了這種運算所提前的信號的形狀信息,形態(tài)學圖像處理是在圖像中移動一個結構元素,然后將結構元素與二值圖像進行交、并等集合運算,其基本的形態(tài)運算是腐蝕(erodeoperator)和膨脹(flilate)。令B(x)代表結構元素,對工作空間E中的每一點,腐蝕和膨脹的定義分別為:
腐蝕具有使目標縮小、目標內孔增大,以及外部孤立噪聲消除的效果;膨脹是將圖像中與目標物體接觸的所有背景點合并到物體中的過程,結果是使目標增大、空洞縮小,可填補目標中的空洞,使其形成連通域。
在數學形態(tài)學圖像處理中,除了腐蝕和膨脹這兩種基本運算外,還有兩種非常重要的運算方法,即開運算和閉運算,其定義如下:[!--empirenews.page--]
2.4 眼睛和嘴唇的檢測
由以上工作,我們確定了人臉的位置,這為我們下一步人眼和嘴唇的檢測縮小了范圍。
本文從形態(tài)學的角度進行眼睛和嘴唇的檢測。設人臉區(qū)域為A,構造一個半徑為r的圓盤形結構元素B。用結構元素B對人臉區(qū)域A做閉運算
[!--empirenews.page--]
經實驗證明,圓盤結構元素的半徑r取值為8或9達到最佳效果。檢測出的眼睛和嘴唇的效果如圖(4)和圖(5)由上圖我們可以看出,結構元素B對人臉區(qū)域A做閉運算后,人臉區(qū)域保持完整,而且人眼和嘴唇也被保存了下來,接下來我們可以通過找白色小區(qū)域中心的方法來定位眼睛和嘴唇。
3 分析與結論
本方法實驗照片來自互聯網和數碼相機所拍攝照片,部分實驗檢測結果如圖(6)所示。
本文算法利用YCbCr顏色空間進行膚色區(qū)域分割,分割的膚色區(qū)域簡潔、獨立性好,減少了背景的干擾,又利用數學形態(tài)學平滑了邊界以利于人臉區(qū)域的提??;在對人眼和嘴的檢測中,充分利于了數學形態(tài)學模板大小和形狀的靈活定義和計算快速的特點,加快了檢測速度,提高了檢測的準確性,節(jié)約了時間。結果表明,本文的算法對正面人臉、具有一定旋轉角度的人臉和復雜背景下的人臉都可以進行精確的識別和檢測。