日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 通信技術 > 通信技術
[導讀]在人臉識別中,高維、小樣本是一個問題。對此,提出了一種基于Gabor小波與徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡的人臉識別方法。首先對人臉進行Gabor濾波,選取有效的Gabor組合。進行小波分解,獲取低頻圖像,構造特征矢量,采用主分量分析降低特征維數(shù)。接著,提出了一種聚類方法用于確定RBF神經(jīng)網(wǎng)絡的結(jié)構和初值,采用混合學習法訓練RBF神經(jīng)網(wǎng)絡。用ORL人臉庫進行試驗,結(jié)果表明本文提出的方法具有優(yōu)秀的學習效率和識別效果。

1 引言
   
人臉識別是人類最杰出的認知能力之一,讓汁算機具有人的智能,使它可以象人類一樣辨認人,一直是眾多計算機科學工作者追求的目標。人臉識別作為一種應用前景十分廣泛的身份鑒別方法,是模式識別領域極富挑戰(zhàn)性的一個熱點研究問題。
    人臉圖像由于受光照、表情以及姿態(tài)等因素的影響,同一個人的臉像矩陣差異也比較大,人臉識別所選取的特征必須對上述因素具備一定的穩(wěn)定性和不變性。Gabor小波是Gabor變換與小波理論相結(jié)合的產(chǎn)物,它繼承了小波變換的多分辨率特性,同時具有GaborN數(shù)本身所具有的局域性和方向性。VD Malsburg小組最先將Gabor小波引入人臉識別領域,應用Gabor小波與彈性圖匹配技術相結(jié)合取得了良好的識別效果。Gabor小波核函數(shù)具有與哺育動物大腦皮層簡單細胞的二維反射區(qū)相同的特性,即具有較強的空間位置和方向選擇性,并且能夠捕捉對應于空間和頻率的局部結(jié)構信息;Gabor濾波器對于圖像的亮度和對比度變化以及人臉姿態(tài)變化具有較強的健壯性,并且它表達的是對人臉識別最為有用的局部特征。
    提高神經(jīng)網(wǎng)絡的泛化能力問題是RBF網(wǎng)絡的一個重要研究方向。目前,提高網(wǎng)絡泛化能力的研究主要集中在如何選取恰當?shù)木W(wǎng)絡規(guī)模,即網(wǎng)絡結(jié)構設計問題上。關于RBFN絡結(jié)構設計,一個公認的指導原則是Moody準則,即:在沒有其它先驗知識的情況下,與給定樣本一致的規(guī)模最小的網(wǎng)絡就是最好的選擇。
    本文充分利用人臉特征矢量的相對分布信息,提出了一種新的聚類初始化方法,能使RBFN絡逼近于Moody準則下的最優(yōu)結(jié)構,從而保證該網(wǎng)絡具有較好的泛化能力。由于在隱層參數(shù)固定的條件下,線性方程組的最小二乘解就是全局最優(yōu)解,所以本文采用混合學習算法:由線性最小二乘法計算隱層和輸出層之間的連接權值,由梯度下降法調(diào)整隱層神經(jīng)元的中心和寬度。這種方法與單純采用梯度下降法相比,學習速度更快,而且可以避免局部極小值問題。同時提出了一種有效的學習速率估算方法,使得RBF網(wǎng)絡的整個學習過程具備自適應能力。

2 基于Gabor小波的人臉特征提取
2.1 構造Gabor小波

    Gabor小波核函數(shù)定義如下:

   
    上式表示一個經(jīng)過高斯包絡調(diào)制過的正弦波,其中控制高斯窗口的寬度以及正弦波的波長,φ控制整個濾波器的方向,改變φ可以對濾波器進行旋轉(zhuǎn),σ為高斯窗的寬度與正弦波的波長之比。ψk經(jīng)過平移、旋轉(zhuǎn)和尺度變化形成一個自相似的函數(shù)族,即Gabor濾波器組。
    對于數(shù)字圖像,需要把參數(shù)k的模||k||和方向參數(shù)φ進行離散化,通常在5個對數(shù)空間頻率v∈{0…,4}8個方向μ∈{0,…,7}上采樣。針對人臉圖像本文通過實驗確定在2個空問頻率v∈{1,2}和8個方向μ∈{0,…,7}上進行采樣,形成16個Gabor濾波器。
2.2 人臉圖像Gabor濾波
   
將人臉灰度圖像插值為128×128(記為I),再分別與各個Gabor濾波器進行卷積,得到人臉圖像的Gabor小波表示:
   
    稱Oμ,v(z)為Gabor人臉,其中z=(x,y)為相對于頻譜中心的相對坐標值。通過二維快速傅立葉變換,將時域卷積變換為頻域乘積運算以提高計算速度。
2.3 小波分解降維
   
每幅Gabor人臉圖像Oμ,v(z)都是與I(z)同樣大小的復數(shù)矩陣,取其幅值系數(shù)作為特征。通過參數(shù)μ,v的變化,Oμ,v(z)表達不同頻率和方向的人臉特征信息,將一幅人臉的全部Gabor特征組成矢量,則人臉的原始特征數(shù)據(jù)高達262144維,后續(xù)處理非常困難。ChenKiun Liu分別取采樣因子ρ=4,16,64進行下采樣處理,所得識別結(jié)果相差很小,所以采樣法最低可以得到4096維。而小波變換是一種常用的圖像壓縮方法,與采樣法相比具有能量和信息損失小的優(yōu)點。Harmon指出16×16的圖像對于人臉識別是最基本的。因而,本文對Gabor人臉進行3次小波分解,將其低頻近似圖按行連接起來組成列矢量,并將全部列矢量依次連接起來,即為一幅人臉的低維Gabor特征列矢量。
2.4 主分量分析
   
設n為訓練樣本數(shù)目,Xi表示第i幅人臉圖像的L維Gabor特征列矢量,則訓練樣本集的總體散布矩陣表示為:
   
式中為樣本均值。由于St為實對稱矩陣(L×L),可將St化成對角形的特征值,P為正交變換矩陣,且特征值均非負值,令λ1≥λ2≥…λL≥0,λl對應的正交歸一化特征向量為ul,則u1,u2,…,uL可以構成RL空間的一組標準正交基,在該正交特征空間中,人臉樣本Xi可以表示為:
   
    選用前r(r<<L)個較大特征值對應的特征向量作為正交基底(主分量),將Xi向該正交空間的子空間投影則有:

   
得到Pi=xi(1),xi(2),…,xi(r)為一組坐標系數(shù),代表了Xi在新特征子空間中的位置,可將r維投影系數(shù)Pi作為人臉特征矢量輸入分類器進行識別。

3 基于RBF神經(jīng)網(wǎng)絡的分類器設計
    RBF神經(jīng)網(wǎng)絡的結(jié)構如圖1所示,它是一種三層前向網(wǎng)絡,其中r、u和s分別為輸入層、隱層和輸出層的節(jié)點數(shù)。

為隱層第k個神經(jīng)元的中心,則隱層節(jié)點k的輸出為:
式中||·||表示歐氏范數(shù)。當RBF選用高斯核函數(shù)時,其輸出為:

   
式中σk為隱層第k個神經(jīng)元的寬度。輸出層第j個節(jié)點的輸出值yj為:

   
式中W(j,k)為隱層節(jié)點k到第j個輸出節(jié)點的連接權值。
3.1 RBF網(wǎng)絡初始化
    RBF神經(jīng)網(wǎng)絡可看作是從特征子空間到類的映射,因此輸入層的節(jié)點數(shù)與輸入特征矢量的維數(shù)r相等,輸出層的節(jié)點數(shù)就是待分類樣本的類別數(shù)。隱層節(jié)點的選取是一個開放的問題,在理想情況下,隱層節(jié)點數(shù)取得最小值為樣本類別數(shù)。每個人最多對應2~3個隱層節(jié)點,隱層聚類的初始化過程如下:
    1)先假設每人收斂于一個聚類中心,將隱層節(jié)點數(shù)初始化為輸出層節(jié)點數(shù)。
    2)隱層第k個神經(jīng)元的中心Ck為k類特征矢量的均值。
    3)計算k類各個樣本到中心Ck的距離,以最遠點Pk(f)到中心的距離作為σk的初值。
    4)計算各個聚類中心j到聚類中心k的距離:
   
其中,最小距離為:
   

    根據(jù)dmin(k,l)與dk,dl的關系,可將k類分為如下幾種情況:
    a)若dk+dl≤dmin(k,l),則k類與其它類沒有重疊,如圖2(a)所示;
    b)若dk+dl>dmin(k,l),則k類與其它類相交。進一步分為兩種情況:
    i)dk一dl<dmin(k,l),如圖2(b)所示;
    ii)dk一dl≥dmin(k,l),如圖2(c)所示,表示k類包含其它類,可能導致RBF神經(jīng)網(wǎng)絡分類錯誤。
    5)對每類樣本,依次按照以下兩個規(guī)則進行判別并細分:
    i)包含規(guī)則:若dk+dl>dmin(k,l)且dk一dl≥dmin(k,l),則k類包含其它類,必須將k類細分為兩個聚類;
    ii)正確歸類規(guī)則:若k類包含其它類樣本的個數(shù)大于1,必須將k類細分為兩個聚類。
    完成上述步驟之后,每人最多對應于3個隱層節(jié)點,整個RBF網(wǎng)絡的結(jié)構隨之確定。

3.2 RBF網(wǎng)絡混合學習算法
    網(wǎng)絡學習就是通過調(diào)整連接權W(j,k)、隱層中心Ck和寬度σk,以減小輸出誤差。隱層參數(shù)Ck、σk的調(diào)整是非線性過程,學習速度較慢;而W(j,k)調(diào)整是線性過程,學習速度較快。因此,RBF網(wǎng)絡的每一次訓練分為兩個層次進行。
3.2.1 連接權調(diào)整
   
設輸出目標矩陣T∈Rsxn,其元素t(j,i)為0或為1,表示Pi是否屬于j類,T每列有、且僅有一個元素為l,表示Pi所屬類別。定義誤差函數(shù)為:

   
y(j,i)表示Pi在輸出層j節(jié)點的輸出yj(Pi),可通過線性最小二乘法求解最佳權值W*。
3.2.2 隱層中心及寬度調(diào)整
    W固定,由(11)式采用梯度下降法,經(jīng)推導可得Ck和σk的迭代計算公式為:

   

其中梯度矢量為:

   
式中η1、η2分別為隱層中心Ck和寬度σk的學習速率(η1,η2>O),m為迭代次數(shù)。
    σk的學習速率通常大于Ck的學習速率(選取η2=2η1)。但ηl或η2的選取一般只能通過試驗分析確定。為此,本文從(13)式出發(fā),提出了學習速率η2的估算方法。設σk(0)為高斯寬度的初值,經(jīng)推導可得η2的估算公式如下:

   
式中a為常數(shù)項,用于控制學習速率大小。實驗表明a=0.01可以較好的滿足條件。


4 實驗結(jié)果

    試驗選用0RL人臉數(shù)據(jù)庫,共包括40個人的臉部圖像,其中每人lO幅具有豐富的面部表情和姿態(tài)變化。在未對ORL人臉進行任何預處理的條件下,選取每人的前5幅圖像共200幅進行訓練,另外200幅用于識別。然后將訓練與識別圖像相互交換,再次進行實驗,識別正確率取兩次試驗結(jié)果的均值。表1、表2、圖4和表3“任選5幅”部分的實驗都是基于上述方法。為了便于比較,對于表3的1至4行的識別率是從相應參考文獻上引用過來,第5行即本文方法是作者根據(jù)本文提出的算法進行實驗的結(jié)果,其中對于“任選3幅”是指第一次選取每人的前3幅圖像共120幅進行訓練,余下280幅用于識別,第二次再選取每人的后3幅圖像共120幅進行訓練,余下280幅用于識別,識別率取兩次結(jié)果的平均;“任選5幅(1幅側(cè)面)”是指每人參與訓練的樣本都含1幅側(cè)面的圖像,其它與“任選5幅”的相同。
    首先對第二個類別細分判別規(guī)則進行了驗證。表l列出了設置不同判別規(guī)則,兩次試驗所得RBF網(wǎng)絡的隱層節(jié)點個數(shù)以及識別錯誤的圖像數(shù)目。
    表1可以看出,“正確歸類規(guī)則”的設置比較合理,改變規(guī)則或者各個聚類不作細分,識別成功率較低。而且按照本文的聚類初始化方法,所得RBF網(wǎng)絡的隱層節(jié)點數(shù)目很少。40個人的訓練樣本,只有少數(shù)幾個人的特征矢量需要進行類別細分。所以,本文的初始化方法得到的網(wǎng)絡結(jié)構非常簡單,網(wǎng)絡的學習訓練和分類識別具有較高的效率,并具備優(yōu)異的泛化能力。

    從表1還能看出,采用前五幅圖像和后五幅圖像進行訓練,后者識別成功率明顯高于前者。其中兩幅識別錯誤的人臉以及相應的訓練樣本,如圖3所示。

    圖3中每行最后一幅為識別錯誤圖像,前五幅為訓練圖像??梢钥闯?,前五幅人臉之間的姿態(tài)變化較小,而測試人臉的姿態(tài)與訓練樣本差別較大。若采用前五幅圖像訓練將會使得RBF網(wǎng)絡隱層神經(jīng)元的聚類寬度偏小,造成這幾個測試樣本與本屬同類的隱層聚類中心相對距離較遠,神經(jīng)元激活程度不夠,從而導致分類識別錯誤。當采用不同姿態(tài)的人臉訓練時,同類樣本問的差異可以使得RBF網(wǎng)絡的學習更加充分,有利于正確地分類識別。
    通過實驗,8個方向的濾波器若忽略其中任何一個方向,識別正確率都明顯下降,說明對于多姿態(tài)人臉來說,各個方向的人臉Gabor特征都不可缺少。若使用全部40個濾波器運算量又太大,同時也不能獲得更好的結(jié)果。限于篇幅,表2列出了全8個方向與部分頻率組合的實驗結(jié)果比較,從表2可以看出選取空間頻率v∈{1,2}或v∈{0,1,2}均能獲得最佳識別結(jié)果,故本文在2個空間頻率v∈{l,2}和8個方向μ∈{0,…,7}上進行采樣,形成16個Gabor濾波器。

    圖4表示對Gabor人臉采用小波分解和采樣法進行降維處理的識別結(jié)果。由圖4可知,小波分解方法明顯優(yōu)于采樣法,本文特征提取方法的最佳維數(shù)在140維左右。

    由表3可知,同樣采用基于RBF神經(jīng)網(wǎng)絡的分類器:與方法l相比,基于Gabor小波的特征提取方法優(yōu)于主分量分析(PCA)與Fisher線性鑒別變換(FLD)的組合;方法2采用高階偽澤爾尼克不變矩表征人臉,需要運用橢圓模型對人臉進行精確的尺度校正和分割。方法3采用5個頻率的40個Gabor濾波器,本文選用2個頻率的16個濾波器,在識別速度和占用內(nèi)存等方面具有顯著優(yōu)勢。方法4采用自組織稀疏RAM的N—tuple神經(jīng)網(wǎng)絡分類器,對于小樣本具有較好的泛化逼近能力,本文算法在相同試驗條件下具有不相上下的識別率。

5 結(jié)論
    實驗表明Gabor小波對于人臉位置、圖像亮度變化具備較好的適應能力,在基于二維圖像的人臉識別方法中具有一定的優(yōu)越性。同時,也注意到前人研究成果主要針對128×128的人臉圖像,進一步的研究工作可以根據(jù)Gabor小波的構造原理,選取適用于較低分辨率圖像(如64x64)的濾波器參數(shù)。由于濾波處理的計算復雜度為O(d2),人臉識別速度可以提高4倍,則有望滿足實時識別要求。
    RBF神經(jīng)網(wǎng)絡具有結(jié)構簡單、非線性逼近能力強、收斂速度快以及全局收斂等顯著優(yōu)點。本文采用的RBF神經(jīng)網(wǎng)絡初始化方法,充分利用了人臉特征矢量的相對分布信息,聚類初始化過程簡單、快速,同時可以保證RBF神經(jīng)網(wǎng)絡結(jié)構極其簡單,具有較好的泛化能力。本文提出的學習速率估算方法具有普遍性,使得RBF網(wǎng)絡無需先驗參數(shù)、具備自適應能力。而且神經(jīng)網(wǎng)絡是以并行方式處理信息,采用硬件實現(xiàn)能夠達到較高速度,所以該研究成果具有廣泛意義。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險積極籌備個人養(yǎng)老金的產(chǎn)品設計和系統(tǒng)開發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動商業(yè)養(yǎng)老保險、個人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險等產(chǎn)品供給。 搭養(yǎng)老政策東風 ...

關鍵字: 溫度 BSP 東風 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎單元,承載著生存與活動的最基本功能。而對于理想空間的解構意義卻在物理性容器之外,體現(xiàn)出人們對于空間和生活深層關系的思考,同時也塑造著人與空間的新型連接...

關鍵字: 溫度 BSP 智能化 進程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績預告。今年前三季度,公司預計實現(xiàn)營業(yè)收入7.54億元至8.33億元,同比增長60.24%至77.03%;歸母凈利潤預計為1.73億...

關鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟和信息化局發(fā)布2022年度第一批北京市市級企業(yè)技術中心創(chuàng)建名單的通知,諾誠健華正式獲得"北京市企業(yè)技術中心"認定。 北京市企業(yè)技...

關鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國軟件定義存儲及超融合市場研究報告》,報告顯示:2022年上半年浪潮超融合銷售額同比增長59.4%,近5倍于...

關鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團成立60周年的紀念日。趁著首都銀行集團成立60周年與首都銀行(中國)在華深耕經(jīng)營12年的“大日子”,圍繞作為外資金融機構對在華戰(zhàn)略的構想和業(yè)...

關鍵字: 數(shù)字化 BSP 供應鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團公司上海通運國際物流有限公司(Nipp...

關鍵字: 溫控 精密儀器 半導體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國進出口商品交易會("廣交會")于"云端"開幕。本屆廣交會上高新技術企業(yè)云集,展出的智能產(chǎn)品超過140,...

關鍵字: 中國智造 BSP 手機 CAN

大到城市建筑群“燈光秀”、車站樞紐應急預警,小至社區(qū)卡口人臉識別、交通路口出行規(guī)劃,這些城市運行中的方方面面都可以被“智慧大腦”悉數(shù)掌握。北京青年報記者在近日舉行的豐臺區(qū)“遇見豐臺·發(fā)現(xiàn)京彩”豐臺企業(yè)創(chuàng)新成果專場發(fā)布會上...

關鍵字: 智慧城市 人臉識別 CAE+AI

要問機器人公司哪家強,波士頓動力絕對是其中的佼佼者。近來年該公司在機器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機器人會后空翻,自主爬樓梯等。這不,波士頓動力又發(fā)布了其機器人組團跳男團舞的新視頻,表演的機器人包括...

關鍵字: 機器人 BSP 工業(yè)機器人 現(xiàn)代汽車

通信技術

120685 篇文章

關注

發(fā)布文章

編輯精選

技術子站

關閉