2 支持向量機(jī)簡介
支持向量機(jī)(SVM)是Vapnik及其研究小組提出的針對二類別的分類問題而提出的一種分類技術(shù),是一種新的非常有發(fā)展前景的分類技術(shù)。支持向量機(jī)的基本思想是在樣本空間或特征空間,構(gòu)造出最優(yōu)超平面使超平面與不同類樣本集之間的距離最大,從而達(dá)到最大的泛化能力,其算法的詳細(xì)敘述可參考文獻(xiàn)。
支持向量機(jī)方法根據(jù)Vapnik的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,盡量提高學(xué)習(xí)機(jī)的泛化能力,使有限少量訓(xùn)練樣本得到的決策規(guī)則對獨(dú)立的測試集仍能得到小的誤差。這樣只需有限的少量樣本參與訓(xùn)練,就可以保證訓(xùn)練產(chǎn)生的分類器具有很小的誤差。而車牌字符識別時(shí),相對于預(yù)測的樣本,只能有有限的少量樣本參與訓(xùn)練,支持向量機(jī)的方法可以使訓(xùn)練產(chǎn)生的分類器在識別車牌字符時(shí)只有小的誤差,并且大幅減少訓(xùn)練的時(shí)間。
對于數(shù)據(jù)分類問題,通用的神經(jīng)網(wǎng)絡(luò)方法的機(jī)理可以簡單地描述為:系統(tǒng)隨機(jī)產(chǎn)生一個(gè)超平面并移動(dòng)它,直到訓(xùn)練集中屬于不同類別的點(diǎn)正好位于平面的不同側(cè)面。這種處理機(jī)制決定了神經(jīng)網(wǎng)絡(luò)方法最終獲得的分割平面并不是一個(gè)最優(yōu)超平面,只是一個(gè)局部的次優(yōu)超平面。而SVM將最優(yōu)超平面的求解問題轉(zhuǎn)換為一個(gè)不等式約束下的二次函數(shù)尋優(yōu)問題,這是一個(gè)凸二次優(yōu)化問題,存在唯一解,能保證找到的極值解就是全局最優(yōu)解。
SVM通過一個(gè)非線性函數(shù)將輸入數(shù)據(jù)映射到具有高維甚至為無窮維的特征空間,并在這個(gè)高維特征空間進(jìn)行線性分類,構(gòu)造最優(yōu)分類超平面,但在求解最優(yōu)化問題和計(jì)算判別函數(shù)時(shí)并不需要顯式計(jì)算該非線性函數(shù),而只需計(jì)算核函數(shù),從而避免特征空間維數(shù)災(zāi)難問題。
車牌字符識別問題中每個(gè)樣本為一個(gè)字符圖像,每個(gè)字符圖像由許多像素組成,具有高維的特點(diǎn)。SVM通過核函數(shù)的計(jì)算,避免了神經(jīng)網(wǎng)絡(luò)解決樣本空間的高維問題帶來的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)問題,使訓(xùn)練模型與輸入數(shù)據(jù)的維數(shù)無關(guān);并且每個(gè)字符的整幅圖像作為一個(gè)樣本輸入,不需要進(jìn)行特征提取,節(jié)省了識別時(shí)間。
3 車牌字符分類器的構(gòu)造
我國標(biāo)準(zhǔn)車牌格式是:X1X2.X3X4X5X6X7,其中X1是各省、直轄市和自治區(qū)的簡稱,X2是英文字母,X3X4是英文字母或阿拉伯?dāng)?shù)字,X5X6X7是阿拉伯?dāng)?shù)字,并且對于不同的Xl,X2的取值范圍是不一樣的。X2和X3之間有一小圓點(diǎn)。
針對車牌字符的排列特征,為了提高車牌整體的識別率,可以設(shè)計(jì)4個(gè)分類器來進(jìn)行車牌字符的識別,即漢字分類器、數(shù)字分類器、英文字母分類器、數(shù)字+字母分類器。根據(jù)車牌中字符的序號,選擇對應(yīng)的分類器進(jìn)行識別,然后將識別結(jié)果按字符序號進(jìn)行組合,就得到了整個(gè)車牌的識別結(jié)果。4個(gè)分類器如圖l所示。
字符集中漢字有50多個(gè),其中31個(gè)為各省、直轄市和自治區(qū)的簡稱;英文字母全部為大寫字母,不含字母“I”,字母“o”歸為數(shù)字“0”,故英文字母集由24個(gè)大寫字母組成;數(shù)字為0~9的阿拉伯?dāng)?shù)字。
支持向量機(jī)是針對二類別的分類而提出的,但車牌字符識別是多類別的分類問題,需要將二類別分類方法擴(kuò)展到多類別分類,本文采用了一一區(qū)分法實(shí)現(xiàn)。一一區(qū)分法(one—against—one method)是分別選取2個(gè)不同類別構(gòu)成一個(gè)SVM子分類器,這樣對于k類問題,共有k(k一1)/2個(gè)SVM子分類器。在構(gòu)造類別i和類別j的SVM子分類器時(shí),在樣本數(shù)據(jù)集中選取屬于類別i和類別j的樣本數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),并將屬于類別i的數(shù)據(jù)標(biāo)記為正,將屬于類別j的數(shù)據(jù)標(biāo)記為負(fù)。測試時(shí),將測試數(shù)據(jù)對k(k一1)/2個(gè)SVM子分類器分別進(jìn)行測試,并累計(jì)各類別的得分,選擇得分最高者所對應(yīng)的類別為測試數(shù)據(jù)的類別。
4 最佳參數(shù)模型的選擇
本文從某一實(shí)際卡口系統(tǒng)采集到的768×576像素的汽車牌照圖片進(jìn)行車牌定位和字符分割后,將分割的每個(gè)車牌字符進(jìn)行二值化操作,字符筆劃對應(yīng)的像素置為l,背景像素置為0,再將每個(gè)字符歸一化到13x24像素,并根據(jù)每個(gè)字符在車牌中的位置,編上序號l~7。
本文所選汽車牌照圖片共計(jì)132張,包括晚上、逆光、字符磨損厲害、牌照傾斜和牌照旁掛其它牌子等情況;有129張圖片可以實(shí)現(xiàn)車牌正確定位,車牌定位率為97.73%;120張圖片可以實(shí)現(xiàn)所有字符正確分割,字符分割完全正確率為93.02%。
本文將每個(gè)字符作為一個(gè)樣本,每個(gè)樣本維數(shù)為312(13x24),根據(jù)其序號分成4類樣本。每類樣本分成兩部分,60%的樣本訓(xùn)練產(chǎn)生模型,另40%用于測試,核函數(shù)采用徑向基函數(shù)K(xi,x)=exp(-||x-xi||2/σ2),分別訓(xùn)練生成4類分類器,從中選擇最優(yōu)參數(shù)模型組成4類最佳分類器,用來進(jìn)行車牌字符的整體識別。
為了求解最佳的分類器參數(shù)(C,σ2),本文選擇雙線性法來求解最佳參數(shù),對每類分類器模型采用以下步驟:
第一步:根據(jù)識別正確率確定最佳參數(shù)C。首先假設(shè)C=10,取σ2=10-1,100,101,102,103,得到最高的識別正確率對應(yīng)的σ2,然后固定σ2,改變C的值,得到這時(shí)最高的識別正確率對應(yīng)的C值,作為最佳參數(shù)C。
4類分類器的最高識別正確率對應(yīng)的(C,σ2)都為(10,100),確定最佳C=10。
第二步:確定最佳參數(shù)(C,σ2)。固定最佳參數(shù)C,取σ2=l,10,100,200,300,400,500,600,700,800,900,1000,取最高識別正確率對應(yīng)的(C,σ2)為分類器模型的最佳參數(shù)。
觀察發(fā)現(xiàn),4類分類器模型在σ2的值變?yōu)?00以下時(shí),對應(yīng)的識別正確率都逐漸減??;σ2的值變?yōu)?00以上時(shí),對應(yīng)的識別正確率先增大后減小,出現(xiàn)“峰值”,取“峰值”對應(yīng)的模型參數(shù)為最佳參數(shù)。4類最佳分類器如下表1所示。
實(shí)驗(yàn)觀察分析,分類器識別時(shí)具有一定的偏向性,即參與訓(xùn)練的某類樣本數(shù)目多,預(yù)測樣本識別為該類的概率就大,如訓(xùn)練樣本中“浙”字較多,漢字分類器將預(yù)測樣本識別為“浙”的可能性較大,而實(shí)際上預(yù)測樣本中“浙”字?jǐn)?shù)目較多,這樣無形中就提高了識別正確率。
5 實(shí)驗(yàn)及結(jié)果
本文用以上4類最佳分類器的組合分類器對所有車牌字符進(jìn)行整體識別,識別結(jié)果如表2所示。
在實(shí)際運(yùn)用中,車牌字符正確數(shù)目在5個(gè)以上就能滿足要求,本文與相關(guān)文獻(xiàn)的車牌字符識別結(jié)果如表3所示。
觀察分析發(fā)現(xiàn),影響識別效果的主要原因是相似字符的誤識,如字符“D”和“0”、“B”和“8”等;還有漢字筆劃多,二值化操作易造成筆劃模糊,使?jié)h字誤識。
6 結(jié)論
本文將SVM的方法引入車牌字符識別中,在詳細(xì)分析了車牌字符的排列特征的基礎(chǔ)上,構(gòu)造了用4個(gè)不同類別的SVM字符分類器;根據(jù)車牌字符的序號分別對應(yīng)識別,再將識別結(jié)果組合,就得到了整幅車牌的號碼。
SVM方法采用核函數(shù)解決了高維樣本識別問題,不需要進(jìn)行模型網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì),并且不需進(jìn)行特征提取,只需要有限的樣本參入訓(xùn)練,節(jié)省了識別時(shí)間,這些都非常符合車牌字符識別的要求。本文采用一一區(qū)分法將SVM方法從二類別識別擴(kuò)展到了多類別識別,并取得了滿意的識別效果;但一一區(qū)分法需要保證訓(xùn)練樣本的充分性,需要所有類別的樣本都參加訓(xùn)練。
試驗(yàn)結(jié)果表明,本方法有較好的實(shí)用性,而進(jìn)一步減少相似字符和漢字誤識是本工作以后努力的方向,其關(guān)鍵是加強(qiáng)圖像的預(yù)處理,改進(jìn)字符分割方法和二值化方法,使字符筆劃更清楚。
北京2022年10月18日 /美通社/ -- 10月14日,國際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國軟件定義存儲及超融合市場研究報(bào)告》,報(bào)告顯示:2022年上半年浪潮超融合銷售額同比增長59.4%,近5倍于...
關(guān)鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心東京2022年10月18日 /美通社/ -- NIPPON EXPRESS HOLDINGS株式會社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團(tuán)公司上海通運(yùn)國際物流有限公司(Nipp...
關(guān)鍵字: 溫控 精密儀器 半導(dǎo)體制造 BSP要問機(jī)器人公司哪家強(qiáng),波士頓動(dòng)力絕對是其中的佼佼者。近來年該公司在機(jī)器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機(jī)器人會后空翻,自主爬樓梯等。這不,波士頓動(dòng)力又發(fā)布了其機(jī)器人組團(tuán)跳男團(tuán)舞的新視頻,表演的機(jī)器人包括...
關(guān)鍵字: 機(jī)器人 BSP 工業(yè)機(jī)器人 現(xiàn)代汽車