王曉光,王 群
(北京理工大學(xué)電子工程系 北京 100081)
摘 要:支持向量機(SVM)是20世紀90年代初由Vapnik等人提出的一類(lèi)新型機器學(xué)習方法,此方法能夠在訓練樣本很少的情況下達到很好的分類(lèi)推廣能力。本文應用SVM算法對車(chē)牌中的漢字字符進(jìn)行識別,無(wú)字符特征提取提高了識別速度,并且可得到較高的識別率。實(shí)驗討論了SVM算法用于字符識別時(shí),不同的核函數對識別率的影響。實(shí)驗結果表明,用SVM算法進(jìn)行車(chē)牌字符識別具有較高的識別率。
關(guān)鍵詞:支持矢量機(SVM);車(chē)牌字符識別;最優(yōu)分類(lèi)面;核函數
車(chē)牌自動(dòng)識別技術(shù)是智能交通系統的一個(gè)重要的領(lǐng)域。車(chē)牌字符識別的準確性和識別速度直接關(guān)系到該技術(shù)是否能夠得到實(shí)際應用。傳統的字符識別方法,如模板匹配、神經(jīng)網(wǎng)絡(luò )等,在進(jìn)行車(chē)牌字符識別時(shí)其識別率很大程度上依賴(lài)于訓練樣本的數量,且在無(wú)特征提取的情況下,識別的正確率相對較低。
支持矢量機(SupportVector Machines,SVM)是由Vapnik等人于1995年提出的一類(lèi)新型機器學(xué)習方法,能夠較好的解決小樣本、非線(xiàn)性及高維數等模式識別問(wèn)題。近年來(lái)SVM已在臉像識別[1]、函數逼近以及概率密度估計等眾多領(lǐng)域[2]得到了廣泛的應用。利用該方法進(jìn)行車(chē)牌漢字識別,在訓練樣本相對較少且無(wú)字符特征提取的情況下,仍可得到較高的識別率。
1 支持矢量機基本原理[3]
SVM是統計學(xué)習理論中最年輕的部分,主要用于解決有限樣本情況下的模式識別問(wèn)題。
1.1 線(xiàn)性可分情況
SVM方法是從線(xiàn)性可分情況下的最優(yōu)分類(lèi)面(OptimalHyperplane)提出的。所謂最優(yōu)分類(lèi)面就是要求 分類(lèi)線(xiàn)不但能將兩類(lèi)樣本無(wú)錯誤的分開(kāi),而且要使兩類(lèi)之間的距離最大。
設線(xiàn)性可分樣本集為(xi,yi),i=1,2,…,n,x∈Rd,y∈{+1,-1}是類(lèi)別標號。d維空間中線(xiàn)性判別函數的一般形式為:g(x)=w.x+b,分類(lèi)面方程為:
將判別函數進(jìn)行歸一化,使兩類(lèi)所有樣本都滿(mǎn)足|g(x)|≥1,即使離分類(lèi)面最近的樣本的|g(x)|=1,這樣分類(lèi)間隔就等于2/‖w‖,因此間隔最大等價(jià)于使‖w‖(或‖w‖2)最??;而要求分類(lèi)線(xiàn)對所有樣本正確分類(lèi),就是要求其滿(mǎn)足:
因此,滿(mǎn)足上述條件且使‖w‖2最小的分類(lèi)面就是最優(yōu)分類(lèi)面。過(guò)兩類(lèi)樣本中離分類(lèi)面最近的點(diǎn)且平行于最優(yōu)分類(lèi)面的超平面上的訓練樣本就是使式(2)中等號成立的那些樣本,他們叫做支持向量(SupportVectors)。
根據上面的討論,最優(yōu)分類(lèi)面問(wèn)題可以表示成如下的約束優(yōu)化問(wèn)題,即在式(2)的約束下,求函數:
的最小值。這是一個(gè)二次規劃問(wèn)題,可定義以下的Lagrange函數:
其中:ai>0為L(cháng)agrange系數。求式(3)的極小值就是對w和b求L氏函數的極小值。求L對w和b的偏微分并令他 們等于0,可轉化為對偶問(wèn)題:
顯然,只有支持向量的系數ai不為0,即只有支持向量影響最終的劃分結果。于是w可表示為:
其中:sgn()為符號函數,b*是分類(lèi)的閾值,可以由任意一個(gè)支持向量用式(7)求得,或通過(guò)2類(lèi)中任意一對支持向量取中值求得。對于給定的未知樣本x,只需計算sgn(wx+b),即可判定x所屬的分類(lèi)。
1.2 線(xiàn)性不可分情況
對于線(xiàn)性不可分的樣本,希望使誤分類(lèi)的點(diǎn)數最小,為此在式(2)中引入松弛變量ξi≥0:
取極小值的w,b,這一優(yōu)化問(wèn)題同樣需要變換為用拉格朗日乘子表示的對偶問(wèn)題,變換的過(guò)程與前面線(xiàn)性可分樣本的對偶問(wèn)題類(lèi)似,結果也幾乎完全相同,只是約束條件略有變化:
其中:C是實(shí)現選定的,他反映了在復雜性和不可分樣本所占比例之間的折中。
1.3 支持向量機
如果用內積K(x,x′)代替最優(yōu)分類(lèi)面中的點(diǎn)積,就相當于把原特征空間變換到了某一新的特征空間,此時(shí)優(yōu)化函數變?yōu)椋?div style="height:15px;">