首頁 > 學(xué)習(xí)園地 > 制作工藝 > 印刷體文字的識別研究方法分類介紹

印刷體文字的識別研究方法分類介紹
2012-06-11 10:56:40 作者：來源：評論：0 點擊：

　　識別方法是整個系統(tǒng)的核心。用于漢字識別的模式識別方法可以大致分為結(jié)構(gòu)模式識別、統(tǒng)計模式識別及兩者的結(jié)合。下面分別進(jìn)行介紹。

　　結(jié)構(gòu)模式識別

　　漢字是一種特殊的模式，其結(jié)構(gòu)雖然比較復(fù)雜，但具有相當(dāng)嚴(yán)格的規(guī)律性。換言之，漢字圖形含有豐富的結(jié)構(gòu)信息，可以設(shè)法提取含有這種信息的結(jié)構(gòu)特征及其組字規(guī)律，作為識別漢字的依據(jù)，這就是結(jié)構(gòu)模式識別。

　　結(jié)構(gòu)模式識別是早期漢字識別研究的主要方法。其主要出發(fā)點是漢字的組成結(jié)構(gòu)。從漢字的構(gòu)成上講，漢字是由筆劃(點橫豎撇捺等)、偏旁部首構(gòu)成的；還可以認(rèn)為漢字是由更小的結(jié)構(gòu)基元構(gòu)成的。由這些結(jié)構(gòu)基元及其相互關(guān)系完全可以精確地對漢字加以描述，就像一篇文章由單字、詞、短語和句子按語法規(guī)律所組成一樣。所以這種方法也叫句法模式識別。識別時，利用上述結(jié)構(gòu)信息及句法分析的方法進(jìn)行識別，類似一個邏輯推理器。

　　用這種方法來描述漢字字形結(jié)構(gòu)在理論上是比較恰當(dāng)?shù)模渲饕獌?yōu)點在于對字體變化的適應(yīng)性強(qiáng)，區(qū)分相似字能力強(qiáng)；但是，在實際應(yīng)用中，面臨的主要問題是抗干擾能力差，因為在實際得到的文本圖象中存在著各種干擾，如傾斜，扭曲，斷裂，粘連，紙張上的污點，對比度差等等。這些因素直接影響到結(jié)構(gòu)基元的提取，假如結(jié)構(gòu)基元不能準(zhǔn)確地得到，后面的推理過程就成了無源之水。此外結(jié)構(gòu)模式識別的描述比較復(fù)雜，匹配過程的復(fù)雜度因而也較高。所以在印刷體漢字識別領(lǐng)域中，純結(jié)構(gòu)模式識別方法已經(jīng)逐漸衰落，句法識別的方法正日益受到挑戰(zhàn)。

　　統(tǒng)計模式識別

　　統(tǒng)計決策論發(fā)展較早，理論也較成熟。其要點是提取待識別模式的的一組統(tǒng)計特征，然后按照一定準(zhǔn)則所確定的決策函數(shù)進(jìn)行分類判決。

　　漢字的統(tǒng)計模式識別是將字符點陣看作一個整體，其所用的特征是從這個整體上經(jīng)過大量的統(tǒng)計而得到的。統(tǒng)計特征的特點是抗干擾性強(qiáng)，匹配與分類的算法簡單，易于實現(xiàn)。不足之處在于細(xì)分能力較弱，區(qū)分相似字的能力差一些。常見的統(tǒng)計模式識別方法有：

　　(1) 模板匹配。模板匹配并不需要特征提取過程。字符的圖象直接作為特征，與字典中的模板相比，相似度最高的模板類即為識別結(jié)果。這種方法簡單易行，可以并行處理；但是一個模板只能識別同樣大小、同種字體的字符，對于傾斜、筆劃變粗變細(xì)均無良好的適應(yīng)能力。

　　(2)利用變換特征的方法。對字符圖象進(jìn)行二進(jìn)制變換(如Walsh, Hardama變換)或更復(fù)雜的變換(如Karhunen-Loeve, Fourier,Cosine，Slant變換等)，變換后的特征的維數(shù)大大降低。但是這些變換不是旋轉(zhuǎn)不變的，因此對于傾斜變形的字符的識別會有較大的偏差。二進(jìn)制變換的計算雖然簡單，但變換后的特征沒有明顯的物理意義。K-L變換雖然從最小均方誤差角度來說是最佳的，但是運(yùn)算量太大，難以實用。總之，變換特征的運(yùn)算復(fù)雜度較高。

　　(3)投影直方圖法。利用字符圖象在水平及垂直方向的投影作為特征。該方法對傾斜旋轉(zhuǎn)非常敏感，細(xì)分能力差。

　　(4)幾何矩(Geometric Moment)特征。M. K. Hu提出利用矩不變量作為特征的想法，引起了研究矩的熱潮。研究人員又確定了數(shù)十個移不變、比例不變的矩。我們都希望找到穩(wěn)定可靠的、對各種干擾適應(yīng)能力很強(qiáng)的特征，在幾何矩方面的研究正反映了這一愿望。以上所涉及到的幾何矩均在線性變換下保持不變。但在實際環(huán)境中，很難保證線性變換這一前提條件。

　　(5)Spline曲線近似與傅立葉描繪子(Fourier Descriptor)。兩種方法都是針對字符圖象輪廓的。Spline曲線近似是在輪廓上找到曲率大的折點，利用Spline曲線來近似相鄰折點之間的輪廓線。而傅立葉描繪子則是利用傅立葉函數(shù)模擬封閉的輪廓線，將傅立葉函數(shù)的各個系數(shù)作為特征的。前者對于旋轉(zhuǎn)很敏感。后者對于輪廓線不封閉的字符圖象不適用，因此很難用于筆劃斷裂的字符的識別。

　　(6)筆劃密度特征。筆劃密度的描述有許多種，這里采用如下定義：字符圖象某一特定范圍的筆劃密度是在該范圍內(nèi)，以固定掃描次數(shù)沿水平、垂直或?qū)蔷€方向掃描時的穿透次數(shù)。這種特征描述了漢字的各部分筆劃的疏密程度，提供了比較完整的信息。在圖象質(zhì)量可以保證的情況下，這種特征相當(dāng)穩(wěn)定。在脫機(jī)手寫體的識別中也經(jīng)常用到這種特征。但是在字符內(nèi)部筆劃粘連時誤差較大。

　　(7)外圍特征。漢字的輪廓包含了豐富的特征，即使在字符內(nèi)部筆劃粘連的情況下，輪廓部分的信息也還是比較完整的。這種特征非常適合于作為粗分類的特征。

　　(8)基于微結(jié)構(gòu)特征的方法。這種方法的出發(fā)點在于，漢字是由筆劃組成的，而筆劃是由一定方向，一定位置關(guān)系與長寬比的矩形段組成的。這些矩形段則稱為微結(jié)構(gòu)。利用微結(jié)構(gòu)及微結(jié)構(gòu)之間的關(guān)系組成的特征對漢字進(jìn)行識別，尤其是對于多體漢字的識別，獲得了良好的效果。其不足之處是，在內(nèi)部筆劃粘連時，微結(jié)構(gòu)的提取會遇到困難。

　　(9)特征點特征。早在1957年，Solatron Electronics Group公司發(fā)布了第一個利用窺視孔(peephole)方法的OCR系統(tǒng)。其主要思想是利用字符點陣中一些有代表性的黑點(筆劃)，白點(背景)作為特征來區(qū)分不同的字符。后有人又將這種方法運(yùn)用到漢字識別中，對其中的黑點又增加了屬性的描述，如端點、折點、交叉點等。也獲得了比較好的效果。其特點是對于內(nèi)部筆劃粘連的字符的識別的適應(yīng)性較強(qiáng)，直觀性好，但是不易表示為矢量形式，不適合作為粗分類的特征，匹配難度大。

　　當(dāng)然還有許多種不同的統(tǒng)計特征，諸如圖描述法、包含配選法、脫殼透視法、差筆劃法等，這里就不一一介紹了。

　　統(tǒng)計識別與結(jié)構(gòu)識別的結(jié)合

　　結(jié)構(gòu)模式識別與統(tǒng)計模式識別各有優(yōu)缺點，隨著我們對于兩種方法認(rèn)識的深入，這兩種方法正在逐漸融合。網(wǎng)格化特征就是這種結(jié)合的產(chǎn)物。字符圖象被均勻地或非均勻地劃分為若干區(qū)域，稱之為“網(wǎng)格”。在每一個網(wǎng)格內(nèi)尋找各種特征，如筆劃點與背景點的比例，交叉點、筆劃端點的個數(shù)，細(xì)化后的筆劃的長度、網(wǎng)格部分的筆劃密度等等。特征的統(tǒng)計以網(wǎng)格為單位，即使個別點的統(tǒng)計有誤差也不會造成大的影響，增強(qiáng)了特征的抗干擾性。這種方法正得到日益廣泛的應(yīng)用。

　　人工神經(jīng)網(wǎng)絡(luò)

　　人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network，以下稱ANN)是一種模擬人腦神經(jīng)元細(xì)胞的網(wǎng)絡(luò)結(jié)構(gòu)，它是由大量簡單的基本元件－神經(jīng)元相互連接成的自適應(yīng)非線性動態(tài)系統(tǒng)。雖然目前對于人腦神經(jīng)元的研究還很不完善，我們無法確定ANN的工作方式是否與人腦神經(jīng)元的運(yùn)作方式相同，但是ANN正在吸引著越來越多的注意力。

　　ANN中的各個神經(jīng)元的結(jié)構(gòu)與功能較為簡單，但大量的簡單神經(jīng)元的組合卻可以非常復(fù)雜，我們從而可以通過調(diào)整神經(jīng)元間的連接系數(shù)完成分類、識別等復(fù)雜的功能。ANN還具有一定的自適應(yīng)的學(xué)習(xí)與組織能力，組成網(wǎng)絡(luò)的各個“細(xì)胞”可以并行工作，并可以通過調(diào)整“細(xì)胞”間的連接系數(shù)完成分類、識別等復(fù)雜的功能。這是馮·諾依曼的計算機(jī)無法做到的。

　　ANN可以作為單純的分類器(不包含特征提取，選擇),也可以用作功能完善的分類器。在英文字母與數(shù)字的識別等類別數(shù)目較少的分類問題中，常常將字符的圖象點陣直接作為神經(jīng)網(wǎng)絡(luò)的輸入。不同于傳統(tǒng)的模式識別方法，在這種情況下，神經(jīng)網(wǎng)絡(luò)所“提取”的特征并無明顯的物理含義，而是儲存在神經(jīng)物理中各個神經(jīng)元的連接之中，省去了由人來決定特征提取的方法與實現(xiàn)過程。從這個意義上來說，ANN提供了一種“字符自動識別”的可能性。此外，ANN分類器是一種非線性的分類器，它可以提供我們很難想象到的復(fù)雜的類間分界面，這也為復(fù)雜分類問題的解決提供了一種可能的解決方式。

　　目前，在對于象漢字識別這樣超多類的分類問題，ANN的規(guī)模會很大，結(jié)構(gòu)也很復(fù)雜，現(xiàn)在還遠(yuǎn)未達(dá)到實用的程度。其中的原因很多，主要的原因還在于我們對人腦的工作方式以及ANN本身的許多問題還沒有找到完美的答案。

相關(guān)熱詞搜索：包裝印刷模式識別

上一篇：絲印龜裂問題的解決方法
下一篇：環(huán)境溫濕度對煙標(biāo)平整度的影響

分享到：

評論排行

·2015首屆中國國際紙箱紙板人才招聘會(4294967295)
·勵展博覽集團(tuán)倡導(dǎo)綠色包裝引領(lǐng)柔印發(fā)展(4294967295)
·彼岸視覺昌平印刷廠---e線黃頁(4294967295)
·2015中國國際保健養(yǎng)生食品展覽會(4294967295)
·瑞士歐瑞康美科公司您不可不知的裝備耐...(4294967295)
·揚(yáng)州偉鵬機(jī)械首推水性印刷模切自動清廢...(4294967295)
·網(wǎng)站編輯求職(4294967295)
·能盛放無水酒精的樹脂包裝新材料(4294967295)
·唐山佳捷2015中國國際瓦楞展新品發(fā)布(4294967295)
·藍(lán)莓包裝盒包裝設(shè)計(4294967282)
·制作包裝品時常見的材料有哪些(4294967236)
·我國包裝機(jī)械正走向國際市場(16)
·廣東省東莞市金利源包裝制品廠(15)
·義烏膠帶廠_膠帶批發(fā)_封箱膠帶_透明膠帶...(14)
·珍珠棉片材(14)
·金利源庫存PE膠袋(13)
·售樓小姐獲500萬年終獎印刷行業(yè)年終獎...(9)
·手提袋外加工(7)
·防偽包裝一體化促力酒企打假防偽(7)
·李麗麗——大專求職財務(wù) 7年工作經(jīng)驗(7)

日本精品不卡,精品综合久久久久久97超人该,久久国产精品久久国产精品,www.奇米第四色,亚洲黄色激情网,免费萌白酱国产一区二区三区

印刷體文字的識別研究方法分類介紹
2012-06-11 10:56:40 作者：來源：評論：0 點擊：

評論排行

頻道總排行

頻道本月排行

日本精品不卡,精品综合久久久久久97超人该,久久国产精品久久国产精品,www.奇米第四色,亚洲黄色激情网,免费萌白酱国产一区二区三区

印刷體文字的識別研究方法分類介紹 2012-06-11 10:56:40 作者： 來源： 評論：0 點擊：

延伸閱讀：

評論排行

頻道總排行

頻道本月排行

印刷體文字的識別研究方法分類介紹
2012-06-11 10:56:40 作者：來源：評論：0 點擊：