中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

OCR技術(shù)研究進(jìn)展及前瞻

發(fā)布時(shí)間:2014-07-30 10:35

  1、概述

  OCR (Optical Character Recognition),即光學(xué)字符識(shí)別,是指 電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過(guò)檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程即對(duì)文本資料進(jìn)行掃描,然后對(duì)圖像文件進(jìn)行分析處理,獲取文字及版面信息的過(guò)程。

  隨著計(jì)算機(jī)網(wǎng)絡(luò)飛速發(fā)展信息電子化已經(jīng)成為個(gè)時(shí)代必然趨勢(shì)。文字作為信息中最重要、最集中的載體,其電子化進(jìn)程顯得尤為重要。而OCR技術(shù)則是文字電子化過(guò)程中最重要的環(huán)節(jié),它改變了傳統(tǒng)的紙質(zhì)介質(zhì)資料輸入的概念。比如,通過(guò)OCR技術(shù).用戶(hù)可以將通過(guò)攝像機(jī)、掃描儀等光學(xué)輸入方式得到的報(bào)刊‘書(shū)籍、文稿、表格等印刷品的圖像信息轉(zhuǎn)化為可以供計(jì)算機(jī)識(shí)別和處理的文本信息。因此與傳統(tǒng)的手工錄入方式相比OCR技術(shù)大大提高了人們進(jìn)行資料存儲(chǔ).檢索.加工的效率。目前市場(chǎng)上符合銀行、證券、保險(xiǎn).稅務(wù)、公安.海關(guān)、機(jī)場(chǎng)、工商、軍隊(duì)及其它行業(yè)應(yīng)用的OCR產(chǎn)品已經(jīng)相對(duì)成熟,它們已經(jīng)通過(guò)市場(chǎng)檢驗(yàn)并被廣大用戶(hù)大規(guī)模使用11-4J。

  2、OCR技術(shù)的起源及發(fā)展

  OCR的起源最早追溯到1929年德國(guó)的科學(xué)家Taushcck獲得了 光學(xué)字符識(shí)別技術(shù)專(zhuān)利間,但是對(duì)于當(dāng)時(shí)的科技發(fā)展情況而言,一切僅僅是個(gè)設(shè)想『直到計(jì)算機(jī)的誕生才使得這種設(shè)想成為現(xiàn)實(shí)。經(jīng)過(guò)近百年的發(fā)展OCR已經(jīng)成為當(dāng)今模式識(shí)別領(lǐng)域中最活躍的分支之一。它綜合了數(shù)字圖像處理、計(jì)算機(jī)圖形學(xué)及人工智能等多方面的理論知識(shí)并在計(jì)算機(jī)及其相關(guān)領(lǐng)域中得到了相當(dāng)廣泛的應(yīng)用。近幾年來(lái),它同語(yǔ)音識(shí)別、行為識(shí)到等一起曰益成為人們研究及關(guān)注的焦點(diǎn)。

  在二十世紀(jì)六七十年代,世界各國(guó)就已經(jīng)展開(kāi)了光學(xué)字符識(shí)別研究,如我們的鄰國(guó)日本,在六十年代中期就有了郵政編碼識(shí)別系統(tǒng)的產(chǎn)品問(wèn)世,該系統(tǒng)能夠識(shí)別郵件上的郵政編碼,幫助郵局進(jìn)行區(qū)域分信作業(yè),這也使得郵政編碼一直沿用至今,6,隨后,經(jīng)過(guò)科研學(xué)者的努力,日本的三洋,筆耕論文,富士,理光,松下等知名公司也相繼有字符識(shí)§lIJ系統(tǒng)的產(chǎn)品面世。

  我國(guó)的光學(xué)字符識(shí)別研究相對(duì)國(guó)外起步較晚!但是發(fā)展十分迅速。從早期簡(jiǎn)單的單體識(shí)別發(fā)展到多種字體混合排列的多體識(shí)別,從中文印刷材料的識(shí)別發(fā)展到中英文混排印刷材料的雙語(yǔ)言識(shí)別,目前各個(gè)系統(tǒng)都可以支持筒、繁體漢字的識(shí)別,也有同時(shí)支持中,英,韓等多國(guó)文字的識(shí)別系統(tǒng),它們解決了多體多字號(hào)混排文本的識(shí)別問(wèn)題,對(duì)于簡(jiǎn)單的版面可以進(jìn)行效的定量分析,同時(shí)漢字識(shí)別率已經(jīng)可以達(dá)到98%以上。

  推薦閱讀:《計(jì)算機(jī)研究與發(fā)展》

  3、OCR技術(shù)的應(yīng)用

  國(guó)外的OCR技術(shù)應(yīng)用相對(duì)成熟,包括IBM、Motor口怡、HP和Microsoft等世界型大公司都陸續(xù)展開(kāi)了這方面的研究,在他們的產(chǎn) 品中綁定OCR技術(shù)。光符識(shí)別設(shè)備把報(bào)紙、雜志和其它印刷材料上的印刷字符讀取到計(jì)算機(jī)內(nèi)存。OCR軟件可以和任何流行的操作系統(tǒng)一起使用。除了識(shí)別印刷字符之外OCR也可能識(shí)別欄目布局,這種布局會(huì)在報(bào)紙中出現(xiàn)。例如,微軟公司最新推出的辦公套件一一州icrosoft Office XP中不僅加強(qiáng)了原有對(duì)手寫(xiě)輸入的支持,還新增加了光學(xué)字符識(shí)別(OCR)的工具組件。字符識(shí)別產(chǎn)品的廣泛應(yīng)用推動(dòng)了模式識(shí)別等相關(guān)理論的發(fā)展,促進(jìn)了計(jì)算機(jī)應(yīng)用的普及。2008竿, Google也宣布它將開(kāi)始在網(wǎng)絡(luò)蜘蛛中使用OCR技術(shù),這樣就可以識(shí)別許多非格式化文本和圖像并將其索引到數(shù)據(jù)庫(kù)。

  如今OCR技術(shù)在我國(guó)的應(yīng)用也極為廣泛,可以說(shuō)有漢字的地方就有OCR技術(shù)應(yīng)用的存在。在信息技術(shù)及計(jì)算機(jī)技術(shù)日益普及的今天,如何將文字方便、快捷地輸入到計(jì)算機(jī)中已經(jīng)成為影響人機(jī)接口效率的一個(gè)重要難題,也關(guān)系到計(jì)算機(jī)是否能夠真正在我國(guó)得到普及和應(yīng)用。

  漢字輸入主要分為人工鍵盤(pán)輸入和機(jī)器自動(dòng)識(shí)別輸入兩種c其中人工鍵入速度慢而且勞動(dòng)強(qiáng)度大,自動(dòng)輸入又分為漢字識(shí)別輸入及語(yǔ)音識(shí)別輸入。從識(shí)另IJ技術(shù)的難度來(lái)說(shuō),手寫(xiě)體識(shí)別的難度高于印刷體識(shí)別,而在手寫(xiě)體識(shí)別中,脫機(jī)手寫(xiě)體的難度又遠(yuǎn)遠(yuǎn)超過(guò)聯(lián)機(jī)手寫(xiě)體識(shí)別。歪IJ目前為止,除了脫機(jī)手寫(xiě)體數(shù)字的識(shí)別已有實(shí)際應(yīng)用外,漢字等文字的脫機(jī)手寫(xiě)體識(shí)別還處在實(shí)驗(yàn)室階段。簡(jiǎn)單來(lái)說(shuō),從影像到結(jié)果輸出,須經(jīng)過(guò)影像輸入、影像前處理、文字特征抽取、~t對(duì)識(shí)別、最后經(jīng)人工校正將認(rèn)錯(cuò)的文字更正,將結(jié)果輸出等環(huán)節(jié)的過(guò)程。

  隨著我國(guó)信息化建設(shè)全面普及OCR技術(shù)的應(yīng)用前景將更加地廣闊。就目前從行業(yè)需求來(lái)看,金融、保險(xiǎn)、稅務(wù)、工商‘電子商務(wù)等行業(yè)對(duì)信息識(shí)別的需求已經(jīng)越來(lái)越廣泛,促進(jìn)了識(shí)別技術(shù)的大規(guī)模應(yīng)用。而個(gè)人消費(fèi)者對(duì)資料電子化、手寫(xiě)識(shí)別技術(shù)等各方面需求則拓展了OCR識(shí)另IJ技術(shù)在這一領(lǐng)域的應(yīng)用之路,另一方面,網(wǎng)絡(luò)時(shí)代的高速發(fā)展使個(gè)人資料電子化、商務(wù)辦公自動(dòng)化等需求的呼聲也變得越來(lái)越高。

 



本文編號(hào):6149

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/qitalunwen/6149.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)04a72***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com