中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 科技論文 > 計算機應(yīng)用論文 >

基于深度學(xué)習(xí)的場景文字識別研究

發(fā)布時間:2024-06-29 01:34
  場景文字識別是一種通用文字識別技術(shù),近年來其已經(jīng)成為計算機領(lǐng)域重點的研究方向。傳統(tǒng)光學(xué)字符識別技術(shù)(Optical Character Recognition,OCR)在文檔圖像方面已經(jīng)取得了很好的識別效果,但卻難以應(yīng)對場景文字在字體、分布、背景等方面的復(fù)雜性。近年來深度學(xué)習(xí)技術(shù)快速發(fā)展,并且在OCR領(lǐng)域里發(fā)揮了主導(dǎo)作用,因此本文基于深度學(xué)習(xí)方法,圍繞場景文字識別問題展開研究,主要研究內(nèi)容如下:(1)提出了一種文本圖像矯正方法。針對文本行傾斜問題,提出了一種基于連通區(qū)域分析的傾斜矯正方法。該方法首先獲取輸入圖像的連通區(qū)域,然后根據(jù)字符的比例、大小等先驗知識過濾非字符連通區(qū)域,最后通過計算連通區(qū)域間的傾斜角度來估算文本行傾斜角度。實驗結(jié)果表明,所提方法能夠有效提升相同框架的識別性能。(2)設(shè)計一種序列到序列的文字識別網(wǎng)絡(luò)。在卷積循環(huán)網(wǎng)絡(luò)(Convolutional Recurrent Neural Networks,CRNN)網(wǎng)絡(luò)的基礎(chǔ)上,本文首先利用所提出的圖像矯正方法對輸入圖像進行矯正,降低問題復(fù)雜度;其次將CRNN中的卷積部分加入BN層,在提高卷積神經(jīng)網(wǎng)絡(luò)的收斂速度、降低網(wǎng)絡(luò)對初始...

【文章頁數(shù)】:56 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖1-6基于多邊形或者曲線框的任意形狀場景文本示例

圖1-6基于多邊形或者曲線框的任意形狀場景文本示例

第一章緒論圖1-6基于多邊形或者曲線框的任意形狀場景文本示例。到更好的保證,從而提高識別的結(jié)果。在過去,端到端場景文本檢測及識別的系統(tǒng)面臨著幾個主要的問題。速度太慢。早期的端到端的方法通常是將檢測與識別網(wǎng)絡(luò)簡單的堆砌在一起,使得端到端的結(jié)構(gòu)速度比較其獨立的兩個模型沒有明顯的優(yōu)勢。....


圖1場景文字示例

圖1場景文字示例

在場景文字圖像自身存在眾多外接干擾因素,比如模糊、失真、噪聲、低分辨率、不均勻的光線及部分區(qū)域的污跡涂抹等,都增加場景文字檢測與識別的難度;谏鲜鲭y點,傳統(tǒng)的圖像文字提取方法無法有效地解決場景文字的檢測和識別問題,因此國內(nèi)外研究者們嘗試研究基于深度學(xué)習(xí)的場景文字的檢測和識別技術(shù)....


圖2.2文字實例長度分布

圖2.2文字實例長度分布

?基于深度學(xué)習(xí)的場景文字檢測與識別方法研究???4000??3500??I3000??(U??^?2500??^?2000?■??I?1500?||??|||-??n?————屬.JLBI?Jl_I—麵_????I??0?250?500?750?1000?1250?1500?17....


圖2.3前50個字符類別的出現(xiàn)頻率

圖2.3前50個字符類別的出現(xiàn)頻率

?基于深度學(xué)習(xí)的場景文字檢測與識別方法研究???4000??3500??I3000??(U??^?2500??^?2000?■??I?1500?||??|||-??n?————屬.JLBI?Jl_I—麵_????I??0?250?500?750?1000?1250?1500?17....



本文編號:3996961

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/shengwushengchang/3996961.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7f0dc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com