OCR技術(shù)在審計現(xiàn)場中的應(yīng)用研究
發(fā)布時間:2021-01-30 13:08
電網(wǎng)企業(yè)目前的計算機(jī)審計工作主要基于數(shù)據(jù)庫中的電子數(shù)據(jù)進(jìn)行分析,而從審計經(jīng)驗(yàn)看,被審計單位的各類紙質(zhì)文件中往往隱藏著大量的審計線索和疑點(diǎn),如何充分利用相關(guān)數(shù)據(jù)是本課題的核心;诖,本文首先要解決的問題就把相關(guān)紙質(zhì)文件轉(zhuǎn)化成計算機(jī)能夠識別的文字,這需要企業(yè)利用掃描儀將相關(guān)文件掃描成圖片;其次,本文研究了OCR圖片識別技術(shù),將掃描后的圖片文件進(jìn)行OCR處理,并抽取成文字文檔,為相關(guān)文檔的深度挖掘和利用奠定基礎(chǔ)。
【文章來源】:中國管理信息化. 2020,23(16)
【文章頁數(shù)】:3 頁
【部分圖文】:
財務(wù)報表識別步驟
影響識別準(zhǔn)確率的技術(shù)瓶頸是文字檢測和文本識別,而這兩部分也是OCR技術(shù)的重中之重。在傳統(tǒng)OCR技術(shù)中,圖像預(yù)處理指針對存在圖像的成像、內(nèi)容等問題進(jìn)行修正。常見的預(yù)處理過程包括:幾何變換(透視、扭曲、旋轉(zhuǎn)等)、畸變校正、去除模糊、圖像增強(qiáng)和光線校正等。文字檢測即檢測文本的所在位置和范圍及其內(nèi)容和布局。一般包括文字版面分析和內(nèi)容文字行檢測等。文字檢測主要解決的問題是哪里出現(xiàn)文字、文字的范圍涵蓋有多大等。文本識別是在文本預(yù)檢測和行檢測的基礎(chǔ)上,對文本內(nèi)容進(jìn)行識別,將圖像中的文本信息轉(zhuǎn)化為文本信息。文字識別主要解決的問題是每個文字是什么。識別出的文本通常需要再次核對以保證其正確性。其中,當(dāng)識別的內(nèi)容是由詞庫中的詞匯組成時,可以稱為詞典識別(Lexicon-based),反之稱為無詞典識別(Lexicon-free)。(1)圖像預(yù)處理
【參考文獻(xiàn)】:
期刊論文
[1]推進(jìn)內(nèi)部審計整改工作的思考[J]. 袁芳. 財會學(xué)習(xí). 2017(15)
[2]淺談OCR技術(shù)的發(fā)展和應(yīng)用[J]. 王文華. 福建電腦. 2012(06)
碩士論文
[1]基于Tesseract光學(xué)字符辨識應(yīng)用的設(shè)計與實(shí)現(xiàn)[D]. 張揚(yáng).西安電子科技大學(xué) 2013
本文編號:3008956
【文章來源】:中國管理信息化. 2020,23(16)
【文章頁數(shù)】:3 頁
【部分圖文】:
財務(wù)報表識別步驟
影響識別準(zhǔn)確率的技術(shù)瓶頸是文字檢測和文本識別,而這兩部分也是OCR技術(shù)的重中之重。在傳統(tǒng)OCR技術(shù)中,圖像預(yù)處理指針對存在圖像的成像、內(nèi)容等問題進(jìn)行修正。常見的預(yù)處理過程包括:幾何變換(透視、扭曲、旋轉(zhuǎn)等)、畸變校正、去除模糊、圖像增強(qiáng)和光線校正等。文字檢測即檢測文本的所在位置和范圍及其內(nèi)容和布局。一般包括文字版面分析和內(nèi)容文字行檢測等。文字檢測主要解決的問題是哪里出現(xiàn)文字、文字的范圍涵蓋有多大等。文本識別是在文本預(yù)檢測和行檢測的基礎(chǔ)上,對文本內(nèi)容進(jìn)行識別,將圖像中的文本信息轉(zhuǎn)化為文本信息。文字識別主要解決的問題是每個文字是什么。識別出的文本通常需要再次核對以保證其正確性。其中,當(dāng)識別的內(nèi)容是由詞庫中的詞匯組成時,可以稱為詞典識別(Lexicon-based),反之稱為無詞典識別(Lexicon-free)。(1)圖像預(yù)處理
【參考文獻(xiàn)】:
期刊論文
[1]推進(jìn)內(nèi)部審計整改工作的思考[J]. 袁芳. 財會學(xué)習(xí). 2017(15)
[2]淺談OCR技術(shù)的發(fā)展和應(yīng)用[J]. 王文華. 福建電腦. 2012(06)
碩士論文
[1]基于Tesseract光學(xué)字符辨識應(yīng)用的設(shè)計與實(shí)現(xiàn)[D]. 張揚(yáng).西安電子科技大學(xué) 2013
本文編號:3008956
本文鏈接:http://www.lk138.cn/jingjilunwen/sjlw/3008956.html
最近更新
教材專著