基于深度卷積神經網絡的甲骨文字識別研究
發(fā)布時間:2024-06-08 04:30
甲骨文是中國迄今為止發(fā)現的最早的成熟文字系統,是漢字的來源,也是中國優(yōu)秀傳統文化的根源。現在甲骨文的研究已經進入信息時代,2019年在安陽市舉行的紀念甲骨文發(fā)現120周年國際學術研討會的開幕式上,甲骨文大數據平臺——“殷契文淵”正式發(fā)布。該平臺是甲骨文知識共享平臺,對全世界的學者免費開放。由于目前甲骨文資源大多是圖片,不利于該平臺的數據進行輸入、存儲、檢索、傳輸等,所以作為該數據平臺研究團隊中的一員,對甲骨文字進行識別研究工作愈加重要。本文主要研究拓片上甲骨文字的識別,文字識別的傳統方法主要是基于“數據預處理+人工特征提取+分類識別”框架,對印刷體文字的識別率較高,而對于手寫體的識別率并不高。甲骨文是殷商時期的手寫體文字,異形體較多,數據樣本少,并且拓片上的甲骨文還有背景噪聲,所以識別有一定的難度。近幾年,基于深度學習的脫機手寫文字識別技術得到充足的發(fā)展,深度神經網絡具有極強的圖像多層次特征提取能力,能夠描述文字圖像不同級別的數據特征。因此,本文利用深度神經網絡進行甲骨文字識別研究,設計具有較好識別能力的深度卷積神經網絡甲骨文字識別框架。實驗結果證明該模型能夠較好地表達甲骨文字特征,達...
【文章頁數】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內外研究現狀
1.3 本文主要工作
1.4 論文組織結構
2 相關技術
2.1 神經網絡
2.1.1 神經元模型
2.1.2 感知機
2.1.3 BP算法
2.2 卷積神經網絡
2.2.1 CNN基本結構
2.2.2 經典卷積神經網絡模型
2.3 本章小結
3 甲骨文字數據集
3.1 獲取數據圖像
3.2 數據預處理
3.2.1 數據增強
3.2.2 圖像去噪
3.2.3 數據歸一化
3.3 本章小結
4 基于深度卷積神經網絡的甲骨文字識別
4.1 甲骨文字識別網絡概述
4.2 OBI-CNN網絡模型
4.3 OBI-CNN損失函數與梯度優(yōu)化選擇
4.3.1 損失函數
4.3.2 梯度優(yōu)化算法
4.4 模型訓練
4.4.1 深度學習框架
4.4.2 實驗環(huán)境
4.4.3 訓練過程
4.5 本章小結
5 性能評估與系統開發(fā)
5.1 評估指標
5.2 性能評估
5.3 甲骨文字識別系統的設計與實現
5.3.1 系統開發(fā)環(huán)境
5.3.2 系統總體框架
5.3.3 前端界面及運行測試
5.4 本章小結
6 總結與展望
6.1 論文總結
6.2 研究展望
參考文獻
個人簡歷、在學期間發(fā)表的學術論文與研究成果
致謝
本文編號:3991454
【文章頁數】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內外研究現狀
1.3 本文主要工作
1.4 論文組織結構
2 相關技術
2.1 神經網絡
2.1.1 神經元模型
2.1.2 感知機
2.1.3 BP算法
2.2 卷積神經網絡
2.2.1 CNN基本結構
2.2.2 經典卷積神經網絡模型
2.3 本章小結
3 甲骨文字數據集
3.1 獲取數據圖像
3.2 數據預處理
3.2.1 數據增強
3.2.2 圖像去噪
3.2.3 數據歸一化
3.3 本章小結
4 基于深度卷積神經網絡的甲骨文字識別
4.1 甲骨文字識別網絡概述
4.2 OBI-CNN網絡模型
4.3 OBI-CNN損失函數與梯度優(yōu)化選擇
4.3.1 損失函數
4.3.2 梯度優(yōu)化算法
4.4 模型訓練
4.4.1 深度學習框架
4.4.2 實驗環(huán)境
4.4.3 訓練過程
4.5 本章小結
5 性能評估與系統開發(fā)
5.1 評估指標
5.2 性能評估
5.3 甲骨文字識別系統的設計與實現
5.3.1 系統開發(fā)環(huán)境
5.3.2 系統總體框架
5.3.3 前端界面及運行測試
5.4 本章小結
6 總結與展望
6.1 論文總結
6.2 研究展望
參考文獻
個人簡歷、在學期間發(fā)表的學術論文與研究成果
致謝
本文編號:3991454
本文鏈接:http://www.lk138.cn/shekelunwen/kgx/3991454.html