疾病名稱識別和規(guī)范化
發(fā)布時間:2024-07-07 04:02
近年來,隨著生物醫(yī)學實驗方法的變革,生物醫(yī)學方面的實驗數據和文獻資料呈指數級增長,如何從如此龐大的科學文獻數據中快速有效地抽取有價值的信息,是當前亟待解決的問題。生物醫(yī)學領域(如基因/蛋白質、化學物和疾病等)的實體識別與規(guī)范化是生物醫(yī)學文本挖掘的基礎,它對生物醫(yī)學實體關系的抽取和生物醫(yī)學知識庫的建立等方面都有著重要的研究意義。其中,疾病名稱識別與規(guī)范化是從生物醫(yī)學文獻資料中自動抽取疾病名稱并且鏈接到指定疾病數據庫中。針對這一任務,本文進行了以下三個方面的研究工作:(1)基于句法和語義特征的疾病名稱識別。針對目前疾病名稱識別中存在的問題,在條件隨機場模型的基礎上,提出了一系列新的句法特征和語義特征來獲取疾病名稱在句子中的結構信息以及在數據庫中的語義信息。實驗結果表明,本文的特征能夠在疾病實體識別任務中取得較好的結果。(2)基于深度學習的疾病名稱識別。為了緩解傳統(tǒng)機器學習中特征稀疏性問題,本文采用了高性能的深度學習模型BiLSTM-CRF來實現疾病名稱識別,探討了不同的句法特征以及語義特征對疾病名稱識別的影響。實驗表明,深度學習模型獲得了與當前最高性能相當的結果。(3)基于上下文信息的疾病...
【文章頁數】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 課題研究現狀
1.2.1 生物醫(yī)學領域的疾病名稱識別
1.2.2 生物醫(yī)學領域的疾病名稱規(guī)范化
1.3 研究內容
1.4 文章組織結構
第二章 相關知識方法
2.1 相關實驗方法
2.1.1 條件隨機場
2.1.2 循環(huán)神經網絡
2.1.3 卷積神經網絡
2.1.4 注意力機制
2.2 相關工具及資源
2.2.1 句法分析器
2.2.2 縮寫識別工具
2.2.3 復合物識別工具
2.2.4 疾病詞典
2.2.5 深度學習開源框架
第三章 基于句法和語義特征的疾病名稱識別
3.1 疾病名稱識別介紹
3.1.1 任務描述
3.1.2 疾病名稱識別難點
3.2 疾病名稱識別框架
3.3 特征提取
3.3.1 詞法特征
3.3.2 句法特征
3.3.3 語義特征
3.4 實驗
3.4.1 實驗語料
3.4.2 評估標準
3.4.3 語料預處理
3.4.4 實驗結果
3.5 本章小結
第四章 基于深度學習的疾病名稱識別
4.1 疾病名稱識別模型
4.2 特征提取
4.2.1 詞法特征(MOR)
4.2.2 句法特征(SYN)
4.2.3 語義特征(SEM)
4.3 實驗
4.3.1 參數設置
4.3.2 實驗結果
4.4 本章小結
第五章 基于上下文信息的疾病名稱規(guī)范化
5.1 疾病規(guī)范化介紹
5.1.1 任務描述
5.1.2 任務難點
5.2 疾病名稱規(guī)范化
5.2.1 數據預處理
5.2.2 候選集生成
5.2.3 候選集消歧
5.3 實驗
5.3.1 實驗語料
5.3.2 評估標準
5.3.3 實驗結果
5.4 本章小結
第六章 總結與展望
6.1 工作總結
6.2 工作展望
參考文獻
攻讀碩士學位期間的研究成果
致謝
本文編號:4003125
【文章頁數】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 課題研究現狀
1.2.1 生物醫(yī)學領域的疾病名稱識別
1.2.2 生物醫(yī)學領域的疾病名稱規(guī)范化
1.3 研究內容
1.4 文章組織結構
第二章 相關知識方法
2.1 相關實驗方法
2.1.1 條件隨機場
2.1.2 循環(huán)神經網絡
2.1.3 卷積神經網絡
2.1.4 注意力機制
2.2 相關工具及資源
2.2.1 句法分析器
2.2.2 縮寫識別工具
2.2.3 復合物識別工具
2.2.4 疾病詞典
2.2.5 深度學習開源框架
第三章 基于句法和語義特征的疾病名稱識別
3.1 疾病名稱識別介紹
3.1.1 任務描述
3.1.2 疾病名稱識別難點
3.2 疾病名稱識別框架
3.3 特征提取
3.3.1 詞法特征
3.3.2 句法特征
3.3.3 語義特征
3.4 實驗
3.4.1 實驗語料
3.4.2 評估標準
3.4.3 語料預處理
3.4.4 實驗結果
3.5 本章小結
第四章 基于深度學習的疾病名稱識別
4.1 疾病名稱識別模型
4.2 特征提取
4.2.1 詞法特征(MOR)
4.2.2 句法特征(SYN)
4.2.3 語義特征(SEM)
4.3 實驗
4.3.1 參數設置
4.3.2 實驗結果
4.4 本章小結
第五章 基于上下文信息的疾病名稱規(guī)范化
5.1 疾病規(guī)范化介紹
5.1.1 任務描述
5.1.2 任務難點
5.2 疾病名稱規(guī)范化
5.2.1 數據預處理
5.2.2 候選集生成
5.2.3 候選集消歧
5.3 實驗
5.3.1 實驗語料
5.3.2 評估標準
5.3.3 實驗結果
5.4 本章小結
第六章 總結與展望
6.1 工作總結
6.2 工作展望
參考文獻
攻讀碩士學位期間的研究成果
致謝
本文編號:4003125
本文鏈接:http://www.lk138.cn/kejilunwen/shengwushengchang/4003125.html
上一篇:三角網格孔洞修補算法研究
下一篇:沒有了
下一篇:沒有了
最近更新
教材專著