疾病名稱識(shí)別和規(guī)范化
發(fā)布時(shí)間:2024-07-07 04:02
近年來(lái),隨著生物醫(yī)學(xué)實(shí)驗(yàn)方法的變革,生物醫(yī)學(xué)方面的實(shí)驗(yàn)數(shù)據(jù)和文獻(xiàn)資料呈指數(shù)級(jí)增長(zhǎng),如何從如此龐大的科學(xué)文獻(xiàn)數(shù)據(jù)中快速有效地抽取有價(jià)值的信息,是當(dāng)前亟待解決的問(wèn)題。生物醫(yī)學(xué)領(lǐng)域(如基因/蛋白質(zhì)、化學(xué)物和疾病等)的實(shí)體識(shí)別與規(guī)范化是生物醫(yī)學(xué)文本挖掘的基礎(chǔ),它對(duì)生物醫(yī)學(xué)實(shí)體關(guān)系的抽取和生物醫(yī)學(xué)知識(shí)庫(kù)的建立等方面都有著重要的研究意義。其中,疾病名稱識(shí)別與規(guī)范化是從生物醫(yī)學(xué)文獻(xiàn)資料中自動(dòng)抽取疾病名稱并且鏈接到指定疾病數(shù)據(jù)庫(kù)中。針對(duì)這一任務(wù),本文進(jìn)行了以下三個(gè)方面的研究工作:(1)基于句法和語(yǔ)義特征的疾病名稱識(shí)別。針對(duì)目前疾病名稱識(shí)別中存在的問(wèn)題,在條件隨機(jī)場(chǎng)模型的基礎(chǔ)上,提出了一系列新的句法特征和語(yǔ)義特征來(lái)獲取疾病名稱在句子中的結(jié)構(gòu)信息以及在數(shù)據(jù)庫(kù)中的語(yǔ)義信息。實(shí)驗(yàn)結(jié)果表明,本文的特征能夠在疾病實(shí)體識(shí)別任務(wù)中取得較好的結(jié)果。(2)基于深度學(xué)習(xí)的疾病名稱識(shí)別。為了緩解傳統(tǒng)機(jī)器學(xué)習(xí)中特征稀疏性問(wèn)題,本文采用了高性能的深度學(xué)習(xí)模型BiLSTM-CRF來(lái)實(shí)現(xiàn)疾病名稱識(shí)別,探討了不同的句法特征以及語(yǔ)義特征對(duì)疾病名稱識(shí)別的影響。實(shí)驗(yàn)表明,深度學(xué)習(xí)模型獲得了與當(dāng)前最高性能相當(dāng)?shù)慕Y(jié)果。(3)基于上下文信息的疾病...
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 課題研究現(xiàn)狀
1.2.1 生物醫(yī)學(xué)領(lǐng)域的疾病名稱識(shí)別
1.2.2 生物醫(yī)學(xué)領(lǐng)域的疾病名稱規(guī)范化
1.3 研究?jī)?nèi)容
1.4 文章組織結(jié)構(gòu)
第二章 相關(guān)知識(shí)方法
2.1 相關(guān)實(shí)驗(yàn)方法
2.1.1 條件隨機(jī)場(chǎng)
2.1.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.1.3 卷積神經(jīng)網(wǎng)絡(luò)
2.1.4 注意力機(jī)制
2.2 相關(guān)工具及資源
2.2.1 句法分析器
2.2.2 縮寫(xiě)識(shí)別工具
2.2.3 復(fù)合物識(shí)別工具
2.2.4 疾病詞典
2.2.5 深度學(xué)習(xí)開(kāi)源框架
第三章 基于句法和語(yǔ)義特征的疾病名稱識(shí)別
3.1 疾病名稱識(shí)別介紹
3.1.1 任務(wù)描述
3.1.2 疾病名稱識(shí)別難點(diǎn)
3.2 疾病名稱識(shí)別框架
3.3 特征提取
3.3.1 詞法特征
3.3.2 句法特征
3.3.3 語(yǔ)義特征
3.4 實(shí)驗(yàn)
3.4.1 實(shí)驗(yàn)語(yǔ)料
3.4.2 評(píng)估標(biāo)準(zhǔn)
3.4.3 語(yǔ)料預(yù)處理
3.4.4 實(shí)驗(yàn)結(jié)果
3.5 本章小結(jié)
第四章 基于深度學(xué)習(xí)的疾病名稱識(shí)別
4.1 疾病名稱識(shí)別模型
4.2 特征提取
4.2.1 詞法特征(MOR)
4.2.2 句法特征(SYN)
4.2.3 語(yǔ)義特征(SEM)
4.3 實(shí)驗(yàn)
4.3.1 參數(shù)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果
4.4 本章小結(jié)
第五章 基于上下文信息的疾病名稱規(guī)范化
5.1 疾病規(guī)范化介紹
5.1.1 任務(wù)描述
5.1.2 任務(wù)難點(diǎn)
5.2 疾病名稱規(guī)范化
5.2.1 數(shù)據(jù)預(yù)處理
5.2.2 候選集生成
5.2.3 候選集消歧
5.3 實(shí)驗(yàn)
5.3.1 實(shí)驗(yàn)語(yǔ)料
5.3.2 評(píng)估標(biāo)準(zhǔn)
5.3.3 實(shí)驗(yàn)結(jié)果
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的研究成果
致謝
本文編號(hào):4003125
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 課題研究現(xiàn)狀
1.2.1 生物醫(yī)學(xué)領(lǐng)域的疾病名稱識(shí)別
1.2.2 生物醫(yī)學(xué)領(lǐng)域的疾病名稱規(guī)范化
1.3 研究?jī)?nèi)容
1.4 文章組織結(jié)構(gòu)
第二章 相關(guān)知識(shí)方法
2.1 相關(guān)實(shí)驗(yàn)方法
2.1.1 條件隨機(jī)場(chǎng)
2.1.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.1.3 卷積神經(jīng)網(wǎng)絡(luò)
2.1.4 注意力機(jī)制
2.2 相關(guān)工具及資源
2.2.1 句法分析器
2.2.2 縮寫(xiě)識(shí)別工具
2.2.3 復(fù)合物識(shí)別工具
2.2.4 疾病詞典
2.2.5 深度學(xué)習(xí)開(kāi)源框架
第三章 基于句法和語(yǔ)義特征的疾病名稱識(shí)別
3.1 疾病名稱識(shí)別介紹
3.1.1 任務(wù)描述
3.1.2 疾病名稱識(shí)別難點(diǎn)
3.2 疾病名稱識(shí)別框架
3.3 特征提取
3.3.1 詞法特征
3.3.2 句法特征
3.3.3 語(yǔ)義特征
3.4 實(shí)驗(yàn)
3.4.1 實(shí)驗(yàn)語(yǔ)料
3.4.2 評(píng)估標(biāo)準(zhǔn)
3.4.3 語(yǔ)料預(yù)處理
3.4.4 實(shí)驗(yàn)結(jié)果
3.5 本章小結(jié)
第四章 基于深度學(xué)習(xí)的疾病名稱識(shí)別
4.1 疾病名稱識(shí)別模型
4.2 特征提取
4.2.1 詞法特征(MOR)
4.2.2 句法特征(SYN)
4.2.3 語(yǔ)義特征(SEM)
4.3 實(shí)驗(yàn)
4.3.1 參數(shù)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果
4.4 本章小結(jié)
第五章 基于上下文信息的疾病名稱規(guī)范化
5.1 疾病規(guī)范化介紹
5.1.1 任務(wù)描述
5.1.2 任務(wù)難點(diǎn)
5.2 疾病名稱規(guī)范化
5.2.1 數(shù)據(jù)預(yù)處理
5.2.2 候選集生成
5.2.3 候選集消歧
5.3 實(shí)驗(yàn)
5.3.1 實(shí)驗(yàn)語(yǔ)料
5.3.2 評(píng)估標(biāo)準(zhǔn)
5.3.3 實(shí)驗(yàn)結(jié)果
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的研究成果
致謝
本文編號(hào):4003125
本文鏈接:http://www.lk138.cn/kejilunwen/shengwushengchang/4003125.html
上一篇:三角網(wǎng)格孔洞修補(bǔ)算法研究
下一篇:沒(méi)有了
下一篇:沒(méi)有了
最近更新
教材專著