作者姓名消歧方法研究與應(yīng)用
發(fā)布時間:2024-02-18 18:43
信息化水平的不斷提高加速了圖書館的數(shù)字化建設(shè),數(shù)字圖書館極大地便捷了人們的學習和工作。然而,數(shù)字圖書館的高速發(fā)展也帶來了數(shù)據(jù)碎片化的問題,導致數(shù)據(jù)質(zhì)量低、可用性差。作者姓名歧義是數(shù)字圖書館存在的典型問題之一,該問題是指多個不同的作者共享同一姓名,其嚴重影響著數(shù)字圖書館的內(nèi)容質(zhì)量和服務(wù)體驗。作者姓名消歧旨在識別擁有相同姓名的不同作者及其各自發(fā)表的文章。由于數(shù)據(jù)的海量性、低質(zhì)性和相依性,作者姓名消歧任務(wù)面臨著巨大的挑戰(zhàn)。目前主流的方法存在特征表達能力不足、引入低質(zhì)關(guān)系等問題,因此,作者姓名消歧任務(wù)的性能還有很大的上升空間。為此,本文從提高特征表達能力和降低低質(zhì)關(guān)系的影響出發(fā),研究作者姓名消歧方法,主要貢獻如下:·提出基于多類型特征融合的作者姓名消歧方法。為解決目前主流方法中特征表達能力不足、未消歧的合作者引入了低質(zhì)關(guān)系的局限,本文提出了多類型特征融合的作者姓名消歧方法CMFAD,充分挖掘文章的隱式和顯式特征。首先,CMFAD設(shè)計了融合多類型特征的分類模型來預(yù)測兩篇文章屬于同一作者的概率,特征包括:基于注意力機制的孿生Bi LSTM網(wǎng)絡(luò)挖掘的標題隱式特征和融入全局數(shù)據(jù)信息的圖嵌入方法挖掘的合...
【文章頁數(shù)】:95 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景
1.2 研究內(nèi)容與主要貢獻
1.2.1 基于多類型特征融合的作者姓名消歧方法
1.2.2 基于增量模式的無監(jiān)督作者姓名消歧方法
1.2.3 基于標簽數(shù)據(jù)的作者姓名消歧優(yōu)化方法
1.3 組織結(jié)構(gòu)
第二章 研究現(xiàn)狀
2.1 基于監(jiān)督學習的作者姓名消歧方法
2.1.1 基于顯式特征的作者姓名消歧方法
2.1.2 基于隱式特征的作者姓名消歧方法
2.1.3 基于多類型特征的作者姓名消歧方法
2.2 基于無監(jiān)督學習的作者姓名消歧方法
2.2.1 基于自上而下方式的作者姓名消歧方法
2.2.2 基于自下而上方式的作者姓名消歧方法
第三章 基于多類型特征融合的作者姓名消歧方法
3.1 問題定義
3.2 方法架構(gòu)及詳解
3.2.1 整體架構(gòu)
3.2.2 標題隱式特征
3.2.3 合作關(guān)系隱式特征
3.2.4 顯式特征
3.2.5 推理機制
3.3 實驗分析
3.3.1 實驗設(shè)置
3.3.2 性能比較
3.3.3 各部分特征作用分析
3.3.4 推理機制有效性分析
3.3.5 可擴展性分析
3.3.6 分類模型收斂性分析
3.3.7 超參數(shù)分析
3.4 本章小結(jié)
第四章 基于增量模式的無監(jiān)督作者姓名消歧方法
4.1 問題定義
4.2 方法架構(gòu)及詳解
4.2.1 整體架構(gòu)
4.2.2 穩(wěn)定合作網(wǎng)絡(luò)構(gòu)建
4.2.3 全局合作網(wǎng)絡(luò)構(gòu)建
4.3 實驗分析
4.3.1 實驗設(shè)置
4.3.2 性能比較
4.3.3 各階段作用分析
4.3.4 可擴展性分析
4.3.5 增量模式分析
4.3.6 相似度函數(shù)合理性分析
4.4 本章小結(jié)
第五章 基于標簽數(shù)據(jù)的作者姓名消歧優(yōu)化方法
5.1 問題發(fā)現(xiàn)
5.2 優(yōu)化方案設(shè)計
5.2.1 基于高精度規(guī)則的預(yù)篩選方案
5.2.2 基于標簽數(shù)據(jù)的預(yù)篩選方案
5.3 實驗分析
5.3.1 實驗設(shè)置
5.3.2 性能比較
5.3.3 預(yù)篩選方案作用分析
5.3.4 可擴展性分析
5.4 本章小結(jié)
第六章 總結(jié)與展望
參考文獻
致謝
攻讀碩士學位期間發(fā)表論文、參與科研和獲得榮譽情況
本文編號:3902353
【文章頁數(shù)】:95 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景
1.2 研究內(nèi)容與主要貢獻
1.2.1 基于多類型特征融合的作者姓名消歧方法
1.2.2 基于增量模式的無監(jiān)督作者姓名消歧方法
1.2.3 基于標簽數(shù)據(jù)的作者姓名消歧優(yōu)化方法
1.3 組織結(jié)構(gòu)
第二章 研究現(xiàn)狀
2.1 基于監(jiān)督學習的作者姓名消歧方法
2.1.1 基于顯式特征的作者姓名消歧方法
2.1.2 基于隱式特征的作者姓名消歧方法
2.1.3 基于多類型特征的作者姓名消歧方法
2.2 基于無監(jiān)督學習的作者姓名消歧方法
2.2.1 基于自上而下方式的作者姓名消歧方法
2.2.2 基于自下而上方式的作者姓名消歧方法
第三章 基于多類型特征融合的作者姓名消歧方法
3.1 問題定義
3.2 方法架構(gòu)及詳解
3.2.1 整體架構(gòu)
3.2.2 標題隱式特征
3.2.3 合作關(guān)系隱式特征
3.2.4 顯式特征
3.2.5 推理機制
3.3 實驗分析
3.3.1 實驗設(shè)置
3.3.2 性能比較
3.3.3 各部分特征作用分析
3.3.4 推理機制有效性分析
3.3.5 可擴展性分析
3.3.6 分類模型收斂性分析
3.3.7 超參數(shù)分析
3.4 本章小結(jié)
第四章 基于增量模式的無監(jiān)督作者姓名消歧方法
4.1 問題定義
4.2 方法架構(gòu)及詳解
4.2.1 整體架構(gòu)
4.2.2 穩(wěn)定合作網(wǎng)絡(luò)構(gòu)建
4.2.3 全局合作網(wǎng)絡(luò)構(gòu)建
4.3 實驗分析
4.3.1 實驗設(shè)置
4.3.2 性能比較
4.3.3 各階段作用分析
4.3.4 可擴展性分析
4.3.5 增量模式分析
4.3.6 相似度函數(shù)合理性分析
4.4 本章小結(jié)
第五章 基于標簽數(shù)據(jù)的作者姓名消歧優(yōu)化方法
5.1 問題發(fā)現(xiàn)
5.2 優(yōu)化方案設(shè)計
5.2.1 基于高精度規(guī)則的預(yù)篩選方案
5.2.2 基于標簽數(shù)據(jù)的預(yù)篩選方案
5.3 實驗分析
5.3.1 實驗設(shè)置
5.3.2 性能比較
5.3.3 預(yù)篩選方案作用分析
5.3.4 可擴展性分析
5.4 本章小結(jié)
第六章 總結(jié)與展望
參考文獻
致謝
攻讀碩士學位期間發(fā)表論文、參與科研和獲得榮譽情況
本文編號:3902353
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/3902353.html
最近更新
教材專著