基于文檔多維度的學(xué)術(shù)文獻(xiàn)推薦研究
發(fā)布時(shí)間:2024-07-10 23:03
近年來,學(xué)術(shù)資源的爆炸性增長使得人們在海量數(shù)據(jù)中快速定位自己需要的信息變得困難。關(guān)鍵詞搜索模式雖然可以一定程度緩解信息過載的問題,但是面對海量數(shù)據(jù),關(guān)鍵詞搜索的結(jié)果依舊規(guī)模龐大,需要用戶在搜索結(jié)果中再次甄選所需文獻(xiàn)。基于用戶歷史數(shù)據(jù)的推薦系統(tǒng)能更精準(zhǔn)地獲取與用戶興趣相關(guān)的文獻(xiàn),F(xiàn)有文檔推薦系統(tǒng)通常根據(jù)文檔的內(nèi)容和領(lǐng)域相關(guān)性或者用戶間協(xié)同過濾等方式完成推薦,較少考慮到用戶的自身學(xué)術(shù)水平。這使得推薦結(jié)果雖然與用戶興趣相關(guān),但部分結(jié)果并不符合用戶的學(xué)術(shù)水平和閱讀需求,導(dǎo)致利用率較低,造成無效推薦。因此,研究針對學(xué)術(shù)型用戶的學(xué)術(shù)文獻(xiàn)推薦方法具有重要的實(shí)用價(jià)值。本文完成的主要工作及成果如下:(1)通過網(wǎng)絡(luò)爬蟲技術(shù)抓取在線學(xué)術(shù)文獻(xiàn)(2000年-2020年AAAI會(huì)議論文集和百度文庫文獻(xiàn))作為本研究的數(shù)據(jù)集。(2)依據(jù)維基百科分類詞條目錄構(gòu)建概念從屬樹,將詞匯在概念從屬樹中所處的樹深度作為該詞匯的概念抽象層次。在學(xué)術(shù)文獻(xiàn)特征提取的過程中考慮了學(xué)術(shù)文獻(xiàn)的文檔結(jié)構(gòu)特征和內(nèi)容特征,改進(jìn)了傳統(tǒng)的詞匯權(quán)重計(jì)算方法,在TF-IDF算法的基礎(chǔ)上結(jié)合了詞匯概念抽象層次和詞匯的段落權(quán)重。該種計(jì)算方法可以更加合理的提取...
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 課題研究背景
1.1.2 課題研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容及成果
1.4 本文組織結(jié)構(gòu)
第二章 推薦系統(tǒng)基礎(chǔ)知識(shí)和相關(guān)理論
2.1 推薦技術(shù)發(fā)展歷程
2.1.1 推薦算法
2.1.2 推薦方式和評(píng)估方式
2.2 推薦系統(tǒng)模型
2.3 基于維基百科的概念從屬樹構(gòu)建
2.3.1 維基百科相關(guān)背景知識(shí)
2.3.2 概念從屬樹的構(gòu)建
2.4 文檔表示模型
2.5 文檔處理
2.5.1 關(guān)鍵詞提取算法
2.5.2 文檔相似度計(jì)算
2.6 本章小結(jié)
第三章 基于文檔多維度的學(xué)術(shù)文獻(xiàn)推薦方法
3.1 問題描述
3.2 用戶的文本需求與文檔多維度之間對應(yīng)關(guān)系的研究
3.2.1 文檔多維度選定與剖析
3.2.2 用戶模型
3.3 基于TF-IDF融合文檔特征的特征詞提取方法
3.4 基于文檔多維度的學(xué)術(shù)文獻(xiàn)推薦方法
3.4.1 基于文檔概念抽象層次的學(xué)術(shù)文獻(xiàn)推薦
3.4.2 基于文檔難度的學(xué)術(shù)文獻(xiàn)推薦
3.4.3 基于學(xué)習(xí)難度跨度的文檔推薦
3.5 本章小結(jié)
第四章 實(shí)驗(yàn)與分析
4.1 數(shù)據(jù)集采集及樣本庫的構(gòu)建
4.2 文檔各維度正確性驗(yàn)證實(shí)驗(yàn)
4.2.1 樣本集
4.2.2 評(píng)估方法
4.2.3 實(shí)驗(yàn)結(jié)果與分析
4.3 基于文檔多維度學(xué)術(shù)文獻(xiàn)推薦方法的實(shí)驗(yàn)與驗(yàn)證
4.3.1 樣本集
4.3.2 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
第五章 系統(tǒng)功能與展示
5.1 系統(tǒng)功能
5.2 系統(tǒng)展示
5.3 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間申請的專利
致謝
本文編號(hào):4004869
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 課題研究背景
1.1.2 課題研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容及成果
1.4 本文組織結(jié)構(gòu)
第二章 推薦系統(tǒng)基礎(chǔ)知識(shí)和相關(guān)理論
2.1 推薦技術(shù)發(fā)展歷程
2.1.1 推薦算法
2.1.2 推薦方式和評(píng)估方式
2.2 推薦系統(tǒng)模型
2.3 基于維基百科的概念從屬樹構(gòu)建
2.3.1 維基百科相關(guān)背景知識(shí)
2.3.2 概念從屬樹的構(gòu)建
2.4 文檔表示模型
2.5 文檔處理
2.5.1 關(guān)鍵詞提取算法
2.5.2 文檔相似度計(jì)算
2.6 本章小結(jié)
第三章 基于文檔多維度的學(xué)術(shù)文獻(xiàn)推薦方法
3.1 問題描述
3.2 用戶的文本需求與文檔多維度之間對應(yīng)關(guān)系的研究
3.2.1 文檔多維度選定與剖析
3.2.2 用戶模型
3.3 基于TF-IDF融合文檔特征的特征詞提取方法
3.4 基于文檔多維度的學(xué)術(shù)文獻(xiàn)推薦方法
3.4.1 基于文檔概念抽象層次的學(xué)術(shù)文獻(xiàn)推薦
3.4.2 基于文檔難度的學(xué)術(shù)文獻(xiàn)推薦
3.4.3 基于學(xué)習(xí)難度跨度的文檔推薦
3.5 本章小結(jié)
第四章 實(shí)驗(yàn)與分析
4.1 數(shù)據(jù)集采集及樣本庫的構(gòu)建
4.2 文檔各維度正確性驗(yàn)證實(shí)驗(yàn)
4.2.1 樣本集
4.2.2 評(píng)估方法
4.2.3 實(shí)驗(yàn)結(jié)果與分析
4.3 基于文檔多維度學(xué)術(shù)文獻(xiàn)推薦方法的實(shí)驗(yàn)與驗(yàn)證
4.3.1 樣本集
4.3.2 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
第五章 系統(tǒng)功能與展示
5.1 系統(tǒng)功能
5.2 系統(tǒng)展示
5.3 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間申請的專利
致謝
本文編號(hào):4004869
本文鏈接:http://www.lk138.cn/tushudanganlunwen/4004869.html
最近更新
教材專著