基于隨機游走模型的高校圖書館知識發(fā)現系統構建
發(fā)布時間:2020-12-09 13:34
[目的]為了實現知識的快速聚類和關聯分類,由傳統的以資源檢索為目標的高校圖書館系統轉變?yōu)橥耆嫦蛴脩粜枨蟮、主動發(fā)現和推送知識的圖書館知識發(fā)現系統。[過程]本文融合網絡爬蟲技術和學術資源網站結構化數據的特征,構建了基于隨機游走模型,依據摘要詞頻對文獻資料進行主題詞的提取、聚類;隨后在標簽信息標注的基礎上,根據相似性對游走過程進行加權處理;最終完成了知識關聯分類的知識發(fā)現系統。[結果]本文實現了用高效的知識提取手段,基于智慧云、物聯網構建更加準確和更具關聯性的知識發(fā)現系統,提高了高校圖書館知識檢索系統的查全率和查準率。
【文章來源】:現代情報. 2020年05期 第96-103頁 CSSCI
【文章頁數】:8 頁
【部分圖文】:
基于隨機游走模型的高校圖書館知識發(fā)現系統架構
圖1 基于隨機游走模型的高校圖書館知識發(fā)現系統架構該知識發(fā)現系統將資源整合與用戶服務相結合,將數據層、匹配層和用戶層相聯系,具體服務操作流程如圖2所示:首先,系統起始操作由用戶或系統管理者發(fā)起。系統管理者發(fā)起對系統進行文獻錄入,并由系統的匹配層完成輸入處理,匹配層提取文獻摘要關鍵詞并進行隨機游走完成聚類,計入文獻資源庫的某一聚類集群中。其次,用戶在登入系統后,系統通過訪問用戶資源庫提取用戶的數據,包括歷史訪問、偏愛集群和用戶信息,獲取用戶可能感興趣的文獻或集群。在用戶輸入信息進行搜索后,系統的匹配層完成輸入處理,并將用戶搜索輸入時提供的新用戶特征,如感興趣的學科內容等錄入用戶資源庫。第三,用戶輸入搜索,匹配層完成資源匹配,將數據庫中的文獻資源與用戶搜索內容進行匹配。最后,系統完成匹配,將用戶的搜索與資源庫的文獻或集群的關聯展示給用戶,與此同時,新的用戶搜索增加新的用戶特征與關聯圖譜。通過此系統,提高了高校圖書館信息檢索的查全率和查準率,實現了知識聚類。
獲取文獻摘要并提取主題詞的爬蟲部分代碼
【參考文獻】:
期刊論文
[1]基于隨機游走的分類垃圾回收最優(yōu)路徑規(guī)劃[J]. 趙紅霞,劉高森,李愈. 交通運輸工程與信息學報. 2018(03)
[2]基于深度學習的數字圖書館網絡知識發(fā)現研究[J]. 王勛. 圖書館學刊. 2018(07)
[3]大數據時代圖書館嵌入式知識發(fā)現情報分析服務研究[J]. 姜璐. 農業(yè)圖書情報學刊. 2018(08)
[4]基于加權超圖隨機游走的文獻關鍵詞提取算法[J]. 馬慧芳,劉芳,夏琴,郝占軍. 電子學報. 2018(06)
[5]基于標簽信息特征相似性的協同過濾個性化推薦[J]. 何明,要凱升,楊芃,張久伶. 計算機科學. 2018(S1)
[6]基于Spark的高校圖書館文獻推薦方案及實證研究[J]. 何勝,熊太純,柳益君,葉飛躍,潘瑜. 圖書情報工作. 2017(23)
[7]基于SOM神經網絡的高校圖書館個性化推薦服務系統構建[J]. 劉愛琴,李永清. 圖書館論壇. 2018(04)
[8]基于圖書情報機構智庫建設的知識發(fā)現系統構建研究[J]. 李祎. 圖書館工作與研究. 2017(02)
[9]一種基于隨機游走算法的復雜網絡生成[J]. 余思東,萬榮澤,黃欣. 計算機應用與軟件. 2015(02)
[10]基于項目和標簽的隨機游走個性化信息推薦模型[J]. 王麗莎,張紹武,林鴻飛. 情報學報. 2012 (03)
本文編號:2906943
【文章來源】:現代情報. 2020年05期 第96-103頁 CSSCI
【文章頁數】:8 頁
【部分圖文】:
基于隨機游走模型的高校圖書館知識發(fā)現系統架構
圖1 基于隨機游走模型的高校圖書館知識發(fā)現系統架構該知識發(fā)現系統將資源整合與用戶服務相結合,將數據層、匹配層和用戶層相聯系,具體服務操作流程如圖2所示:首先,系統起始操作由用戶或系統管理者發(fā)起。系統管理者發(fā)起對系統進行文獻錄入,并由系統的匹配層完成輸入處理,匹配層提取文獻摘要關鍵詞并進行隨機游走完成聚類,計入文獻資源庫的某一聚類集群中。其次,用戶在登入系統后,系統通過訪問用戶資源庫提取用戶的數據,包括歷史訪問、偏愛集群和用戶信息,獲取用戶可能感興趣的文獻或集群。在用戶輸入信息進行搜索后,系統的匹配層完成輸入處理,并將用戶搜索輸入時提供的新用戶特征,如感興趣的學科內容等錄入用戶資源庫。第三,用戶輸入搜索,匹配層完成資源匹配,將數據庫中的文獻資源與用戶搜索內容進行匹配。最后,系統完成匹配,將用戶的搜索與資源庫的文獻或集群的關聯展示給用戶,與此同時,新的用戶搜索增加新的用戶特征與關聯圖譜。通過此系統,提高了高校圖書館信息檢索的查全率和查準率,實現了知識聚類。
獲取文獻摘要并提取主題詞的爬蟲部分代碼
【參考文獻】:
期刊論文
[1]基于隨機游走的分類垃圾回收最優(yōu)路徑規(guī)劃[J]. 趙紅霞,劉高森,李愈. 交通運輸工程與信息學報. 2018(03)
[2]基于深度學習的數字圖書館網絡知識發(fā)現研究[J]. 王勛. 圖書館學刊. 2018(07)
[3]大數據時代圖書館嵌入式知識發(fā)現情報分析服務研究[J]. 姜璐. 農業(yè)圖書情報學刊. 2018(08)
[4]基于加權超圖隨機游走的文獻關鍵詞提取算法[J]. 馬慧芳,劉芳,夏琴,郝占軍. 電子學報. 2018(06)
[5]基于標簽信息特征相似性的協同過濾個性化推薦[J]. 何明,要凱升,楊芃,張久伶. 計算機科學. 2018(S1)
[6]基于Spark的高校圖書館文獻推薦方案及實證研究[J]. 何勝,熊太純,柳益君,葉飛躍,潘瑜. 圖書情報工作. 2017(23)
[7]基于SOM神經網絡的高校圖書館個性化推薦服務系統構建[J]. 劉愛琴,李永清. 圖書館論壇. 2018(04)
[8]基于圖書情報機構智庫建設的知識發(fā)現系統構建研究[J]. 李祎. 圖書館工作與研究. 2017(02)
[9]一種基于隨機游走算法的復雜網絡生成[J]. 余思東,萬榮澤,黃欣. 計算機應用與軟件. 2015(02)
[10]基于項目和標簽的隨機游走個性化信息推薦模型[J]. 王麗莎,張紹武,林鴻飛. 情報學報. 2012 (03)
本文編號:2906943
本文鏈接:http://www.lk138.cn/tushudanganlunwen/2906943.html