SLR系統(tǒng)基于QGS的半自動化檢索模塊的設(shè)計和實現(xiàn)
發(fā)布時間:2020-06-04 03:27
【摘要】:系統(tǒng)化評價(Systematic Literature Review,SLR)方法是經(jīng)驗軟件工程領(lǐng)域常用的研究方法之一,使用系統(tǒng)化評價方法的研究者需要在網(wǎng)絡(luò)上收集大量的文獻數(shù)據(jù),而“Quasi-Gold Standard”(QGS)是評價所收集文獻數(shù)據(jù)合理性的準(zhǔn)黃金準(zhǔn)則,能夠幫助研究者完成文獻檢索。然而,研究者在使用SLR方法進行研究時,需要消耗大量的時間,且研究過程中產(chǎn)生的數(shù)據(jù)難以保存。對此,某國家重點實驗室開發(fā)了SLR系統(tǒng),旨在為使用SLR方法的研究者提供幫助,覆蓋了SLR方法的各個階段,為研究者記錄過程數(shù)據(jù)。其中,文獻檢索階段是實際實施SLR的第一階段,這一階段得到的檢索結(jié)果能夠影響甚至決定項目研究的成敗,而基于QGS的文獻檢索過程是十分耗時的,目前,還沒有任何在QGS概念的基礎(chǔ)上幫助研究者完成文獻檢索的在線協(xié)作工具發(fā)布。本文所介紹的SLR系統(tǒng)基于QGS的文獻檢索模塊,為研究者提供了基于QGS的文獻檢索功能。本文闡述了SLR系統(tǒng)的產(chǎn)生背景,說明了基于QGS的半自動化檢索在其中的重要作用,概述了學(xué)術(shù)研究中一些輔助工具的發(fā)展?fàn)顩r,綜述了構(gòu)建基于QGS的半自動化檢索模塊所采用的Django、Redis和主題網(wǎng)絡(luò)爬蟲等技術(shù)。論文在詳細分析了系統(tǒng)需求后,設(shè)計了系統(tǒng)總體結(jié)構(gòu)、模塊總體結(jié)構(gòu)和數(shù)據(jù)庫,并將該模塊細分成了四個子模塊:代理池模塊、數(shù)字圖書館爬蟲模塊、文獻檢索模塊和數(shù)據(jù)導(dǎo)出模塊,從功能層面給出了這四個子模塊的詳細設(shè)計和實現(xiàn)細節(jié)。最后,給出了模塊主要功能的測試情況。為了解決不同數(shù)字圖書館對于搜索字符串解析規(guī)則的不同,論文所實現(xiàn)的檢索功能,提出并實現(xiàn)了搜索字符串的格式化,實現(xiàn)了語義一致性。相對于其他基于主題網(wǎng)絡(luò)爬蟲實現(xiàn)的垂直搜索引擎,加入csv文件的獲取和解析,減少了爬蟲所固有的高HTTP請求數(shù)量,降低了時間消耗,另外加上年份區(qū)間檢索的優(yōu)化策略,進一步減少了檢索所需的時間代價。最后,獨有的QS值計算功能為使用系統(tǒng)化評價方法的研究者提供了有力的支持。
【圖文】:
圖2.2:邋Django框架示意圖逡逑經(jīng)過多年的發(fā)展,Django框架在Python輕量級開發(fā)中已經(jīng)占據(jù)了重要的位逡逑
結(jié)果g義賢跡常保哄澹眩牽擁陌胱遠燜髂?橛美煎義細菪棖蠓治觶,基于Q繐砟半走h燜髂?櫚撓美既繽跡常彼荊麇義弦治低徹芾碓焙陀沒Я街紙巧。系蛷剀理詡浜喳[寫沓毓芾硨團萊婀苠義希保村義
本文編號:2695822
【圖文】:
圖2.2:邋Django框架示意圖逡逑經(jīng)過多年的發(fā)展,Django框架在Python輕量級開發(fā)中已經(jīng)占據(jù)了重要的位逡逑
結(jié)果g義賢跡常保哄澹眩牽擁陌胱遠燜髂?橛美煎義細菪棖蠓治觶,基于Q繐砟半走h燜髂?櫚撓美既繽跡常彼荊麇義弦治低徹芾碓焙陀沒Я街紙巧。系蛷剀理詡浜喳[寫沓毓芾硨團萊婀苠義希保村義
本文編號:2695822
本文鏈接:http://lk138.cn/kejilunwen/sousuoyinqinglunwen/2695822.html
最近更新
教材專著