中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于相關(guān)性判據(jù)的信息檢索優(yōu)化

發(fā)布時(shí)間:2020-11-20 21:47
   信息檢索的出現(xiàn)使得人們獲取信息的效率得到了較大的提高,信息檢索的其本質(zhì)是用戶需求與文獻(xiàn)集的匹配過程,用戶將需求通過初始查詢式的形式表達(dá)出來,根據(jù)某種檢索模型在檢索系統(tǒng)中查找自己所需的信息,也就是說,信息檢索是個(gè)用戶需求與檢索對(duì)象相匹配的一個(gè)過程,本質(zhì)是種相關(guān)性檢索。在21世紀(jì)之前,學(xué)界對(duì)于信息檢索的研究側(cè)重于系統(tǒng)觀的相關(guān)性,通過對(duì)檢索系統(tǒng)的檢索機(jī)制、信息源的組織形式和相關(guān)性評(píng)級(jí)算法的探討以期能提高信息系統(tǒng)的檢索性能。 隨著科技和社會(huì)發(fā)展,尤其是最近幾年人機(jī)互動(dòng)和智能檢索的興起,信息檢索中人的作用越來越受到重視,以人為本的相關(guān)反饋在未來應(yīng)該是信息檢索的主流,學(xué)者們對(duì)信息檢索中相關(guān)性的影響因素和提高技術(shù)開始進(jìn)行深入的研究,典型的有相關(guān)反饋技術(shù)。影響相關(guān)性的因素多種多樣,學(xué)者們進(jìn)行了廣泛的摸索,用戶決定了查詢式的質(zhì)量,查詢式依賴于用戶,因此用戶是相關(guān)反饋的最重要影響因素。信息檢索系統(tǒng)的核心是相關(guān)性評(píng)價(jià),在相關(guān)反饋中,用戶是相關(guān)性評(píng)價(jià)的主導(dǎo),這個(gè)評(píng)價(jià)過程受用戶自身和情境影響,主觀性很強(qiáng)。在信息檢索領(lǐng)域尤其是在國內(nèi),針對(duì)信息檢索系統(tǒng)的查詢擴(kuò)展研究較為成熟,但是基于用戶的相關(guān)反饋研究比較少,且目前為止還大部分研究還是基于理論,對(duì)相關(guān)性影響因素的實(shí)證研究較少。 鑒于此,本文綜述了目前國內(nèi)外的信息檢索優(yōu)化技術(shù)和相關(guān)性研究現(xiàn)狀,歸納了相關(guān)性定義、評(píng)價(jià)、影響因素和提高技術(shù),重點(diǎn)介紹了用戶相關(guān)反饋技術(shù),并建立了一個(gè)信息檢索系統(tǒng),采用國際標(biāo)準(zhǔn)五大測試集Cranfield, Medline, CISI, NPL和CACM作為語料庫,并建立索引,將廣為應(yīng)用的向量空間模型作為信息檢索模型,利用TF-IDF算法計(jì)算權(quán)重,檢索系統(tǒng)采用改進(jìn)的計(jì)算公式Ide Dec-hi優(yōu)化查詢向量,在此平臺(tái)上運(yùn)行了三部分信息檢索實(shí)驗(yàn),第一部分沒有相關(guān)反饋,用戶不需要參與反饋,輸入檢索查詢式后,檢索系統(tǒng)輸出檢索文獻(xiàn)集,這個(gè)部分作為BASELINE,檢索結(jié)果作為參照基準(zhǔn);第二部分基于相關(guān)反饋,檢索系統(tǒng)輸出檢索結(jié)果后,用戶需要判斷排在前面的N(參照Salton和Buckley的實(shí)驗(yàn),N值取15)篇文獻(xiàn)哪些是相關(guān)文獻(xiàn)和不相關(guān)文獻(xiàn),然后進(jìn)行二次檢索,檢索系統(tǒng)根據(jù)用戶反饋的結(jié)果,利用Ide Dec-hi算法重新計(jì)算文獻(xiàn)集和查詢式的相似度,再將檢索結(jié)果反饋給用戶,這部分是為對(duì)照組。第三部分基于相關(guān)性判據(jù)集和相關(guān)反饋,類似于第二部分,不同在于用戶在進(jìn)行相關(guān)性判斷時(shí)不是隨性的,而是根據(jù)既定的判斷依據(jù)來,此部分即為實(shí)驗(yàn)組。本文試圖通過實(shí)證研究證實(shí)相關(guān)反饋技術(shù)和依據(jù)相關(guān)性判據(jù)集對(duì)提高相關(guān)性具有良好的效果,并提出了本文的不足和后期研究應(yīng)該做的工作。
【學(xué)位單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2013
【中圖分類】:G354
【文章目錄】:
中文摘要
Abstract
論文表格目錄
論文圖表目錄
1. 緒論
    1.1. 研究背景
    1.2. 研究內(nèi)容
    1.3. 研究意義
    1.4. 論文組織結(jié)構(gòu)
2. 信息檢索及查詢擴(kuò)展技術(shù)研究
    2.1. 信息檢索概述
        2.1.1. 向量模型
        2.1.2. 概率模型
        2.1.3. 布爾模型
    2.2. 查詢擴(kuò)展
        2.2.1. 基于全局分析的查詢擴(kuò)展技術(shù)
            2.2.1.1. 文本聚類
            2.2.1.2. 潛在語義索引
            2.2.1.3. 相似性詞典
        2.2.2. 基于局部分析的查詢擴(kuò)展技術(shù)
            2.2.2.1. 局部聚類
            2.2.2.2. 局部上下文分析
        2.2.3. 基于語義詞表的查詢擴(kuò)展技術(shù)
3. 信息檢索中相關(guān)性研究
    3.1. 相關(guān)性定義
        3.1.1. 面向系統(tǒng)的相關(guān)性
        3.1.2. 面向用戶的相關(guān)性
        3.1.3. 系統(tǒng)和用戶相結(jié)合的相關(guān)性
    3.2. 相關(guān)性度量和評(píng)價(jià)
        3.2.1. 系統(tǒng)觀相關(guān)性度量及其評(píng)價(jià)指標(biāo)
            3.2.1.1. 基于不同檢索方式的相關(guān)性度量
                3.2.1.1.1. 基于向量空間模型的相關(guān)性度量
                3.2.1.1.2. 基于概率模型的相關(guān)性度量
                3.2.1.1.3. 基于布爾模型的相關(guān)性度量
            3.2.1.2. 常用評(píng)價(jià)指標(biāo)
        3.2.2. 用戶相關(guān)性度量判斷和評(píng)價(jià)
    3.3. 相關(guān)性影響因素
    3.4. 相關(guān)性提高技術(shù)研究
        3.4.1. 用戶相關(guān)性
        3.4.2. 系統(tǒng)觀相關(guān)性
        3.4.3. 用戶相關(guān)反饋技術(shù)
            3.4.3.1. 基于向量空間模型的相關(guān)反饋
                3.4.3.1.1. 向量空間模型的相關(guān)反饋權(quán)重計(jì)算
                3.4.3.1.2. 向量空間模型的相關(guān)反饋的優(yōu)缺點(diǎn)
            3.4.3.2. 基于概率模型的相關(guān)反饋
                3.4.3.2.1. 經(jīng)典概率模型的相關(guān)反饋權(quán)重計(jì)算
                3.4.3.2.2. 經(jīng)典概率模型相關(guān)反饋優(yōu)缺點(diǎn)
            3.4.3.3. 基于布爾模型的相關(guān)反饋
            3.4.3.4. 用戶相關(guān)反饋小結(jié)
4. 實(shí)驗(yàn)及結(jié)果分析
    4.1. 實(shí)驗(yàn)框架
    4.2. 數(shù)據(jù)預(yù)處理
        4.2.1. 測試集簡介
        4.2.2. 文獻(xiàn)和查詢的預(yù)處理
        4.2.3. 相似度計(jì)算和評(píng)價(jià)
    4.3. 實(shí)驗(yàn)內(nèi)容
        4.3.1. BASELINE
        4.3.2. 對(duì)照組
        4.3.3. 實(shí)驗(yàn)組
    4.4. 結(jié)果分析
        4.4.1. 實(shí)驗(yàn)結(jié)果
        4.4.2. 結(jié)果分析
5. 總結(jié)與展望
    5.1. 研究總結(jié)
    5.2. 進(jìn)一步工作
參考文獻(xiàn)
攻讀碩士期間主要科研及成果
致謝

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王雅坤;成全;;信息檢索相關(guān)性研究綜述及發(fā)展趨勢[J];圖書與情報(bào);2012年01期

2 袁占亭,張愛民,張秋余;基于概念的Web信息檢索[J];計(jì)算機(jī)工程與應(yīng)用;2003年36期

3 顧榕,王小平,曹立明;一種基于潛在語義分析的查詢擴(kuò)展算法[J];計(jì)算機(jī)工程與應(yīng)用;2004年18期

4 閉劍婷;蘇一丹;;基于潛在語義分析的跨語言查詢擴(kuò)展方法[J];計(jì)算機(jī)工程;2009年10期

5 張敏,宋睿華,馬少平;基于語義關(guān)系查詢擴(kuò)展的文檔重構(gòu)方法[J];計(jì)算機(jī)學(xué)報(bào);2004年10期

6 馮運(yùn);陳治平;;基于局部類別分析的查詢擴(kuò)展[J];計(jì)算機(jī)應(yīng)用;2007年01期

7 賀宏朝,何丕廉,高劍峰,黃昌寧;一種基于上下文的中文信息檢索查詢擴(kuò)展[J];中文信息學(xué)報(bào);2002年06期

8 劉遠(yuǎn)超;王曉龍;徐志明;關(guān)毅;;文檔聚類綜述[J];中文信息學(xué)報(bào);2006年03期

9 丁國棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴(kuò)展方法[J];中文信息學(xué)報(bào);2006年03期

10 張保明;;查全率—查準(zhǔn)率互逆相關(guān)性的數(shù)學(xué)解釋[J];情報(bào)科學(xué);1982年02期


相關(guān)博士學(xué)位論文 前1條

1 成穎;信息檢索相關(guān)性判據(jù)及應(yīng)用研究[D];南京大學(xué);2011年



本文編號(hào):2892039

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/tushudanganlunwen/2892039.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶064b4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com