元搜索引擎結(jié)果個(gè)性化排序的研究與實(shí)現(xiàn).pdf 全文 文檔投稿網(wǎng)
本文關(guān)鍵詞:元搜索引擎結(jié)果個(gè)性化排序的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
中國(guó)石油大學(xué)(華東)
碩士學(xué)位論文
元搜索引擎結(jié)果個(gè)性化排序的研究與實(shí)現(xiàn)
姓名:孫鑫
申請(qǐng)學(xué)位級(jí)別:碩士
專(zhuān)業(yè):計(jì)算機(jī)應(yīng)用技術(shù)
指導(dǎo)教師:索紅光
20080501摘 要
目前,搜索引擎存在著冗余信息過(guò)載和索引數(shù)據(jù)庫(kù)信息覆蓋率低的問(wèn)題,發(fā)展個(gè)性
化的元搜索引擎是解決這兩個(gè)問(wèn)題的一個(gè)重要途徑,由于元搜索引擎可以同時(shí)調(diào)用多個(gè)
獨(dú)立搜索引擎,提高了搜索引擎的查全率;面對(duì)數(shù)量眾多的檢索結(jié)果,采用個(gè)性化的結(jié)
果處理方法,可以提高用戶(hù)檢索的效率和返回結(jié)果的質(zhì)量。
本文研究并設(shè)計(jì)了一個(gè)針對(duì)元搜索引擎返回結(jié)果的個(gè)性化排序算法。算法的主要思
路是將元搜索引擎返回的結(jié)果網(wǎng)頁(yè)預(yù)處理后,通過(guò)聚類(lèi)的方法,將結(jié)果網(wǎng)頁(yè)集合劃分為
不同的類(lèi)別。計(jì)算每個(gè)類(lèi)別與用戶(hù)興趣模型的相似度,根據(jù)相似度對(duì)類(lèi)別進(jìn)行宏觀排序,
從而確定用戶(hù)的興趣類(lèi)別,并對(duì)興趣類(lèi)別中的結(jié)果進(jìn)行基于查詢(xún)關(guān)鍵詞與結(jié)果內(nèi)容相關(guān)
性的微觀排序。文章中同時(shí)也給出了建立用戶(hù)興趣模型的方法和步驟。
在個(gè)性化排序算法的結(jié)果預(yù)處理步驟中采用了一種改進(jìn)的基于超鏈接文本分析的
網(wǎng)頁(yè)正文提取方法;在排序步驟中提出了宏觀排序和微觀排序的概念,給出了兩種排序
的具體實(shí)現(xiàn)方法;在聚類(lèi)處理中,為了提高算法的性能,采用了一種改進(jìn)的聚類(lèi)算法。
根據(jù)元搜索引擎結(jié)果個(gè)性化排序算法,本文設(shè)計(jì)了一個(gè)基于客戶(hù)端的個(gè)性化元搜索
引擎系統(tǒng),系統(tǒng)采用了模塊化的設(shè)計(jì),具有友好的人機(jī)交互界面。文中給出了系
統(tǒng)的測(cè)試數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行了分析和處理。實(shí)驗(yàn)表明,本文的基于個(gè)性化排序算法的
個(gè)性化元搜索引擎系統(tǒng)具有理想的查全率與查準(zhǔn)率,能夠達(dá)到方便用戶(hù)檢索和提
供高質(zhì)量檢索結(jié)果的目的,同時(shí)該系統(tǒng)也存在著很多不足之處,有待于進(jìn)一步的
本文關(guān)鍵詞:元搜索引擎結(jié)果個(gè)性化排序的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):93001
本文鏈接:http://www.lk138.cn/kejilunwen/sousuoyinqinglunwen/93001.html