面向領(lǐng)域的垂直搜索引擎的研究與實現(xiàn)
本文關(guān)鍵詞:面向領(lǐng)域的垂直搜索引擎的研究與實現(xiàn),,由筆耕文化傳播整理發(fā)布。
《大連海事大學》 2011年
面向領(lǐng)域的垂直搜索引擎的研究與實現(xiàn)
邱偉林
【摘要】:伴隨著Web2.0的瘋狂普及,網(wǎng)絡(luò)信息資源的膨脹速度也呈指數(shù)增長,海量的數(shù)據(jù)資源已經(jīng)遠遠超出搜索引擎所能覆蓋的范圍,要想使用傳統(tǒng)的搜索引擎技術(shù)快速、準確地查找所需信息變得越來越困難。數(shù)據(jù)量驚人的遞增速度使得通用搜索引擎難以及時地更新索引數(shù)據(jù)庫;龐大的網(wǎng)頁資源也使得通用搜索引擎深入地抓取信息變得更加困難。針對這些缺點,新一代搜索技術(shù)——垂直搜索引擎應(yīng)運而生。 垂直搜索引擎是通用搜索引擎的細分和延伸,它只針對某一個行業(yè)或主題,為特定人群提供有價值的信息和相關(guān)服務(wù)。主題爬行和檢索服務(wù)作為兩個重要環(huán)節(jié)在很大程度上影響著垂直搜索引擎查詢的準確率和檢索效率。如何快速高效地判斷并預(yù)測主題相關(guān)網(wǎng)頁,以及如何帶給用戶清晰、準確的檢索反饋成為制約垂直搜索引擎發(fā)展的兩大難題。因此,如何改善這兩個環(huán)節(jié)成為本文工作的出發(fā)點。 本文提出了基于分類法的目錄式主題描述法,并以此實現(xiàn)了新的主題爬行策略。使得主題爬蟲不再盲目的預(yù)測主題相關(guān)網(wǎng)頁的方向,而是通過賦予在ODP中不同層次位置的主題結(jié)點不同的權(quán)重值,更加準確地指導主題爬蟲的爬行。在搜索結(jié)果呈現(xiàn)方面,本文采用聚類搜索引擎的優(yōu)點,通過基于主題短語的方法,對文檔特征項進行更加準確的提取,并以此指導聚類工作,用聚類呈現(xiàn)的方式給予用戶更加方便的查詢體驗。最后本文通過設(shè)計對比試驗來驗證二者的有效性。
【關(guān)鍵詞】:
【學位授予單位】:大連海事大學
【學位級別】:碩士
【學位授予年份】:2011
【分類號】:TP391.3
【目錄】:
下載全文 更多同類文獻
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 邊凱;;你會搜索嗎?[J];中國計算機用戶;2007年23期
2 莊芯;;風投押寶垂直搜索 各方巨頭介入又添疑點[J];IT時代周刊;2008年01期
3 顧鵬堯;;讓搜索引擎更好地服務(wù)于教育教學[J];科學24小時;2003年Z1期
4 陳新顏;垂直搜索引擎辨析[J];現(xiàn)代情報;2004年09期
5 胡文勝;;垂直搜索助號碼百事通與商務(wù)領(lǐng)航[J];每周電腦報;2006年32期
6 胡潔;丁寧;關(guān)靜;曹福年;張磊;;基于“PUBMED+PDF”的醫(yī)學垂直搜索引擎的實踐[J];信息系統(tǒng)工程;2009年05期
7 一林;;垂直搜索:前進路上的喜與憂[J];互聯(lián)網(wǎng)天地;2010年02期
8 田野;垂直搜索火熱為哪般[J];中國計算機用戶;2005年37期
9 陳利國;劉忠民;;搜索引擎的工作原理和發(fā)展趨勢[J];電腦知識與技術(shù)(學術(shù)交流);2007年23期
10 張敏;;基于本體的垂直搜索引擎的研究[J];軟件導刊;2010年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計與實現(xiàn)[A];第26屆中國數(shù)據(jù)庫學術(shù)會議論文集(B輯)[C];2009年
2 林歡歡;王文杰;史忠植;;移動環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
3 王旭;杜軍平;;質(zhì)檢總局互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)中聚焦爬蟲的研究[A];中國電子學會第十七屆信息論學術(shù)年會論文集[C];2010年
4 孫靜;郭奇;張志強;馮建華;;一種基于面向領(lǐng)域檢索系統(tǒng)的用戶興趣獲取方法[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2004年
5 華山;李紅燕;;面向領(lǐng)域的工作流模型的設(shè)計[A];第二十屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2003年
6 韓近強;趙靜;楊冬青;唐世渭;姚小波;;基于領(lǐng)域知識的網(wǎng)頁篩選系統(tǒng)[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2002年
7 郭奇;周立柱;郭杭;;模式驅(qū)動的面向領(lǐng)域智能Web數(shù)據(jù)采集引擎[A];第二十二屆中國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2005年
8 林道莊;郭奇;張志強;馮建華;周立柱;孫靜;;基于Metasearch的面向領(lǐng)域的數(shù)據(jù)源發(fā)現(xiàn)和評價方案[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2002年
9 王曉峰;劉惟一;;從用戶需求到網(wǎng)頁集團的模糊變換[A];第二十屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2003年
10 吳倩;楊逍;張兆心;;基于視覺特征的網(wǎng)頁信息提取[A];第六屆全國信息檢索學術(shù)會議論文集[C];2010年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學技術(shù)情報研究所 周峻松;[N];計算機世界;2010年
2 王艷;[N];中國旅游報;2000年
3 賽迪網(wǎng) 方剛;[N];中國計算機報;2000年
4 王靖;[N];人民日報海外版;2000年
5 記者 王滸;[N];中國旅游報;2009年
6 本報記者 王宏;[N];中國計算機報;2001年
7 徐瑾 張玉;[N];人民郵電;2009年
8 本報記者 王曉雁;[N];法制日報;2009年
9 記者 吳德群;[N];深圳特區(qū)報;2009年
10 本報記者 胡鈺;[N];華夏時報;2009年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 吳羽;面向時間敏感對象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學;2011年
2 王曄;垂直搜索引擎若干問題研究[D];復旦大學;2011年
3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實現(xiàn)[D];中國科學技術(shù)大學;2012年
4 李傳席;基于本體的自適應(yīng)Web信息抽取方法研究[D];中國科學技術(shù)大學;2012年
5 焦斌星;用于搜索的網(wǎng)頁可視化摘要技術(shù)研究[D];中國科學技術(shù)大學;2012年
6 荊濤;面向領(lǐng)域網(wǎng)頁的語義標注若干問題研究[D];吉林大學;2011年
7 劉剛;面向領(lǐng)域的軟件需求一致性驗證方法研究[D];哈爾濱工程大學;2008年
8 孟憲軍;互聯(lián)網(wǎng)文本聚類與檢索技術(shù)研究[D];哈爾濱工業(yè)大學;2009年
9 張長利;面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D];吉林大學;2011年
10 劉家茂;Web services動態(tài)合成及UDDI注冊/查詢技術(shù)的研究[D];復旦大學;2005年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 邱偉林;面向領(lǐng)域的垂直搜索引擎的研究與實現(xiàn)[D];大連海事大學;2011年
2 王鵬;垂直搜索引擎的研究[D];武漢理工大學;2010年
3 李春燕;企業(yè)信息垂直搜索引擎的研究與實現(xiàn)[D];中國地質(zhì)大學(北京);2010年
4 許厚金;垂直搜索引擎及其關(guān)鍵方法研究[D];燕山大學;2010年
5 陳向東;寵物用品垂直搜索引擎研究與設(shè)計[D];西北農(nóng)林科技大學;2010年
6 薛萍;基于教育領(lǐng)域的垂直搜索引擎的研究與實現(xiàn)[D];天津師范大學;2011年
7 劉大伸;垂直搜索引擎技術(shù)的研究及實現(xiàn)[D];東北大學;2008年
8 關(guān)小敏;垂直搜索引擎的研究與實現(xiàn)[D];北京郵電大學;2012年
9 張倩;教育信息垂直搜索引擎的研究[D];吉林大學;2012年
10 東興;垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江理工大學;2012年
本文關(guān)鍵詞:面向領(lǐng)域的垂直搜索引擎的研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號:84859
本文鏈接:http://www.lk138.cn/kejilunwen/sousuoyinqinglunwen/84859.html