中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于網(wǎng)頁結(jié)構(gòu)特征的垂直搜索引擎研究與實現(xiàn).pdf

發(fā)布時間:2016-08-04 18:26

  本文關(guān)鍵詞:基于網(wǎng)頁結(jié)構(gòu)特征的垂直搜索引擎研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。


文檔介紹:
上海交通大學(xué)工程碩士學(xué)位論文摘要第 I 頁基于網(wǎng)頁結(jié)構(gòu)特征的垂直搜索引擎研究與實現(xiàn)摘要隨著 的飛速發(fā)展,人們越來越依靠網(wǎng)絡(luò)來查找他們所需要的信息。的信息資源具有多樣性、分布性、開放性、時效性和異構(gòu)性的特點,同一主題的信息通常分散存放在不同網(wǎng)站上,表現(xiàn)的形式也各不相同。垂直搜索引擎可以將這些信息按主題進行抽取,以結(jié)構(gòu)化形式存儲。本文提出了一種基于網(wǎng)頁結(jié)構(gòu)特征的垂直搜索引擎模型。根據(jù)專業(yè)和行業(yè)網(wǎng)站的領(lǐng)域特點,提出相應(yīng)主題的元數(shù)據(jù)統(tǒng)一表示標準。通過對對應(yīng)網(wǎng)站的網(wǎng)頁分析,依據(jù)元數(shù)據(jù)表示標準和網(wǎng)頁結(jié)構(gòu)特征,提煉出具體網(wǎng)站網(wǎng)頁的信息抽取模板。垂直搜索引擎根據(jù)該信息抽取模板對目標網(wǎng)站進行網(wǎng)頁爬行、頁面轉(zhuǎn)換、抽取數(shù)據(jù)和分離數(shù)據(jù)及保存數(shù)據(jù)。網(wǎng)站的信息抽取模板采用 XML 進行描述,對應(yīng)網(wǎng)頁結(jié)構(gòu)特征。由于采用標準的 XML 并以文件形式存放,可以方便地在關(guān)心該網(wǎng)站信息的用戶之間共享。根據(jù)本文提出的基于網(wǎng)頁結(jié)構(gòu)特征的垂直搜索引擎模型,我們開發(fā)了一個基于網(wǎng)頁結(jié)構(gòu)特征的垂直搜索引擎系統(tǒng)。整個系統(tǒng)以元數(shù)據(jù)模型為基礎(chǔ),對網(wǎng)站網(wǎng)頁結(jié)構(gòu)進行結(jié)構(gòu)化處理,獲得網(wǎng)頁的結(jié)構(gòu)化信息;谠撍阉饕,我們開發(fā)了車貨配物流等垂直搜索網(wǎng)站,在實踐中進一步得到了檢... 內(nèi)容來自轉(zhuǎn)載請標明出處.


  本文關(guān)鍵詞:基于網(wǎng)頁結(jié)構(gòu)特征的垂直搜索引擎研究與實現(xiàn),,由筆耕文化傳播整理發(fā)布。



本文編號:84928

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/sousuoyinqinglunwen/84928.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8553c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com