中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

采用URL特征的Hub網(wǎng)頁(yè)識(shí)別方法研究

發(fā)布時(shí)間:2019-11-25 22:11
【摘要】:【目的】通過(guò)構(gòu)建簡(jiǎn)單數(shù)據(jù)樣本,解決傳統(tǒng)網(wǎng)頁(yè)類型識(shí)別方法效率低的難題!痉椒ā坎捎肬RL特征作為識(shí)別依據(jù),抽取URL信息構(gòu)建訓(xùn)練集與測(cè)試集,使用支持向量機(jī)(SVM)建立機(jī)器學(xué)習(xí)模型以提高識(shí)別效率!窘Y(jié)果】在同樣的數(shù)據(jù)集上,該方法的準(zhǔn)確率為91.2%,優(yōu)于其他識(shí)別方法。在效率性能方面,該方法提升近60%!揪窒蕖慨(dāng)遇到URL特征不明顯甚至完全相背的網(wǎng)站時(shí),識(shí)別準(zhǔn)確率會(huì)大幅度降低!窘Y(jié)論】該方法在效率方面存在很大優(yōu)勢(shì),應(yīng)用到采集系統(tǒng)中可提高采集效率。

【參考文獻(xiàn)】

相關(guān)碩士學(xué)位論文 前1條

1 謝光華;中文網(wǎng)頁(yè)自動(dòng)分類的研究及其應(yīng)用[D];大連理工大學(xué);2007年

【共引文獻(xiàn)】

相關(guān)碩士學(xué)位論文 前6條

1 蘇秀芝;網(wǎng)頁(yè)去噪與特征提取算法的研究及實(shí)現(xiàn)[D];西南交通大學(xué);2010年

2 白凡;改進(jìn)的K近鄰算法在網(wǎng)頁(yè)文本分類中的應(yīng)用[D];安徽大學(xué);2010年

3 劉艷敏;網(wǎng)頁(yè)自動(dòng)分類和存儲(chǔ)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2010年

4 王立建;中文web文本過(guò)濾技術(shù)研究[D];中北大學(xué);2010年

5 郭媛媛;基于GIS的商場(chǎng)疏散安全評(píng)估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2013年

6 錢強(qiáng);中文網(wǎng)頁(yè)分類算法研究[D];江蘇科技大學(xué);2013年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前9條

1 陳桂林,王永成;Internet網(wǎng)絡(luò)信息自動(dòng)摘要的研究[J];高技術(shù)通訊;1999年02期

2 馮是聰,單松巍,龔筆宏,張志剛,李曉明;“天網(wǎng)”目錄導(dǎo)航服務(wù)研究[J];計(jì)算機(jī)研究與發(fā)展;2004年04期

3 王琦,唐世渭,楊冬青,王騰蛟;基于DOM的網(wǎng)頁(yè)主題信息自動(dòng)提取[J];計(jì)算機(jī)研究與發(fā)展;2004年10期

4 周明建,高濟(jì),李飛;基于本體論的Web信息抽取[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2004年04期

5 趙欣欣;索紅光;劉玉樹;;基于標(biāo)記窗的網(wǎng)頁(yè)正文信息提取方法[J];計(jì)算機(jī)應(yīng)用研究;2007年03期

6 許勇,荀恩東,賈愛平,宋柔;基于互連網(wǎng)的術(shù)語(yǔ)定義獲取系統(tǒng)[J];中文信息學(xué)報(bào);2004年04期

7 孫承杰,關(guān)毅;基于統(tǒng)計(jì)的網(wǎng)頁(yè)正文信息抽取方法的研究[J];中文信息學(xué)報(bào);2004年05期

8 胡國(guó)平;張巍;王仁華;;基于雙層決策的新聞網(wǎng)頁(yè)正文精確抽取[J];中文信息學(xué)報(bào);2006年06期

9 范焱,鄭誠(chéng),王清毅,蔡慶生,劉潔;用Naive Bayes方法協(xié)調(diào)分類Web網(wǎng)頁(yè)[J];軟件學(xué)報(bào);2001年09期

相關(guān)碩士學(xué)位論文 前1條

1 董靜;中文網(wǎng)頁(yè)形式自動(dòng)分類[D];大連理工大學(xué);2006年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張東準(zhǔn);網(wǎng)頁(yè)減肥工具大觀[J];電腦技術(shù);2001年04期

2 黃家貞;彈指間網(wǎng)頁(yè)內(nèi)碼隨心換[J];電腦知識(shí)與技術(shù);2004年22期

3 黃家貞;彈指間網(wǎng)頁(yè)內(nèi)碼隨心換[J];網(wǎng)絡(luò)與信息;2004年09期

4 宏偉;巧妙抓取防滾屏網(wǎng)頁(yè)[J];電腦愛好者;2005年20期

5 啟動(dòng);;淺談網(wǎng)頁(yè)文件引用[J];網(wǎng)絡(luò)與信息;2006年05期

6 小叢;;教你輕松抓取無(wú)法滾屏的網(wǎng)頁(yè)[J];計(jì)算機(jī)與網(wǎng)絡(luò);2006年08期

7 花的神明;;追尋網(wǎng)頁(yè)上閃動(dòng)的音樂(lè)[J];電腦迷;2007年12期

8 秋思;;收藏一個(gè)網(wǎng)頁(yè)只需一個(gè)文件[J];電腦愛好者(普及版);2009年05期

9 唐永明;;淺議網(wǎng)頁(yè)設(shè)計(jì)與制作[J];科技信息;2009年20期

10 蔣偉;徐義平;;個(gè)性化網(wǎng)頁(yè)淺析[J];魅力中國(guó);2009年35期

相關(guān)會(huì)議論文 前7條

1 張曉明;奈一雄;齊炯明;安媛媛;張建楠;王靜嫻;;基于信息隱藏的網(wǎng)頁(yè)入侵檢測(cè)技術(shù)與實(shí)現(xiàn)[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2009年

2 林政;呂雅娟;劉群;馬希榮;;基于雙語(yǔ)混和網(wǎng)頁(yè)的平行語(yǔ)料挖掘[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

3 熊德蘭;鄢靖豐;陳靜;;基于論壇主題的網(wǎng)頁(yè)褒貶傾向性識(shí)別[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

4 隋春明;郭志豐;;網(wǎng)頁(yè)防篡改技術(shù)在電力信息網(wǎng)中的應(yīng)用[A];二○○九年全國(guó)電力企業(yè)信息化大會(huì)論文集[C];2009年

5 王海源;石睿智;;高校網(wǎng)頁(yè)惡意代碼的檢測(cè)、清理與預(yù)防[A];中國(guó)高等教育學(xué)會(huì)教育信息化分會(huì)第十次學(xué)術(shù)年會(huì)論文集[C];2010年

6 戴玉剛;;藏文網(wǎng)頁(yè)采集技術(shù)研究[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

7 劉世杰;唐世渭;楊冬青;王騰蛟;姚小波;;自動(dòng)的WEB信息提取和集成[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

相關(guān)重要報(bào)紙文章 前10條

1 范德生 鄧亞玲;守住網(wǎng)頁(yè)的秘密[N];電腦報(bào);2005年

2 貞;網(wǎng)頁(yè)特效與瘦身專家[N];中國(guó)電腦教育報(bào);2002年

3 網(wǎng)天;在自己的電腦上發(fā)布網(wǎng)頁(yè)[N];大眾科技報(bào);2000年

4 楊興平 六子;我的網(wǎng)頁(yè)你別動(dòng)[N];電腦報(bào);2004年

5 楊耀祥;簡(jiǎn)繁網(wǎng)頁(yè)批量互轉(zhuǎn)有妙法[N];中國(guó)電腦教育報(bào);2003年

6 河北 李永波;網(wǎng)頁(yè)底圖顯個(gè)性[N];電腦報(bào);2004年

7 ;讓你的網(wǎng)頁(yè)綻放最美麗的特效[N];中國(guó)電腦教育報(bào);2004年

8 劉成富;編輯網(wǎng)頁(yè)有妙法[N];計(jì)算機(jī)世界;2004年

9 綿陽(yáng)南山 iled;讓 Frontpage 2000 給我們“一了百了”[N];電腦報(bào);2001年

10 陳宗偉;妙用查找替換功能編輯網(wǎng)頁(yè)[N];電腦報(bào);2004年

相關(guān)博士學(xué)位論文 前3條

1 計(jì)華;Web Spam特征分析及其檢測(cè)技術(shù)研究[D];山東師范大學(xué);2015年

2 陳定權(quán);自動(dòng)主題搜索的應(yīng)用研究[D];中國(guó)科學(xué)院研究生院(文獻(xiàn)情報(bào)中心);2003年

3 胡燕;基于Web信息抽取的專業(yè)知識(shí)獲取方法研究[D];武漢理工大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 杜明明;基于關(guān)鍵詞的垃圾網(wǎng)頁(yè)判別研究[D];哈爾濱工業(yè)大學(xué);2015年

2 劉慕凡;基于主題與語(yǔ)義的作弊網(wǎng)頁(yè)檢測(cè)方法研究[D];北京化工大學(xué);2015年

3 賀知義;基于關(guān)鍵詞的搜索引擎網(wǎng)頁(yè)去重算法研究[D];華中師范大學(xué);2015年

4 李小娟;基于分類技術(shù)的網(wǎng)頁(yè)去噪方法的研究[D];貴州師范大學(xué);2015年

5 龔誠(chéng);網(wǎng)頁(yè)增量式采集技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年

6 李雙;基于用戶思維模型分析的網(wǎng)頁(yè)可用性設(shè)計(jì)研究[D];江南大學(xué);2008年

7 劉典型;多頁(yè)面特殊網(wǎng)頁(yè)文字提取與合并技術(shù)研究[D];湖南大學(xué);2010年

8 宋鰲;網(wǎng)頁(yè)去噪在交互電視中的應(yīng)用與研究[D];上海交通大學(xué);2011年

9 柳周頻;基于鏈接上下文的網(wǎng)頁(yè)預(yù)測(cè)[D];吉林大學(xué);2006年

10 姜鑫;基于網(wǎng)頁(yè)連通信息的主題爬行技術(shù)研究與實(shí)現(xiàn)[D];吉林大學(xué);2007年

,

本文編號(hào):2565868

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/guanlilunwen/ydhl/2565868.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶48f75***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com