中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

欺詐網(wǎng)頁挖掘中特征優(yōu)選及檢測性能研究

發(fā)布時(shí)間:2020-11-20 15:46
   隨著信息時(shí)代的蓬勃發(fā)展,互聯(lián)網(wǎng)在帶給人們方便的同時(shí),也帶來了許多安全問題,其中,以網(wǎng)頁欺詐為核心的網(wǎng)絡(luò)詐騙行為肆意橫行。欺詐網(wǎng)頁通過各種偽裝手段欺騙搜索引擎,提高自身網(wǎng)頁排名,從而達(dá)到廣告、非法傳銷等目的。在網(wǎng)頁欺詐與反欺詐的博弈里,如何快速有效、低成本地檢測出欺詐網(wǎng)頁,加速構(gòu)建和諧、安全的互聯(lián)網(wǎng)環(huán)境,成了刻不容緩的問題。在欺詐網(wǎng)頁檢測的研究中存在兩個(gè)挑戰(zhàn):一方面,網(wǎng)頁基本特征的高維、冗余增加了欺詐網(wǎng)頁檢測的計(jì)算消耗和計(jì)算代價(jià),影響檢測效率;另一方面,挖掘欺詐網(wǎng)頁的過程中可能會(huì)泄露敏感數(shù)據(jù)的隱私。為了應(yīng)對上述兩個(gè)挑戰(zhàn),提出了多種有效的特征選擇算法,并在此基礎(chǔ)上進(jìn)一步提出一種兼顧數(shù)據(jù)隱私保護(hù)和檢測性能的特征選擇算法,以及一個(gè)高效安全的欺詐網(wǎng)頁檢測模型。本文首先深入研究了欺詐網(wǎng)頁的基本分類以及對應(yīng)的網(wǎng)頁基本特征,并將研究重點(diǎn)放在網(wǎng)頁基本特征的優(yōu)選上,通過分析多種特征選擇算法,提出一種基于信息增益(Information Gain,IG)和遺傳算法(Genetic Algorithm,GA)的改進(jìn)特征選擇算法IFS-BIGGA,并且得到了最佳最小的特征子集(OMFS)。為了分析對比IFS-BIGGA算法的有效性,本文另外實(shí)現(xiàn)了三種基于隨機(jī)森林和鄰域粗糙集的高效的特征選擇算法,實(shí)驗(yàn)結(jié)果證明了IFS-BIGGA算法優(yōu)于其他特征選擇算法。考慮到欺詐網(wǎng)頁挖掘中數(shù)據(jù)隱私保護(hù)的重要性,本文結(jié)合網(wǎng)頁特征選擇,在IFSBIGGA的基礎(chǔ)上,加入基于條件熵的隱私度和置信度,實(shí)現(xiàn)了基于隱私保護(hù)的級聯(lián)特征選擇算法PPGAFS,解決了欺詐網(wǎng)頁挖掘中提高欺詐網(wǎng)頁檢測性能和保護(hù)數(shù)據(jù)隱私之間的矛盾,并在此基礎(chǔ)上提出了一個(gè)高效安全的欺詐網(wǎng)頁檢測模型WSDM,主要包括數(shù)據(jù)離散化、數(shù)據(jù)平衡化、特征選擇和分類檢測四個(gè)階段。為了驗(yàn)證提出算法和模型的有效性,在WEBSPAM-UK2007數(shù)據(jù)集上進(jìn)行了多組對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明了提出的基于PPGAFS的欺詐網(wǎng)頁檢測模型優(yōu)于其他多種新提出的檢測方案,有效保護(hù)了數(shù)據(jù)隱私,并且提高了欺詐網(wǎng)頁檢測性能。
【學(xué)位單位】:西南交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP393.092
【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景和意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 研究內(nèi)容和論文組織結(jié)構(gòu)
        1.3.1 研究內(nèi)容
        1.3.2 論文組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)研究
    2.1 網(wǎng)頁欺詐類型及相關(guān)網(wǎng)頁特征
        2.1.1 鏈接欺詐與基于鏈接的特征
        2.1.2 內(nèi)容欺詐與基于內(nèi)容的特征
        2.1.3 隱藏型欺詐與隱藏型特征
    2.2 特征選擇與分類
        2.2.1 特征選擇
        2.2.2 分類算法
    2.3 總結(jié)
第3章 基于信息增益和遺傳算法改進(jìn)特征選擇策略
    3.1 改進(jìn)的信息增益-特征選擇
    3.2 改進(jìn)的遺傳算法
        3.2.1 染色體編碼
        3.2.2 遺傳算子
    3.3 基于信息增益和遺傳算法的改進(jìn)特征選擇算法IFS-BIGGA
    3.4 數(shù)據(jù)集與評價(jià)指標(biāo)
        3.4.1 數(shù)據(jù)集
        3.4.2 評價(jià)指標(biāo)
        3.4.3 箱型圖
    3.5 基于IFS-BIGGA的特征選擇實(shí)驗(yàn)與結(jié)果分析
        3.5.1 實(shí)驗(yàn)參數(shù)設(shè)置
        3.5.2 特征選擇實(shí)驗(yàn)結(jié)果
        3.5.3 驗(yàn)證性實(shí)驗(yàn)與結(jié)果分析
    3.6 三種特征選擇算法與實(shí)驗(yàn)結(jié)果對比
        3.6.1 基于比例刪除的隨機(jī)森林特征選擇算法PDRFFS
RFFS'>        3.6.2 基于卡方檢驗(yàn)的隨機(jī)森林特征選擇算法Chi-SquareRFFS
        3.6.3 基于鄰域粗糙集的特征選擇算法FHARA
    3.7 本章小結(jié)
第4章 基于隱私保護(hù)的級聯(lián)特征選擇算法
    4.1 隱私度與置信度
    4.2 隱私保護(hù)-特征選擇
    4.3 基于隱私保護(hù)和遺傳算法的級聯(lián)特征選擇算法PPGAFS
    4.4 數(shù)據(jù)集與評價(jià)指標(biāo)
    4.5 實(shí)驗(yàn)與結(jié)果分析
    4.6 本章小結(jié)
第5章 一個(gè)高效安全的欺詐網(wǎng)頁檢測模型
    5.1 欺詐網(wǎng)頁檢測模型WSDM
    5.2 基于WSDM的驗(yàn)證實(shí)驗(yàn)
    5.3 本章小結(jié)
總結(jié)與展望
    總結(jié)
    展望
致謝
參考文獻(xiàn)
攻讀碩士期間發(fā)表的論文

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王嘉卿;朱焱;陳同孝;張真誠;;欺詐網(wǎng)頁檢測中基于遺傳算法的特征優(yōu)選[J];計(jì)算機(jī)應(yīng)用;2018年01期

2 盧曉勇;陳木生;;基于隨機(jī)森林和欠采樣集成的垃圾網(wǎng)頁檢測[J];計(jì)算機(jī)應(yīng)用;2016年03期

3 韋莎;朱焱;;主題相似度與鏈接權(quán)重相結(jié)合的垃圾網(wǎng)頁排序檢測[J];計(jì)算機(jī)應(yīng)用;2016年03期

4 陸釗;李石君;;基于鏈接相似度和作弊系數(shù)的Spam網(wǎng)頁識(shí)別算法[J];計(jì)算機(jī)工程與科學(xué);2015年10期

5 吳少華;程書寶;胡勇;;基于SVM的Web攻擊檢測技術(shù)[J];計(jì)算機(jī)科學(xué);2015年S1期

6 宋源;梁雪春;張然;;基于統(tǒng)計(jì)特性隨機(jī)森林算法的特征選擇[J];計(jì)算機(jī)應(yīng)用;2015年05期

7 董師師;黃哲學(xué);;隨機(jī)森林理論淺析[J];集成技術(shù);2013年01期

8 羅武;方逵;朱興輝;;網(wǎng)絡(luò)搜索引擎排序算法研究進(jìn)展[J];湖南農(nóng)業(yè)科學(xué);2010年07期

9 常璐,夏祖奇;搜索引擎的幾種常用排序算法[J];圖書情報(bào)工作;2003年06期

10 沈?qū)W華,周志華,吳建鑫,陳兆乾;Boosting和Bagging綜述[J];計(jì)算機(jī)工程與應(yīng)用;2000年12期


相關(guān)碩士學(xué)位論文 前5條

1 孫丹丹;集成URL新特征的網(wǎng)絡(luò)釣魚檢測機(jī)制研究[D];西南交通大學(xué);2017年

2 江雄偉;偽裝型垃圾網(wǎng)頁檢測技術(shù)的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2014年

3 李法良;集成Web質(zhì)量的垃圾網(wǎng)頁分級檢測機(jī)制研究[D];西南交通大學(xué);2013年

4 王莉麗;隱藏型垃圾網(wǎng)頁檢測研究[D];西南交通大學(xué);2013年

5 周政;隱藏型垃圾網(wǎng)頁檢測技術(shù)的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2012年



本文編號(hào):2891640

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/guanlilunwen/ydhl/2891640.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f145f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com