基于深度學習的釣魚網(wǎng)頁檢測方法研究
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
圖4.6釣魚網(wǎng)頁示例
4基于表征學習的釣魚網(wǎng)頁檢測37樣,將“https://www.google.com”分割得到的單詞進行編碼并轉(zhuǎn)換為one-hot編碼矩陣,然后表征到低維向量空間,過程如圖4.5所示。URL單詞矩陣表示0.51455805,0.61036707,0.94602879,0.1377....
圖4.7網(wǎng)頁標簽實例
4基于表征學習的釣魚網(wǎng)頁檢測39HTML文本內(nèi)容,但本質(zhì)結(jié)構(gòu)卻會有很大差異。HTML網(wǎng)頁的主要組成部分為文本內(nèi)容、標簽以及組件信息,其中文本內(nèi)容負責網(wǎng)頁信息的展示,標簽則為所展示網(wǎng)頁內(nèi)容的控制符號。將HTML源碼進行解析,得到網(wǎng)頁標簽信息,可將其構(gòu)造成HTML網(wǎng)頁DOM樹型結(jié)構(gòu)。....
圖4.11URL字符串TSNE可視化
西安科技大學全日制工程碩士學位論文48從圖4.10可以看出,當URL字符串、DOM結(jié)構(gòu)以及HTML文本內(nèi)容均表示為128維向量時,MICBA模型在Accuracy和F1優(yōu)于其他向量維度表示,DOM結(jié)構(gòu)以和HTML文本內(nèi)容在Precision更優(yōu),URL字符串和DOM結(jié)構(gòu)的TPR效....
圖4.12DOM結(jié)構(gòu)TSNE可視化
4基于表征學習的釣魚網(wǎng)頁檢測49FPR上有著更好的結(jié)果。②DOM結(jié)構(gòu)圖4.12為DOM樹結(jié)構(gòu)向量化映射在二維平面上,可以發(fā)現(xiàn)head標簽跟body距離更近,tr和td為表格標簽也聚集在一起。這樣證明網(wǎng)頁DOM樹結(jié)構(gòu)包含著深層次語義特征信息,能夠支持采用表征學習技術(shù)對其進行表示。圖....
本文編號:3902650
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/3902650.html