基于深度學(xué)習(xí)的釣魚網(wǎng)頁檢測方法研究
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖4.6釣魚網(wǎng)頁示例
4基于表征學(xué)習(xí)的釣魚網(wǎng)頁檢測37樣,將“https://www.google.com”分割得到的單詞進(jìn)行編碼并轉(zhuǎn)換為one-hot編碼矩陣,然后表征到低維向量空間,過程如圖4.5所示。URL單詞矩陣表示0.51455805,0.61036707,0.94602879,0.1377....
圖4.7網(wǎng)頁標(biāo)簽實(shí)例
4基于表征學(xué)習(xí)的釣魚網(wǎng)頁檢測39HTML文本內(nèi)容,但本質(zhì)結(jié)構(gòu)卻會有很大差異。HTML網(wǎng)頁的主要組成部分為文本內(nèi)容、標(biāo)簽以及組件信息,其中文本內(nèi)容負(fù)責(zé)網(wǎng)頁信息的展示,標(biāo)簽則為所展示網(wǎng)頁內(nèi)容的控制符號。將HTML源碼進(jìn)行解析,得到網(wǎng)頁標(biāo)簽信息,可將其構(gòu)造成HTML網(wǎng)頁DOM樹型結(jié)構(gòu)。....
圖4.11URL字符串TSNE可視化
西安科技大學(xué)全日制工程碩士學(xué)位論文48從圖4.10可以看出,當(dāng)URL字符串、DOM結(jié)構(gòu)以及HTML文本內(nèi)容均表示為128維向量時(shí),MICBA模型在Accuracy和F1優(yōu)于其他向量維度表示,DOM結(jié)構(gòu)以和HTML文本內(nèi)容在Precision更優(yōu),URL字符串和DOM結(jié)構(gòu)的TPR效....
圖4.12DOM結(jié)構(gòu)TSNE可視化
4基于表征學(xué)習(xí)的釣魚網(wǎng)頁檢測49FPR上有著更好的結(jié)果。②DOM結(jié)構(gòu)圖4.12為DOM樹結(jié)構(gòu)向量化映射在二維平面上,可以發(fā)現(xiàn)head標(biāo)簽跟body距離更近,tr和td為表格標(biāo)簽也聚集在一起。這樣證明網(wǎng)頁DOM樹結(jié)構(gòu)包含著深層次語義特征信息,能夠支持采用表征學(xué)習(xí)技術(shù)對其進(jìn)行表示。圖....
本文編號:3902650
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/3902650.html