中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

面向移動(dòng)惡意應(yīng)用流量的非平衡識(shí)別方法研究

發(fā)布時(shí)間:2020-11-07 06:44
   隨著移動(dòng)網(wǎng)絡(luò)的高速發(fā)展,以智能手機(jī)和平板電腦為主的智能終端的數(shù)量呈指數(shù)級(jí)的增長(zhǎng)。智能手機(jī)的普及給人們的生活帶來(lái)了諸多的便利,同時(shí)也存在著許多安全問(wèn)題。近年來(lái),惡意應(yīng)用日益猖獗,給用戶和社會(huì)帶來(lái)了極大危害,也給網(wǎng)絡(luò)安全與管理帶來(lái)新的挑戰(zhàn)。而大部分的惡意應(yīng)用通過(guò)網(wǎng)絡(luò)執(zhí)行惡意行為,因此,分析移動(dòng)應(yīng)用產(chǎn)生的惡意流量成為安全領(lǐng)域研究的熱點(diǎn)。近年來(lái),基于機(jī)器學(xué)習(xí)的流量識(shí)別技術(shù)日趨成熟,這使得從機(jī)器學(xué)習(xí)與網(wǎng)絡(luò)技術(shù)的角度對(duì)惡意流量準(zhǔn)確識(shí)別成為可能。然而應(yīng)用機(jī)器學(xué)習(xí)技術(shù),研究有效的惡意流量識(shí)別方法,數(shù)項(xiàng)關(guān)鍵問(wèn)題卻亟待解決:(1)惡意流量特征提取問(wèn)題。隨著技術(shù)的發(fā)展,采用傳統(tǒng)特征對(duì)惡意流量的識(shí)別率已經(jīng)不能滿足實(shí)際需求。(2)包抽樣問(wèn)題。在高速網(wǎng)絡(luò)環(huán)境中,網(wǎng)絡(luò)的速率越來(lái)越快,采集和處理完整數(shù)據(jù)流相當(dāng)困難;包抽樣技術(shù)的發(fā)展給流量識(shí)別提供了一種新思路,減輕了計(jì)算機(jī)的負(fù)擔(dān)。(3)非平衡流量分類問(wèn)題。從互聯(lián)網(wǎng)中流量分布角度來(lái)看,正常流量遠(yuǎn)遠(yuǎn)高于惡意流量,直接采用標(biāo)準(zhǔn)的分類算法更傾向于對(duì)正常流量的準(zhǔn)確識(shí)別,分類器獲得的性能往往不盡人意。針對(duì)惡意流量識(shí)別中的以上問(wèn)題,本文將從以下幾個(gè)方面開展研究工作:首先,針對(duì)惡意流量特征提取和評(píng)估問(wèn)題,本文分別從數(shù)據(jù)包層面和內(nèi)容層面提取了特征,采用機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練,并構(gòu)建有效的惡意流量識(shí)別模型。其次,針對(duì)樣本抽樣問(wèn)題,本文在早期惡意流量識(shí)別中,采用了數(shù)據(jù)包抽樣技術(shù),結(jié)合分類算法驗(yàn)證了樣本抽樣在流量識(shí)別中的有效性。最后,針對(duì)非平衡分類問(wèn)題,本文從數(shù)據(jù)層面的角度出發(fā),提出了三種解決方法。(1)本文提出了一種基于對(duì)抗生成網(wǎng)絡(luò)的樣本再生成方法,通過(guò)網(wǎng)絡(luò)的對(duì)抗訓(xùn)練學(xué)習(xí)真實(shí)數(shù)據(jù)的潛在分布并合成少數(shù)類樣本,結(jié)合機(jī)器學(xué)習(xí)算法驗(yàn)證了方法的有效性。(2)本文提出了一種非線性加權(quán)差異化樣本重采樣方法。該方法構(gòu)造出一個(gè)在能反映少數(shù)類的安全樣本和邊界樣本對(duì)分類有不同作用的函數(shù),計(jì)算每個(gè)少數(shù)類樣本的權(quán)重和采樣率。然后,結(jié)合SMOTE算法對(duì)樣本進(jìn)行過(guò)采樣并驗(yàn)證了算法的有效性。(3)本文提出了一種基于差分進(jìn)化的改進(jìn)的SMOTE算法。通過(guò)差分進(jìn)化算法智能地搜索最優(yōu)的采樣率取值組合,然后根據(jù)該組合對(duì)數(shù)據(jù)集進(jìn)行SMOTE采樣。實(shí)驗(yàn)表明,該算法在解決非平衡問(wèn)題上是有效的。
【學(xué)位單位】:濟(jì)南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP181;TP393.08
【部分圖文】:

包頭,時(shí)間戳,包級(jí),文件頭


首先我們?cè)诹髁康陌?jí)別上進(jìn)行了特征提取。圖 3.1 Packet 包頭和 Packet 數(shù)據(jù)組成圖 3.1 是 Pcap 文件去除文件頭之后的數(shù)據(jù)格式,可以看到 Packet Header 可以有多個(gè),每個(gè) Packet Header 后面會(huì)跟著一串 Packet Data,Packet Header 定義了 Packet Data的長(zhǎng)度、時(shí)間戳等信息。Pcap 包頭(Packet Header)字段說(shuō)明:Timestamp:時(shí)間戳高位,精確到 seconds。

分類器,特征集合,包大小,混合特征


面向移動(dòng)惡意應(yīng)用流量的非平衡識(shí)別方法研究了在提取的特征集合進(jìn)行訓(xùn)練,并得到的實(shí)驗(yàn)結(jié)果?晒,大多數(shù)的分類器上在包到達(dá)時(shí)間間隔上分類準(zhǔn)確小,所有的算法的在 iat 上的準(zhǔn)確率降低了 5%左右。實(shí)包大小是比 iat 更有效的流量識(shí)別特征。此外,本文把n+iat),可以看到所有的分類算法在混合特征上的分類尤其在 C4.5 和 KNN 上表現(xiàn)更為顯著。這表明 iat 包含

壓縮比,實(shí)驗(yàn)結(jié)果,識(shí)別效果,字符串


圖 3.5 不同的壓縮比例的 ACC 的實(shí)驗(yàn)結(jié)果的壓縮比例的 ACC 的結(jié)果,可以看到:所有的分類準(zhǔn)確率基本相同,在 ratio=8 的識(shí)別效果最差。這是會(huì)丟失一定的信息,對(duì)惡意流量的識(shí)別精度自然降tio=256 時(shí),只是簡(jiǎn)單的計(jì)算字符串包含了多少個(gè)相
【參考文獻(xiàn)】

相關(guān)期刊論文 前5條

1 危美林;張明清;董書琴;李海龍;齊先慶;;面向異常流量檢測(cè)的自適應(yīng)抽樣算法研究[J];計(jì)算機(jī)應(yīng)用研究;2015年10期

2 霍玉丹;谷瓊;蔡之華;袁磊;;基于遺傳算法改進(jìn)的少數(shù)類樣本合成過(guò)采樣技術(shù)的非平衡數(shù)據(jù)集分類算法[J];計(jì)算機(jī)應(yīng)用;2015年01期

3 劉余霞;劉三民;劉濤;王忠群;;一種新的過(guò)采樣算法DB_SMOTE[J];計(jì)算機(jī)工程與應(yīng)用;2014年06期

4 陳偉;胡磊;楊龍;;基于載荷特征的加密流量快速識(shí)別方法[J];計(jì)算機(jī)工程;2012年12期

5 王超學(xué);潘正茂;董麗麗;馬春森;張星;;基于改進(jìn)SMOTE的非平衡數(shù)據(jù)集分類研究[J];計(jì)算機(jī)工程與應(yīng)用;2013年02期



本文編號(hào):2873587

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/guanlilunwen/ydhl/2873587.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fc91f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com