基于非均衡數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)激勵函數(shù)的改進研究
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1TomekLinks算法示意圖
圖2-1TomekLinks算法示意圖圖中觀察可見,此算法主要剔除了在小樣本類中的大樣本類樣本,使各更加集中。在建立TomekLinks鏈接對后,對滿足配對的大樣本類贗本除,在平衡正負類數(shù)據(jù)的同時,也減少了模型的復(fù)雜性。有一種欠采樣的方法就是NearMiss算法....
圖2-2Nearmiss算法示意圖
圖2-2Nearmiss算法示意圖圖中觀察,能略微分辨出三種欠采樣方法的區(qū)別,從原理上分析,Near于其工作原理,在多數(shù)類樣本點選擇上,更偏向于集中在少數(shù)類附近法更具有局部性,最后樣本的分布并不是均勻的。NearMiss-3算法則離少數(shù)類近的多數(shù)類樣本,因此兩類樣本的分布....
圖2-3SMOTE及衍生算法示意圖
華中科技大學(xué)碩士學(xué)位論文P加入到新的集合中。(3)最后針對在新合成集合中的每個樣本點再次使用SMOTE算法生成新對于Borderline-SMOTE2[18]的思路與Borderline-SMOTE1的1、2兩步都大是在新集合中不是進行簡單....
圖2-4SMOTE+Tomek算法示意圖
圖2-4SMOTE+Tomek算法示意圖可以觀察出,首先SMOTE是通過線性插值方法提高少數(shù)類樣本過采樣補充的數(shù)據(jù)量大,這樣就可以一定程度上在平衡分布的問題。而后在數(shù)據(jù)中建立TomekLinks對,尋找類別之間,將這些連接對直接剔除,而且這里由于一開始擴充了樣本容....
本文編號:3891623
本文鏈接:http://lk138.cn/guanlilunwen/tongjijuecelunwen/3891623.html