SMOTE混合抽樣對(duì)非平衡數(shù)據(jù)分類效果的影響分析
發(fā)布時(shí)間:2024-05-14 22:36
本文旨在研究對(duì)非平衡數(shù)據(jù)建模時(shí),SMOTE過抽樣和隨機(jī)欠抽樣的不同比例對(duì)模型預(yù)測(cè)效果產(chǎn)生的影響。首先基于模擬數(shù)據(jù),探究了混合抽樣比例的不同組合下,帶有LASSO變量選擇的邏輯回歸模型對(duì)于非平衡程度不同數(shù)據(jù)的分類效果。模擬結(jié)果表明,過抽樣和欠抽樣的比例越高,預(yù)測(cè)效果越好,但是在某些情況下,直接使用原始數(shù)據(jù)進(jìn)行建模,選取一個(gè)合適的臨界值,可以得到更理想的分類模型。通過對(duì)某擔(dān)保公司的數(shù)據(jù)實(shí)證研究發(fā)現(xiàn),前述結(jié)論基本成立,且當(dāng)原始數(shù)據(jù)極不平衡時(shí),采用混合抽樣方法進(jìn)行數(shù)據(jù)預(yù)處理可以有效提高模型的預(yù)測(cè)效果,這對(duì)于非平衡數(shù)據(jù)的建模分析過程有一定的指導(dǎo)意義。
【文章頁數(shù)】:8 頁
本文編號(hào):3973514
【文章頁數(shù)】:8 頁
本文編號(hào):3973514
本文鏈接:http://www.lk138.cn/guanlilunwen/tongjijuecelunwen/3973514.html
最近更新
教材專著