基于混合特征提取和集成學(xué)習(xí)的個(gè)人貸款違約預(yù)測(cè)研究
發(fā)布時(shí)間:2025-07-03 03:17
隨著互聯(lián)網(wǎng)金融的不斷發(fā)展,許多小貸公司因風(fēng)險(xiǎn)控制能力不足,接連暴雷。借款人違約風(fēng)險(xiǎn)評(píng)估模型作為一種有效的風(fēng)控手段,可以利用借款人的個(gè)人信息和社會(huì)活動(dòng)數(shù)據(jù)發(fā)現(xiàn)用戶潛在的違約風(fēng)險(xiǎn),在小貸企業(yè)中發(fā)揮著顯著作用。本文針對(duì)借款用戶數(shù)據(jù)類(lèi)別不平衡、特征維度高的特點(diǎn)以及企業(yè)接入數(shù)據(jù)成本高的問(wèn)題,對(duì)信貸數(shù)據(jù)進(jìn)行特征選擇和均衡化處理,并在此基礎(chǔ)上建立了基于集成學(xué)習(xí)的借款人違約風(fēng)險(xiǎn)概率預(yù)測(cè)模型。具體研究?jī)?nèi)容和貢獻(xiàn)如下:(1)本文提出了一種分層的特征選擇框架。首先使用ReliefS算法,通過(guò)在特征篩選階段給與少數(shù)類(lèi)樣本更多關(guān)注,選擇出對(duì)少數(shù)類(lèi)樣本區(qū)分能力強(qiáng)的特征,提高模型在不平衡樣本集的預(yù)測(cè)效果,結(jié)合Pearson相關(guān)系數(shù)法對(duì)復(fù)雜且高維的信貸特征進(jìn)行快速的特征初篩,然后對(duì)剩余特征使用精篩算法。相比于直接進(jìn)行特征精篩,在保證模型效果的前提下,分層特征選擇顯著提升了篩選效率。(2)針對(duì)不同預(yù)測(cè)模型特點(diǎn)提出了針對(duì)性的特征精篩算法。因邏輯回歸模型效果受信貸特征影響大,本文提出了IKPLasso特征篩選算法,從多個(gè)角度評(píng)估信貸特征,避免了單一評(píng)價(jià)指標(biāo)造成信貸特征多方面信息被忽...
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 國(guó)內(nèi)外研究歷史與現(xiàn)狀
1.2.1 貸款違約預(yù)測(cè)的的研究現(xiàn)狀
1.2.2 非平衡分類(lèi)算法的研究現(xiàn)狀
1.2.3 特性選擇算法的研究現(xiàn)狀
1.3 本文的主要貢獻(xiàn)與創(chuàng)新
1.4 本論文的結(jié)構(gòu)安排
第二章 相關(guān)理論知識(shí)與關(guān)鍵性技術(shù)
2.1 不平衡分類(lèi)算法
2.1.1 數(shù)據(jù)層面
2.1.2 算法層面
2.2 特征選擇
2.2.1 過(guò)濾式(Filter)算法
2.2.2 包裹式(Wrapper)算法
2.2.3 嵌入式(Embedded)算法
2.3 邏輯回歸(Logistic Regression)算法
2.3.1 邏輯回歸的預(yù)測(cè)函數(shù)
2.3.2 邏輯回歸的損失函數(shù)
2.3.3 邏輯回歸梯度下降法求解
2.4 LightGBM算法
2.4.1 GBDT算法基礎(chǔ)
2.4.2 XGBoost算法基礎(chǔ)
2.4.3 LightGBM算法基礎(chǔ)
2.5 深度神經(jīng)網(wǎng)絡(luò)(DNN)算法
2.5.1 神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
2.5.2 DNN前向傳播
2.5.3 DNN反向傳播
2.6 本章小結(jié)
第三章 分層特征篩選算法
3.1 特征處理與篩選框架
3.2 特征初篩
3.2.1 改進(jìn)的Relief算法(ReliefS)
3.2.2 皮爾森相關(guān)系數(shù)法
3.2.3 特征初篩算法流程
3.3 針對(duì)不同預(yù)測(cè)模型的個(gè)性化特征篩選算法
3.3.1 邏輯回歸的特征篩選算法
3.3.2 LightGBM的特征篩選算法
3.3.3 深度神經(jīng)網(wǎng)絡(luò)的特征篩選算法
3.4 本章小結(jié)
第四章 構(gòu)建信貸評(píng)估模型中的工程實(shí)現(xiàn)
4.1 小貸場(chǎng)景數(shù)據(jù)集介紹
4.2 探索性數(shù)據(jù)分析
4.3 特征處理
4.3.1 缺失值處理
4.3.2 連續(xù)特征離散化
4.3.3 WOE轉(zhuǎn)化
4.4 特征構(gòu)建
4.5 本章小結(jié)
第五章 實(shí)驗(yàn)結(jié)果與分析
5.1 實(shí)驗(yàn)設(shè)置
5.2 分層特征篩選算法效果對(duì)比
5.2.1 實(shí)驗(yàn)設(shè)計(jì)
5.2.2 實(shí)驗(yàn)結(jié)果
5.3 結(jié)合特征選擇的邏輯回歸模型
5.3.1 實(shí)驗(yàn)設(shè)計(jì)
5.3.2 實(shí)驗(yàn)結(jié)果
5.4 結(jié)合特征選擇的LightGBM模型
5.4.1 實(shí)驗(yàn)設(shè)計(jì)
5.4.2 實(shí)驗(yàn)結(jié)果
5.5 結(jié)合特征選擇的DNN模型
5.5.1 實(shí)驗(yàn)設(shè)計(jì)
5.5.2 實(shí)驗(yàn)結(jié)果
5.6 模型融合與比較
5.7 RP+LightGBM-RRFE通用數(shù)據(jù)集的結(jié)果與分析
5.7.1 數(shù)據(jù)描述與處理
5.7.2 實(shí)驗(yàn)設(shè)計(jì)
5.7.3 實(shí)驗(yàn)結(jié)果
5.8 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 展望
致謝
參考文獻(xiàn)
本文編號(hào):4055681
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 國(guó)內(nèi)外研究歷史與現(xiàn)狀
1.2.1 貸款違約預(yù)測(cè)的的研究現(xiàn)狀
1.2.2 非平衡分類(lèi)算法的研究現(xiàn)狀
1.2.3 特性選擇算法的研究現(xiàn)狀
1.3 本文的主要貢獻(xiàn)與創(chuàng)新
1.4 本論文的結(jié)構(gòu)安排
第二章 相關(guān)理論知識(shí)與關(guān)鍵性技術(shù)
2.1 不平衡分類(lèi)算法
2.1.1 數(shù)據(jù)層面
2.1.2 算法層面
2.2 特征選擇
2.2.1 過(guò)濾式(Filter)算法
2.2.2 包裹式(Wrapper)算法
2.2.3 嵌入式(Embedded)算法
2.3 邏輯回歸(Logistic Regression)算法
2.3.1 邏輯回歸的預(yù)測(cè)函數(shù)
2.3.2 邏輯回歸的損失函數(shù)
2.3.3 邏輯回歸梯度下降法求解
2.4 LightGBM算法
2.4.1 GBDT算法基礎(chǔ)
2.4.2 XGBoost算法基礎(chǔ)
2.4.3 LightGBM算法基礎(chǔ)
2.5 深度神經(jīng)網(wǎng)絡(luò)(DNN)算法
2.5.1 神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
2.5.2 DNN前向傳播
2.5.3 DNN反向傳播
2.6 本章小結(jié)
第三章 分層特征篩選算法
3.1 特征處理與篩選框架
3.2 特征初篩
3.2.1 改進(jìn)的Relief算法(ReliefS)
3.2.2 皮爾森相關(guān)系數(shù)法
3.2.3 特征初篩算法流程
3.3 針對(duì)不同預(yù)測(cè)模型的個(gè)性化特征篩選算法
3.3.1 邏輯回歸的特征篩選算法
3.3.2 LightGBM的特征篩選算法
3.3.3 深度神經(jīng)網(wǎng)絡(luò)的特征篩選算法
3.4 本章小結(jié)
第四章 構(gòu)建信貸評(píng)估模型中的工程實(shí)現(xiàn)
4.1 小貸場(chǎng)景數(shù)據(jù)集介紹
4.2 探索性數(shù)據(jù)分析
4.3 特征處理
4.3.1 缺失值處理
4.3.2 連續(xù)特征離散化
4.3.3 WOE轉(zhuǎn)化
4.4 特征構(gòu)建
4.5 本章小結(jié)
第五章 實(shí)驗(yàn)結(jié)果與分析
5.1 實(shí)驗(yàn)設(shè)置
5.2 分層特征篩選算法效果對(duì)比
5.2.1 實(shí)驗(yàn)設(shè)計(jì)
5.2.2 實(shí)驗(yàn)結(jié)果
5.3 結(jié)合特征選擇的邏輯回歸模型
5.3.1 實(shí)驗(yàn)設(shè)計(jì)
5.3.2 實(shí)驗(yàn)結(jié)果
5.4 結(jié)合特征選擇的LightGBM模型
5.4.1 實(shí)驗(yàn)設(shè)計(jì)
5.4.2 實(shí)驗(yàn)結(jié)果
5.5 結(jié)合特征選擇的DNN模型
5.5.1 實(shí)驗(yàn)設(shè)計(jì)
5.5.2 實(shí)驗(yàn)結(jié)果
5.6 模型融合與比較
5.7 RP+LightGBM-RRFE通用數(shù)據(jù)集的結(jié)果與分析
5.7.1 數(shù)據(jù)描述與處理
5.7.2 實(shí)驗(yàn)設(shè)計(jì)
5.7.3 實(shí)驗(yàn)結(jié)果
5.8 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 展望
致謝
參考文獻(xiàn)
本文編號(hào):4055681
本文鏈接:http://lk138.cn/guanlilunwen/huobilw/4055681.html
上一篇:金融危機(jī)對(duì)中國(guó)膠合板產(chǎn)業(yè)的影響研究
下一篇:沒(méi)有了
下一篇:沒(méi)有了
最近更新
教材專(zhuān)著