基于混合特征提取和集成學(xué)習(xí)的個人貸款違約預(yù)測研究
發(fā)布時間:2025-07-03 03:17
隨著互聯(lián)網(wǎng)金融的不斷發(fā)展,許多小貸公司因風(fēng)險控制能力不足,接連暴雷。借款人違約風(fēng)險評估模型作為一種有效的風(fēng)控手段,可以利用借款人的個人信息和社會活動數(shù)據(jù)發(fā)現(xiàn)用戶潛在的違約風(fēng)險,在小貸企業(yè)中發(fā)揮著顯著作用。本文針對借款用戶數(shù)據(jù)類別不平衡、特征維度高的特點以及企業(yè)接入數(shù)據(jù)成本高的問題,對信貸數(shù)據(jù)進行特征選擇和均衡化處理,并在此基礎(chǔ)上建立了基于集成學(xué)習(xí)的借款人違約風(fēng)險概率預(yù)測模型。具體研究內(nèi)容和貢獻如下:(1)本文提出了一種分層的特征選擇框架。首先使用ReliefS算法,通過在特征篩選階段給與少數(shù)類樣本更多關(guān)注,選擇出對少數(shù)類樣本區(qū)分能力強的特征,提高模型在不平衡樣本集的預(yù)測效果,結(jié)合Pearson相關(guān)系數(shù)法對復(fù)雜且高維的信貸特征進行快速的特征初篩,然后對剩余特征使用精篩算法。相比于直接進行特征精篩,在保證模型效果的前提下,分層特征選擇顯著提升了篩選效率。(2)針對不同預(yù)測模型特點提出了針對性的特征精篩算法。因邏輯回歸模型效果受信貸特征影響大,本文提出了IKPLasso特征篩選算法,從多個角度評估信貸特征,避免了單一評價指標造成信貸特征多方面信息被忽...
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 國內(nèi)外研究歷史與現(xiàn)狀
1.2.1 貸款違約預(yù)測的的研究現(xiàn)狀
1.2.2 非平衡分類算法的研究現(xiàn)狀
1.2.3 特性選擇算法的研究現(xiàn)狀
1.3 本文的主要貢獻與創(chuàng)新
1.4 本論文的結(jié)構(gòu)安排
第二章 相關(guān)理論知識與關(guān)鍵性技術(shù)
2.1 不平衡分類算法
2.1.1 數(shù)據(jù)層面
2.1.2 算法層面
2.2 特征選擇
2.2.1 過濾式(Filter)算法
2.2.2 包裹式(Wrapper)算法
2.2.3 嵌入式(Embedded)算法
2.3 邏輯回歸(Logistic Regression)算法
2.3.1 邏輯回歸的預(yù)測函數(shù)
2.3.2 邏輯回歸的損失函數(shù)
2.3.3 邏輯回歸梯度下降法求解
2.4 LightGBM算法
2.4.1 GBDT算法基礎(chǔ)
2.4.2 XGBoost算法基礎(chǔ)
2.4.3 LightGBM算法基礎(chǔ)
2.5 深度神經(jīng)網(wǎng)絡(luò)(DNN)算法
2.5.1 神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
2.5.2 DNN前向傳播
2.5.3 DNN反向傳播
2.6 本章小結(jié)
第三章 分層特征篩選算法
3.1 特征處理與篩選框架
3.2 特征初篩
3.2.1 改進的Relief算法(ReliefS)
3.2.2 皮爾森相關(guān)系數(shù)法
3.2.3 特征初篩算法流程
3.3 針對不同預(yù)測模型的個性化特征篩選算法
3.3.1 邏輯回歸的特征篩選算法
3.3.2 LightGBM的特征篩選算法
3.3.3 深度神經(jīng)網(wǎng)絡(luò)的特征篩選算法
3.4 本章小結(jié)
第四章 構(gòu)建信貸評估模型中的工程實現(xiàn)
4.1 小貸場景數(shù)據(jù)集介紹
4.2 探索性數(shù)據(jù)分析
4.3 特征處理
4.3.1 缺失值處理
4.3.2 連續(xù)特征離散化
4.3.3 WOE轉(zhuǎn)化
4.4 特征構(gòu)建
4.5 本章小結(jié)
第五章 實驗結(jié)果與分析
5.1 實驗設(shè)置
5.2 分層特征篩選算法效果對比
5.2.1 實驗設(shè)計
5.2.2 實驗結(jié)果
5.3 結(jié)合特征選擇的邏輯回歸模型
5.3.1 實驗設(shè)計
5.3.2 實驗結(jié)果
5.4 結(jié)合特征選擇的LightGBM模型
5.4.1 實驗設(shè)計
5.4.2 實驗結(jié)果
5.5 結(jié)合特征選擇的DNN模型
5.5.1 實驗設(shè)計
5.5.2 實驗結(jié)果
5.6 模型融合與比較
5.7 RP+LightGBM-RRFE通用數(shù)據(jù)集的結(jié)果與分析
5.7.1 數(shù)據(jù)描述與處理
5.7.2 實驗設(shè)計
5.7.3 實驗結(jié)果
5.8 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 展望
致謝
參考文獻
本文編號:4055681
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 國內(nèi)外研究歷史與現(xiàn)狀
1.2.1 貸款違約預(yù)測的的研究現(xiàn)狀
1.2.2 非平衡分類算法的研究現(xiàn)狀
1.2.3 特性選擇算法的研究現(xiàn)狀
1.3 本文的主要貢獻與創(chuàng)新
1.4 本論文的結(jié)構(gòu)安排
第二章 相關(guān)理論知識與關(guān)鍵性技術(shù)
2.1 不平衡分類算法
2.1.1 數(shù)據(jù)層面
2.1.2 算法層面
2.2 特征選擇
2.2.1 過濾式(Filter)算法
2.2.2 包裹式(Wrapper)算法
2.2.3 嵌入式(Embedded)算法
2.3 邏輯回歸(Logistic Regression)算法
2.3.1 邏輯回歸的預(yù)測函數(shù)
2.3.2 邏輯回歸的損失函數(shù)
2.3.3 邏輯回歸梯度下降法求解
2.4 LightGBM算法
2.4.1 GBDT算法基礎(chǔ)
2.4.2 XGBoost算法基礎(chǔ)
2.4.3 LightGBM算法基礎(chǔ)
2.5 深度神經(jīng)網(wǎng)絡(luò)(DNN)算法
2.5.1 神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
2.5.2 DNN前向傳播
2.5.3 DNN反向傳播
2.6 本章小結(jié)
第三章 分層特征篩選算法
3.1 特征處理與篩選框架
3.2 特征初篩
3.2.1 改進的Relief算法(ReliefS)
3.2.2 皮爾森相關(guān)系數(shù)法
3.2.3 特征初篩算法流程
3.3 針對不同預(yù)測模型的個性化特征篩選算法
3.3.1 邏輯回歸的特征篩選算法
3.3.2 LightGBM的特征篩選算法
3.3.3 深度神經(jīng)網(wǎng)絡(luò)的特征篩選算法
3.4 本章小結(jié)
第四章 構(gòu)建信貸評估模型中的工程實現(xiàn)
4.1 小貸場景數(shù)據(jù)集介紹
4.2 探索性數(shù)據(jù)分析
4.3 特征處理
4.3.1 缺失值處理
4.3.2 連續(xù)特征離散化
4.3.3 WOE轉(zhuǎn)化
4.4 特征構(gòu)建
4.5 本章小結(jié)
第五章 實驗結(jié)果與分析
5.1 實驗設(shè)置
5.2 分層特征篩選算法效果對比
5.2.1 實驗設(shè)計
5.2.2 實驗結(jié)果
5.3 結(jié)合特征選擇的邏輯回歸模型
5.3.1 實驗設(shè)計
5.3.2 實驗結(jié)果
5.4 結(jié)合特征選擇的LightGBM模型
5.4.1 實驗設(shè)計
5.4.2 實驗結(jié)果
5.5 結(jié)合特征選擇的DNN模型
5.5.1 實驗設(shè)計
5.5.2 實驗結(jié)果
5.6 模型融合與比較
5.7 RP+LightGBM-RRFE通用數(shù)據(jù)集的結(jié)果與分析
5.7.1 數(shù)據(jù)描述與處理
5.7.2 實驗設(shè)計
5.7.3 實驗結(jié)果
5.8 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 展望
致謝
參考文獻
本文編號:4055681
本文鏈接:http://lk138.cn/guanlilunwen/huobilw/4055681.html
上一篇:金融危機對中國膠合板產(chǎn)業(yè)的影響研究
下一篇:沒有了
下一篇:沒有了
最近更新
教材專著