對于信用卡透支還款客戶分類問題的研究
發(fā)布時間:2020-12-08 02:19
隨著信用經(jīng)濟(jì)的發(fā)展,近幾年我國信用卡市場進(jìn)入快速發(fā)展時期,持卡人增多、發(fā)卡量增大,伴隨而來的信用風(fēng)險隨之增加。銀行在現(xiàn)階段拓展信用卡業(yè)務(wù)的同時,需更加重視信用卡客戶帶來的不良透支風(fēng)險,加大審批力度,減少不必要的經(jīng)濟(jì)損失。本文利用商業(yè)銀行現(xiàn)有信用卡客戶數(shù)據(jù),通過對已透支客戶還款行為的研究,深入分析信用卡客戶透支還款情況。首先,通過描述性統(tǒng)計針對重要變量進(jìn)行分析,用圖表的形式直觀地分析影響透支還款行為的客戶指標(biāo)。然后,根據(jù)央行信用卡五級分類準(zhǔn)則將客戶狀態(tài)變量劃分為正常、關(guān)注、次級、可疑和損失五個級別,對五級分類數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理、數(shù)據(jù)可視化、多分類建模預(yù)測等研究。最后,以銀行實際需求為導(dǎo)向,重點研究銀行的信用卡不良透支客戶分類問題,通過XGBoost、lightGBM等機(jī)器學(xué)習(xí)方法,結(jié)合不平衡數(shù)據(jù)處理和代價敏感AdaCost算法,尋找用于識別不平衡數(shù)據(jù)少數(shù)類更有效的分類器,來準(zhǔn)確預(yù)測逾期時間較長未正常還款的客戶。
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【部分圖文】:
信用卡五級分類人數(shù)餅圖
蘭州大學(xué)碩士學(xué)位論文對于信用卡透支還款客戶分類問題的研究圖2.2信用卡五級分類透支金額條形圖應(yīng)的透支金額中位數(shù),從正常級別、關(guān)注級別一直到損失級別,各類別客戶的透支金額中位數(shù)呈遞增態(tài)勢,正常級別客戶透支金額中位數(shù)約為3000元,損失級別客戶透支金額中位數(shù)約為6500元,顯然透支金額越大的客戶還款越容易出現(xiàn)問題,所以銀行信用卡部門在監(jiān)測到客戶出現(xiàn)高額貸款時需要特別關(guān)注。以上分析主要基于銀行五級分類口徑對客戶透支情況進(jìn)行初步介紹,下面對自變量描述性分析時將次級、可疑、損失三個類別稱為不良透支,進(jìn)一步分析各變量對不良透支情況的影響,其中不良透支率即為發(fā)生不良透支的客戶人數(shù)占該類別客戶總數(shù)的比例。3自變量描述性分析首先針對不同年齡客戶分析信用卡不良透支率,得到如圖2.3所示的折線圖,該數(shù)據(jù)集中年齡分布在1486歲。通過觀察,在3568這個年齡段,信用卡不良透支率趨勢比較平穩(wěn),且處在較低水平,均小于7%,而位于兩側(cè)的年齡段35歲以下和68歲10
蘭州大學(xué)碩士學(xué)位論文對于信用卡透支還款客戶分類問題的研究t-SNE(t-distributedstochasticneighborembedding)即t分布隨機(jī)鄰近嵌入,是一種非線性降維方法,在2008年由LaurensvanderMaaten和GeoffreyHinton提出[24],適用于高維數(shù)據(jù)降維到二維或三維,并進(jìn)行可視化。t-SNE是由SNE發(fā)展而來的一種算法,SNE是通過變換將高維中的數(shù)據(jù)點映射到低維概率分布上,SNE將高維和低維中的樣本分布都看作高斯分布,而t-SNE在低維空間中用t分布來代替高斯分布,使用厚尾分布t分布可以讓距離大的簇之間距離拉大,可視化效果更好。圖3.1信用卡五級分類t-SNE可視化圖圖3.1是利用Python中manifold包中的TSNE函數(shù)對信用卡五級分類數(shù)據(jù)做降維處理,然后用降維后的二維數(shù)據(jù)在平面上繪制散點圖得到。圖中五級分類用不同顏色表示,其中紫色表示的正常級別最多,其次是關(guān)注級別,這兩類在圖中的分布位置比較接近,分布在圖中下方的是次級、可疑、損失三類?梢暬Y(jié)果顯示屬于正常和關(guān)注級別的客戶特征較為相似,屬于次級類的客戶相對比較獨立,容易區(qū)分,而屬于可疑和損失類的客戶特征比較相似,相對難區(qū)分。18
本文編號:2904280
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【部分圖文】:
信用卡五級分類人數(shù)餅圖
蘭州大學(xué)碩士學(xué)位論文對于信用卡透支還款客戶分類問題的研究圖2.2信用卡五級分類透支金額條形圖應(yīng)的透支金額中位數(shù),從正常級別、關(guān)注級別一直到損失級別,各類別客戶的透支金額中位數(shù)呈遞增態(tài)勢,正常級別客戶透支金額中位數(shù)約為3000元,損失級別客戶透支金額中位數(shù)約為6500元,顯然透支金額越大的客戶還款越容易出現(xiàn)問題,所以銀行信用卡部門在監(jiān)測到客戶出現(xiàn)高額貸款時需要特別關(guān)注。以上分析主要基于銀行五級分類口徑對客戶透支情況進(jìn)行初步介紹,下面對自變量描述性分析時將次級、可疑、損失三個類別稱為不良透支,進(jìn)一步分析各變量對不良透支情況的影響,其中不良透支率即為發(fā)生不良透支的客戶人數(shù)占該類別客戶總數(shù)的比例。3自變量描述性分析首先針對不同年齡客戶分析信用卡不良透支率,得到如圖2.3所示的折線圖,該數(shù)據(jù)集中年齡分布在1486歲。通過觀察,在3568這個年齡段,信用卡不良透支率趨勢比較平穩(wěn),且處在較低水平,均小于7%,而位于兩側(cè)的年齡段35歲以下和68歲10
蘭州大學(xué)碩士學(xué)位論文對于信用卡透支還款客戶分類問題的研究t-SNE(t-distributedstochasticneighborembedding)即t分布隨機(jī)鄰近嵌入,是一種非線性降維方法,在2008年由LaurensvanderMaaten和GeoffreyHinton提出[24],適用于高維數(shù)據(jù)降維到二維或三維,并進(jìn)行可視化。t-SNE是由SNE發(fā)展而來的一種算法,SNE是通過變換將高維中的數(shù)據(jù)點映射到低維概率分布上,SNE將高維和低維中的樣本分布都看作高斯分布,而t-SNE在低維空間中用t分布來代替高斯分布,使用厚尾分布t分布可以讓距離大的簇之間距離拉大,可視化效果更好。圖3.1信用卡五級分類t-SNE可視化圖圖3.1是利用Python中manifold包中的TSNE函數(shù)對信用卡五級分類數(shù)據(jù)做降維處理,然后用降維后的二維數(shù)據(jù)在平面上繪制散點圖得到。圖中五級分類用不同顏色表示,其中紫色表示的正常級別最多,其次是關(guān)注級別,這兩類在圖中的分布位置比較接近,分布在圖中下方的是次級、可疑、損失三類?梢暬Y(jié)果顯示屬于正常和關(guān)注級別的客戶特征較為相似,屬于次級類的客戶相對比較獨立,容易區(qū)分,而屬于可疑和損失類的客戶特征比較相似,相對難區(qū)分。18
本文編號:2904280
本文鏈接:http://www.lk138.cn/shoufeilunwen/benkebiyelunwen/2904280.html
最近更新
教材專著