個人信貸領(lǐng)域的用戶畫像建模與逾期識別集成算法研究
發(fā)布時間:2020-10-15 01:10
隨著我國經(jīng)濟發(fā)展進入新常態(tài),國內(nèi)金融信貸行業(yè)發(fā)展迅速,許多金融信貸服務(wù)逐步推廣到大眾生活當(dāng)中,個人信貸業(yè)務(wù)已經(jīng)風(fēng)生水起,加上互聯(lián)網(wǎng)金融的不斷發(fā)展,個人信用消費越來越普遍,信貸行業(yè)用戶畫像模型與逾期識別模型的建立已經(jīng)是一種迫切需求。本文首先針對基礎(chǔ)樣本數(shù)據(jù)的變量類型提出了變量細(xì)分的想法,得到了變量細(xì)分的十一個維度,并在傳統(tǒng)RFM價值評價模型基礎(chǔ)上建立了以信貸用戶消費能力、用戶粘性和還貸意愿這三個維度的綜合評價指標(biāo)體系;谧兞考(xì)分維度與綜合評價指標(biāo)體系我們建立了用戶畫像模型,其中包括了用戶細(xì)分畫像與用戶漏斗畫像。對于用戶細(xì)分畫像,我們使用綜合評價指標(biāo)體系在消費能力、用戶粘性、還貸意愿這三個維度細(xì)分了信貸領(lǐng)域的用戶群,針對性的評價了每類用戶群的價值并提出了相應(yīng)的資源配置策略。對于用戶漏斗畫像,我們基于變量細(xì)分維度后得到的十一個維度使用用戶漏斗算法,得到了高逾期占比用戶群體并捕獲了高逾期占比用戶群的行為路徑。在構(gòu)建完用戶畫像模型后,我們著力于構(gòu)建逾期識別集成算法模型。首先基于變量細(xì)分的思想與相關(guān)機器學(xué)習(xí)算法,完成了對基礎(chǔ)樣本數(shù)據(jù)的打分、降維,得到了新的兩類樣本數(shù)據(jù),全量特征打分?jǐn)?shù)據(jù)與細(xì)分維度打分?jǐn)?shù)據(jù),研究了不同樣本數(shù)據(jù)對隨機森林集成算法預(yù)測精度的影響。再基于兩種不同樣本、五種不同的集成算法,通過對測試集、交叉驗證集、學(xué)習(xí)曲線與若干評價指標(biāo)的評估選擇了最優(yōu)的Stacking集成算法,提供了精準(zhǔn)、穩(wěn)定、科學(xué)的逾期風(fēng)險識別模型。本文構(gòu)建用戶畫像模型是為了更好的服務(wù)于業(yè)務(wù),構(gòu)建集成算法模型是為了更好的服務(wù)于逾期風(fēng)險識別精度。
【學(xué)位單位】:安徽師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:F832.4;TP18
【部分圖文】:
中心所屬的類。)所得到的 K 類聚類結(jié)果,重新計算新的 K 個類中心,再重復(fù)步驟(2)復(fù)步驟(3),直到滿足迭代次數(shù)或損失函數(shù)收斂 算法使用的損失函數(shù):( )21ik kii x cf x x x= = 價指標(biāo)體系的用戶細(xì)分體系主要指從消費能力、用戶粘性和還貸意愿度決定了我們對用戶的畫像是三維立體的,而來說,消費能力、用戶粘性和還貸意愿分別占符合每個坐標(biāo)軸有正負(fù)的客觀事實,這樣我們就為八類,具備較好的細(xì)分效果。如圖 3-1 所示
s 聚類算法達到用戶分群的目的。按使用機器學(xué)習(xí)算法的順序分卡算法使用評分卡算法。評分卡算法的主要工作是得到全體特征打打分?jǐn)?shù)據(jù)、得到還貸意愿得分。體特征打分?jǐn)?shù)據(jù)據(jù)預(yù)處理的樣本數(shù)據(jù),首先進行特征分箱處理,這里我們采使用 2.3.1 的公式(2-5)與公式(2-6),計算出每個特征的箱結(jié)果計算后的 WOE 值替換原始樣本數(shù)據(jù),得到 WOE 編碼碼數(shù)據(jù)為樣本,使用Logistic回歸擬合WOE編碼數(shù)據(jù),得到一,依據(jù) Logistic 回歸的回歸系數(shù)、截距項及 WOE 值,使用 公式(2-8),可以對每個樣本計算信用評分,此時 Logistic 回。實現(xiàn)這一整套操作的算法叫做評分卡算法。全量用戶信用:
漏斗算法的召回率最終保持在 82.37%,精確率達到 94。在得到這種效果的同時,我們還“顯示”的通過特征及到這種結(jié)果。這是其他算法無法做到的,我們在把“黑箱高的精確度,這是不容易的,也是具有較大業(yè)務(wù)價值的。 4-10 轉(zhuǎn)換成易于理解的漏斗圖,如圖 4-5 所示,
【參考文獻】
本文編號:2841462
【學(xué)位單位】:安徽師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:F832.4;TP18
【部分圖文】:
中心所屬的類。)所得到的 K 類聚類結(jié)果,重新計算新的 K 個類中心,再重復(fù)步驟(2)復(fù)步驟(3),直到滿足迭代次數(shù)或損失函數(shù)收斂 算法使用的損失函數(shù):( )21ik kii x cf x x x= = 價指標(biāo)體系的用戶細(xì)分體系主要指從消費能力、用戶粘性和還貸意愿度決定了我們對用戶的畫像是三維立體的,而來說,消費能力、用戶粘性和還貸意愿分別占符合每個坐標(biāo)軸有正負(fù)的客觀事實,這樣我們就為八類,具備較好的細(xì)分效果。如圖 3-1 所示
s 聚類算法達到用戶分群的目的。按使用機器學(xué)習(xí)算法的順序分卡算法使用評分卡算法。評分卡算法的主要工作是得到全體特征打打分?jǐn)?shù)據(jù)、得到還貸意愿得分。體特征打分?jǐn)?shù)據(jù)據(jù)預(yù)處理的樣本數(shù)據(jù),首先進行特征分箱處理,這里我們采使用 2.3.1 的公式(2-5)與公式(2-6),計算出每個特征的箱結(jié)果計算后的 WOE 值替換原始樣本數(shù)據(jù),得到 WOE 編碼碼數(shù)據(jù)為樣本,使用Logistic回歸擬合WOE編碼數(shù)據(jù),得到一,依據(jù) Logistic 回歸的回歸系數(shù)、截距項及 WOE 值,使用 公式(2-8),可以對每個樣本計算信用評分,此時 Logistic 回。實現(xiàn)這一整套操作的算法叫做評分卡算法。全量用戶信用:
漏斗算法的召回率最終保持在 82.37%,精確率達到 94。在得到這種效果的同時,我們還“顯示”的通過特征及到這種結(jié)果。這是其他算法無法做到的,我們在把“黑箱高的精確度,這是不容易的,也是具有較大業(yè)務(wù)價值的。 4-10 轉(zhuǎn)換成易于理解的漏斗圖,如圖 4-5 所示,
【參考文獻】
相關(guān)期刊論文 前8條
1 杜云生;;基于客戶消費數(shù)據(jù)的信用卡持卡人細(xì)分研究[J];金融理論與實踐;2014年09期
2 賀昌政;孔力;;基于CLV要素的信用卡客戶細(xì)分模型[J];統(tǒng)計與決策;2013年11期
3 孫耀;;基于數(shù)據(jù)挖掘的客戶價值評價研究[J];現(xiàn)代商業(yè);2011年32期
4 陳光會;;基于BP網(wǎng)絡(luò)的客戶價值分析[J];統(tǒng)計與決策;2011年08期
5 鐘雁;郭雨松;;數(shù)據(jù)挖掘技術(shù)在鐵路貨運客戶細(xì)分中的應(yīng)用[J];北京交通大學(xué)學(xué)報;2008年03期
6 趙曉煜;黃小原;;基于數(shù)據(jù)挖掘的客戶價值預(yù)測方法[J];東北大學(xué)學(xué)報;2006年12期
7 黃亦瀟,邵培基,李菁菁;基于客戶價值的客戶分類方法研究[J];預(yù)測;2004年03期
8 王光宏,蔣平;數(shù)據(jù)挖掘綜述[J];同濟大學(xué)學(xué)報(自然科學(xué)版);2004年02期
本文編號:2841462
本文鏈接:http://www.lk138.cn/jingjilunwen/touziyanjiulunwen/2841462.html
最近更新
教材專著