Logistic模型缺失協(xié)變量的半?yún)?shù)方法研究及其應(yīng)用
發(fā)布時(shí)間:2024-04-11 04:21
缺失數(shù)據(jù)的存在比較普遍.合理的處理缺失數(shù)據(jù)能更好的利用數(shù)據(jù)中的信息來(lái)做決策,缺失數(shù)據(jù)處理方法的研究就變得很有現(xiàn)實(shí)意義.本文采用經(jīng)驗(yàn)似然方法對(duì)缺失部分的條件分布函數(shù)進(jìn)行估計(jì),并對(duì)具有缺失協(xié)變量的Logistic模型進(jìn)行參數(shù)化建模.本文在符合Logistic模型的實(shí)際數(shù)據(jù)中應(yīng)用半?yún)?shù)方法和其他幾種方法并分析驗(yàn)證半?yún)?shù)方法性能,其內(nèi)容可分為兩點(diǎn):1.通過(guò)模擬得到缺失數(shù)據(jù),一種方式是完全可觀測(cè)數(shù)據(jù),在MAR機(jī)制下針對(duì)協(xié)變量模擬不同的缺失率得到協(xié)變量缺失數(shù)據(jù).完全可觀測(cè)數(shù)據(jù)一個(gè)是太平洋保險(xiǎn)理賠數(shù)據(jù),設(shè)定2個(gè)缺失協(xié)變量,模擬的缺失率分別為5%、10%、15%、20%、25%、30%、35%、40%.另一個(gè)是德國(guó)信用評(píng)估數(shù)據(jù),設(shè)定8個(gè)缺失協(xié)變量,模擬的缺失率分別為5%、10%、15%、20%、25%、30%.另一種方式通過(guò)模擬與原缺失數(shù)據(jù)相近的全數(shù)據(jù),設(shè)定3個(gè)缺失協(xié)變量,在全數(shù)據(jù)的基礎(chǔ)上模擬三種缺失機(jī)制:MAR機(jī)制、MCAR機(jī)制、改進(jìn)的NI機(jī)制下的協(xié)變量缺失數(shù)據(jù).2.在模擬協(xié)變量帶缺失的太平洋保險(xiǎn)和德國(guó)信用評(píng)估數(shù)據(jù)中,采用了半?yún)?shù)方法和CC、均值插補(bǔ)、MI、EM方法來(lái)做缺失處理,這幾種方法的性能采用...
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.2.3 國(guó)內(nèi)外研究現(xiàn)狀對(duì)比分析
1.3 主要研究?jī)?nèi)容和技術(shù)線路
第二章 缺失數(shù)據(jù)相關(guān)知識(shí)概述
2.1 缺失數(shù)據(jù)產(chǎn)生的原因
2.2 缺失數(shù)據(jù)的缺失模式
2.2.1 單變量缺失和多變量缺失
2.2.2 單調(diào)缺失和非單調(diào)缺失
2.2.3 文件匹配缺失
2.2.4 因子分析缺失
2.3 缺失數(shù)據(jù)的缺失機(jī)制
2.3.1 隨機(jī)缺失(MAR)
2.3.2 完全隨機(jī)缺失(MCAR)
2.3.3 非完全隨機(jī)缺失(NMAR)
2.4 缺失數(shù)據(jù)的幾種常見處理方法
2.4.1 完全案例分析法(CC)
2.4.2 均值插補(bǔ)
2.4.3 回歸插補(bǔ)
2.4.4 EM算法
2.4.5 多重插補(bǔ)(MI)
2.5 本章小結(jié)
第三章 Logistic模型和缺失協(xié)變量半?yún)?shù)方法研究
3.1 Logistic模型
3.1.1 Logistic模型的定義
3.1.2 Logistic模型的估計(jì)
3.2 缺失協(xié)變量的半?yún)?shù)方法
3.3 本章小結(jié)
第四章 半?yún)?shù)方法的應(yīng)用
4.1 半?yún)?shù)方法在保險(xiǎn)數(shù)據(jù)中的應(yīng)用
4.1.1 數(shù)據(jù)的選取說(shuō)明
4.1.2 半?yún)?shù)方法的應(yīng)用
4.2 半?yún)?shù)方法在信用評(píng)估數(shù)據(jù)中的應(yīng)用
4.2.1 數(shù)據(jù)的選取說(shuō)明
4.2.2 半?yún)?shù)方法的應(yīng)用
4.3 半?yún)?shù)方法在醫(yī)學(xué)數(shù)據(jù)中的應(yīng)用
4.3.1 模擬研究
4.3.2 數(shù)據(jù)的選取說(shuō)明及應(yīng)用
4.4 本章小結(jié)
第五章 結(jié)論與展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
本文編號(hào):3950867
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.2.3 國(guó)內(nèi)外研究現(xiàn)狀對(duì)比分析
1.3 主要研究?jī)?nèi)容和技術(shù)線路
第二章 缺失數(shù)據(jù)相關(guān)知識(shí)概述
2.1 缺失數(shù)據(jù)產(chǎn)生的原因
2.2 缺失數(shù)據(jù)的缺失模式
2.2.1 單變量缺失和多變量缺失
2.2.2 單調(diào)缺失和非單調(diào)缺失
2.2.3 文件匹配缺失
2.2.4 因子分析缺失
2.3 缺失數(shù)據(jù)的缺失機(jī)制
2.3.1 隨機(jī)缺失(MAR)
2.3.2 完全隨機(jī)缺失(MCAR)
2.3.3 非完全隨機(jī)缺失(NMAR)
2.4 缺失數(shù)據(jù)的幾種常見處理方法
2.4.1 完全案例分析法(CC)
2.4.2 均值插補(bǔ)
2.4.3 回歸插補(bǔ)
2.4.4 EM算法
2.4.5 多重插補(bǔ)(MI)
2.5 本章小結(jié)
第三章 Logistic模型和缺失協(xié)變量半?yún)?shù)方法研究
3.1 Logistic模型
3.1.1 Logistic模型的定義
3.1.2 Logistic模型的估計(jì)
3.2 缺失協(xié)變量的半?yún)?shù)方法
3.3 本章小結(jié)
第四章 半?yún)?shù)方法的應(yīng)用
4.1 半?yún)?shù)方法在保險(xiǎn)數(shù)據(jù)中的應(yīng)用
4.1.1 數(shù)據(jù)的選取說(shuō)明
4.1.2 半?yún)?shù)方法的應(yīng)用
4.2 半?yún)?shù)方法在信用評(píng)估數(shù)據(jù)中的應(yīng)用
4.2.1 數(shù)據(jù)的選取說(shuō)明
4.2.2 半?yún)?shù)方法的應(yīng)用
4.3 半?yún)?shù)方法在醫(yī)學(xué)數(shù)據(jù)中的應(yīng)用
4.3.1 模擬研究
4.3.2 數(shù)據(jù)的選取說(shuō)明及應(yīng)用
4.4 本章小結(jié)
第五章 結(jié)論與展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
本文編號(hào):3950867
本文鏈接:http://lk138.cn/guanlilunwen/tongjijuecelunwen/3950867.html
最近更新
教材專著