中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當前位置:主頁 > 管理論文 > 領導決策論文 >

決策樹及增強算法在實際問題中的應用

發(fā)布時間:2020-12-22 22:31
  決策樹是機器學習中較為常用的一種算法,是一種強大的分類器。決策樹的基本原理是利用樹形結構對特征屬性以及潛在結果之間的關系建立起的模型。與神經(jīng)網(wǎng)絡,支持向量機不同,利用決策樹進行建模后,預測模型容易理解,預測結果容易解釋,并且對缺失值及變量的分布不敏感,因此幾乎能夠在任何類型的數(shù)據(jù)集上進行建模,被廣泛的應用于個人信用評估、醫(yī)學診斷、自然語言處理等各個領域。在實際問題中擬合模型時,要考慮犯不同類型錯誤時的代價,并且尋找方法對模型進行優(yōu)化。在本文中采用決策樹擬合模型,主要采用的基本算法為C5.0算法及CART算法,并對每種算法分別加入Boosting增強算法提高模型性能。在傳統(tǒng)的比較模型性能時,往往采用的方法為比較模型的準確率或者錯誤率。但是在實際問題中,比較不同模型的性能時,不能單純比較模型在測試集上準確率,測試集的選取有一定偶然性,并且只比較模型的準確性對于有犯錯代價的問題時,不足以說明模型性能的好壞。因此本文采用模型的靈敏度作為樣本,并通過假設檢驗方法來進行模型的比較。由于各組樣本之間不獨立,因此在比較多組模型的靈敏度時,采用Friedman非參數(shù)假設檢驗方法來比較模型的性能,檢驗結果... 

【文章來源】:大連理工大學遼寧省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:67 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
引言
1理論
    1.1 決策樹
        1.1.1 決策樹劃分選擇
        1.1.2 剪枝
        1.1.3 缺失值處理
    1.2 Boosting算法
    1.3 主成分分析
    1.4 評價模型的指標
        1.4.1 單個模型的性能度量
        1.4.2 不同模型之間的比較檢驗
2實證分析
    2.1 數(shù)據(jù)簡介
    2.2 數(shù)據(jù)前期預處理
        2.2.1 識別缺失值
        2.2.2 探索數(shù)據(jù)
        2.2.3 驗證變量之間的相關關系
        2.2.4 對連續(xù)變量進行多重共線性檢驗
    2.3 模型擬合
        2.3.1 C5.0模型擬合
        2.3.2 增強算法
        2.3.3 CART算法模型
        2.3.4 CART算法中加入增強算法
    2.4 比較模型
結論
參考文獻
附錄A 程序
致謝


【參考文獻】:
期刊論文
[1]基于決策樹的改進AdaBoost算法在車輛檢測中的應用[J]. 李斌,王凱,徐英杰,劉賞.  軟件導刊. 2017(05)
[2]基于改進決策樹分類的Android惡意軟件檢測[J]. 鮑美英.  軟件. 2017(02)
[3]面向大數(shù)據(jù)分析的決策樹算法[J]. 張棪,曹健.  計算機科學. 2016(S1)
[4]基于決策樹算法的競爭對手識別模型研究[J]. 王知津,周鵬,韓正彪.  情報理論與實踐. 2013(03)
[5]基于多分類器組合的個人信用評估模型[J]. 向暉,楊勝剛.  湖南大學學報(社會科學版). 2011(03)
[6]數(shù)據(jù)挖掘中的決策樹算法比較研究[J]. 林向陽.  中國科技信息. 2010(02)
[7]精煉決策樹模型在個人信用評估中的應用[J]. 朱毅峰,孫亞南.  統(tǒng)計教育. 2008(01)
[8]基于決策樹的個人住房貸款信用風險評估模型[J]. 劉軍麗,陳翔.  計算機工程. 2006(13)
[9]數(shù)據(jù)挖掘中決策樹算法的最新進展[J]. 韓慧,毛鋒,王文淵.  計算機應用研究. 2004(12)
[10]數(shù)據(jù)挖掘中決策樹算法的探討[J]. 唐華松,姚耀文.  計算機應用研究. 2001(08)



本文編號:2932550

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/guanlilunwen/lindaojc/2932550.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶c038e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com