基于離散粒子群優(yōu)化算法的高維數(shù)據(jù)特征選擇分類方法研究
發(fā)布時間:2024-09-28 19:33
在信息時代,機器學習算法通常需要處理大量高維數(shù)據(jù)。數(shù)據(jù)的維度高意味著其含有大量的特征,這通常給模型的建立帶來困難,例如分類問題或回歸任務。高維數(shù)據(jù)中有大量特征是不相關(guān)或冗余的,它們對訓練模型的性能產(chǎn)生負面的影響。為了解決這一問題,特征的選擇問題得到了廣泛關(guān)注,其旨在通過選擇更小的特征子集來提高分類測試的準確性。特征選擇是一個組合優(yōu)化問題,而粒子群優(yōu)化算法作為一個全局尋優(yōu)的進化計算技術(shù),在特征選擇問題得到了廣泛使用。除此之外,離散化技術(shù)也是特征選擇預處理階段的重要手段,通過離散化技術(shù),可以忽略數(shù)據(jù)集中特征的微小波動和噪聲。因此,本文對離散化粒子群優(yōu)化算法在特征選擇問題上的應用進行了深入研究分析。本文的主要研究工作包括以下三點:1)分析高維數(shù)據(jù)的特征冗余問題,闡明了特征選擇的關(guān)鍵性與必要性。分析了近年來國內(nèi)外基于離散粒子群優(yōu)化的特征選擇算法的研究成果,總結(jié)出三大類典型離散化的方法。著重介紹了基于二進制和基于切點這兩種離散化方法,并分析其在結(jié)合基于粒子群優(yōu)化算法的特征選擇問題上的優(yōu)勢與不足。2)通過分析離散二進制粒子群優(yōu)化算法容易陷入局部最優(yōu)、粒子探索能力較弱和計算開銷太大等問題,本文提出了一...
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要貢獻
1.4 本文組織結(jié)構(gòu)
第2章 基礎(chǔ)理論
2.1 引言
2.2 特征選擇
2.2.1 特征選擇的基本概念
2.2.2 特征選擇的一般過程
2.2.3 過濾器與包裝器特征選擇
2.3 粒子群優(yōu)化算法
2.3.1 進化計算與群體智能
2.3.2 粒子群優(yōu)化算法
2.4 離散化方法
2.5 常見離散粒子群優(yōu)化算法的特征選擇方法
2.5.1 基于離散二進制粒子群優(yōu)化特征選擇方法
2.5.2 基于粒子群優(yōu)化的特征離散化與選擇方法
2.6 本章小結(jié)
第3章 改進的離散二進制粒子群優(yōu)化特征選擇方法
3.1 引言
3.2 信息論
3.3 方法提出
3.3.1 特征預處理
3.3.2 粒子更新操作
3.3.3 自適應機制的慣性權(quán)重
3.3.4 pbest與 gbest的更新方法
3.3.5 適應度函數(shù)設計
3.4 實驗設計
3.4.1 交叉驗證
3.4.2 K最近鄰分類器
3.4.3 數(shù)據(jù)集介紹
3.4.4 參數(shù)設置
3.4.5 算法總覽
3.5 實驗結(jié)果與分析
3.6 本章小結(jié)
第4章 改進的基于粒子群優(yōu)化的特征離散化與選擇方法
4.1 引言
4.2 Relief F算法
4.3 切點的生成
4.4 方法提出
4.4.1 數(shù)據(jù)集預處理
4.4.2 粒子的編碼與解碼
4.4.3 基于切點的離散化
4.4.4 適應度函數(shù)設計
4.4.5 粒子更新操作
4.4.6 局部搜索策略
4.5 實驗與分析
4.5.1 實驗設置
4.5.2 算法總覽
4.5.3 實驗結(jié)果與分析
4.6 本章小節(jié)
第5章 總結(jié)與展望
參考文獻
指導教師對研究生學位論文的學術(shù)評語
學位論文答辯委員會決議書
致謝
攻讀碩士學位期間的研究成果
本文編號:4006250
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要貢獻
1.4 本文組織結(jié)構(gòu)
第2章 基礎(chǔ)理論
2.1 引言
2.2 特征選擇
2.2.1 特征選擇的基本概念
2.2.2 特征選擇的一般過程
2.2.3 過濾器與包裝器特征選擇
2.3 粒子群優(yōu)化算法
2.3.1 進化計算與群體智能
2.3.2 粒子群優(yōu)化算法
2.4 離散化方法
2.5 常見離散粒子群優(yōu)化算法的特征選擇方法
2.5.1 基于離散二進制粒子群優(yōu)化特征選擇方法
2.5.2 基于粒子群優(yōu)化的特征離散化與選擇方法
2.6 本章小結(jié)
第3章 改進的離散二進制粒子群優(yōu)化特征選擇方法
3.1 引言
3.2 信息論
3.3 方法提出
3.3.1 特征預處理
3.3.2 粒子更新操作
3.3.3 自適應機制的慣性權(quán)重
3.3.4 pbest與 gbest的更新方法
3.3.5 適應度函數(shù)設計
3.4 實驗設計
3.4.1 交叉驗證
3.4.2 K最近鄰分類器
3.4.3 數(shù)據(jù)集介紹
3.4.4 參數(shù)設置
3.4.5 算法總覽
3.5 實驗結(jié)果與分析
3.6 本章小結(jié)
第4章 改進的基于粒子群優(yōu)化的特征離散化與選擇方法
4.1 引言
4.2 Relief F算法
4.3 切點的生成
4.4 方法提出
4.4.1 數(shù)據(jù)集預處理
4.4.2 粒子的編碼與解碼
4.4.3 基于切點的離散化
4.4.4 適應度函數(shù)設計
4.4.5 粒子更新操作
4.4.6 局部搜索策略
4.5 實驗與分析
4.5.1 實驗設置
4.5.2 算法總覽
4.5.3 實驗結(jié)果與分析
4.6 本章小節(jié)
第5章 總結(jié)與展望
參考文獻
指導教師對研究生學位論文的學術(shù)評語
學位論文答辯委員會決議書
致謝
攻讀碩士學位期間的研究成果
本文編號:4006250
本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/4006250.html
上一篇:基于排序?qū)W習的個性化推薦
下一篇:沒有了
下一篇:沒有了
最近更新
教材專著