隨著大數(shù)據(jù)時代的到來,生產(chǎn)生活中的高維數(shù)據(jù)越來越普遍。在保存更多有用信息的同時,高維數(shù)據(jù)也引入了很多不相關(guān)或冗余的屬性(特征)。為了減少系統(tǒng)學(xué)習(xí)的時間、提高學(xué)習(xí)的精度,如何選出最具代表性的特征已成為機器學(xué)習(xí)的研究熱點之一。相對有監(jiān)督和半監(jiān)督特征選擇問題,因為沒有標(biāo)簽信息進(jìn)行指導(dǎo),無監(jiān)督特征選擇變得非常困難。本文基于數(shù)據(jù)結(jié)構(gòu)學(xué)習(xí)和微粒群優(yōu)化等方法或技術(shù),研究高效的無監(jiān)督特征選擇算法,主要包括以下三個內(nèi)容:(1)首先,考慮數(shù)據(jù)的局部結(jié)構(gòu),將無監(jiān)督特征選擇問題轉(zhuǎn)化為有監(jiān)督特征選擇問題,提出了一種基于非負(fù)拉普拉斯嵌入引導(dǎo)子空間學(xué)習(xí)的特征選擇模型及求解算法。該方法利用非負(fù)拉普拉斯嵌入產(chǎn)生問題的偽標(biāo)簽,以保證數(shù)據(jù)的分類精度;有機融合數(shù)據(jù)的標(biāo)簽信息,建立了基于子空間學(xué)習(xí)的特征選擇模型,以保持?jǐn)?shù)據(jù)的局部結(jié)構(gòu);給出了模型的迭代求解算法,并證明了算法的收斂性;將所提算法用于臉部圖像處理等典型數(shù)據(jù)集,實驗結(jié)果證明了它的有效性。(2)其次,同時考慮數(shù)據(jù)的全局和局部結(jié)構(gòu),提出了一種融合結(jié)構(gòu)學(xué)習(xí)的無監(jiān)督特征選擇模型及求解算法。該方法利用稀疏自表示和概率鄰域關(guān)系圖,分別學(xué)習(xí)原始數(shù)據(jù)的全局和局部流形結(jié)構(gòu);在進(jìn)行結(jié)構(gòu)學(xué)習(xí)的同時,通過引入行稀疏特征變換矩陣來選擇特征,給出了融合結(jié)構(gòu)學(xué)習(xí)的無監(jiān)督特征選擇模型;設(shè)計了結(jié)構(gòu)學(xué)習(xí)和特征選擇并進(jìn)的迭代求解算法;將所提算法用于語音數(shù)據(jù)處理等典型數(shù)據(jù)集,實驗結(jié)果證明了其優(yōu)越性。(3)最后,有機融合微粒群優(yōu)化的全局搜索能力和過濾式方法的局部開發(fā)能力,提出了一種兩階段混合無監(jiān)督特征選擇方法。第一階段,利用信息熵評估特征之間的平均相關(guān)性,給出了基于最大熵原理的特征空間縮減策略,用以快速刪除不相關(guān)的特征;第二階段,利用一種改進(jìn)的骨干微粒群優(yōu)化算法,從縮減后的特征空間中搜索關(guān)鍵特征,用以產(chǎn)生高質(zhì)量的特征子集。進(jìn)一步,給出了一種基于特征冗余性的微粒局部搜索策略,改善微粒群的開發(fā)能力;在多個典型數(shù)據(jù)集上的實驗結(jié)果,表明了所提算法的有效性和優(yōu)越性。
【學(xué)位單位】:中國礦業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP18
【部分圖文】: 融合骨干微粒群優(yōu)化和平均相關(guān)性的兩階段混合無監(jiān)督特征選擇了大量的不相關(guān)和冗余特征。其它 4 種特征選擇方法進(jìn)行比較,表 5-2 和表 5所有算法的分類精度結(jié)果。在表 5-2 和表 5-3 中類器所得分類結(jié)果,其它列為不同特征選擇方法算法在不同數(shù)據(jù)集上的平均分類精度值。利用黑相應(yīng)的特征選擇方法。
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 崔文巖;孟相如;李紀(jì)真;王明鳴;陳天平;王坤;;基于粗糙集粒子群支持向量機的特征選擇方法[J];微電子學(xué)與計算機;2015年01期
2 王凌;沈婧楠;王圣堯;鄧瑾;;協(xié)同進(jìn)化算法研究進(jìn)展[J];控制與決策;2015年02期
3 鞏敦衛(wèi);胡瀅;張勇;;基于多目標(biāo)微粒群優(yōu)化的異質(zhì)數(shù)據(jù)特征選擇[J];電子學(xué)報;2014年07期
4 譚臺哲;葉青;尚鵬;;基于局部重構(gòu)的無監(jiān)督特征選擇方法[J];計算機應(yīng)用研究;2014年09期
5 何清;李寧;羅文娟;史忠植;;大數(shù)據(jù)下的機器學(xué)習(xí)算法綜述[J];模式識別與人工智能;2014年04期
6 周志華;;基于分歧的半監(jiān)督學(xué)習(xí)[J];自動化學(xué)報;2013年11期
7 范雪莉;馮海泓;原猛;;基于互信息的主成分分析特征選擇算法[J];控制與決策;2013年06期
8 戴大蒙;慕德俊;;非完備信息系統(tǒng)的啟發(fā)式特征選擇遺傳算法[J];電子學(xué)報;2013年03期
9 孟小峰;慈祥;;大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J];計算機研究與發(fā)展;2013年01期
10 李曉艷;張子剛;張逸石;張謐;;一種基于KL散度和類分離策略的特征選擇算法[J];計算機科學(xué);2012年12期
本文編號:
2890149
本文鏈接:http://www.lk138.cn/kejilunwen/sousuoyinqinglunwen/2890149.html