高維數(shù)據(jù)的近似粒度特征選擇和分類方法研究
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.2局部敏感哈算法的一個例子??Fig.?2.2?An?example?of?a?locally?sensitive?hash?algorithm??
題。??2.2局部敏感哈希算法理論??本節(jié),將介紹局部敏感哈希算法(又稱為LSH函數(shù))的基本理論和方法。理論上,??局部敏感哈希算法應(yīng)該擁有這樣的性質(zhì):樣本的相似程度越高,就有更高的概率被劃分??到一個桶中。如果兩個樣本數(shù)據(jù),在相同的LSH函數(shù)映射下被劃分到相同的楠中,則??稱兩....
圖3.1?LSH算法映射的結(jié)果??Fig.?3.1?The?mapping?result?of?LSH?algorithm??
模型??直觀上,在LSH算法中每個桶中的樣本足夠相似,而在粗糙集理論的等價類劃分??中每個等價類子集中的樣本特征值相同,說明等價類子集中的樣本相似,基于這兩個概??念的相似之處,本文提出用LSH算法中桶的劃分方法替換原始粗糙集中等價類的劃分??方法。下面舉例說明兩個概念的相似點。....
圖4.2以查詢?yōu)榛鶞实耐皠澐址椒??Fig.?4.2?Bucket?division?method?based?on?query??
分類算法,在這些LSH函數(shù)的映射??下,相似度足夠高且擁有相同決策屬性的樣本有很高的概率被劃分到同一個桶中。顯然,??篩選后的LSH函數(shù)有利于進行接下來分類算法的相關(guān)工作。??(3)以分類點為基準的桶劃分方式??根據(jù)局部敏感哈希算法的理論,對于L距離的LSH函數(shù)而言,原數(shù)據(jù)相似程....
圖4.3分類算法流程圖??Fig.?4.3?The?flow?chart?for?approximate?classification??-27?-??
/本,待分類樣本?和w個/??/?LSH?函數(shù)。?/???????將《個數(shù)掮樣本在w個LSH函教下逬行映肘??,形成離散化后的教搨???\?/???計茸每一個眙希函數(shù)對于:夬策屬性的依賴度??■?^???保留依賴度較高的々個LSH函教??^???循訐刺余的LSH函數(shù)???^???....
本文編號:4003842
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/4003842.html
下一篇:沒有了