中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

基于K-Means與原型網(wǎng)絡(luò)的兩階段聚類算法及應(yīng)用

發(fā)布時間:2024-03-02 12:15
  大數(shù)據(jù)領(lǐng)域的迅速發(fā)展,使得用戶數(shù)據(jù)信息日益完善、數(shù)倉整合更加合理、數(shù)據(jù)質(zhì)量不斷提高,因此數(shù)據(jù)的價值越來越大。如何合理的利用戶數(shù)據(jù)進行個性化服務(wù)和推薦已經(jīng)成為智能社交平臺的研究熱點。而用戶分層是個性化服務(wù)的基礎(chǔ),因此做好基礎(chǔ)的聚類任務(wù)至關(guān)重要。目前應(yīng)用較為廣泛的K-Means算法在混合數(shù)據(jù)聚類上受限于相似性度量的選擇,所以本文提出了基于K-Means算法與原型網(wǎng)絡(luò)的兩階段聚類算法,將原型網(wǎng)絡(luò)擴展到無監(jiān)督聚類,從而可以通過原型網(wǎng)絡(luò)訓(xùn)練得到一個嵌入空間,使得混合數(shù)據(jù)投影到嵌入空間后類內(nèi)高度聚合,類間高度分離。為了驗證算法可行性,我們首先在手寫字數(shù)據(jù)集上進行測驗。該數(shù)據(jù)集共有1700個樣本,共有10個類別。首先是第一階段使用K-Means算法標注閾值范圍內(nèi)的樣本,實現(xiàn)數(shù)據(jù)轉(zhuǎn)化,然后將標注樣本放入原型網(wǎng)絡(luò)訓(xùn)練得到嵌入空間并完成所有樣本的聚類。同時我們還與K-Means算法、K-Means++算法、PCA-based算法進行聚類效果比較。采用同質(zhì)性評分、完整性評分、ARI、AMI、Silhouette、V measure這五個指標進行聚類效果的對比。結(jié)果表明:本文提出的算法各項指標最高,PCA-b...

【文章頁數(shù)】:53 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖2.1嵌入空間示意圖

圖2.1嵌入空間示意圖

第二章聚類算法簡介9算法原理簡單但仍能得到良好的訓(xùn)練結(jié)果。原型網(wǎng)絡(luò)的基本思想是從支持集={(1,1),,(,)}中提取每個類原型向量,并根據(jù)查詢集與每個類的原型向量之間的距離對查詢集中的樣本點進行分類。更準確地說,原型網(wǎng)絡(luò)學(xué)習(xí)了一個嵌入函數(shù)h(x)用于數(shù)據(jù)投影,該函數(shù)被參數(shù)化為神....


圖3.3手寫數(shù)字數(shù)據(jù)集

圖3.3手寫數(shù)字數(shù)據(jù)集

第三章基于K-Means與原型網(wǎng)絡(luò)的兩階段聚類算法19圖3.3手寫數(shù)字數(shù)據(jù)集圖3.4數(shù)據(jù)集所含類別分占比布圖3.2.1聚類算法間的比較為了論證本文提出的算法的有效性,我們將對比分析本文提出的算法與的K-Means算法及其改進算法的聚類效果。Random表示最基本的K-Means算....


圖3.4數(shù)據(jù)集所含類別分占比布圖

圖3.4數(shù)據(jù)集所含類別分占比布圖

第三章基于K-Means與原型網(wǎng)絡(luò)的兩階段聚類算法19圖3.3手寫數(shù)字數(shù)據(jù)集圖3.4數(shù)據(jù)集所含類別分占比布圖3.2.1聚類算法間的比較為了論證本文提出的算法的有效性,我們將對比分析本文提出的算法與的K-Means算法及其改進算法的聚類效果。Random表示最基本的K-Means算....


圖3.5手寫數(shù)字聚類實驗結(jié)果圖

圖3.5手寫數(shù)字聚類實驗結(jié)果圖

基于K-Means與原型網(wǎng)絡(luò)的兩階段聚類算法及應(yīng)用20算法的一種改進算法,不同于傳統(tǒng)的隨機抽樣的方法選取初始聚類中心的方法,該算法在選擇初始聚類中心時盡可能地讓各聚類中心之間距離遠,也就是讓各類別的差異盡可能的明顯;PCA-based算法是先對原始數(shù)據(jù)進行主成分分析,對原始數(shù)據(jù)進....



本文編號:3916844

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/3916844.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶65148***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com