中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類博士論文 >

面向用戶數(shù)據(jù)特性的協(xié)同過(guò)濾推薦方法研究

發(fā)布時(shí)間:2025-02-07 19:04
  互聯(lián)網(wǎng)時(shí)代,數(shù)據(jù)呈爆炸式增長(zhǎng),前所未有的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)超過(guò)受眾的接收和處理能力,因此,從海量復(fù)雜數(shù)據(jù)中有效獲取關(guān)鍵性有用信息成為必須解決的問(wèn)題.面對(duì)信息過(guò)載問(wèn)題,人們迫切需要一種高效的信息過(guò)濾系統(tǒng),“推薦系統(tǒng)”應(yīng)運(yùn)而生.20世紀(jì)90年代以來(lái),盡管推薦系統(tǒng)在理論、方法和應(yīng)用方面取得了系列重要進(jìn)展,但數(shù)據(jù)的稀疏性與長(zhǎng)尾性、用戶行為模式挖掘、可解釋性、社會(huì)化推薦等問(wèn)題仍然是其面臨的重要挑戰(zhàn).進(jìn)一步地,伴隨互聯(lián)網(wǎng)及信息技術(shù)的持續(xù)飛速發(fā)展,用戶規(guī)模與項(xiàng)目數(shù)量急劇增長(zhǎng),相應(yīng)地,用戶行為數(shù)據(jù)的稀疏性、長(zhǎng)尾性問(wèn)題更加凸顯.面對(duì)上述挑戰(zhàn),本文針對(duì)數(shù)據(jù)稀疏性挑戰(zhàn)下的“經(jīng)典相似性度量的失效問(wèn)題”“近鄰?fù)扑]對(duì)稀疏數(shù)據(jù)的敏感性問(wèn)題”、數(shù)據(jù)長(zhǎng)尾性挑戰(zhàn)下的“可解釋性問(wèn)題”“社會(huì)化信息融合問(wèn)題”開(kāi)展協(xié)同過(guò)濾推薦方法的創(chuàng)新性研究.主要研究成果概括如下:(1)針對(duì)用戶評(píng)分矩陣稀疏情境下經(jīng)典相似性度量的失效問(wèn)題,提出了基于極端評(píng)分行為相似度的近鄰?fù)扑]方法.面對(duì)數(shù)據(jù)稀疏情境下共同評(píng)分項(xiàng)目極少現(xiàn)象引致的經(jīng)典相似性度量失效或度量不準(zhǔn)確問(wèn)題,著眼于用戶共同極端評(píng)分行為的深入分析,建立了用戶之間的極端評(píng)分行為指數(shù);通過(guò)將極端評(píng)分行為指數(shù)作...

【文章頁(yè)數(shù)】:123 頁(yè)

【學(xué)位級(jí)別】:博士

【部分圖文】:

圖2.1評(píng)分值的分布(a)ML-100k(b)ML-latest-small

圖2.1評(píng)分值的分布(a)ML-100k(b)ML-latest-small

圖2.1繪制了評(píng)分?jǐn)?shù)據(jù)集中各種評(píng)分的百分比柱狀圖.從圖2.1上可以看出,ML-100k數(shù)據(jù)集上5分和1分的評(píng)分?jǐn)?shù)量占所有評(píng)分的27.31%,ML-latest-small數(shù)據(jù)集上5分和1分的評(píng)分?jǐn)?shù)量占所有評(píng)分的27.24%.同時(shí),這里還統(tǒng)計(jì)了評(píng)1分和5分的用戶數(shù),在ML-100k....


圖2.2兩個(gè)用戶共同極端評(píng)分比例(a)ML-100k(b)ML-latest-small

圖2.2兩個(gè)用戶共同極端評(píng)分比例(a)ML-100k(b)ML-latest-small

圖2.1評(píng)分值的分布(a)ML-100k(b)ML-latest-small圖2.2繪制了用戶共同極端評(píng)分對(duì)數(shù)占所有共同評(píng)分對(duì)數(shù)的比例.具體地,我們將用戶共同評(píng)分的項(xiàng)目數(shù)分為(0,10],[11,20],[21,30],[31,40],[41,50]五個(gè)區(qū)間段.每個(gè)柱狀分別表示在....


圖2.3在ML-100k數(shù)據(jù)集上近鄰參數(shù)k對(duì)MAE的影響

圖2.3在ML-100k數(shù)據(jù)集上近鄰參數(shù)k對(duì)MAE的影響

最后,對(duì)參數(shù)進(jìn)行分析.在近鄰?fù)扑]中,目標(biāo)用戶的近鄰個(gè)數(shù)k是一個(gè)重要的參數(shù).本章從10到100,以10個(gè)為間隔進(jìn)行了不同近鄰個(gè)數(shù)的實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果以曲線的形式匯總到圖2.3~2.6.從圖中可以看出,當(dāng)k=20時(shí),預(yù)測(cè)結(jié)果最好,這似乎違背了人們的常規(guī)認(rèn)識(shí).通常,我們認(rèn)為近鄰越多越好.然....


圖2.4在ML-100k數(shù)據(jù)集上近鄰參數(shù)k對(duì)RMSE的影響

圖2.4在ML-100k數(shù)據(jù)集上近鄰參數(shù)k對(duì)RMSE的影響

圖2.3在ML-100k數(shù)據(jù)集上近鄰參數(shù)k對(duì)MAE的影響圖2.5在ML-latest-small數(shù)據(jù)集上近鄰參數(shù)k對(duì)MAE的影響



本文編號(hào):4031160

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/shoufeilunwen/xxkjbs/4031160.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f2904***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com