中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

基于LDA模型和核方法改進的協(xié)同過濾算法

發(fā)布時間:2020-11-15 04:57
   在互聯(lián)網(wǎng)高速發(fā)展的今天,“信息過載”問題使得人們難以在海量信息中找到真正的需求,成為新時代最重要的挑戰(zhàn)之一,F(xiàn)在信息體系下,具有豐富的用戶行為歷史數(shù)據(jù)。推薦系統(tǒng)通過對此數(shù)據(jù)進行分析,從而挖掘用戶的潛在興趣,實現(xiàn)精準化推薦,有效過濾信息,因而具有巨大的應用價值。但是同時,推薦系統(tǒng)也面臨著許多問題。本文主要針對數(shù)據(jù)噪聲和稀疏性兩個主要問題提出了改進方法。針對數(shù)據(jù)噪聲問題,構(gòu)造了LOF離群點檢測算法。本文分別基于用戶的共同項目評分和用戶評分數(shù)據(jù)分布特征指標兩種方法計算用戶離群因子。最后通過效果對比表明:基于構(gòu)建指標數(shù)據(jù)的LOF算法比基于原始共同項目評分LOF算法效果具有更優(yōu)的表現(xiàn)。針對數(shù)據(jù)稀疏問題,構(gòu)造了LDA-CF和Kernel-CF混合模型。(1)LDA-CF模型根據(jù)主題生成模型的思想,假設用戶喜歡某個項目是因為喜歡某些隱含的主題,利用用戶評分數(shù)據(jù)生成偽文檔,計算用戶下的潛在主題分布和潛在主題下的項目分布,然后根據(jù)用戶主題分布相似性和項目主題分布相似性,在此基礎上結(jié)合鄰域方法預測用戶偏好。(2)Kernel-CF模型假設用戶的評分服從某一穩(wěn)定的分布,利用核密度估計的方法分別估計每個用戶評分分布密度函數(shù),然后在根據(jù)用戶的評分分布密度函數(shù)計算用戶的相似度,最后結(jié)合鄰域方法預測用戶偏好。通過在MovieLens數(shù)據(jù)集上的實驗驗證,表明了兩種混合協(xié)同過濾在RMSE性能指標上均有優(yōu)于基于用戶和項目的協(xié)同過濾算法。最后,本文介紹了推薦算法在課堂交互平臺上的一種新型應用:利用Kernel-CF預測學生的答題得分。
【學位單位】:華中科技大學
【學位級別】:碩士
【學位年份】:2017
【中圖分類】:C81
【部分圖文】:

個性化推薦,亞馬遜


代表用戶 v 對物品 i 的評分,, 代表用戶 u,v 的平均評分。于物品的協(xié)同過濾算法于物品的協(xié)同過濾算法(以下簡稱 ItemCF)的中心思想是通過用戶的歷史行量項目之間的相似性和關聯(lián)度,然后將相關聯(lián)的物品推薦給用戶。比如在用戶推薦列表中[21],根據(jù)購買《推薦系統(tǒng)實戰(zhàn)》的歷史記錄,推薦了《機戰(zhàn)》,《Spark 快速大數(shù)據(jù)分析》,《利用 Python 進行數(shù)據(jù)分析》等書籍(圖 2. 1),熟悉這領域的人都知道,這都是機器學習,數(shù)據(jù)挖掘領域內(nèi)的書籍。因為推薦系統(tǒng)實戰(zhàn)》的讀者大都購買了推薦出來的其他書籍,因而這些書籍都出來。因為,在機器學習,數(shù)據(jù)挖掘這一領域研究者,大都需要這些書,能匹配用戶需求。

概念圖,對象,離群點,離群


圖 3. 1 k 距離、可達距離概念圖示:假設對象 o 與 p0 之間的距離為 §¨ ¢ (£),那么當,p1 與對象 o 的可達距離為 §¨ ¢ (£),當 p2 不在對可達距離為兩個對象的實際距離 (¤ £)。象 p 的局部可達密度 | ( )p 的 | ( )的[29]定義公式為: | ( ) =| ( )| | distancek ?(p o) ( ) ? ? ?( )表示的是距離數(shù)據(jù)點 p 最近的 k 個點的集 。從定義公式可以看出,當 | ( )的值較小時,表明布比較稀疏,則對象數(shù)據(jù)點 p 可能為離群點,反之,則象 p 的局部離群因子 LOF

評分項目,測算法,用戶對象,算法描述


圖 3. 2 LOF 異常分布圖測算法檢測異常用戶算法描述,k 值,閾值 t用戶,基于兩個用戶的共同評分項目計算兩個用戶對象之公式為:離: §¨ ¢ ( a) = ∑ ( ?( ) ?( ) §¨ ¢ ( a) = ∑ | | ?( ) ?( )
【相似文獻】

相關期刊論文 前10條

1 許媛萍;;基于內(nèi)容的推薦與協(xié)同過濾融合的新聞推薦分析與探究[J];新聞研究導刊;2018年13期

2 李改;鄒小青;;基于隱式反饋的協(xié)同過濾算法研究綜述[J];福建電腦;2018年11期

3 胡致杰;胡羽沫;;協(xié)同過濾推薦瓶頸問題研究[J];無線互聯(lián)科技;2016年09期

4 鄭婕;鮑海琴;;基于協(xié)同過濾推薦技術的個性化網(wǎng)絡教學平臺研究[J];科技風;2012年06期

5 章宗杰;陳瑋;;基于標簽擴展的協(xié)同過濾算法在音樂推薦中的應用[J];軟件導刊;2018年01期

6 王嬋;;一種基于加權(quán)因子的混合協(xié)同過濾算法[J];電腦知識與技術;2018年09期

7 劉文佳;張駿;;改進的協(xié)同過濾算法在電影推薦系統(tǒng)中的應用[J];現(xiàn)代商貿(mào)工業(yè);2018年17期

8 吳佳婧;賀嘉楠;王越群;董立巖;;基于項目屬性分類的協(xié)同過濾算法研究[J];吉林大學學報(信息科學版);2018年04期

9 周澤宇;王春玲;;基于協(xié)同過濾的個性化選課推薦與評論系統(tǒng)[J];信息記錄材料;2018年10期

10 盈艷;曹妍;牟向偉;;基于項目評分預測的混合式協(xié)同過濾推薦[J];現(xiàn)代圖書情報技術;2015年06期


相關博士學位論文 前10條

1 顧梁;播存結(jié)構(gòu)中基于協(xié)同過濾的內(nèi)容推薦技術研究[D];東南大學;2017年

2 袁衛(wèi)華;面向稀疏數(shù)據(jù)的多視圖個性化推薦方法研究[D];山東師范大學;2018年

3 孫小華;協(xié)同過濾系統(tǒng)的稀疏性與冷啟動問題研究[D];浙江大學;2005年

4 薛福亮;電子商務協(xié)同過濾推薦質(zhì)量影響因素及其改進機制研究[D];天津大學;2012年

5 段銳;融合文本內(nèi)容與情境信息的協(xié)同過濾推薦方法研究[D];合肥工業(yè)大學;2017年

6 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應用研究[D];大連理工大學;2008年

7 張雪潔;基于QoS的個性化云服務推薦方法研究[D];南京航空航天大學;2015年

8 姜邵巍;基于競爭關系的推薦技術研究[D];北京郵電大學;2014年

9 王立才;上下文感知推薦系統(tǒng)若干關鍵技術研究[D];北京郵電大學;2012年

10 錢付蘭;基于商空間模型的協(xié)同過濾推薦算法研究[D];安徽大學;2016年


相關碩士學位論文 前10條

1 安靜思;基于用戶影響力和潛在因子的協(xié)同過濾推薦方法[D];哈爾濱工程大學;2018年

2 靳愷;協(xié)同過濾中數(shù)據(jù)稀疏性緩解方法研究[D];湖南大學;2016年

3 王佳偉;基于置信度加權(quán)的單類協(xié)同過濾推薦算法研究[D];遼寧工程技術大學;2018年

4 王曉亮;基于Spark平臺的協(xié)同過濾推薦算法的研究與實現(xiàn)[D];大連交通大學;2017年

5 朱滿洲;基于協(xié)同過濾的個性化新聞推薦系統(tǒng)的設計與實現(xiàn)[D];南京理工大學;2019年

6 宋建鋒;基于LDA模型和核方法改進的協(xié)同過濾算法[D];華中科技大學;2017年

7 吳亞;協(xié)同過濾推薦算法在家裝領域中的應用研究[D];蘭州財經(jīng)大學;2018年

8 寧勇余;協(xié)同過濾推薦算法的設計與實現(xiàn)[D];湖南大學;2015年

9 呂夢晨;基于復雜網(wǎng)絡的協(xié)同過濾推薦算法的研究[D];東北大學;2016年

10 張云洲;單類協(xié)同過濾推薦算法的研究[D];中國科學技術大學;2018年



本文編號:2884368

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/guanlilunwen/tongjijuecelunwen/2884368.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2801d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com