【摘要】:隨著大數(shù)據(jù)和云計(jì)算技術(shù)的發(fā)展,各種互聯(lián)網(wǎng)應(yīng)用的出現(xiàn)導(dǎo)致網(wǎng)絡(luò)數(shù)據(jù)信息呈指數(shù)級(jí)增長(zhǎng)。大規(guī)模數(shù)據(jù)信息蘊(yùn)含豐富的價(jià)值,但從中找到有價(jià)值的信息變得越來越困難,這將產(chǎn)生“信息過載”等問題。推薦系統(tǒng)可以從大規(guī)模的數(shù)據(jù)中挖掘出用戶感興趣的信息,并根據(jù)用戶偏好推薦給用戶,已經(jīng)成為克服“信息過載”問題的有效策略。目前,推薦系統(tǒng)已廣泛應(yīng)用于電子商務(wù)和廣告計(jì)算領(lǐng)域,并帶來巨大的商業(yè)價(jià)值。但是,推薦系統(tǒng)仍然面臨眾多挑戰(zhàn),主要體現(xiàn)在以下幾方面:(1)數(shù)據(jù)稀疏問題:在項(xiàng)目數(shù)量較為龐大的業(yè)務(wù)系統(tǒng)中,由于用戶通常只訪問少量項(xiàng)目,這將導(dǎo)致蘊(yùn)含用戶偏好的歷史記錄相對(duì)稀疏。因此,如何基于海量數(shù)據(jù)信息解決推薦系統(tǒng)中的數(shù)據(jù)稀疏問題是一個(gè)值得探討的課題。(2)冷啟動(dòng)問題:由于缺少充足的信息深入提取用戶偏好,當(dāng)新用戶加入推薦系統(tǒng)時(shí),推薦系統(tǒng)很難為用戶提供準(zhǔn)確推薦。因此,如何給新加入系統(tǒng)的用戶提供個(gè)性化推薦是一個(gè)亟需解決的問題。(3)可解釋性問題:通常情況下,用戶期望推薦系統(tǒng)對(duì)預(yù)測(cè)結(jié)果給出合理的解釋,而不是僅僅給用戶展示“黑盒”推薦。因此,如何提高推薦的可解釋性也是推薦系統(tǒng)面臨的重要挑戰(zhàn)。(4)推薦的多樣性問題:由于用戶的興趣偏好較為廣泛,而推薦系統(tǒng)經(jīng)常根據(jù)用戶的歷史活動(dòng)記錄推薦同類型的項(xiàng)目給用戶,同質(zhì)的推薦不能滿足用戶的個(gè)性化需求。因此,研究推薦的多樣性問題可以提高用戶對(duì)推薦系統(tǒng)的滿意度。針對(duì)上述挑戰(zhàn),國(guó)內(nèi)外研究人員提出了大量的解決方案。然而,僅僅利用用戶的評(píng)分信息不能從本質(zhì)上解決推薦系統(tǒng)中存在的問題。隨著互聯(lián)網(wǎng)中越來越多的多源異構(gòu)數(shù)據(jù)(如文本、位置、社交關(guān)系、圖像等)能夠被獲取,融合多源數(shù)據(jù)信息已經(jīng)成為推薦系統(tǒng)重要的研究方向。如何在推薦系統(tǒng)中融合多源信息,捕捉數(shù)據(jù)內(nèi)部之間復(fù)雜的關(guān)系,成為推薦系統(tǒng)領(lǐng)域重要的研究問題。由于深度學(xué)習(xí)技術(shù)能夠從豐富的可訪問數(shù)據(jù)源(如上下文、文本和視覺信息)中有效地捕捉非線性和有意義的用戶-項(xiàng)目關(guān)系,并使更復(fù)雜的抽象編碼成為更高層的數(shù)據(jù)表示,基于深度學(xué)習(xí)研究多源數(shù)據(jù)融合推薦算法具有重要的理論意義和應(yīng)用價(jià)值。本文以國(guó)家自然科學(xué)基金為依托,針對(duì)上述現(xiàn)有研究工作存在的問題,對(duì)基于深度學(xué)習(xí)融合多源信息的推薦算法進(jìn)行深入研究,其中包括利用卷積神經(jīng)網(wǎng)絡(luò)融合多源數(shù)據(jù)信息捕捉非線性用戶-項(xiàng)目關(guān)系,解決推薦中存在的數(shù)據(jù)稀疏和冷啟動(dòng)問題;引入深度學(xué)習(xí)的注意力機(jī)制提取用戶評(píng)論文本信息,深入了解用戶偏好進(jìn)行推薦,提高推薦的可解釋性;挖掘項(xiàng)目之間強(qiáng)關(guān)聯(lián)規(guī)則,提高推薦的多樣性。本文的主要工作如下:1.提出了一種基于卷積矩陣分解的興趣點(diǎn)推薦算法由于現(xiàn)實(shí)生活中用戶在位置社交網(wǎng)絡(luò)中只對(duì)少數(shù)興趣點(diǎn)進(jìn)行簽到,使得用戶簽到歷史數(shù)據(jù)極其稀疏。評(píng)論文本信息以及上下文信息可以解決推薦系統(tǒng)的數(shù)據(jù)稀疏問題,更加深入地了解用戶偏好。目前研究人員探討基于評(píng)論文本信息的位置興趣點(diǎn)推薦,但是現(xiàn)有的方法是基于詞袋或文檔主題模型處理評(píng)論文本,只能對(duì)用戶偏好進(jìn)行淺層理解。為了捕捉用戶深層次偏好,本文利用卷積神經(jīng)網(wǎng)絡(luò)處理評(píng)論文本信息,對(duì)位置興趣點(diǎn)的潛在因子建模,在矩陣分解模型的基礎(chǔ)上,融合用戶的社交關(guān)系以及位置興趣點(diǎn)地理信息因子,將多源信息融入同一概率因子模型中進(jìn)行求解,從而對(duì)用戶偏好進(jìn)行更為細(xì)致的建模。實(shí)驗(yàn)結(jié)果表明,與沒有使用卷積神經(jīng)網(wǎng)絡(luò)處理評(píng)論文本信息的算法相比,該算法在準(zhǔn)確率和評(píng)分預(yù)測(cè)方面取得了較好的效果。2.提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的內(nèi)容感知興趣點(diǎn)推薦算法上述模型只是利用評(píng)論文本信息對(duì)興趣點(diǎn)潛在因子建模,用戶的潛在因子還是利用傳統(tǒng)的概率矩陣分解求得,為此,本文在上文的基礎(chǔ)之上,利用卷積神經(jīng)網(wǎng)絡(luò)處理評(píng)論文本信息,對(duì)位置興趣點(diǎn)和用戶的潛在因子建模,同時(shí)融合用戶的地理位置信息以及求得的用戶評(píng)論情感類別信息構(gòu)造目標(biāo)函數(shù),該目標(biāo)函數(shù)由矩陣分解以及概率目標(biāo)函數(shù)最大化組成,對(duì)目標(biāo)函數(shù)進(jìn)行求解。實(shí)驗(yàn)結(jié)果表明,利用卷積神經(jīng)網(wǎng)絡(luò)處理評(píng)論文本能夠有效地對(duì)用戶和位置興趣點(diǎn)進(jìn)行建模,并且與其他基準(zhǔn)算法相比,可以得到更優(yōu)的推薦結(jié)果。3.提出了一種基于分層注意力機(jī)制的推薦算法目前許多研究人員提出利用深度神經(jīng)網(wǎng)絡(luò)處理用戶和產(chǎn)品評(píng)論文本信息生成評(píng)論文本表示,進(jìn)而提高推薦的性能。然而,評(píng)論中一些單詞或句子可以強(qiáng)烈的表達(dá)出用戶偏好,而另一些則傾向于表示產(chǎn)品的特性,將用戶和產(chǎn)品評(píng)論信息映射成同一特征表示是不合理的。因此,本文應(yīng)用雙向門控循環(huán)單元分別生成用戶和產(chǎn)品特征表示。為了使得用戶和產(chǎn)品的特征表示反映在語義層而不是詞層,本文設(shè)計(jì)了單詞級(jí)和句子級(jí)分層表示結(jié)構(gòu)。由于注意力機(jī)制可以從大量信息中有選擇地篩選出重要信息并聚焦到重要信息上,本文在每層表示結(jié)構(gòu)中引入注意力機(jī)制,忽略大多數(shù)不重要的信息,提高推薦的性能。通過數(shù)據(jù)分析和實(shí)驗(yàn)結(jié)果表明,引入分層的注意力機(jī)制能夠有效地對(duì)評(píng)論文本信息建模,提高推薦的可解釋性,并且和其他基準(zhǔn)算法相比,可以更好地捕捉用戶興趣偏好。4.提出了一種基于高效用關(guān)聯(lián)模式挖掘的推薦算法現(xiàn)實(shí)生活中,大多數(shù)用戶只對(duì)幾個(gè)單一類別的項(xiàng)目感興趣,為用戶推薦不同類別但具有強(qiáng)關(guān)聯(lián)模式的項(xiàng)目,往往可以提高推薦的多樣性,但是如何獲取項(xiàng)目之間的關(guān)聯(lián)關(guān)系是推薦任務(wù)中首先需要解決的一個(gè)問題。因此,本文深度挖掘項(xiàng)目之間的關(guān)聯(lián)關(guān)系,融合事務(wù)數(shù)據(jù)中的項(xiàng)目頻度以及價(jià)值度等多源信息,對(duì)高效用關(guān)聯(lián)模式挖掘算法UP-Growth進(jìn)行改進(jìn)。采用聚類的方法把數(shù)據(jù)庫中相似的事務(wù)劃分為多個(gè)數(shù)據(jù)子集,將數(shù)據(jù)子集分配到分布式計(jì)算平臺(tái)的各個(gè)節(jié)點(diǎn)中構(gòu)造效用模式樹,各個(gè)節(jié)點(diǎn)中相同項(xiàng)的條件模式基分配到同一個(gè)節(jié)點(diǎn)中挖掘高效用關(guān)聯(lián)模式,為后續(xù)基于關(guān)聯(lián)模式的推薦提供支持。數(shù)據(jù)分析和實(shí)驗(yàn)結(jié)果表明,該算法在效率和推薦的多樣性方面優(yōu)于對(duì)比算法。本文從推薦的數(shù)據(jù)稀疏性、冷啟動(dòng)、可解釋性以及多樣性四個(gè)方面研究了三種推薦算法。第一種算法涉及本文第二、三章內(nèi)容,由于評(píng)分?jǐn)?shù)據(jù)過于稀疏,并且在沒有大量評(píng)分?jǐn)?shù)據(jù)的情況下推薦系統(tǒng)容易產(chǎn)生冷啟動(dòng)問題,融合評(píng)論文本、地理位置、用戶社交關(guān)系信息可以解決數(shù)據(jù)稀疏以及冷啟動(dòng)問題,提高推薦的性能。第二種算法涉及本文第四章內(nèi)容,在解決數(shù)據(jù)稀疏以及冷啟動(dòng)問題的基礎(chǔ)上,研究推薦的可解釋性問題,基于深度神經(jīng)網(wǎng)絡(luò)分析大量的評(píng)論文本信息,提取評(píng)論內(nèi)容特征,引入注意力機(jī)制查找評(píng)論文本中重要的單詞和句子作為解釋,增加推薦的可解釋性。第三種算法涉及本文第五章內(nèi)容,討論推薦的多樣性問題,通過挖掘不同類別項(xiàng)目之間的強(qiáng)關(guān)聯(lián)規(guī)則,建立項(xiàng)目的關(guān)聯(lián)規(guī)則庫,為用戶提供多樣化的推薦服務(wù)。綜上所述,本文針對(duì)推薦系統(tǒng)中存在的數(shù)據(jù)稀疏、冷啟動(dòng)、可解釋性以及多樣性問題進(jìn)行探討。為了解決上述問題,利用深度學(xué)習(xí)技術(shù)對(duì)多源數(shù)據(jù)進(jìn)行處理并將其融合,基于此提出了多個(gè)推薦算法,提升推薦的性能,并且通過理論及實(shí)驗(yàn)證明了本文研究工作的有效性。
【學(xué)位授予單位】:山東師范大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.3;TP18
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 俞偉;徐德華;;推薦算法概述與展望[J];科技與創(chuàng)新;2019年04期
2 張世東;;推薦算法概述[J];科技傳播;2019年04期
3 張艷紅;諶頏;;基于標(biāo)簽的自助教育資源推薦算法研究[J];現(xiàn)代信息科技;2019年12期
4 李欣鞠;;個(gè)性化推薦算法下的“信息繭房”效應(yīng)研究——以“天天快報(bào)”為例[J];西部廣播電視;2019年13期
5 陳軍;謝衛(wèi)紅;陳揚(yáng)森;;國(guó)內(nèi)外大數(shù)據(jù)推薦算法領(lǐng)域前沿動(dòng)態(tài)研究[J];中國(guó)科技論壇;2018年01期
6 向洋樂;;大數(shù)據(jù)背景下互聯(lián)網(wǎng)購(gòu)物推薦算法應(yīng)用研究[J];中國(guó)戰(zhàn)略新興產(chǎn)業(yè);2018年04期
7 喻國(guó)明;劉鈺菡;王暢穎;王丹敏;;推薦算法:信息推送的王者品性與進(jìn)階重點(diǎn)[J];山東社會(huì)科學(xué);2018年03期
8 劉順程;岳思穎;鐘瑞敏;;基于拉普拉斯噪聲的輕型推薦算法[J];中國(guó)戰(zhàn)略新興產(chǎn)業(yè);2018年20期
9 劉濤;劉佐;;一種面向新文章的個(gè)性化推薦算法研究[J];控制工程;2018年06期
10 汪海鵬;鄭揚(yáng)飛;;基于特征值的律師推薦算法及改進(jìn)方案[J];計(jì)算機(jī)與現(xiàn)代化;2018年10期
相關(guān)會(huì)議論文 前10條
1 米傳民;彭鵬;單曉菲;馬靜;;考慮顯式評(píng)分的基于二部圖的推薦算法[A];第十七屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2015年
2 秦國(guó);杜小勇;;基于用戶層次信息的協(xié)同推薦算法[A];第二十一屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
3 王韜丞;羅喜軍;杜小勇;;基于層次的推薦:一種新的個(gè)性化推薦算法[A];第二十四屆中國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
4 唐燦;;基于模糊用戶心理模式的個(gè)性化推薦算法[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年
5 蘇日啟;胡皓;汪秉宏;;基于網(wǎng)絡(luò)的含時(shí)推薦算法[A];第五屆全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年
6 梁莘q,
本文編號(hào):2601122
本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/2601122.html