基于時段-時長耦合LDA的用戶收視行為挖掘
發(fā)布時間:2024-06-14 22:23
網(wǎng)絡(luò)協(xié)議電視(IPTV)的用戶收視興趣不僅體現(xiàn)在用戶觀看的節(jié)目列表,還體現(xiàn)在節(jié)目的觀看時間點和時長上?紤]到現(xiàn)有方法對時間點和時長的忽略,提出一種時段-時長耦合的LDA模型。通過刻畫用戶興趣主題和收視時段的隱變量生成收視記錄中的觀看節(jié)目、觀看時間點和時長,并用Gibbs采樣對上述隱變量進行推斷。在天津電視臺用戶行為數(shù)據(jù)上進行驗證,結(jié)果表明,該模型可以得到節(jié)目相關(guān)性更高的興趣主題,更加精確地挖掘到用戶在不同時段的收視興趣分布。將該模型用于IPTV節(jié)目推薦,相較于傳統(tǒng)的cLDA,推薦效果有顯著提升。
【文章頁數(shù)】:9 頁
【部分圖文】:
本文編號:3994509
【文章頁數(shù)】:9 頁
【部分圖文】:
圖1LDA概率圖模型
LDA是Blei等學者于2003年提出的一種基于概率模型的文本主題建模方法,可以識別龐大文檔集或語料庫中的隱藏主題信息,被廣泛應用于信息檢索、自然語言處理等領(lǐng)域[13~15]。LDA的圖模型如圖1所示,該模型假設(shè)文章是由多個主題以不同比例混合而成,每個主題可以用多個詞的概率分布表....
圖2用戶收視記錄的周期性變化
(4)用戶對某個節(jié)目的觀看時長越長,則對這個節(jié)目的喜愛程度越高。基于上述分析,本文將LDA模型中的興趣主題分布θm擴展為表示用戶收視興趣、時段與時長的行為模式分布,建立TDC-LDA模型。表2是LDA模型推廣到TDC-LDA模型后θm的變化。在LDA模型中,每個IPTV用戶的興....
圖3TDC-LDA概率圖模型
TDC-LDA模型是一個概率生成模型,它是對LDA模型的拓展,模型如圖3所示。假設(shè)有K個興趣主題,Vm個不同的電視節(jié)目,興趣主題對應的電視節(jié)目多項式分布描述成K×Vm維的矩陣Φ,φk,vw是節(jié)目vm屬于主題k的概率。同樣,假設(shè)有L個時段(時段指一些特定的時間區(qū)間,例如,工作日17....
圖6用戶M觀看最多的5個節(jié)目的觀看次數(shù)與時長
表9用戶M的興趣主題概率分布模型興趣主題動畫I類動畫II類古裝愛情類cLDA0.7585140.05804950.003096TDC-LDA0.5554180.06037150.212454分析圖6可知用戶M是一個以兒童與家庭主婦主導收....
本文編號:3994509
本文鏈接:http://www.lk138.cn/kejilunwen/wltx/3994509.html
最近更新
教材專著