網(wǎng)絡(luò)虛擬學(xué)習(xí)社區(qū)重要用戶與核心主題聯(lián)合分析
【文章頁(yè)數(shù)】:11 頁(yè)
【部分圖文】:
圖1“用戶-詞匯”超網(wǎng)絡(luò)結(jié)構(gòu)分解
本文提出的“用戶-詞匯”超網(wǎng)絡(luò)嵌入LDA模型,以文檔主題模型為基礎(chǔ),將虛擬學(xué)習(xí)社區(qū)作為一個(gè)臨時(shí)的社會(huì)網(wǎng)絡(luò),建立跨越文檔的詞匯上下文關(guān)聯(lián)關(guān)系,研究用戶與發(fā)帖(或回復(fù))內(nèi)容的交互關(guān)系。如圖1所示,定義兩層超網(wǎng)絡(luò)g(V,E,L),V為節(jié)點(diǎn)集,分為兩類:VL=1={ui}為用戶節(jié)點(diǎn)集,表....
圖2傳統(tǒng)LDA分解示意圖
超網(wǎng)絡(luò)嵌入LDA模型是在傳統(tǒng)LDA模型的“文檔-主題-詞匯”三層結(jié)構(gòu)(如圖2所示)的基礎(chǔ)上,加入用戶維度,轉(zhuǎn)化成“用戶-文檔-主題-詞匯”的4層結(jié)構(gòu)(如圖3所示)!坝脩-文檔-詞匯”三維權(quán)重矩陣(udtmTF-IDFsij)為模型輸入信息,而用戶與文檔是一對(duì)多的確定關(guān)系,....
圖3“用戶-詞匯”超網(wǎng)絡(luò)嵌入LDA模型分解示意圖
圖2傳統(tǒng)LDA分解示意圖由于超網(wǎng)絡(luò)嵌入LDA模型加入了用戶維度信息,模型的輸入數(shù)據(jù)為“用戶-文檔-詞匯”三維權(quán)重矩陣(udtmsijTF-IDF)。該矩陣的權(quán)重計(jì)算為原“文檔-詞匯”權(quán)重矩陣(dtmijTF-IDF)與超網(wǎng)絡(luò)節(jié)點(diǎn)重要性計(jì)算出的用戶重要性和詞匯重要性系數(shù)的乘積,如....
圖4實(shí)驗(yàn)數(shù)據(jù)
本文以經(jīng)管之家論壇“數(shù)據(jù)分析與數(shù)據(jù)挖掘”版塊(1)為例,該版塊比較活躍,每天都有大量的學(xué)習(xí)互動(dòng)。在經(jīng)管之家論壇頁(yè)面,利用R語(yǔ)言的rvest包,抓取最近50頁(yè)發(fā)帖頁(yè)面,提取版塊主題和回復(fù)文本2萬多條,經(jīng)過清洗過濾的結(jié)構(gòu)化數(shù)據(jù)如圖4(a)所示,用戶發(fā)帖和回帖互動(dòng)關(guān)系如圖4(b)所示。....
本文編號(hào):3956569
本文鏈接:http://lk138.cn/jiaoyulunwen/xueshengguanli/3956569.html