基于微博社區(qū)的意見(jiàn)領(lǐng)袖發(fā)現(xiàn)方法研究
發(fā)布時(shí)間:2021-01-11 19:09
微博作為Web2.0時(shí)代具有代表性的社交網(wǎng)站,對(duì)于社交網(wǎng)絡(luò)服務(wù)的發(fā)展產(chǎn)生了很大的影響。微博服務(wù)平臺(tái)使得人與人之間極大地拉近了距離,為人們新的合作與溝通交流方式提供了可能。微博網(wǎng)絡(luò)的逐漸形成過(guò)程中,網(wǎng)絡(luò)結(jié)構(gòu)也顯示出稀疏性,社區(qū)結(jié)構(gòu)的內(nèi)部成員間往往具有很強(qiáng)的相關(guān)性與聯(lián)系性,準(zhǔn)確地劃分出各個(gè)社區(qū)能夠進(jìn)一步改善微博服務(wù)質(zhì)量。標(biāo)簽傳播算法(Label Propagation Algorithm,簡(jiǎn)稱LPA)是一個(gè)有著規(guī)則簡(jiǎn)單、時(shí)間復(fù)雜度低等優(yōu)勢(shì)的社區(qū)發(fā)現(xiàn)算法,但其節(jié)點(diǎn)的隨機(jī)選擇對(duì)于最終社區(qū)結(jié)構(gòu)識(shí)別的穩(wěn)定性造成了一定的影響,同時(shí)對(duì)于用戶同時(shí)擁有多個(gè)標(biāo)簽的重疊社區(qū)是不適用的。因此,本文提出一種基于用戶核心度的重疊社區(qū)標(biāo)簽傳播算法(User Core Label Propagation Algorithm,簡(jiǎn)稱UCLPA)用來(lái)發(fā)現(xiàn)主題社區(qū),其思想建立在社交網(wǎng)絡(luò)中核心-外圍結(jié)構(gòu)特征和多標(biāo)簽傳播算法COPRA(Community Overlap Propagation Algorithm)基礎(chǔ)上,在標(biāo)簽的初始化階段和標(biāo)簽更新的優(yōu)先度選擇兩個(gè)方面進(jìn)行改進(jìn),針對(duì)微博用戶同時(shí)擁有多個(gè)主題標(biāo)簽的特征,通過(guò)引入用戶...
【文章來(lái)源】:西華大學(xué)四川省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
微博用戶關(guān)系圖
一個(gè)文檔詞項(xiàng)分布,即各個(gè)詞項(xiàng)在這篇文檔所占的比例。對(duì)一篇文章的生成看成是,用戶首先以一定概率選擇某個(gè)主題選擇主題相關(guān)的詞語(yǔ)。在依次重復(fù)這個(gè)過(guò)程之后,每次生成數(shù)目的詞為止。生成一篇文檔,那么在文檔中每個(gè)詞語(yǔ)出p ( )= P ( ) p( )主題詞語(yǔ) 文檔 詞語(yǔ) 主題 主題 文檔于等式左邊矩陣的每個(gè)元素,其表示每篇文檔中每個(gè)詞詞頻示每個(gè)主題中每個(gè)單詞的概率;對(duì)于文檔主題矩陣,其表示概率。文檔中詞的生成過(guò)程從概率角度可以用如下公式表( ) ( ) ( ) ( ) ( ) ( ) ( )z zp w d p z p w z p z d p d p z d p w zd )是已知的,而 p ( w z )和 p ( z d )未知,假設(shè)有文檔 D 篇,每一篇有 K 個(gè),那么 p ( w z )是一個(gè) D N的向量, p ( z d )是一個(gè) D K矩陣。
西華大學(xué)碩士學(xué)位論文指節(jié)點(diǎn) X 在第t 次迭代的標(biāo)簽結(jié)果,以它的鄰居節(jié)點(diǎn)在第 ,公式如下:1( ) ( ( 1),.... ( 1))x x xkC t f C t C t ( )x t 指節(jié)點(diǎn) x 在 t 時(shí)刻的標(biāo)簽, f 函數(shù)返回鄰 x 居節(jié)點(diǎn)具有相簽。一般情況下,如果有多個(gè)標(biāo)簽被最多的鄰居節(jié)點(diǎn)使用,是,這種方法可能出現(xiàn)震蕩現(xiàn)象,甚至如圖 3.2,無(wú)限迭代
【參考文獻(xiàn)】:
期刊論文
[1]一種基于節(jié)點(diǎn)影響力的局部社區(qū)發(fā)現(xiàn)算法[J]. 易秀雙,韓業(yè)挺,王興偉. 小型微型計(jì)算機(jī)系統(tǒng). 2013(09)
[2]基于LDA模型的中文微博話題意見(jiàn)領(lǐng)袖挖掘[J]. 馮時(shí),景珊,楊卓,王大玲. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(04)
[3]Balanced Multi-Label Propagation for Overlapping Community Detection in Social Networks[J]. 武志昊,林友芳,Steve Gregory,萬(wàn)懷宇School of Computer and Information Technology,Beijing Jiaotong University,田盛豐. Journal of Computer Science & Technology. 2012(03)
[4]基于局部探測(cè)的快速?gòu)?fù)雜網(wǎng)絡(luò)聚類算法[J]. 金弟,劉大有,楊博,劉杰,何東曉,田野. 電子學(xué)報(bào). 2011(11)
[5]語(yǔ)言技術(shù)平臺(tái)[J]. 劉挺,車萬(wàn)翔,李正華. 中文信息學(xué)報(bào). 2011(06)
本文編號(hào):2971318
【文章來(lái)源】:西華大學(xué)四川省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
微博用戶關(guān)系圖
一個(gè)文檔詞項(xiàng)分布,即各個(gè)詞項(xiàng)在這篇文檔所占的比例。對(duì)一篇文章的生成看成是,用戶首先以一定概率選擇某個(gè)主題選擇主題相關(guān)的詞語(yǔ)。在依次重復(fù)這個(gè)過(guò)程之后,每次生成數(shù)目的詞為止。生成一篇文檔,那么在文檔中每個(gè)詞語(yǔ)出p ( )= P ( ) p( )主題詞語(yǔ) 文檔 詞語(yǔ) 主題 主題 文檔于等式左邊矩陣的每個(gè)元素,其表示每篇文檔中每個(gè)詞詞頻示每個(gè)主題中每個(gè)單詞的概率;對(duì)于文檔主題矩陣,其表示概率。文檔中詞的生成過(guò)程從概率角度可以用如下公式表( ) ( ) ( ) ( ) ( ) ( ) ( )z zp w d p z p w z p z d p d p z d p w zd )是已知的,而 p ( w z )和 p ( z d )未知,假設(shè)有文檔 D 篇,每一篇有 K 個(gè),那么 p ( w z )是一個(gè) D N的向量, p ( z d )是一個(gè) D K矩陣。
西華大學(xué)碩士學(xué)位論文指節(jié)點(diǎn) X 在第t 次迭代的標(biāo)簽結(jié)果,以它的鄰居節(jié)點(diǎn)在第 ,公式如下:1( ) ( ( 1),.... ( 1))x x xkC t f C t C t ( )x t 指節(jié)點(diǎn) x 在 t 時(shí)刻的標(biāo)簽, f 函數(shù)返回鄰 x 居節(jié)點(diǎn)具有相簽。一般情況下,如果有多個(gè)標(biāo)簽被最多的鄰居節(jié)點(diǎn)使用,是,這種方法可能出現(xiàn)震蕩現(xiàn)象,甚至如圖 3.2,無(wú)限迭代
【參考文獻(xiàn)】:
期刊論文
[1]一種基于節(jié)點(diǎn)影響力的局部社區(qū)發(fā)現(xiàn)算法[J]. 易秀雙,韓業(yè)挺,王興偉. 小型微型計(jì)算機(jī)系統(tǒng). 2013(09)
[2]基于LDA模型的中文微博話題意見(jiàn)領(lǐng)袖挖掘[J]. 馮時(shí),景珊,楊卓,王大玲. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(04)
[3]Balanced Multi-Label Propagation for Overlapping Community Detection in Social Networks[J]. 武志昊,林友芳,Steve Gregory,萬(wàn)懷宇School of Computer and Information Technology,Beijing Jiaotong University,田盛豐. Journal of Computer Science & Technology. 2012(03)
[4]基于局部探測(cè)的快速?gòu)?fù)雜網(wǎng)絡(luò)聚類算法[J]. 金弟,劉大有,楊博,劉杰,何東曉,田野. 電子學(xué)報(bào). 2011(11)
[5]語(yǔ)言技術(shù)平臺(tái)[J]. 劉挺,車萬(wàn)翔,李正華. 中文信息學(xué)報(bào). 2011(06)
本文編號(hào):2971318
本文鏈接:http://www.lk138.cn/guanlilunwen/lindaojc/2971318.html
最近更新
教材專著