基于微博社區(qū)的意見領(lǐng)袖發(fā)現(xiàn)方法研究
發(fā)布時間:2021-01-11 19:09
微博作為Web2.0時代具有代表性的社交網(wǎng)站,對于社交網(wǎng)絡(luò)服務(wù)的發(fā)展產(chǎn)生了很大的影響。微博服務(wù)平臺使得人與人之間極大地拉近了距離,為人們新的合作與溝通交流方式提供了可能。微博網(wǎng)絡(luò)的逐漸形成過程中,網(wǎng)絡(luò)結(jié)構(gòu)也顯示出稀疏性,社區(qū)結(jié)構(gòu)的內(nèi)部成員間往往具有很強的相關(guān)性與聯(lián)系性,準(zhǔn)確地劃分出各個社區(qū)能夠進(jìn)一步改善微博服務(wù)質(zhì)量。標(biāo)簽傳播算法(Label Propagation Algorithm,簡稱LPA)是一個有著規(guī)則簡單、時間復(fù)雜度低等優(yōu)勢的社區(qū)發(fā)現(xiàn)算法,但其節(jié)點的隨機選擇對于最終社區(qū)結(jié)構(gòu)識別的穩(wěn)定性造成了一定的影響,同時對于用戶同時擁有多個標(biāo)簽的重疊社區(qū)是不適用的。因此,本文提出一種基于用戶核心度的重疊社區(qū)標(biāo)簽傳播算法(User Core Label Propagation Algorithm,簡稱UCLPA)用來發(fā)現(xiàn)主題社區(qū),其思想建立在社交網(wǎng)絡(luò)中核心-外圍結(jié)構(gòu)特征和多標(biāo)簽傳播算法COPRA(Community Overlap Propagation Algorithm)基礎(chǔ)上,在標(biāo)簽的初始化階段和標(biāo)簽更新的優(yōu)先度選擇兩個方面進(jìn)行改進(jìn),針對微博用戶同時擁有多個主題標(biāo)簽的特征,通過引入用戶...
【文章來源】:西華大學(xué)四川省
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
微博用戶關(guān)系圖
一個文檔詞項分布,即各個詞項在這篇文檔所占的比例。對一篇文章的生成看成是,用戶首先以一定概率選擇某個主題選擇主題相關(guān)的詞語。在依次重復(fù)這個過程之后,每次生成數(shù)目的詞為止。生成一篇文檔,那么在文檔中每個詞語出p ( )= P ( ) p( )主題詞語 文檔 詞語 主題 主題 文檔于等式左邊矩陣的每個元素,其表示每篇文檔中每個詞詞頻示每個主題中每個單詞的概率;對于文檔主題矩陣,其表示概率。文檔中詞的生成過程從概率角度可以用如下公式表( ) ( ) ( ) ( ) ( ) ( ) ( )z zp w d p z p w z p z d p d p z d p w zd )是已知的,而 p ( w z )和 p ( z d )未知,假設(shè)有文檔 D 篇,每一篇有 K 個,那么 p ( w z )是一個 D N的向量, p ( z d )是一個 D K矩陣。
西華大學(xué)碩士學(xué)位論文指節(jié)點 X 在第t 次迭代的標(biāo)簽結(jié)果,以它的鄰居節(jié)點在第 ,公式如下:1( ) ( ( 1),.... ( 1))x x xkC t f C t C t ( )x t 指節(jié)點 x 在 t 時刻的標(biāo)簽, f 函數(shù)返回鄰 x 居節(jié)點具有相簽。一般情況下,如果有多個標(biāo)簽被最多的鄰居節(jié)點使用,是,這種方法可能出現(xiàn)震蕩現(xiàn)象,甚至如圖 3.2,無限迭代
【參考文獻(xiàn)】:
期刊論文
[1]一種基于節(jié)點影響力的局部社區(qū)發(fā)現(xiàn)算法[J]. 易秀雙,韓業(yè)挺,王興偉. 小型微型計算機系統(tǒng). 2013(09)
[2]基于LDA模型的中文微博話題意見領(lǐng)袖挖掘[J]. 馮時,景珊,楊卓,王大玲. 東北大學(xué)學(xué)報(自然科學(xué)版). 2013(04)
[3]Balanced Multi-Label Propagation for Overlapping Community Detection in Social Networks[J]. 武志昊,林友芳,Steve Gregory,萬懷宇School of Computer and Information Technology,Beijing Jiaotong University,田盛豐. Journal of Computer Science & Technology. 2012(03)
[4]基于局部探測的快速復(fù)雜網(wǎng)絡(luò)聚類算法[J]. 金弟,劉大有,楊博,劉杰,何東曉,田野. 電子學(xué)報. 2011(11)
[5]語言技術(shù)平臺[J]. 劉挺,車萬翔,李正華. 中文信息學(xué)報. 2011(06)
本文編號:2971318
【文章來源】:西華大學(xué)四川省
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
微博用戶關(guān)系圖
一個文檔詞項分布,即各個詞項在這篇文檔所占的比例。對一篇文章的生成看成是,用戶首先以一定概率選擇某個主題選擇主題相關(guān)的詞語。在依次重復(fù)這個過程之后,每次生成數(shù)目的詞為止。生成一篇文檔,那么在文檔中每個詞語出p ( )= P ( ) p( )主題詞語 文檔 詞語 主題 主題 文檔于等式左邊矩陣的每個元素,其表示每篇文檔中每個詞詞頻示每個主題中每個單詞的概率;對于文檔主題矩陣,其表示概率。文檔中詞的生成過程從概率角度可以用如下公式表( ) ( ) ( ) ( ) ( ) ( ) ( )z zp w d p z p w z p z d p d p z d p w zd )是已知的,而 p ( w z )和 p ( z d )未知,假設(shè)有文檔 D 篇,每一篇有 K 個,那么 p ( w z )是一個 D N的向量, p ( z d )是一個 D K矩陣。
西華大學(xué)碩士學(xué)位論文指節(jié)點 X 在第t 次迭代的標(biāo)簽結(jié)果,以它的鄰居節(jié)點在第 ,公式如下:1( ) ( ( 1),.... ( 1))x x xkC t f C t C t ( )x t 指節(jié)點 x 在 t 時刻的標(biāo)簽, f 函數(shù)返回鄰 x 居節(jié)點具有相簽。一般情況下,如果有多個標(biāo)簽被最多的鄰居節(jié)點使用,是,這種方法可能出現(xiàn)震蕩現(xiàn)象,甚至如圖 3.2,無限迭代
【參考文獻(xiàn)】:
期刊論文
[1]一種基于節(jié)點影響力的局部社區(qū)發(fā)現(xiàn)算法[J]. 易秀雙,韓業(yè)挺,王興偉. 小型微型計算機系統(tǒng). 2013(09)
[2]基于LDA模型的中文微博話題意見領(lǐng)袖挖掘[J]. 馮時,景珊,楊卓,王大玲. 東北大學(xué)學(xué)報(自然科學(xué)版). 2013(04)
[3]Balanced Multi-Label Propagation for Overlapping Community Detection in Social Networks[J]. 武志昊,林友芳,Steve Gregory,萬懷宇School of Computer and Information Technology,Beijing Jiaotong University,田盛豐. Journal of Computer Science & Technology. 2012(03)
[4]基于局部探測的快速復(fù)雜網(wǎng)絡(luò)聚類算法[J]. 金弟,劉大有,楊博,劉杰,何東曉,田野. 電子學(xué)報. 2011(11)
[5]語言技術(shù)平臺[J]. 劉挺,車萬翔,李正華. 中文信息學(xué)報. 2011(06)
本文編號:2971318
本文鏈接:http://www.lk138.cn/guanlilunwen/lindaojc/2971318.html
最近更新
教材專著