結(jié)合評論關(guān)系網(wǎng)絡(luò)圖的微博垃圾評論識別方法研究
發(fā)布時間:2024-01-29 12:20
伴隨著微博平臺影響力的不斷擴(kuò)大,大量無意義帶有廣告營銷、惡意攻擊言語性質(zhì)的垃圾評論信息充斥在平臺中,威脅著平臺本身發(fā)展的穩(wěn)定與和諧。因此,如何在已有垃圾評論識別研究的基礎(chǔ)之上提高垃圾評論整體的識別率以及降低垃圾評論和正常評論的誤判率是面向微博平臺垃圾評論識別研究中的重點內(nèi)容。提出一種結(jié)合評論關(guān)系網(wǎng)絡(luò)圖的微博垃圾評論識別方法,在建立評論關(guān)系網(wǎng)絡(luò)圖模型的基礎(chǔ)之上,采用文本相關(guān)度計算模型代替?zhèn)鹘y(tǒng)嚴(yán)苛的文本相似度計算模型,將評論與原博文的相關(guān)關(guān)系考慮進(jìn)來,降低正常相關(guān)評論的誤判率。文本相關(guān)度又由底層實現(xiàn)基于Lucence全文搜索引擎的微博語料全文搜索庫詞語相關(guān)度計算而來,該方法結(jié)合了傳統(tǒng)基于搜索引擎和語料庫兩種詞語相關(guān)度計算方法以適用于評論關(guān)系網(wǎng)絡(luò)圖中的文本詞之間相關(guān)度計算。在評論文本特征不夠豐富的情況下,通過用戶共同屬性、用戶交互頻度、用戶間互評估可信度模型量化評論關(guān)系網(wǎng)絡(luò)圖中評論兩端用戶友好關(guān)系以及評論用戶可信度,利用用戶關(guān)系越友好、用戶可信度越高,相互之間發(fā)表垃圾評論概率越低的性質(zhì)提高垃圾評論識別算法的準(zhǔn)確率。并且為了提升垃圾評論識別算法的性能,選擇基于圖模型的圖數(shù)據(jù)庫來存儲和管理包含各...
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
本文編號:3888175
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
圖3.4評論關(guān)系網(wǎng)絡(luò)圖Neo4j存儲
圖3.9文本分詞示例
本文編號:3888175
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/3888175.html
最近更新
教材專著