中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類碩士論文 >

基于社交網(wǎng)絡(luò)的垃圾用戶檢測(cè)方法分析與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-03-10 23:42

  本文選題:垃圾檢測(cè) 切入點(diǎn):用戶分類 出處:《北京交通大學(xué)》2017年碩士論文 論文類型:學(xué)位論文


【摘要】:隨著互聯(lián)網(wǎng)的快速發(fā)展,社交網(wǎng)絡(luò)成為人們獲取信息和交流互動(dòng)的重要平臺(tái)。人們期待社交網(wǎng)絡(luò)成為一個(gè)安全、可靠的交流平臺(tái),然而,層出不窮的傳播垃圾信息的行為對(duì)正常用戶造成了極大的干擾,甚至威脅著用戶的個(gè)人信息安全。如何對(duì)垃圾用戶及其發(fā)布的垃圾消息進(jìn)行識(shí)別,已經(jīng)成為了亟待解決的問(wèn)題。本文針對(duì)垃圾用戶的檢測(cè)問(wèn)題,提出了基于內(nèi)容識(shí)別和基于特征識(shí)別的兩種算法,從不同的角度識(shí)別出垃圾用戶。一方面,搭建了基于字符粒度的卷積神經(jīng)網(wǎng)絡(luò)CharCNN用于垃圾信息檢測(cè),直接使用漢字作為輸入特征,通過(guò)實(shí)驗(yàn)驗(yàn)證了漢字用于字符級(jí)CNN的優(yōu)越性,準(zhǔn)確率達(dá)到了 93%。在此基礎(chǔ)上,為了通過(guò)垃圾信息定位垃圾用戶,引入序貫概率比模型,使用CNN模型對(duì)用戶發(fā)送的消息進(jìn)行分類,通過(guò)對(duì)分類結(jié)果序列建模,實(shí)現(xiàn)對(duì)用戶的實(shí)時(shí)監(jiān)控及分類,從而有效識(shí)別出垃圾用戶。另一方面,以新浪微博為研究對(duì)象,基于微博用戶的特點(diǎn),從用戶信息,用戶行為,社交關(guān)系和博文文本內(nèi)容等四個(gè)角度出發(fā),分析了可用的特征集合并完成了特征信息獲取算法的設(shè)計(jì)。通過(guò)多種特征選擇算法完成特征排序后,結(jié)合不同類別的分類器在平衡數(shù)據(jù)集以及不平衡數(shù)據(jù)集上的表現(xiàn),選出了最優(yōu)特征子集與最佳分類器的搭配,完成了垃圾用戶的檢測(cè)算法。并通過(guò)實(shí)驗(yàn)證明了算法的有效性,準(zhǔn)確率達(dá)到了 90%。最后,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)垃圾用戶分類檢測(cè)及標(biāo)注系統(tǒng),該系統(tǒng)可以完成樣本數(shù)據(jù)的獲取并使用兩種分類算法完成分類預(yù)測(cè),通過(guò)仿真測(cè)試證明了兩種算法的有效性。
[Abstract]:With the rapid development of the Internet, social networking has become an important platform for people to access information and communicate with each other. The behavior of spreading spam information in endlessly has caused great interference to the normal users and even threatened the personal information security of the users. In this paper, two algorithms based on content recognition and feature recognition are proposed to identify garbage users from different angles. A convolution neural network (CharCNN) based on character granularity is built for spam detection, and Chinese characters are directly used as input features. The superiority of Chinese characters used in character level CNN is verified by experiments, and the accuracy is 933%. In order to locate the garbage users through spam information, the sequential probability ratio model is introduced, and the CNN model is used to classify the messages sent by the users. By modeling the sequence of the classification results, the real-time monitoring and classification of the users are realized. On the other hand, taking Weibo of Sina as the research object, based on the characteristics of the user, from four angles of user information, user behavior, social relations and the content of the blog text, The available feature sets are analyzed and the design of feature information acquisition algorithm is completed. After several feature selection algorithms are used to complete feature sorting, the performance of different classifiers on balanced and unbalanced data sets is combined. The collocation of the optimal feature subset and the best classifier is selected, and the detection algorithm of garbage user is completed. The validity of the algorithm is proved by experiments, and the accuracy reaches 90%. Finally, A garbage user classification detection and tagging system is designed and implemented. The system can obtain the sample data and use two classification algorithms to complete the classification prediction. The simulation results show that the two algorithms are effective.
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP393.092;TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 Bruce Antelman;李雯;;社交網(wǎng)絡(luò)[J];高校圖書(shū)館工作;2008年01期

2 ;基于位置的手機(jī)社交網(wǎng)絡(luò)“貝多”正式發(fā)布[J];中國(guó)新通信;2008年06期

3 曹增輝;;社交網(wǎng)絡(luò)更偏向于用戶工具[J];信息網(wǎng)絡(luò);2009年11期

4 ;美國(guó):印刷企業(yè)青睞社交網(wǎng)絡(luò)營(yíng)銷新方式[J];中國(guó)包裝工業(yè);2010年Z1期

5 李智惠;柳承燁;;韓國(guó)移動(dòng)社交網(wǎng)絡(luò)服務(wù)的類型分析與促進(jìn)方案[J];現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào));2010年08期

6 賈富;;改變一切的社交網(wǎng)絡(luò)[J];互聯(lián)網(wǎng)天地;2011年04期

7 譚拯;;社交網(wǎng)絡(luò):連接與發(fā)現(xiàn)[J];廣東通信技術(shù);2011年07期

8 陳一舟;;社交網(wǎng)絡(luò)的發(fā)展趨勢(shì)[J];傳媒;2011年12期

9 殷樂(lè);;全球社交網(wǎng)絡(luò)新態(tài)勢(shì)及文化影響[J];新聞與寫(xiě)作;2012年01期

10 許麗;;社交網(wǎng)絡(luò):孤獨(dú)年代的集體狂歡[J];上海信息化;2012年09期

相關(guān)會(huì)議論文 前10條

1 趙云龍;李艷兵;;社交網(wǎng)絡(luò)用戶的人格預(yù)測(cè)與關(guān)系強(qiáng)度研究[A];第七屆(2012)中國(guó)管理學(xué)年會(huì)商務(wù)智能分會(huì)場(chǎng)論文集(選編)[C];2012年

2 宮廣宇;李開(kāi)軍;;對(duì)社交網(wǎng)絡(luò)中信息傳播的分析和思考——以人人網(wǎng)為例[A];首屆華中地區(qū)新聞與傳播學(xué)科研究生學(xué)術(shù)論壇獲獎(jiǎng)?wù)撐腫C];2010年

3 楊子鵬;喬麗娟;王夢(mèng)思;楊雪迎;孟子冰;張禹;;社交網(wǎng)絡(luò)與大學(xué)生焦慮緩解[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文集[C];2013年

4 畢雪梅;;體育虛擬社區(qū)中的體育社交網(wǎng)絡(luò)解析[A];第九屆全國(guó)體育科學(xué)大會(huì)論文摘要匯編(4)[C];2011年

5 杜p,

本文編號(hào):1595580


資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/1595580.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1d4a1***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com