基于灰色關(guān)聯(lián)分析的熱門微博數(shù)據(jù)可視化研究
本文選題:關(guān)聯(lián)規(guī)則 切入點:加權(quán)鏈接 出處:《鄭州大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:關(guān)聯(lián)分析可視化是從數(shù)據(jù)中識別有效的、潛在的、有用的和可理解關(guān)系模式的一種非平凡過程。微博作為社交網(wǎng)絡(luò)的一種傳播介質(zhì),對社會輿論的傳播有不可替代的作用。并且熱門微博的出現(xiàn)使信息的傳播更為迅速,是社會輿情的導(dǎo)向標,通過關(guān)聯(lián)分析可視化技術(shù),將微博之間以及微博與微博屬性之間的相關(guān)聯(lián)系進行直觀的發(fā)掘,找出潛在的關(guān)聯(lián)關(guān)系,對社會輿情的預(yù)防控制有重要的作用,因此對熱門微博數(shù)據(jù)進行關(guān)聯(lián)分析可視化的研究具有重要意義。關(guān)聯(lián)分析挖掘算法是關(guān)聯(lián)分析可視化過程中非常重要的部分,當前對關(guān)聯(lián)分析可視化優(yōu)化模型的研究處于初期階段,現(xiàn)有的關(guān)聯(lián)分析可視化方法也存在一些問題,將有效的數(shù)據(jù)挖掘模型與良好的可視化方法相結(jié)合,以便獲得有價值的結(jié)果成為研究的重點。論文主要工作如下:1)為評價社交網(wǎng)絡(luò)中微博博主影響力對微博傳播的影響,結(jié)合微博在社交網(wǎng)絡(luò)的傳播特性以及信息傳播的途徑、方法,提出基于中心性加權(quán)鏈接強度的混合算法,該算法應(yīng)用中心性加權(quán)鏈接強度,將啟發(fā)式算法與貪心算法相結(jié)合,給出用戶節(jié)點之間的影響力估計公式,從而計算每條微博傳播者影響力的值,為評估熱門微博屬性的權(quán)重提供可靠依據(jù)。實驗表明,相比較貪心算法、基于節(jié)點度的啟發(fā)式算法,采用中心性加權(quán)鏈接強度算法在準確度上有明顯的提升。2)針對微博數(shù)據(jù)經(jīng)過無量綱化處理后,難以對其屬性權(quán)重進行客觀賦值的問題。提出一種基于灰度集合中多屬性分析的方法。該方法結(jié)合微博博主的影響力與微博屬性的關(guān)系,對多屬性值進行定義和分類,建立挖掘過程參數(shù)調(diào)整策略,為選擇關(guān)鍵屬性值進行挖掘分析提供支持。3)針對現(xiàn)有關(guān)聯(lián)分析可視化算法存在一些不足,將社交網(wǎng)絡(luò)數(shù)據(jù)作為應(yīng)用背景,提出基于灰色關(guān)聯(lián)分析的可視化算法。該算法利用灰色關(guān)聯(lián)分析理論,將熱門微博中不同屬性的數(shù)據(jù)區(qū)分,解決關(guān)聯(lián)規(guī)則數(shù)量較多時傳統(tǒng)關(guān)聯(lián)分析方法面臨的可視化界面紊亂、產(chǎn)生歧義等問題。實驗結(jié)果表明,改進后的挖掘算法具有較好的性能,所提出的可視化形式和已有成果相比具有良好的展現(xiàn)效果。
[Abstract]:Association analysis visualization is a nontrivial process of identifying valid, potential, useful and understandable relational patterns from data. It has an irreplaceable effect on the dissemination of public opinion. And the emergence of hot Weibo makes the dissemination of information more rapid. It is the guide of social public opinion, and through the visual technology of association analysis, It is important for the prevention and control of social public opinion to explore directly the correlation between Weibo and the attributes of Weibo and to find out the potential relationship. Therefore, it is of great significance to study the association analysis visualization of hot Weibo data. The association analysis mining algorithm is a very important part in the process of association analysis visualization. At present, the research on the visualization optimization model of association analysis is in the initial stage, and the existing visualization methods of association analysis also have some problems, which combine the effective data mining model with the good visualization method. In order to obtain valuable results, the main work of this paper is as follows: 1) in order to evaluate the influence of Weibo's influence on the transmission of Weibo in social networks, combining the communication characteristics and the ways of information dissemination in social networks, Methods A hybrid algorithm based on the central weighted link strength is proposed. The heuristic algorithm is combined with the greedy algorithm and the influence estimation formula between the user nodes is given by applying the central weighted link strength. Thus the value of each Weibo communicator's influence is calculated, which provides a reliable basis for evaluating the weight of the popular Weibo attribute. The experiment shows that compared with greedy algorithm, the heuristic algorithm based on node degree, The centrality weighted link strength algorithm is used to improve the accuracy obviously. 2) after the data of Weibo is dimensionless, It is difficult to assign the attribute weight objectively. This paper presents a method based on multi-attribute analysis in gray level set. This method defines and classifies the multi-attribute value based on the relationship between Weibo's influence and Weibo attribute. A mining process parameter adjustment strategy is established to support mining analysis by selecting key attribute values. 3) aiming at the shortcomings of the existing visualization algorithms for association analysis, the social network data is used as the application background. This paper presents a visualization algorithm based on grey association analysis, which uses the theory of grey correlation analysis to distinguish the data of different attributes in the popular Weibo, and solves the visual interface disorder faced by the traditional association analysis method when the number of association rules is large. The experimental results show that the improved mining algorithm has better performance and the proposed visualization has a good performance compared with the existing results.
【學(xué)位授予單位】:鄭州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP311.13
【相似文獻】
相關(guān)期刊論文 前10條
1 董慶華;;數(shù)據(jù)可視化技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用探討[J];山西農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版);2007年S1期
2 姚遠;;數(shù)據(jù)可視化技術(shù)實現(xiàn)流程探討[J];軟件導(dǎo)刊;2010年05期
3 趙巾幗;羅慶云;;基于網(wǎng)絡(luò)的數(shù)據(jù)可視化研究與實現(xiàn)[J];大慶師范學(xué)院學(xué)報;2010年06期
4 任思雨;;數(shù)字時代數(shù)據(jù)可視化的類型及其特征[J];傳播與版權(quán);2014年03期
5 陳建軍,于志強,朱昀;數(shù)據(jù)可視化技術(shù)及其應(yīng)用[J];紅外與激光工程;2001年05期
6 劉勘,周曉崢,周洞汝;數(shù)據(jù)可視化的研究與發(fā)展[J];計算機工程;2002年08期
7 劉緒崇,鄧蘇,楊強,陳衛(wèi)東;基于數(shù)據(jù)管技術(shù)的證券數(shù)據(jù)可視化[J];計算機工程與設(shè)計;2003年06期
8 肖湘萍,尹志喜;數(shù)據(jù)可視化在流場數(shù)值模擬中的應(yīng)用研究[J];華北工學(xué)院學(xué)報;2004年02期
9 任永功;于戈;;數(shù)據(jù)可視化技術(shù)的研究與進展[J];計算機科學(xué);2004年12期
10 韓麗娜;;數(shù)據(jù)可視化技術(shù)及其應(yīng)用展望[J];煤礦現(xiàn)代化;2005年06期
相關(guān)會議論文 前10條
1 劉勘;周洞汝;;大型數(shù)據(jù)庫中的數(shù)據(jù)可視化技術(shù)[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2001年
2 袁永菊;;數(shù)據(jù)可視化技術(shù)在飛機改裝中的應(yīng)用研究[A];探索 創(chuàng)新 交流(第4集)——第四屆中國航空學(xué)會青年科技論壇文集[C];2010年
3 石昊蘇;韓麗娜;;數(shù)據(jù)可視化技術(shù)及其應(yīng)用展望[A];全國自動化新技術(shù)學(xué)術(shù)交流會會議論文集(一)[C];2005年
4 夏菁;劉真;胡越琦;陳為;彭帝超;;基于超圖的骨生物數(shù)據(jù)可視化研究[A];第五屆全國幾何設(shè)計與計算學(xué)術(shù)會議論文集[C];2011年
5 陳進生;羅月童;;輪廓樹及其在體數(shù)據(jù)可視化中的應(yīng)用[A];全國第21屆計算機技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2010年
6 金紅霞;趙建娜;;影響我國服務(wù)業(yè)FDI的環(huán)境因素灰色關(guān)聯(lián)分析[A];管理科學(xué)與系統(tǒng)科學(xué)研究新進展——第8屆全國青年管理科學(xué)與系統(tǒng)科學(xué)學(xué)術(shù)會議論文集[C];2005年
7 汪濤;吳琳麗;;基于灰色關(guān)聯(lián)分析的戰(zhàn)場目標攻擊價值評估[A];第16屆全國灰色系統(tǒng)學(xué)術(shù)會議論文集[C];2008年
8 羅雄飛;廖再飛;劉偉;;流程工業(yè)多尺度數(shù)據(jù)可視化系統(tǒng)的設(shè)計與應(yīng)用[A];2009中國過程系統(tǒng)工程年會暨中國mes年會論文集[C];2009年
9 李亞平;劉思峰;;房地產(chǎn)業(yè)與經(jīng)濟發(fā)展的灰色關(guān)聯(lián)分析[A];第19屆灰色系統(tǒng)全國會議論文集[C];2010年
10 謝跟蹤;陳文惠;鄭達賢;;基于Map Info的福建省經(jīng)濟數(shù)據(jù)可視化研究[A];地圖學(xué)與GIS學(xué)術(shù)討論會論文集[C];2002年
相關(guān)重要報紙文章 前10條
1 國家統(tǒng)計局教育中心 寧紅;數(shù)據(jù)可視化對服務(wù)型統(tǒng)計建設(shè)的啟示[N];中國信息報;2013年
2 北京永洪商智科技有限公司 何春濤;一周實現(xiàn)大數(shù)據(jù)可視化分析[N];中國計算機報;2014年
3 本報記者 于杰;讓POI數(shù)據(jù)可視化[N];中國計算機報;2014年
4 邱燕娜;從汶川地震話位置智能[N];中國計算機報;2008年
5 本報駐堪培拉記者 陳小方;社交網(wǎng)絡(luò)讓人焦慮不安[N];光明日報;2010年
6 彭敏;社交網(wǎng)絡(luò)分析異軍突起成新寵[N];電腦商報;2011年
7 VAR記者 彭敏;企業(yè)擁抱社交網(wǎng)絡(luò)的步驟及工具[N];電腦商報;2011年
8 中國電信廣東公司員工 譚拯;社交網(wǎng)絡(luò):挖掘“連接”與“發(fā)現(xiàn)”的價值[N];人民郵電;2011年
9 周虎城;管理社交網(wǎng)絡(luò)需要政治智慧[N];南方日報;2011年
10 劉一冰;方案商的社交網(wǎng)絡(luò)[N];電腦商報;2011年
相關(guān)博士學(xué)位論文 前10條
1 任永功;面向聚類的數(shù)據(jù)可視化方法及相關(guān)技術(shù)研究[D];東北大學(xué);2006年
2 馬仁安;基于微機的三維地震數(shù)據(jù)可視化技術(shù)研究[D];南京理工大學(xué);2004年
3 華崗;地震體數(shù)據(jù)可視化與分析研究[D];浙江大學(xué);2011年
4 周璐;復(fù)雜向量場數(shù)據(jù)可視化技術(shù)研究與實現(xiàn)[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2000年
5 梁秀霞;醫(yī)學(xué)影像數(shù)據(jù)可視化中若干問題研究[D];山東大學(xué);2006年
6 常鳳香;基于生物電阻抗測量原理的經(jīng)絡(luò)診斷數(shù)據(jù)可視化方法研究[D];燕山大學(xué);2012年
7 蔣志方;城市空氣質(zhì)量預(yù)測模型與數(shù)據(jù)可視化方法研究[D];山東大學(xué);2011年
8 呂加國;在線社交網(wǎng)絡(luò)社會影響傳播與影響最大化問題研究[D];燕山大學(xué);2015年
9 李鑫;基于位置社交網(wǎng)絡(luò)的地點推薦方法及應(yīng)用研究[D];中國科學(xué)技術(shù)大學(xué);2015年
10 王婷;異構(gòu)社交網(wǎng)絡(luò)中社區(qū)發(fā)現(xiàn)算法研究[D];中國礦業(yè)大學(xué)(北京);2016年
相關(guān)碩士學(xué)位論文 前10條
1 付源;基于灰色關(guān)聯(lián)分析的熱門微博數(shù)據(jù)可視化研究[D];鄭州大學(xué);2017年
2 曾悠;大數(shù)據(jù)時代背景下的數(shù)據(jù)可視化概念研究[D];浙江大學(xué);2014年
3 石雪萍;網(wǎng)易“數(shù)讀”專欄報道特色研究[D];河北大學(xué);2015年
4 陳欣;《21世紀經(jīng)濟報道—飛笛金融圈》金融新聞的數(shù)據(jù)可視化研究[D];河北大學(xué);2015年
5 張健;基于WebGIS的農(nóng)業(yè)地理數(shù)據(jù)可視化技術(shù)研究及應(yīng)用[D];浙江大學(xué);2015年
6 龔旭超;基于webGL的交互繪制應(yīng)用研究[D];浙江大學(xué);2015年
7 臧若蒙;面向車輛監(jiān)控系統(tǒng)的海量數(shù)據(jù)可視化研究[D];大連海事大學(xué);2015年
8 劉迪珊;試驗數(shù)據(jù)云平臺中數(shù)據(jù)可視化的設(shè)計與實現(xiàn)[D];西安電子科技大學(xué);2014年
9 朱會國;直觀高效的體數(shù)據(jù)可視化方法的設(shè)計與研究[D];合肥工業(yè)大學(xué);2014年
10 呂佩吾;火電廠生產(chǎn)運行數(shù)據(jù)可視化平臺的研究與實現(xiàn)[D];華北電力大學(xué);2015年
,本文編號:1599184
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/1599184.html