中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 社科論文 > 新聞傳播論文 >

基于密度峰值融合K-means聚類算法的微博輿情分析

發(fā)布時(shí)間:2024-06-30 02:34
  社交媒體近幾年快速發(fā)展,微博逐漸發(fā)展成為了人們?nèi)粘I钪胁豢苫蛉钡囊环N社交媒體。微博輿情對社會(huì)具有極強(qiáng)的影響力,它實(shí)時(shí)地反映了大眾對各種事件的觀點(diǎn)和態(tài)度,是政府掌握事件輿情和發(fā)展動(dòng)態(tài)、企業(yè)了解民意的重要渠道。因此及時(shí)準(zhǔn)確地分析微博輿情對正確地預(yù)測和控制社會(huì)事態(tài)的發(fā)展、對促進(jìn)國家的經(jīng)濟(jì)建設(shè)和維護(hù)社會(huì)的安定團(tuán)結(jié)具有極其重要的意義。本文將針對微博輿情分析技術(shù)展開深入研究,包含微博數(shù)據(jù)獲取、微博文本的預(yù)處理、文本聚類以及輿情結(jié)果分析這四個(gè)方面。本文的研究工作主要包括以下三個(gè)部分:第一部分采用密度峰值算法(CFSFDP)融合K-means算法方式完成微博文本聚類。密度峰值快速準(zhǔn)確地發(fā)現(xiàn)聚類中心彌補(bǔ)K-means算法選取聚類中心時(shí)具有隨機(jī)性的不足。但密度峰值算法存在截?cái)嗑嚯x需手動(dòng)設(shè)定、聚類中心選取較主觀的缺點(diǎn)。本文提出一種截?cái)嗑嚯x選取策略,找出最優(yōu)截?cái)嗑嚯x,然后對布局密度以及相對最小距離實(shí)行歸一化處理后,引入斜率變化計(jì)算方法實(shí)現(xiàn)自動(dòng)化確定聚類中心,最后利用K-means算法簡單易操作的特點(diǎn)迭代聚類。將融合后算法和其他算法進(jìn)行實(shí)驗(yàn)操作后對比分析,驗(yàn)證本文算法在文本聚類方面的精確性和穩(wěn)定性,更好地挖掘...

【文章頁數(shù)】:69 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖3.1微博開放平臺(tái)Fig.3.1WeiboOpenPlatform

圖3.1微博開放平臺(tái)Fig.3.1WeiboOpenPlatform

19第3章微博數(shù)據(jù)采集獲取微博文本是進(jìn)行輿情分析實(shí)驗(yàn)的前提,微博文本數(shù)據(jù)的采集主要是利用微博搜索界面利用網(wǎng)頁提取技術(shù)來爬取數(shù)據(jù),采集技術(shù)主要包括基于微博API的采集方式,另一種是手工開發(fā)抓取程序的形式,本文接下來將詳細(xì)介紹這兩種不同的采集方式。3.1微博API數(shù)據(jù)采集方式3.1.....


圖3.4請求數(shù)據(jù)流Fig.3.4RequestDataFlow

圖3.4請求數(shù)據(jù)流Fig.3.4RequestDataFlow

23網(wǎng)絡(luò)爬蟲抓取數(shù)據(jù)是通過模擬瀏覽器行為向服務(wù)器發(fā)送請求從而獲得微博文本信息的過程,本章節(jié)主要介紹網(wǎng)絡(luò)爬蟲爬取數(shù)據(jù)的方式中需要解決的關(guān)鍵性的問題:對網(wǎng)頁抓包以及微博站點(diǎn)進(jìn)行分析,模擬瀏覽器行為請求并開啟微博數(shù)據(jù)爬取,最后對存儲(chǔ)的微博數(shù)據(jù)存儲(chǔ)予以解析。爬蟲方式獲取數(shù)據(jù)流程圖如圖3.....


圖3.5請求相應(yīng)信息Fig.3.5RequestCorrespondingInformation

圖3.5請求相應(yīng)信息Fig.3.5RequestCorrespondingInformation

23網(wǎng)絡(luò)爬蟲抓取數(shù)據(jù)是通過模擬瀏覽器行為向服務(wù)器發(fā)送請求從而獲得微博文本信息的過程,本章節(jié)主要介紹網(wǎng)絡(luò)爬蟲爬取數(shù)據(jù)的方式中需要解決的關(guān)鍵性的問題:對網(wǎng)頁抓包以及微博站點(diǎn)進(jìn)行分析,模擬瀏覽器行為請求并開啟微博數(shù)據(jù)爬取,最后對存儲(chǔ)的微博數(shù)據(jù)存儲(chǔ)予以解析。爬蟲方式獲取數(shù)據(jù)流程圖如圖3.....


圖3.6微博高級搜索Fig.3.6WeiboAdvancedSearch

圖3.6微博高級搜索Fig.3.6WeiboAdvancedSearch

24者工具中分析抓包過程。當(dāng)用戶訪問微博點(diǎn)擊登錄時(shí),如圖3.4所示的開發(fā)者模式中可以看到捕捉的登錄請求數(shù)據(jù)流。Network可以查看所有加載的請求。由圖3.5所示,點(diǎn)擊左側(cè)的請求網(wǎng)址,可以通過右側(cè)的Headers看到頭部參數(shù)設(shè)置,這里面包含了請求的URL和相應(yīng)的信息,點(diǎn)擊Resp....



本文編號:3998259

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/xinwenchuanbolunwen/3998259.html

上一篇:《寧夏民國日報(bào)》研究(1935-1949)  
下一篇:沒有了

Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7adf4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com