中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

高校學生的微博情感分析

發(fā)布時間:2020-11-02 20:53
   隨著信息技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)進入了web2.0時代。在這個日新月異的網(wǎng)絡發(fā)展浪潮中,人們溝通的渠道從傳統(tǒng)的電子通訊產(chǎn)品轉(zhuǎn)向方便快捷的社交媒體,如微博和微信。由于微信用戶面對的是現(xiàn)實生活中的朋友圈,這導致人們發(fā)送微信內(nèi)容時往往有所顧慮。而微博用戶面對的是虛擬網(wǎng)絡,所以博文內(nèi)容拘束性弱,更能反應人們的真實情感和觀點。作為高校學生常用的社交軟件之一,微博也為大家了解高校學生生活、學習、心理等狀態(tài)提供一種有效的渠道。因此,如何有效地提取和挖掘蘊含在海量博文中的情感信息是一項很有意義的研究。目前國內(nèi)學者對于博文的情感分析,主要是針對某一熱點話題的輿情分析。本文主要是通過博文的情感分析探索某高校學生的興趣點和心理健康問題,結(jié)合統(tǒng)計方法和機器學習方法研究該高校學生微博情感特點,并建立異常博文情感的識別系統(tǒng)。所提的方法可應用于國內(nèi)各高校學生的博文情感研究。本文數(shù)據(jù)是通過爬蟲技術(shù)從某高校官方微博中隨機抽取學生的博文信息。論文結(jié)構(gòu)如下:第二章通過從博文中的關鍵詞提取,發(fā)現(xiàn)不同學歷學生的博文內(nèi)容存在差異,本科生和碩士生的文本常用詞匯十分接近,但博士生與前兩者差異較大。第三章改進了文本分詞,構(gòu)建詞向量,使用主成分分析對詞向量降維并計算合成詞的與情感詞典中的詞匯相似度,最終量化這類合成詞的感情色彩。第四章構(gòu)建了預測博文情感的評分卡模型。經(jīng)過測試集驗證,模型的AUC值達到0.86,表明該評分卡模型對微博的情感特征評定具有較高的精確度。第五章分析博文情感分的影響因素,從情感得分挖掘?qū)W生們在推送不同主題博文時的情感差異,發(fā)現(xiàn)微博的內(nèi)容和娛樂美食有關時,博文情感得分偏高,和科研學習有關時,博文情感分較低。構(gòu)建了異常博文情感觀察系統(tǒng),可用于識別有嚴重心理問題或極端情緒的學生。
【學位單位】:北京工業(yè)大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:C81
【部分圖文】:

數(shù)據(jù),信息儲存,應用統(tǒng)計,規(guī)則匹配


北京工業(yè)大學應用統(tǒng)計碩士專業(yè)學位論文圖 1-2 用戶的微博 IDFigure 1-2 ID number of customer我們利用這些 ID 可以根據(jù)指定的規(guī)則匹配出用戶博文的 API 接口,進而解出想要的信息。通常,網(wǎng)頁將信息儲存為 JSON(JavaScript Object Notation)文,不但易于閱讀和編寫,同時也易于機器解析和生成,并有效地提升網(wǎng)絡傳輸率。獲取的 JSON 文件結(jié)構(gòu)類似于圖 1-3,我們可以通過輸入 JSON 文件的各接點名稱獲取數(shù)據(jù),如按順序輸入“data”,“status”,“1”就能獲取某一篇文的所有信息。

內(nèi)容,推送,表情,文字


comment_count 評論數(shù)repost_count 轉(zhuǎn)發(fā)數(shù)created_at 博文推送時間isLongText 是否為長微博Source 博文推送來源Text 博文內(nèi)容textLength 博文長度Id 博主 IDGender 博主性別screen_name 博主昵稱爬取的博文內(nèi)容比較雜亂,數(shù)據(jù)處理過程中存在很多問題。主要集中在:a) 博文存在大量的標簽;b) 表情和文字混合;c) 部分博文為純轉(zhuǎn)發(fā)類型,不帶有任何文字或表情;d) 博文不全是文字,部分博文僅有圖片或者視頻,甚至只出現(xiàn)呼叫好友的

學歷,比例,學生,女性


圖 2-1 不同學歷的學生個數(shù)比例Figure 2-1 Different proportion of degree1 中可以看出,爬取博主的教育程度接近高校學生的學歷具有代表性。圖 2-2 中的性別分布上,女性占了較大比例容和人群是密切相關的。女性在使用微博發(fā)表自身言論的態(tài)、娛樂八卦等熱點信息,而男性對該方面缺少明顯的興于從其他平臺獲取體育,時政等方面的信息。
【參考文獻】

相關期刊論文 前7條

1 李婷婷;姬東鴻;;基于SVM和CRF多特征組合的微博情感分析[J];計算機應用研究;2015年04期

2 羅知林;陳挺;蔡皖東;;一個基于隨機森林的微博轉(zhuǎn)發(fā)預測算法[J];計算機科學;2014年04期

3 高明;金澈清;錢衛(wèi)寧;王曉玲;周傲英;;面向微博系統(tǒng)的實時個性化推薦[J];計算機學報;2014年04期

4 黃星;;微博用語的解讀[J];海南大學學報(人文社會科學版);2014年02期

5 張金偉;劉曉平;;基于心理預警模型的微博情感識別研究[J];合肥工業(yè)大學學報(自然科學版);2013年11期

6 王冠華;張福珍;;大學生使用微博的心理原因探析[J];科教文匯(上旬刊);2013年11期

7 謝麗星;周明;孫茂松;;基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J];中文信息學報;2012年01期


相關博士學位論文 前1條

1 李義萍;基于微博的青少年心理壓力趨勢預測[D];清華大學;2015年


相關碩士學位論文 前2條

1 陳文焰;基于雙數(shù)組Trie的高效索引結(jié)構(gòu)及其并行化的研究[D];昆明理工大學;2018年

2 丁媛媛;基于時間序列的微博熱點話題識別與追蹤[D];西安科技大學;2017年



本文編號:2867557

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/guanlilunwen/tongjijuecelunwen/2867557.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3630f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com