国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

基于SVM的微博情感傾向性分析研究

發(fā)布時(shí)間:2019-05-12 12:35
【摘要】:隨著Web2.0時(shí)代的到來,網(wǎng)絡(luò)的發(fā)展已經(jīng)進(jìn)入人們生活的各個(gè)領(lǐng)域,近年來微博的出現(xiàn),讓生活更加豐富。微博影響力的增長,吸引了大批學(xué)者對微博客的深入研究,而情感詞識別和情感分析成為了一個(gè)重要的課題。在微博的開放平臺,提供的功能是可以查閱信息,也可以發(fā)布信息給別人來看。與此同時(shí),隨著發(fā)布信息的多元化,隨之產(chǎn)生了新問題,如,情感新詞的出現(xiàn)及對微博句的情感極性分析,新詞的出現(xiàn)給中文分詞產(chǎn)生很多難以識別的“散串”和“碎片”;情感分析時(shí)判別感情傾向性微博客的文字,屬于判斷積極的,消極的,中立的法官。對這些文本的情感傾向性,可以對網(wǎng)民的情緒有掌握,不僅有一定的商業(yè)價(jià)值,還有益于社會(huì)、還可以幫助我們在輿情監(jiān)控、詞庫更新、自然語言處理等領(lǐng)域完善。 每天數(shù)以萬計(jì)的中文微博用戶刷新信息,,對微博情感詞的產(chǎn)生以及對極性分析的問題都隨之產(chǎn)生,做好這些工作對了解用戶的態(tài)度很重要和迫切。本文通過從實(shí)驗(yàn)提供的數(shù)據(jù),通過條件隨機(jī)場進(jìn)行情感詞識別,進(jìn)行詞性標(biāo)注,結(jié)合上下文信息特征,構(gòu)建特征向量,對語料數(shù)據(jù)進(jìn)行訓(xùn)練模型構(gòu)建和測試,最后得到情感詞的正確率(Precision)、召回率(Recall)和F-值。對微博情感詞進(jìn)行有效正確的識別是判別微博文本情感傾向性的前提和基礎(chǔ)。本文首先結(jié)合中文信息處理、自然語言等知識,結(jié)合實(shí)驗(yàn)室對情感新詞發(fā)現(xiàn)和情感傾向分析的研究,論述情感傾向相關(guān)的各種關(guān)系,是建立在微博情感傾向性判斷現(xiàn)有所做分析的基礎(chǔ)之上的。本論文的研究最終目的是提高數(shù)據(jù)結(jié)果的正確率、召回率及F-值,為更進(jìn)一步的研究奠定基礎(chǔ)。 實(shí)驗(yàn)數(shù)據(jù)選用項(xiàng)目給定的微博語料,情感詞識別和情感傾向性分析的訓(xùn)練和測試數(shù)據(jù)是不同的,實(shí)驗(yàn)結(jié)果也驗(yàn)證了該論文中用到的方法是可行的。實(shí)驗(yàn)結(jié)果顯示:該方法在情感詞識別正確率為34.21%,召回率為0.11%,F(xiàn)值為0.002%;結(jié)果識別率整體不高,但也為下一步工作打好了基礎(chǔ)。對情感句極性判別的正確率為84.87%,召回率為65.18%,F(xiàn)值為77.27%,此次研究對中文微博的情感傾向性分析進(jìn)行了初步探索。
[Abstract]:With the advent of the Web2.0 era, the development of the network has entered all areas of people's lives. In recent years, the emergence of Weibo has made life more abundant. The growth of Weibo's influence has attracted a large number of scholars to study Weibo customers in depth, and emotional word recognition and emotional analysis have become an important topic. In Weibo's open platform, the function is to access information, or to post information to others to see. At the same time, with the diversification of published information, new problems arise, such as the emergence of emotional neologisms and the analysis of emotional polarity of Weibo sentences. The emergence of new words produces a lot of "scattered strings" and "fragments" that are difficult to recognize for Chinese word segmentation. The text that distinguishes the emotional tendency of Weibo guest in emotional analysis belongs to the judge of positive, negative and neutral. The emotional tendency of these texts can master the emotions of netizens, not only have certain commercial value, but also benefit the society, but also help us to perfect in the fields of public opinion monitoring, vocabulary updating, natural language processing and so on. Tens of thousands of Chinese Weibo users refresh their information every day, and the generation of Weibo emotional words and the analysis of polarity all arise. It is very important and urgent to do a good job in understanding the attitude of users. Through the data provided by the experiment, emotional word recognition through conditional random field, part-of-speech tagging, combining with the characteristics of context information, the feature vector is constructed, and the training model of corpus data is constructed and tested. Finally, the correct (Precision), recall rate (Recall) and F-value of emotional words are obtained. Effective and correct recognition of Weibo emotional words is the premise and basis for judging the emotional tendency of Weibo text. Based on the knowledge of Chinese information processing and natural language, combined with the laboratory research on the discovery of emotional neologisms and the analysis of emotional tendencies, this paper discusses the various relationships related to emotional tendencies. It is based on the existing analysis of Weibo emotional tendency judgment. The ultimate purpose of this paper is to improve the accuracy, recall rate and F-value of the data results, so as to lay a foundation for further research. The experimental data are different from the Weibo corpus given by the project, and the training and test data of emotional word recognition and emotional tendency analysis are different. The experimental results also verify that the method used in this paper is feasible. The experimental results show that the correct rate of emotional word recognition is 34.21%, the recall rate is 0.11%, and the F value is 0.002%. The results show that the overall recognition rate is not high, but it also lays a good foundation for the next step. The correct rate, recall rate and F value of emotional sentence polarity discrimination were 84.87%, 65.18% and 77.27%, respectively. the emotional tendency of Chinese Weibo was preliminarily explored in this study.
【學(xué)位授予單位】:中原工學(xué)院
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1;TP393.092

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 鄧森;楊軍鋒;郭明威;郭創(chuàng);;基于模糊SVM和虛擬儀器的模擬電路故障診斷研究[J];計(jì)算機(jī)測量與控制;2011年04期

2 郭有貴;曾萍;朱建林;;交-交矩陣變換器SVM的新穎調(diào)制模式(英文)[J];系統(tǒng)仿真學(xué)報(bào);2009年22期

3 吳學(xué)文;索麗生;王志堅(jiān);;基于SVM的入庫徑流混沌時(shí)間序列預(yù)測模型及應(yīng)用[J];系統(tǒng)仿真學(xué)報(bào);2011年11期

4 程博,吳國平;基于SVM的脫機(jī)手寫漢字識別[J];現(xiàn)代計(jì)算機(jī);2005年09期

5 鐘明霞;;基于神經(jīng)網(wǎng)絡(luò)和SVM的微鈣化簇分類方法[J];計(jì)算機(jī)時(shí)代;2008年05期

6 宋國明;王厚軍;姜書艷;劉紅;;一種聚類分層決策的SVM模擬電路故障診斷方法[J];儀器儀表學(xué)報(bào);2010年05期

7 張淑雅;趙一鳴;李均利;;基于SVM的圖像分類算法與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2007年25期

8 宋國明;王厚軍;劉紅;姜書艷;;基于提升小波變換和SVM的模擬電路故障診斷[J];電子測量與儀器學(xué)報(bào);2010年01期

9 王志明,蔣加伏,唐賢瑛;基于SVM的小波圖像去噪[J];湖南科技學(xué)院學(xué)報(bào);2005年05期

10 解焱陸,吳禮福,戴蓓劏,李輝;基于SVM評分融合的分類短語音話者確認(rèn)系統(tǒng)[J];數(shù)據(jù)采集與處理;2005年02期

相關(guān)會(huì)議論文 前10條

1 滕衛(wèi)平;胡波;滕舟;鐘元;;SVM回歸法在西太平洋熱帶氣旋路徑預(yù)報(bào)中的應(yīng)用研究[A];S1 災(zāi)害天氣研究與預(yù)報(bào)[C];2012年

2 王紅軍;徐小力;付瑤;;基于SVM的旋轉(zhuǎn)機(jī)械故障診斷知識獲取[A];第八屆全國設(shè)備與維修工程學(xué)術(shù)會(huì)議、第十三屆全國設(shè)備監(jiān)測與診斷學(xué)術(shù)會(huì)議論文集[C];2008年

3 陳兆基;楊宏暉;杜方鍵;;用于水下目標(biāo)識別的選擇性SVM集成算法[A];中國聲學(xué)學(xué)會(huì)水聲學(xué)分會(huì)2011年全國水聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2011年

4 程麗麗;張健沛;楊靜;馬駿;;一種改進(jìn)的層次SVM多類分類方法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

5 左南;李涓子;唐杰;;基于SVM的肖像照片抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

6 寧偉;苗雪雷;胡永華;季鐸;張桂平;蔡東風(fēng);;基于SVM的無參考譯文的譯文質(zhì)量評測[A];機(jī)器翻譯研究進(jìn)展——第四屆全國機(jī)器翻譯研討會(huì)論文集[C];2008年

7 劉旭;羅鵬飛;李綱;;基于擬合角特征及SVM的雷達(dá)輻射源個(gè)體識別[A];全國第五屆信號和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議?(第一冊)[C];2011年

8 羅浩;謝軍龍;胡云鵬;;地源熱泵空調(diào)系統(tǒng)故障診斷中SVM的應(yīng)用[A];全國暖通空調(diào)制冷2008年學(xué)術(shù)年會(huì)資料集[C];2008年

9 劉閃電;王建東;;權(quán)重部分更新的大規(guī)模線性SVM求解器[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年

10 王艦;湯光明;;基于SVM的圖像隱寫檢測分析[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會(huì)湖南省計(jì)算機(jī)學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年

相關(guān)碩士學(xué)位論文 前10條

1 張漢女;基于SVM的海岸線提取方法研究[D];東北師范大學(xué);2010年

2 劉軍;基于SVM的半監(jiān)督網(wǎng)絡(luò)入侵檢測系統(tǒng)[D];復(fù)旦大學(xué);2009年

3 張永俊;基于SVM的增量入侵檢測方法研究[D];西安科技大學(xué);2013年

4 田冪;基于概率SVM的腫瘤預(yù)警系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2013年

5 王碩;基于廣義S變換和SVM的電壓暫降檢測與識別方法研究[D];燕山大學(xué);2013年

6 楊濤;基于SVM的中國醫(yī)藥制造企業(yè)財(cái)務(wù)危機(jī)預(yù)警研究[D];廈門大學(xué);2009年

7 周洪利;基于SVM的網(wǎng)絡(luò)信息過濾研究[D];山東師范大學(xué);2008年

8 齊振東;基于SVM的地基土承載力預(yù)測[D];吉林大學(xué);2008年

9 任瓊;基于SVM的余杭生態(tài)公益林類型的遙感分類研究[D];南京林業(yè)大學(xué);2008年

10 楊洋;基于SVM的印刷品缺陷在線檢測[D];華中科技大學(xué);2012年



本文編號:2475396

資料下載
論文發(fā)表

本文鏈接:http://lk138.cn/guanlilunwen/ydhl/2475396.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0c00f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
超碰 日韩无码| 大香蕉免费国产在线视频| 超碰成人官网| 偷拍,久久久| 国产欧美最新中文字幕免费| 国产摄像头一区在线视频| 久久网站视频污在线| 午夜精品9999| 日韩av123| 国产午夜福利av| 欧美日本在线高清| 噜噜极品av激情| 精品区九九网| 国产这里只有| 狠狠操狠狠操狠狠操| 中文字幕一区二区三区好的| 午夜性片段| AV九色超碰| 日你屄啊啊啊舒服视频| 天天综合欧美VR一区| 天天操天天干天天日一| 中文字幕无码AV一区| 性欧美日韩精品在线| 亚洲无码精品爱| 欧美黄一级| 午夜小电影久久久久| 91麻豆国产精品| 日韩久久久69视频| 国产精品九九99麻豆骚逼| 婷婷久久久久久电影| 九九婷婷| 超碰 成人 国产| 日韩精品人妻AV| 国产成人精品 口爆| 99综合久久综合久久| 特级毛片免费视频观看| 91精品高清| 91视频高清精品| 在线播放日本不卡一二三区| 无码女同AV| 男人的天堂黄片av|