中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

基于SVM的微博情感傾向性分析研究

發(fā)布時(shí)間:2019-05-12 12:35
【摘要】:隨著Web2.0時(shí)代的到來(lái),網(wǎng)絡(luò)的發(fā)展已經(jīng)進(jìn)入人們生活的各個(gè)領(lǐng)域,近年來(lái)微博的出現(xiàn),讓生活更加豐富。微博影響力的增長(zhǎng),吸引了大批學(xué)者對(duì)微博客的深入研究,而情感詞識(shí)別和情感分析成為了一個(gè)重要的課題。在微博的開(kāi)放平臺(tái),提供的功能是可以查閱信息,也可以發(fā)布信息給別人來(lái)看。與此同時(shí),隨著發(fā)布信息的多元化,隨之產(chǎn)生了新問(wèn)題,如,情感新詞的出現(xiàn)及對(duì)微博句的情感極性分析,新詞的出現(xiàn)給中文分詞產(chǎn)生很多難以識(shí)別的“散串”和“碎片”;情感分析時(shí)判別感情傾向性微博客的文字,屬于判斷積極的,消極的,中立的法官。對(duì)這些文本的情感傾向性,可以對(duì)網(wǎng)民的情緒有掌握,不僅有一定的商業(yè)價(jià)值,還有益于社會(huì)、還可以幫助我們?cè)谳浨楸O(jiān)控、詞庫(kù)更新、自然語(yǔ)言處理等領(lǐng)域完善。 每天數(shù)以萬(wàn)計(jì)的中文微博用戶刷新信息,,對(duì)微博情感詞的產(chǎn)生以及對(duì)極性分析的問(wèn)題都隨之產(chǎn)生,做好這些工作對(duì)了解用戶的態(tài)度很重要和迫切。本文通過(guò)從實(shí)驗(yàn)提供的數(shù)據(jù),通過(guò)條件隨機(jī)場(chǎng)進(jìn)行情感詞識(shí)別,進(jìn)行詞性標(biāo)注,結(jié)合上下文信息特征,構(gòu)建特征向量,對(duì)語(yǔ)料數(shù)據(jù)進(jìn)行訓(xùn)練模型構(gòu)建和測(cè)試,最后得到情感詞的正確率(Precision)、召回率(Recall)和F-值。對(duì)微博情感詞進(jìn)行有效正確的識(shí)別是判別微博文本情感傾向性的前提和基礎(chǔ)。本文首先結(jié)合中文信息處理、自然語(yǔ)言等知識(shí),結(jié)合實(shí)驗(yàn)室對(duì)情感新詞發(fā)現(xiàn)和情感傾向分析的研究,論述情感傾向相關(guān)的各種關(guān)系,是建立在微博情感傾向性判斷現(xiàn)有所做分析的基礎(chǔ)之上的。本論文的研究最終目的是提高數(shù)據(jù)結(jié)果的正確率、召回率及F-值,為更進(jìn)一步的研究奠定基礎(chǔ)。 實(shí)驗(yàn)數(shù)據(jù)選用項(xiàng)目給定的微博語(yǔ)料,情感詞識(shí)別和情感傾向性分析的訓(xùn)練和測(cè)試數(shù)據(jù)是不同的,實(shí)驗(yàn)結(jié)果也驗(yàn)證了該論文中用到的方法是可行的。實(shí)驗(yàn)結(jié)果顯示:該方法在情感詞識(shí)別正確率為34.21%,召回率為0.11%,F(xiàn)值為0.002%;結(jié)果識(shí)別率整體不高,但也為下一步工作打好了基礎(chǔ)。對(duì)情感句極性判別的正確率為84.87%,召回率為65.18%,F(xiàn)值為77.27%,此次研究對(duì)中文微博的情感傾向性分析進(jìn)行了初步探索。
[Abstract]:With the advent of the Web2.0 era, the development of the network has entered all areas of people's lives. In recent years, the emergence of Weibo has made life more abundant. The growth of Weibo's influence has attracted a large number of scholars to study Weibo customers in depth, and emotional word recognition and emotional analysis have become an important topic. In Weibo's open platform, the function is to access information, or to post information to others to see. At the same time, with the diversification of published information, new problems arise, such as the emergence of emotional neologisms and the analysis of emotional polarity of Weibo sentences. The emergence of new words produces a lot of "scattered strings" and "fragments" that are difficult to recognize for Chinese word segmentation. The text that distinguishes the emotional tendency of Weibo guest in emotional analysis belongs to the judge of positive, negative and neutral. The emotional tendency of these texts can master the emotions of netizens, not only have certain commercial value, but also benefit the society, but also help us to perfect in the fields of public opinion monitoring, vocabulary updating, natural language processing and so on. Tens of thousands of Chinese Weibo users refresh their information every day, and the generation of Weibo emotional words and the analysis of polarity all arise. It is very important and urgent to do a good job in understanding the attitude of users. Through the data provided by the experiment, emotional word recognition through conditional random field, part-of-speech tagging, combining with the characteristics of context information, the feature vector is constructed, and the training model of corpus data is constructed and tested. Finally, the correct (Precision), recall rate (Recall) and F-value of emotional words are obtained. Effective and correct recognition of Weibo emotional words is the premise and basis for judging the emotional tendency of Weibo text. Based on the knowledge of Chinese information processing and natural language, combined with the laboratory research on the discovery of emotional neologisms and the analysis of emotional tendencies, this paper discusses the various relationships related to emotional tendencies. It is based on the existing analysis of Weibo emotional tendency judgment. The ultimate purpose of this paper is to improve the accuracy, recall rate and F-value of the data results, so as to lay a foundation for further research. The experimental data are different from the Weibo corpus given by the project, and the training and test data of emotional word recognition and emotional tendency analysis are different. The experimental results also verify that the method used in this paper is feasible. The experimental results show that the correct rate of emotional word recognition is 34.21%, the recall rate is 0.11%, and the F value is 0.002%. The results show that the overall recognition rate is not high, but it also lays a good foundation for the next step. The correct rate, recall rate and F value of emotional sentence polarity discrimination were 84.87%, 65.18% and 77.27%, respectively. the emotional tendency of Chinese Weibo was preliminarily explored in this study.
【學(xué)位授予單位】:中原工學(xué)院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.1;TP393.092

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 鄧森;楊軍鋒;郭明威;郭創(chuàng);;基于模糊SVM和虛擬儀器的模擬電路故障診斷研究[J];計(jì)算機(jī)測(cè)量與控制;2011年04期

2 郭有貴;曾萍;朱建林;;交-交矩陣變換器SVM的新穎調(diào)制模式(英文)[J];系統(tǒng)仿真學(xué)報(bào);2009年22期

3 吳學(xué)文;索麗生;王志堅(jiān);;基于SVM的入庫(kù)徑流混沌時(shí)間序列預(yù)測(cè)模型及應(yīng)用[J];系統(tǒng)仿真學(xué)報(bào);2011年11期

4 程博,吳國(guó)平;基于SVM的脫機(jī)手寫漢字識(shí)別[J];現(xiàn)代計(jì)算機(jī);2005年09期

5 鐘明霞;;基于神經(jīng)網(wǎng)絡(luò)和SVM的微鈣化簇分類方法[J];計(jì)算機(jī)時(shí)代;2008年05期

6 宋國(guó)明;王厚軍;姜書艷;劉紅;;一種聚類分層決策的SVM模擬電路故障診斷方法[J];儀器儀表學(xué)報(bào);2010年05期

7 張淑雅;趙一鳴;李均利;;基于SVM的圖像分類算法與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2007年25期

8 宋國(guó)明;王厚軍;劉紅;姜書艷;;基于提升小波變換和SVM的模擬電路故障診斷[J];電子測(cè)量與儀器學(xué)報(bào);2010年01期

9 王志明,蔣加伏,唐賢瑛;基于SVM的小波圖像去噪[J];湖南科技學(xué)院學(xué)報(bào);2005年05期

10 解焱陸,吳禮福,戴蓓劏,李輝;基于SVM評(píng)分融合的分類短語(yǔ)音話者確認(rèn)系統(tǒng)[J];數(shù)據(jù)采集與處理;2005年02期

相關(guān)會(huì)議論文 前10條

1 滕衛(wèi)平;胡波;滕舟;鐘元;;SVM回歸法在西太平洋熱帶氣旋路徑預(yù)報(bào)中的應(yīng)用研究[A];S1 災(zāi)害天氣研究與預(yù)報(bào)[C];2012年

2 王紅軍;徐小力;付瑤;;基于SVM的旋轉(zhuǎn)機(jī)械故障診斷知識(shí)獲取[A];第八屆全國(guó)設(shè)備與維修工程學(xué)術(shù)會(huì)議、第十三屆全國(guó)設(shè)備監(jiān)測(cè)與診斷學(xué)術(shù)會(huì)議論文集[C];2008年

3 陳兆基;楊宏暉;杜方鍵;;用于水下目標(biāo)識(shí)別的選擇性SVM集成算法[A];中國(guó)聲學(xué)學(xué)會(huì)水聲學(xué)分會(huì)2011年全國(guó)水聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2011年

4 程麗麗;張健沛;楊靜;馬駿;;一種改進(jìn)的層次SVM多類分類方法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

5 左南;李涓子;唐杰;;基于SVM的肖像照片抽取[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

6 寧偉;苗雪雷;胡永華;季鐸;張桂平;蔡?hào)|風(fēng);;基于SVM的無(wú)參考譯文的譯文質(zhì)量評(píng)測(cè)[A];機(jī)器翻譯研究進(jìn)展——第四屆全國(guó)機(jī)器翻譯研討會(huì)論文集[C];2008年

7 劉旭;羅鵬飛;李綱;;基于擬合角特征及SVM的雷達(dá)輻射源個(gè)體識(shí)別[A];全國(guó)第五屆信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議專刊(第一冊(cè))[C];2011年

8 羅浩;謝軍龍;胡云鵬;;地源熱泵空調(diào)系統(tǒng)故障診斷中SVM的應(yīng)用[A];全國(guó)暖通空調(diào)制冷2008年學(xué)術(shù)年會(huì)資料集[C];2008年

9 劉閃電;王建東;;權(quán)重部分更新的大規(guī)模線性SVM求解器[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年

10 王艦;湯光明;;基于SVM的圖像隱寫檢測(cè)分析[A];第八屆全國(guó)信息隱藏與多媒體安全學(xué)術(shù)大會(huì)湖南省計(jì)算機(jī)學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年

相關(guān)碩士學(xué)位論文 前10條

1 張漢女;基于SVM的海岸線提取方法研究[D];東北師范大學(xué);2010年

2 劉軍;基于SVM的半監(jiān)督網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)[D];復(fù)旦大學(xué);2009年

3 張永俊;基于SVM的增量入侵檢測(cè)方法研究[D];西安科技大學(xué);2013年

4 田冪;基于概率SVM的腫瘤預(yù)警系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2013年

5 王碩;基于廣義S變換和SVM的電壓暫降檢測(cè)與識(shí)別方法研究[D];燕山大學(xué);2013年

6 楊濤;基于SVM的中國(guó)醫(yī)藥制造企業(yè)財(cái)務(wù)危機(jī)預(yù)警研究[D];廈門大學(xué);2009年

7 周洪利;基于SVM的網(wǎng)絡(luò)信息過(guò)濾研究[D];山東師范大學(xué);2008年

8 齊振東;基于SVM的地基土承載力預(yù)測(cè)[D];吉林大學(xué);2008年

9 任瓊;基于SVM的余杭生態(tài)公益林類型的遙感分類研究[D];南京林業(yè)大學(xué);2008年

10 楊洋;基于SVM的印刷品缺陷在線檢測(cè)[D];華中科技大學(xué);2012年



本文編號(hào):2475396

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/guanlilunwen/ydhl/2475396.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0c00f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com