面向電商評論細粒度觀點挖掘的拓展主題模型研究
本文選題:電商評論 切入點:細粒度觀點挖掘 出處:《浙江工商大學》2017年碩士論文
【摘要】:隨著互聯(lián)網(wǎng)和電子商務技術的發(fā)展,網(wǎng)絡購物成為一種熱潮,人們可以實現(xiàn)足不出戶購買到自己心儀的商品。但是,與傳統(tǒng)線下購物相比,網(wǎng)絡購物有著商品種類繁多、用戶無法直接感受商品的質(zhì)量、體驗商品功能等特征,這使得電商網(wǎng)站上的商品評論信息成為消費者選擇和購買決策的重要參考。同時,評論信息作為反饋機制也可以幫助商家改進產(chǎn)品、提升服務。但是,目前電商網(wǎng)站評論數(shù)據(jù)量巨大、內(nèi)容龐雜,采用人工閱讀方式無法準確有效的得到有用的信息。而且人們更希望得到的是關于產(chǎn)品或服務多個方面的細粒度評價信息,而非其整體情感傾向。因此,針對電商評論的細粒度觀點挖掘成為了熱門的研究課題,受到國內(nèi)外研究學者的廣泛關注。細粒度觀點挖掘旨在從評論數(shù)據(jù)中抽取出被評價實體方面以及相對應的情感,生成評價摘要,,為潛在消費者和商家提供決策支持。考慮到目前細粒度觀點挖掘方法如基于人工定義、基于頻率、基于有監(jiān)督學習方法的局限性,而LDA主題模型作為無監(jiān)督方法不僅不需要人工標注的訓練數(shù)據(jù),還可以克服上面所述方法中沒有將具有相似語義的特征詞進行聚類的缺點,被研究者廣泛應用。但是LDA模型抽取的主題粒度較粗,無法識別被評價實體方面,而且三層模型無法實現(xiàn)細粒度觀點挖掘目標,需要進行改進和拓展。針對上面提到的問題,本文根據(jù)細粒度觀點挖掘的目標,對LDA模型進行設計和拓展,提出了細粒度的主題情感混合模型(Fine-grained Topic Sentiment Unification Model,FG-TSU 模型)。首先針對標準的LDA模型識別出的主題粒度較粗,本文將主題分為局部主題和全局主題,利用滑動窗口的方法將詞共現(xiàn)信息從文檔級降到句子級,實現(xiàn)細粒度局部主題的抽取;然后,本文根據(jù)詞分類和在模型中引入指示變量用以區(qū)分方面詞和觀點詞;最后,本文在LDA模型的三層模型基礎上加入了情感層,對主題和情感進行同時建模,實現(xiàn)情感傾向分析,不僅可以獲得整篇評論的情感極性,還可以獲得被評價實體方面層的情感極性,最終完成細粒度觀點挖掘的目標,生成評價摘要。為了驗證本模型具有跨領域性,本文選取了酒店和手機兩個領域的電商評論數(shù)據(jù)集進行實驗,設計了三個實驗,實驗結(jié)果表明本模型在實現(xiàn)電商評論細粒度觀點挖掘上的可行性。
[Abstract]:With the development of Internet and electronic commerce technology, online shopping has become a kind of upsurge.However, compared with the traditional offline shopping, online shopping has a wide variety of goods, users can not directly feel the quality of goods, experience commodity functions and other characteristics.This makes the product review information on e-commerce website an important reference for consumers to choose and purchase.At the same time, comments as a feedback mechanism can also help businesses improve their products and services.However, at present, the amount of comments on e-commerce websites is huge and the content is complex, so manual reading method can not get useful information accurately and effectively.Moreover, people prefer to get fine-grained evaluation information about multiple aspects of products or services, rather than their overall emotional tendency.Therefore, fine-grained point of view mining for ecommerce reviews has become a hot research topic and received extensive attention from domestic and foreign researchers.Fine-grained viewpoint mining aims to extract the evaluation entity and its corresponding emotions from the comment data, generate evaluation summary, and provide decision support for potential consumers and merchants.Considering the limitations of current fine-grained viewpoint mining methods, such as artificial definition, frequency based and supervised learning, the LDA topic model, as an unsupervised method, not only does not require manual tagging training data.It can also overcome the shortcoming of the method mentioned above that there is no clustering of feature words with similar semantics, which has been widely used by researchers.However, the LDA model can not identify the evaluated entity because of its coarse granularity, and the three-tier model can not achieve the goal of fine-grained viewpoint mining, so it needs to be improved and extended.Aiming at the problems mentioned above, according to the goal of fine-grained view mining, this paper designs and extends the LDA model, and proposes a fine-grained Topic Sentiment Unification model for FG-TSU.Firstly, aiming at the coarse granularity of the theme recognized by the standard LDA model, the topic is divided into local theme and global topic, and the cooccurrence information is reduced from document level to sentence level by sliding window method.Then, according to the classification of words and the introduction of demonstrative variables in the model to distinguish aspect words and opinion words; finally, this paper adds emotional layer to the three-layer model of LDA model, and models the subject and emotion simultaneously.The emotional tendency analysis can not only obtain the emotional polarity of the whole review, but also obtain the emotional polarity of the aspect layer of the evaluated entity. Finally, the goal of fine-grained viewpoint mining can be completed, and the evaluation summary can be generated.In order to verify the cross-domain nature of the model, this paper selects the e-business comment data set in the hotel and mobile phone fields to carry on the experiment, and designs three experiments.The experimental results show that this model is feasible to realize the mining of fine grained viewpoint of ecommerce review.
【學位授予單位】:浙江工商大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:F724.6;F274
【相似文獻】
相關期刊論文 前2條
1 張金魁;桂雁軍;;面向汽車電子商務的細粒度商品本體元模型[J];現(xiàn)代經(jīng)濟信息;2014年07期
2 ;[J];;年期
相關會議論文 前5條
1 葉蘊芳;楊榆;羅鑫;徐國愛;;Appfuse系統(tǒng)中細粒度權限控制的研究與實現(xiàn)[A];2007北京地區(qū)高校研究生學術交流會通信與信息技術會議論文集(上冊)[C];2008年
2 江偉玉;高能;劉澤藝;林雪燕;;一種云計算中的多重身份認證與授權方案[A];第27次全國計算機安全學術交流會論文集[C];2012年
3 郭磊;唐玉華;周杰;董亞卓;;基于FPGA的Cholesky分解細粒度并行結(jié)構(gòu)與實現(xiàn)[A];2010年第16屆全國信息存儲技術大會(IST2010)論文集[C];2010年
4 李俊青;謝圣獻;劉廣亮;陳晨;;P2P網(wǎng)絡基于蟻群優(yōu)化的動態(tài)細粒度訪問控制框架[A];2008年全國開放式分布與并行計算機學術會議論文集(下冊)[C];2008年
5 盛振華;吳羽;江錦華;壽黎但;陳剛;;InfoSigs:一種面向WEB對象的細粒度聚類算法[A];第26屆中國數(shù)據(jù)庫學術會議論文集(A輯)[C];2009年
相關重要報紙文章 前2條
1 趙曉濤;巡展中的三大熱門[N];網(wǎng)絡世界;2007年
2 樂天邋編譯;編織一張更好的Web[N];計算機世界;2007年
相關博士學位論文 前4條
1 付興兵;基于屬性基加密的細粒度訪問控制機制研究[D];電子科技大學;2016年
2 時杰;關系數(shù)據(jù)庫細粒度訪問控制研究[D];華中科技大學;2010年
3 朱倩;面向自由文本的細粒度關系抽取的關鍵技術研究[D];江蘇大學;2011年
4 余a\;基于Simulink模型的細粒度多線程技術研究[D];浙江大學;2014年
相關碩士學位論文 前10條
1 趙黎光;基于依存句法的句子級細粒度情感計算[D];華南理工大學;2015年
2 李星宇;一種細粒度Cloud-RAN框架與關鍵技術研究[D];電子科技大學;2014年
3 酈麗珍;基于Open vSwitch虛擬網(wǎng)絡的細粒度訪問控制[D];復旦大學;2013年
4 姚亮;數(shù)據(jù)訪問控制中基于中間代理的用戶撤銷方法[D];西安電子科技大學;2014年
5 占文平;面向產(chǎn)品評論的情感分析技術研究[D];浙江工商大學;2015年
6 樓弘;基于深度神經(jīng)網(wǎng)絡的傳感器覆蓋細粒度優(yōu)化研究[D];浙江工業(yè)大學;2015年
7 蔡雅雅;基于半監(jiān)督集成剪枝算法的細粒度城市空氣質(zhì)量估計[D];浙江大學;2016年
8 何東梅;細粒度物體分類算法研究與實現(xiàn)[D];北京交通大學;2016年
9 廖純;基于句法和語義的話題細粒度情感分析的研究[D];北京理工大學;2016年
10 李毅;屬性層級觀點挖掘技術的研究與應用[D];石家莊鐵道大學;2016年
,本文編號:1706681
本文鏈接:http://www.lk138.cn/jingjilunwen/guojimaoyilunwen/1706681.html