中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

電子商務(wù)中虛假評論檢測研究

發(fā)布時(shí)間:2020-07-29 12:32
【摘要】:評論數(shù)據(jù)作為電商平臺上的重要信息數(shù)據(jù),在商業(yè)活動(dòng)中發(fā)揮著重要的作用,但大量的虛假評論的存在,給消費(fèi)者和商業(yè)組織帶來錯(cuò)誤導(dǎo)向,造成巨大損失,因此,對其進(jìn)行檢測和控制具有重要意義。電商平臺存在大量的評論數(shù)據(jù),面對如此多的評論數(shù)據(jù),已有的虛假評論檢測方法存在一定局限性。電商平臺上商品種類繁多,涉及到的評論數(shù)據(jù)類型紛繁復(fù)雜,基于內(nèi)容特征的方法采用的分類特征通常具有領(lǐng)域依賴性,分類性能依賴大量正確的領(lǐng)域標(biāo)注評論數(shù)據(jù),泛化能力差;谛袨榉治龅姆椒m然不需要標(biāo)注評論數(shù)據(jù),但其依賴特定的用戶評論行為,識別率不高。先前工作集中于啟發(fā)式策略和傳統(tǒng)的全監(jiān)督學(xué)習(xí)算法。最近研究表明,人類無法通過先驗(yàn)知識有效識別虛假評論,手工標(biāo)注的數(shù)據(jù)集必定存在一定數(shù)量的誤例,因此簡單使用傳統(tǒng)的全監(jiān)督學(xué)習(xí)算法識別虛假評論并不合理,其中容易被錯(cuò)誤標(biāo)注的樣例稱為間諜樣例,如何確定這些樣例的類別標(biāo)簽將直接影響分類器的性能。針對以上這些問題,本文提出面向電商平臺虛假評論的系統(tǒng)性的檢測方法。論文的主要工作由三部分組成,第一,提出了一種評論文本相似性的度量算法。針對傳統(tǒng)文本相似性度量方法準(zhǔn)確率不高的問題,本文利用評論文本的內(nèi)容組織特征,構(gòu)建評論文本樹形結(jié)構(gòu),將其相似性度量分解為對應(yīng)樹各層之間的相似性度量,從而使得每層相似度的度量對象都為同類型的詞語,進(jìn)而分別采用對應(yīng)的相似性度量方法計(jì)算各層的相似性,最后再對各層相似度按照權(quán)重融合得到整體的相似度,在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明本文方法較其它常見度量方法更加有效,準(zhǔn)確率更高。第二,提出一種動(dòng)靜態(tài)特征融合的虛假評論檢測算法。針對現(xiàn)有虛假評論檢測方法未充分利用用戶歷史行為中蘊(yùn)含的動(dòng)態(tài)信息這一問題,本文首先利用時(shí)序分析模型從這些動(dòng)態(tài)信息中挖掘能夠刻畫用戶行為的動(dòng)態(tài)特征;其次,融合這些動(dòng)態(tài)特征與用戶層面靜態(tài)特征發(fā)現(xiàn)可疑用戶,并將用戶可疑概率傳播至用戶所發(fā)表評論,得到評論可疑概率;最后,結(jié)合評論可疑概率與評論層面靜態(tài)特征,使用學(xué)習(xí)策略訓(xùn)練高性能的分類器,實(shí)現(xiàn)虛假評論的檢測,在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)表明,本文方法的性能優(yōu)于現(xiàn)有方法。第三,提出一種面向電商平臺的虛假評論目標(biāo)商品的識別算法。首先,從無標(biāo)注數(shù)據(jù)集中識別出少量可信度較高的負(fù)例。其次,通過整合LDA(Latent Dirichlet allocation)算法和K-means算法,分別計(jì)算出多個(gè)代表性的正例和負(fù)例,然后基于狄利克雷過程混合模型(Dirichlet process mixture model,DEMM)對所有間諜樣例進(jìn)行聚類,混合種群性和個(gè)體性策略來確定間諜樣例的類別標(biāo)簽。最后,多核學(xué)習(xí)算法被用來訓(xùn)練最終的分類器,數(shù)值實(shí)驗(yàn)證實(shí)了所提算法的有效性,超過當(dāng)前的基準(zhǔn)。
【學(xué)位授予單位】:河北大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:F713.36
【圖文】:

論文,準(zhǔn)確性


研究內(nèi)容及組織框架

最大邊緣,邊緣類,分類能力,超平面


決策邊界的邊緣

結(jié)構(gòu)圖,檢測方法,結(jié)構(gòu)圖,動(dòng)態(tài)特征


基于融合特征的虛假評論檢測方法結(jié)構(gòu)圖

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 史戰(zhàn)紅;連玉平;鞏增泰;;基于包含度的粗糙集間的相似性度量[J];數(shù)學(xué)教學(xué)研究;2008年02期

2 李濤;汪光陽;;標(biāo)準(zhǔn)相似性度量及其應(yīng)用[J];山西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2016年04期

3 張豪;陳黎飛;郭躬德;;基于符號熵的序列相似性度量方法[J];計(jì)算機(jī)工程;2016年05期

4 仝朝陽,石教英;一種關(guān)于布爾模式的相似性度量及其應(yīng)用[J];計(jì)算機(jī)研究與發(fā)展;1996年08期

5 韓建超;史忠植;;類比推理與學(xué)習(xí)的研究[J];計(jì)算機(jī)工程與應(yīng)用;1988年01期

6 林燕清;傅仰耿;;基于改進(jìn)相似性度量的擴(kuò)展置信規(guī)則庫規(guī)則激活方法[J];中國科學(xué)技術(shù)大學(xué)學(xué)報(bào);2018年01期

7 賀玲;蔡益朝;楊征;;高維數(shù)據(jù)的相似性度量研究[J];計(jì)算機(jī)科學(xué);2010年05期

8 江詩鋒;何振峰;;一種基于權(quán)重的時(shí)間序列相似性度量[J];計(jì)算機(jī)應(yīng)用與軟件;2010年09期

9 段立娟,高文,林守勛,馬繼涌;圖像檢索中的動(dòng)態(tài)相似性度量方法[J];計(jì)算機(jī)學(xué)報(bào);2001年11期

10 李年攸;;基于等價(jià)類的圖像相似性度量[J];三明學(xué)院學(xué)報(bào);2006年04期

相關(guān)會(huì)議論文 前10條

1 李新光;鄭君君;祝一薇;劉建軍;夏勝平;譚立球;;基于屬性圖模型的圖像相似性度量[A];第十五屆全國圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年

2 白翔;;基于多特征流形結(jié)構(gòu)互補(bǔ)性挖掘的相似性度量融合方法[A];2015年中國自動(dòng)化大會(huì)摘要集[C];2015年

3 李彬彬;羅樂;;基于信源學(xué)的光譜相似性度量方法的比較研究[A];2009全國計(jì)算機(jī)網(wǎng)絡(luò)與通信學(xué)術(shù)會(huì)議論文集[C];2009年

4 沈君;馬生全;;兩種新的相似性度量在模糊推理中的應(yīng)用[A];中國運(yùn)籌學(xué)會(huì)模糊信息與模糊工程分會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2010年

5 周曉蕾;唐明浩;於思俊;;服裝款式系統(tǒng)中的相似性度量算法研究[A];2008年中國高校通信類院系學(xué)術(shù)研討會(huì)論文集(下冊)[C];2009年

6 蘭妥;江弋;張東站;;基于ESAX表示的時(shí)間序列相似性度量[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(一)[C];2008年

7 廉鑫;林偉堅(jiān);張海威;袁曉潔;;基于雙向路徑約束模型的XML文檔結(jié)構(gòu)相似性度量[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

8 何昕;謝志鵬;;基于簡單樹匹配算法的Web頁面結(jié)構(gòu)相似性度量[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年

9 楊明;楊萍;吉根林;;分布式環(huán)境下的隱私保持?jǐn)?shù)據(jù)庫相似性度量[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年

10 羅陽;趙偉;;相似性度量研究及最優(yōu)相似系數(shù)[A];中國氣象學(xué)會(huì)2008年年會(huì)天氣預(yù)報(bào)準(zhǔn)確率與公共氣象服務(wù)分會(huì)場論文集[C];2008年

相關(guān)博士學(xué)位論文 前10條

1 遲榮華;不確定時(shí)間序列相似性非參數(shù)度量方法研究[D];哈爾濱工程大學(xué);2018年

2 邱明;語義相似性度量及其在設(shè)計(jì)管理系統(tǒng)中的應(yīng)用[D];浙江大學(xué);2006年

3 王鵬;基于穩(wěn)定層次空間形態(tài)的道路網(wǎng)匹配[D];中國地質(zhì)大學(xué);2017年

4 朱進(jìn);基于運(yùn)動(dòng)特征的軌跡相似性度量研究[D];南京師范大學(xué);2015年

5 陳曉;網(wǎng)絡(luò)中頂點(diǎn)間相似性度量方法研究[D];燕山大學(xué);2017年

6 王文俊;基因表達(dá)數(shù)據(jù)的相似性度量和特征提取研究[D];西安電子科技大學(xué);2011年

7 李海林;時(shí)間序列數(shù)據(jù)挖掘中的特征表示與相似性度量方法研究[D];大連理工大學(xué);2012年

8 吳學(xué)雁;金融時(shí)間序列模式挖掘方法的研究[D];華南理工大學(xué);2010年

9 張鍵;面向人臉識別的圖像表示和分類研究[D];南京理工大學(xué);2015年

10 晏實(shí)江;基于DEM的地形尺度相似性度量方法研究[D];南京師范大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 趙雅菲;電子商務(wù)中虛假評論檢測研究[D];河北大學(xué);2019年

2 胡曉靜;基于特征點(diǎn)的顱面相似性度量算法研究[D];西北大學(xué);2018年

3 王澤源;考慮用戶滿意度的云服務(wù)排序推薦方法研究[D];合肥工業(yè)大學(xué);2018年

4 劉國明;基于相似性度量的行人重識別算法研究[D];廣州大學(xué);2018年

5 周紫桑;基于鏈接分析的期刊引用網(wǎng)絡(luò)節(jié)點(diǎn)相似性度量[D];清華大學(xué);2017年

6 王盼;基于過程主干約束的軌跡相似性度量方法與應(yīng)用[D];南京航空航天大學(xué);2018年

7 劉泉菲;多尺度空間目標(biāo)相似性度量研究[D];長沙理工大學(xué);2018年

8 李玲;基于句子相似性度量的中文自動(dòng)響應(yīng)問答系統(tǒng)的研究與實(shí)現(xiàn)[D];陜西師范大學(xué);2017年

9 黃義棚;基于相似性度量的人臉性別識別技術(shù)研究[D];北京郵電大學(xué);2018年

10 鄧楠潔;基于數(shù)據(jù)依賴的高維大數(shù)據(jù)相似性度量方法研究[D];北京郵電大學(xué);2018年



本文編號:2773964

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/jingjilunwen/guojimaoyilunwen/2773964.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1faf4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com