中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 社科論文 > 一帶一路論文 >

基于概率模型的細(xì)粒度話題演化分析技術(shù)研究與實現(xiàn)

發(fā)布時間:2020-08-20 19:03
【摘要】:近年來,微博、推特和臉書等在線社交平臺迅猛發(fā)展,用戶量激增,正在沖擊傳統(tǒng)新聞媒體,成為當(dāng)今社會人們最重要的一個方便快捷的信息獲取來源和傳播渠道。人們也研究和依靠在線社交網(wǎng)絡(luò)分析的理論和方法,發(fā)現(xiàn)并分析隱含在社交媒體中的話題及其演化規(guī)律。隨著數(shù)以億計、來自不同領(lǐng)域方向,具有不同背景的人群,持續(xù)地在社交媒體上分享自己對于成千上萬社會熱點事件的觀點與思想,上述話題的演化分析需求也被迫向著精準(zhǔn)化和更細(xì)粒度的方向發(fā)展。基于用戶感興趣信息內(nèi)容的發(fā)現(xiàn)并追蹤社交網(wǎng)絡(luò)中出現(xiàn)的事件的細(xì)粒度話題演化過程,成為當(dāng)前話題演化分析研究的重要問題之一。本文在研究話題發(fā)現(xiàn)與演化的基礎(chǔ)上,對基于在線社交網(wǎng)絡(luò)的文本流中細(xì)粒度話題演化模型進(jìn)行了深入的研究。主要關(guān)注如何從高度動態(tài)化的在線短文本數(shù)據(jù)流中,挖掘出用戶感興趣的高質(zhì)量細(xì)粒度話題,并對其演化過程進(jìn)行追蹤和研究。幫助用戶在高速變化的網(wǎng)絡(luò)時代及時有效地了解和掌握其所關(guān)注的方面最前沿、最敏感的話題,并根據(jù)這些話題的演化規(guī)律和發(fā)展趨勢做出相應(yīng)的判斷和決策。本文的主要研究內(nèi)容,包括以下三個部分:第一,對當(dāng)前主流的話題發(fā)現(xiàn)與演化技術(shù)進(jìn)行研究,再結(jié)合新浪微博等在線社交網(wǎng)絡(luò)中短文本的特點以及文檔集合自帶的時間信息,針對用戶對于話題演化分析更聚焦、更細(xì)節(jié)的需求,分析了現(xiàn)有方法在解決這個問題中可能存在的不足與局限性,在TTM模型(targeted topic model)的基礎(chǔ)上改進(jìn)擴展成可對在線文本流進(jìn)行話題演化分析的細(xì)粒度話題演化模型FG-TEM(fine-grained topic evolution model)。第二,定義了子話題間的五種關(guān)系。通過對文檔集合按照固定尺寸的時間窗口進(jìn)行劃分,再通過細(xì)粒度話題演化模型獲取不同時間窗口內(nèi)的文檔-話題概率分布和話題-詞概率分布。通過計算不同時間窗口內(nèi)子話題間的KL散度來判斷子話題間的相似度,從而獲得子話題間的演化路徑,再計算不同時間窗口內(nèi)各個子話題的話題強度。基于這一系列子話題間演化路徑以及強度變化過程,繪制出用戶感興趣方面的細(xì)粒度話題在整個時間域上的細(xì)粒度話題內(nèi)容和強度演化圖。第三,針對在線社交網(wǎng)絡(luò)文本的特點,提出了一種新的話題一致性度量指標(biāo)EPMI;贓-PMI對上述提出的細(xì)粒度話題演化模型進(jìn)行評估,實驗結(jié)果驗證了FG-TEM生成的話題一致性高,質(zhì)量好,更貼近用戶需求,因此模型的效果也更好。
【學(xué)位授予單位】:國防科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP391.1
【圖文】:

模型圖,模型,多項式分布,概率分布


國防科技大學(xué)研究生院專業(yè)學(xué)位碩士學(xué)位論文主題都是固定詞表上的一個多項式分布;每篇文檔中的詞與詞之,每一個詞都獨立存在,交換彼此的順序并不影響文檔本身;每篇個話題,有一個固定的主題混合比例,從狄利克雷分布中抽樣得到詞都由其中一個話題生成。經(jīng)典的 LDA 模型將文檔集合中每一篇話題詞的概率分布的形式表示。同時它是一種無監(jiān)督學(xué)習(xí)算法,訓(xùn)注好的訓(xùn)練集,僅僅需要給定一個文檔集合以及一個確定的話題數(shù)vidM.Blei 在 2003 年發(fā)表的論文中提出的 LDA 模型的原始模型,概率分布θ加上了狄利克雷先驗,而對話題-詞的概率分布φ并沒有。而后 T.L.Giffiths 對原始 LDA 模型進(jìn)行了改進(jìn),給話題-詞概率分克雷先驗,因為多項式分布和狄利克雷分布滿足共軛分布特性,樣算法來進(jìn)行相應(yīng)的參數(shù)推導(dǎo)。因為 Gibbs 采樣推導(dǎo)簡單,且效大多數(shù)的應(yīng)用中,基本采用 Gibbs 采樣算法來進(jìn)行相關(guān)的參數(shù)估計型如圖 2.1,其中陰影部分表示可觀測變量,空心部分表示隱含變

模型圖,模型圖,模型,主題


國防科技大學(xué)研究生院專業(yè)學(xué)位碩士學(xué)位論文想。同時由于主題模型是無監(jiān)督學(xué)習(xí),所以即使在應(yīng)用于大數(shù)據(jù)時,仍然可能產(chǎn)無法令人滿意的結(jié)果。近年來,一種基于知識的主題模型被提了出來,這種模型要用戶提供一些現(xiàn)有的領(lǐng)域知識來指導(dǎo)模型產(chǎn)生更好的話題;谥R的主題模型同樣也可以應(yīng)用于聚焦式話題發(fā)現(xiàn),在[20]中,作者利狄利克雷森林先驗(DirichletForestPriors),將用戶對于各種話題應(yīng)該具有的各高概率或者低概率話題詞的組成的了解和知識整合進(jìn)主題模型中。ArjunMukherj等人則提出了一種基于用戶提供的作為一些方面類別的種子詞匯來準(zhǔn)確發(fā)現(xiàn)用所需信息的方法,并設(shè)計了兩種基于現(xiàn)有知識的主題模型 SAS 和 ME-SAS[21],圖 2.2。這兩種模型將種子詞匯作為反映用戶感興趣類別的關(guān)鍵詞來自動提取并用戶所需的信息。

模型圖,模型圖


圖 2.3 TTM 模型圖2.2話題演化模型分析分析主要是衡量分析同一個話,題隨著時間的推移,話的動態(tài)性、發(fā)展性和差異性。話題演化分為兩個方面:表示內(nèi)容隨著時間所產(chǎn)生的變化,而這個變化反過程,而發(fā)生的變化。例如,在國際會議開幕前夕,大家的關(guān)備工作,而在會議閉幕之后,大家的關(guān)注點就轉(zhuǎn)移到了生活所帶來的影響。則表示話題強度,隨著時間的推移而經(jīng)歷的一個低潮到程,而這個變化的過程,反應(yīng)了隨著時間的推移,用戶。例如,對于每年舉辦一次的全國人民代表大會,只有戶關(guān)注,在非會議期間受到的關(guān)注程度較低。介紹在一些在線社交網(wǎng)絡(luò)中最常用的且適用范圍廣泛

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 宋鳳義;胡太;楊明;;基于外觀的復(fù)合屬性學(xué)習(xí)的細(xì)粒度識別[J];數(shù)據(jù)采集與處理;2016年06期

2 陳自巖;黃宇;王洋;傅興玉;付琨;;一種利用語義相似特征提升細(xì)粒度情感分析方法[J];計算機應(yīng)用與軟件;2017年03期

3 張潔;董輝;;普適環(huán)境中細(xì)粒度可信管理框架的研究[J];測控技術(shù);2017年05期

4 鐘競德;;超細(xì)粒度氧化釔生產(chǎn)的新工藝分析[J];科技創(chuàng)新與應(yīng)用;2016年06期

5 羅清紅;;大數(shù)據(jù)與靈魂[J];當(dāng)代教育家;2016年12期

6 李濤;劉明耀;閆寧;;超細(xì)粒度砂輪制備技術(shù)研究現(xiàn)狀[J];金剛石與磨料磨具工程;2013年02期

7 譚光華,袁廉灼;從Na_2WO_4溶液制取中、細(xì)粒度WO_3[J];稀有金屬;1989年05期

8 徐德華;張未央;;基于深度記憶網(wǎng)絡(luò)的在線評論細(xì)粒度情感分類[J];電子制作;2020年01期

9 朱陽光;劉瑞敏;王震;王梟;;基于聯(lián)合優(yōu)化多任務(wù)學(xué)習(xí)的細(xì)粒度圖像識別[J];陜西理工大學(xué)學(xué)報(自然科學(xué)版);2019年06期

10 敦欣卉;張云秋;楊鎧西;;基于微博的細(xì)粒度情感分析[J];數(shù)據(jù)分析與知識發(fā)現(xiàn);2017年07期

相關(guān)會議論文 前10條

1 李小慶;曾慶凱;;細(xì)粒度可信恢復(fù)文件系統(tǒng)[A];2011年全國通信安全學(xué)術(shù)會議論文集[C];2011年

2 劉電霆;周德儉;余強;;虛擬企業(yè)中細(xì)粒度協(xié)同設(shè)計任務(wù)的不確定調(diào)度及GA求解[A];先進(jìn)制造技術(shù)高層論壇暨第六屆制造業(yè)自動化與信息化技術(shù)研討會論文集[C];2007年

3 葉蘊芳;楊榆;羅鑫;徐國愛;;Appfuse系統(tǒng)中細(xì)粒度權(quán)限控制的研究與實現(xiàn)[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年

4 朱虹;舒鵬;;擴展SQL實現(xiàn)DBMS細(xì)粒度訪問控制[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2006年

5 郭磊;唐玉華;周杰;董亞卓;;基于FPGA的Cholesky分解細(xì)粒度并行結(jié)構(gòu)與實現(xiàn)[A];2010年第16屆全國信息存儲技術(shù)大會(IST2010)論文集[C];2010年

6 吳舜;蘇丹;吳佳;李坤;許大衛(wèi);劉昀;魏征;;基于Tilera平臺的網(wǎng)絡(luò)細(xì)粒度應(yīng)用行為識別系統(tǒng)[A];2013電力行業(yè)信息化年會論文集[C];2013年

7 李祖德;占國強;葉曉俊;;FG-RBAC:基于RBAC的FGAC模型實現(xiàn)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2005年

8 王運成;任年民;張建平;結(jié)鳳克;柴常謙;;基于角色的XML細(xì)粒度訪問控制模型[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會——通信與信息技術(shù)會議論文集(下)[C];2006年

9 劉偉峰;王智廣;;細(xì)粒度并行計算編程模型研究[A];2008年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(下冊)[C];2008年

10 江偉玉;高能;劉澤藝;林雪燕;;一種云計算中的多重身份認(rèn)證與授權(quán)方案[A];第27次全國計算機安全學(xué)術(shù)交流會論文集[C];2012年

相關(guān)重要報紙文章 前10條

1 ;修正SDH:承載細(xì)粒度IP業(yè)務(wù)[N];中國計算機報;2002年

2 ;細(xì)粒度的訪問控制和日志管理[N];中國計算機報;2003年

3 ;三項措施保護(hù)服務(wù)器[N];網(wǎng)絡(luò)世界;2004年

4 侯麗坤;思達(dá)展示新概念QoS產(chǎn)品[N];計算機世界;2001年

5 《網(wǎng)絡(luò)世界》記者 蒙克;D-Link應(yīng)用層流控網(wǎng)關(guān)細(xì)粒度管理全網(wǎng)流量[N];網(wǎng)絡(luò)世界;2015年

6 呂明;網(wǎng)絡(luò)安全審計需細(xì)粒度報告[N];計算機世界;2008年

7 胡英;F5最新SSL VPN[N];計算機世界;2006年

8 侯闖 綜合編譯;部署SOA需慎重[N];計算機世界;2004年

9 卜葉 整理;新型美顏技術(shù)讓你變明星[N];中國科學(xué)報;2020年

10 ;Allot加入開放式IP服務(wù)創(chuàng)建計劃[N];人民郵電;2007年

相關(guān)博士學(xué)位論文 前10條

1 余少勇;基于深度學(xué)習(xí)的車輛檢測及其細(xì)粒度分類關(guān)鍵技術(shù)研究[D];廈門大學(xué);2017年

2 趙毅力;基于深度學(xué)習(xí)的云南野生鳥類圖像細(xì)粒度識別[D];云南大學(xué);2018年

3 龐程;基于部件的圖像細(xì)粒度視覺分析方法研究[D];哈爾濱工業(yè)大學(xué);2018年

4 韓婷婷;視頻理解中人體動作的細(xì)粒度表示與應(yīng)用[D];哈爾濱工業(yè)大學(xué);2019年

5 楊駿;細(xì)粒度文本情感分析問題研究[D];南京大學(xué);2019年

6 趙波;細(xì)粒度圖像分類、分割、生成與檢索關(guān)鍵技術(shù)研究[D];西南交通大學(xué);2017年

7 洪佳楠;半可信云中基于屬性加密擴展的訪問控制研究[D];中國科學(xué)技術(shù)大學(xué);2018年

8 魏秀參;深度學(xué)習(xí)下細(xì)粒度級別圖像的視覺分析研究[D];南京大學(xué);2018年

9 時杰;關(guān)系數(shù)據(jù)庫細(xì)粒度訪問控制研究[D];華中科技大學(xué);2010年

10 朱倩;面向自由文本的細(xì)粒度關(guān)系抽取的關(guān)鍵技術(shù)研究[D];江蘇大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 熊俊;基于細(xì)粒度情感分析的票房預(yù)測研究[D];重慶郵電大學(xué);2019年

2 聶自闖;基于SDN的IoT設(shè)備細(xì)粒度訪問控制研究與實現(xiàn)[D];重慶郵電大學(xué);2019年

3 鄧敏娜;基于序列生成模型的細(xì)粒度情感分析研究[D];湘潭大學(xué);2019年

4 鄭穎;面向用戶評論的細(xì)粒度情感分析系統(tǒng)設(shè)計與實現(xiàn)[D];山東師范大學(xué);2019年

5 張騰;基于卷積神經(jīng)網(wǎng)絡(luò)的細(xì)粒度車型識別系統(tǒng)研究與實現(xiàn)[D];上海交通大學(xué);2018年

6 陳仿雄;弱監(jiān)督顯著性細(xì)粒度圖像分類算法的研究與實現(xiàn)[D];廣東工業(yè)大學(xué);2019年

7 周晉虹;基于異構(gòu)嵌入式的細(xì)粒度圖像自動分類系統(tǒng)研究[D];成都理工大學(xué);2019年

8 麻凱利;基于深度學(xué)習(xí)的細(xì)粒度目標(biāo)檢測算法研究[D];國防科技大學(xué);2017年

9 劉心;基于概率模型的細(xì)粒度話題演化分析技術(shù)研究與實現(xiàn)[D];國防科技大學(xué);2018年

10 胡飛菊;基于文本挖掘的民宿評論細(xì)粒度情感分析[D];江西農(nóng)業(yè)大學(xué);2019年



本文編號:2798329

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/shekelunwen/ydyl/2798329.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶abaf1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com