云環(huán)境下基于RIHDBSCAN的微博事件檢測(cè)及跟蹤
【圖文】:
文檔-詞條權(quán)值矩陣Fig2.2.Theweightmatrixoftext-term
圖 2.3 歐氏距離和余弦相似度的區(qū)別2.3 The difference between Euclidean distance and Cosine sim,余弦相似度能夠有效規(guī)避文本間的差異表現(xiàn),場(chǎng)景,論文采用規(guī)范化的余弦公式計(jì)算余弦相似度續(xù)聚類分析有重要的影響。本章介紹了預(yù)處理關(guān)鍵首先提出根據(jù)機(jī)械化規(guī)則直接過(guò)濾文本,提高后提出一種改進(jìn)的 FCF-DIDF 動(dòng)態(tài)權(quán)值算法計(jì)算特公式來(lái)計(jì)算文本向量間的相似度,最后得到余弦模型,為聚類分析做好了數(shù)據(jù)準(zhǔn)備。
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP393.092;TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 蔡穎琨,謝昆青,馬修軍;屏蔽了輸入?yún)?shù)敏感性的DBSCAN改進(jìn)算法[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年03期
2 倪維健;黃亞樓;李飛;劉賞;;一種基于加權(quán)多代表點(diǎn)的層次聚類算法[J];計(jì)算機(jī)科學(xué);2005年05期
3 鄭斐然;苗奪謙;張志飛;高燦;;一種中文微博新聞話題檢測(cè)的方法[J];計(jì)算機(jī)科學(xué);2012年01期
4 邱云飛;程亮;;微博突發(fā)話題檢測(cè)方法研究[J];計(jì)算機(jī)工程;2012年09期
5 洪宇;張宇;劉挺;李生;;話題檢測(cè)與跟蹤的評(píng)測(cè)及研究綜述[J];中文信息學(xué)報(bào);2007年06期
6 路榮;項(xiàng)亮;劉明榮;楊青;;基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J];模式識(shí)別與人工智能;2012年03期
7 周紅芳;趙雪涵;周揚(yáng);;基于限定區(qū)域數(shù)據(jù)取樣的密度聚類算法[J];計(jì)算機(jī)應(yīng)用;2012年08期
8 李勁;張華;吳浩雄;向軍;;基于特定領(lǐng)域的中文微博熱點(diǎn)話題挖掘系統(tǒng)BTopicMiner[J];計(jì)算機(jī)應(yīng)用;2012年08期
9 周水庚,周傲英,金文,范曄,錢衛(wèi)寧;FDBSCAN:一種快速 DBSCAN算法(英文)[J];軟件學(xué)報(bào);2000年06期
10 馬帥,王騰蛟,唐世渭,楊冬青,高軍;一種基于參考點(diǎn)和密度的快速聚類算法[J];軟件學(xué)報(bào);2003年06期
本文編號(hào):2571936
本文鏈接:http://www.lk138.cn/guanlilunwen/ydhl/2571936.html