中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

中文微博隱私挖掘系統(tǒng)設(shè)計與實現(xiàn)

發(fā)布時間:2019-05-07 17:03
【摘要】:縱觀近年來中文微博發(fā)展的趨勢,隨著用戶數(shù)量不斷增加,用戶在微博中的關(guān)系網(wǎng)絡(luò)逐步完善,微博中潛在的隱私泄露問題也日益成為人們關(guān)注的焦點,其中蘊含的巨大商機亦待爆發(fā)。本文的工作圍繞中文微博的隱私泄露問題展開,提出了一套中文微博隱私挖掘方案。主要工作包括以下幾個方面: (1)針對中文微博隱私挖掘?qū)?shù)據(jù)的特殊需求,設(shè)計并實現(xiàn)了一套基于Web技術(shù)的數(shù)據(jù)挖掘系統(tǒng)。提出了基于開放平臺接口與頁面解析技術(shù)相結(jié)合的微博數(shù)據(jù)獲取方案:通過線性控制開放平臺接口的訪問頻率,解決了訪問受限問題;配合網(wǎng)絡(luò)爬蟲技術(shù),彌補了開放平臺獲取數(shù)據(jù)信息不完全等問題。 (2)將基于模塊度優(yōu)化的啟發(fā)式算法應用到微博網(wǎng)絡(luò)的社區(qū)檢測中,并對其鄰接矩陣的構(gòu)造提出了針對微博特性的改進方案。利用D3可視化引擎將微博網(wǎng)絡(luò)抽象成無向圖,在強關(guān)系網(wǎng)絡(luò)的基礎(chǔ)上,提出了結(jié)合微博關(guān)系有向性、二度人脈特性的鄰接矩陣邊權(quán)重算法,實現(xiàn)了微博網(wǎng)絡(luò)關(guān)系從有向性到無向性的轉(zhuǎn)換。經(jīng)檢驗,該方案在保證算法效率的前提下,使得社區(qū)檢測的成功率從80.32%提高到了90.16%。 (3)通過基于社區(qū)檢測的隱私分析方法,利用社區(qū)中相同的公開信息來推斷目標用戶未公開的隱私信息,以不低于50%的置信度獲得用戶的地理位置信息、職業(yè)信息、教育信息。 (4)采用借助SAE分詞服務(wù)的自建詞庫的中文關(guān)鍵字提取方法,,幫助實現(xiàn)對用戶興趣等信息的挖掘。根據(jù)中文微博關(guān)鍵字提取與傳統(tǒng)關(guān)鍵字提取工作的區(qū)別進行方案的設(shè)計,設(shè)計了處理中文微博嘈雜信息的啟發(fā)式噪聲過濾規(guī)則。利用社區(qū)檢測結(jié)合關(guān)鍵字提取的方法,實現(xiàn)了對更深層隱私信息的挖掘。
[Abstract]:......
【學位授予單位】:西安電子科技大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP309;TP393.092

【共引文獻】

相關(guān)期刊論文 前10條

1 田卉;;用數(shù)據(jù)挖掘技術(shù)構(gòu)建政府智能化網(wǎng)絡(luò)投訴平臺[J];辦公自動化;2009年18期

2 鐘曉旭;;層次聚類方法在關(guān)鍵詞提取上的研究應用[J];電腦知識與技術(shù);2009年06期

3 高學東;吳玲玉;;基于高維聚類技術(shù)的中文關(guān)鍵詞提取算法[J];中國管理信息化;2011年09期

4 尹倩;胡學鋼;謝飛;吳信東;;基于密度聚類模式的中文新聞網(wǎng)頁關(guān)鍵詞提取[J];廣西師范大學學報(自然科學版);2009年01期

5 宋艷;何嘉;舒紅平;鄭皎凌;梁繁榮;任玉蘭;文立玉;;基于文本挖掘詞頻反文檔頻率方法的疾病癥狀權(quán)重挖掘研究[J];成都信息工程學院學報;2014年01期

6 張岳;;面向中文短信的三維動畫情節(jié)規(guī)劃[J];計算機工程與應用;2012年10期

7 劉金嶺;;基于主題的中文短信文本分類研究[J];計算機工程;2010年04期

8 施聰鶯;徐朝軍;楊曉江;;TFIDF算法研究綜述[J];計算機應用;2009年S1期

9 張靖;;網(wǎng)絡(luò)個性化服務(wù)資源綜合推薦研究[J];計算機仿真;2009年11期

10 李靜月;李培峰;朱巧明;;一種改進的TFIDF網(wǎng)頁關(guān)鍵詞提取方法[J];計算機應用與軟件;2011年05期

相關(guān)會議論文 前1條

1 薛征;廖聞劍;;基于位置權(quán)重和實體識別的關(guān)鍵詞提取[A];中國電子學會第十六屆信息論學術(shù)年會論文集[C];2009年

相關(guān)博士學位論文 前9條

1 蔣玲;面向?qū)W科的知識元標引關(guān)鍵技術(shù)研究[D];華中師范大學;2011年

2 朱朝勇;基于本體的知識庫分類研究[D];中國科學技術(shù)大學;2013年

3 吳宏偉;社會網(wǎng)絡(luò)數(shù)據(jù)發(fā)布中的隱私匿名技術(shù)研究[D];哈爾濱工程大學;2013年

4 王波;數(shù)據(jù)發(fā)布中的個性化隱私匿名技術(shù)研究[D];哈爾濱工程大學;2012年

5 葉明全;基于粗糙集理論的隱私保護數(shù)據(jù)挖掘研究[D];合肥工業(yè)大學;2013年

6 任向民;基于K-匿名的隱私保護方法研究[D];哈爾濱工程大學;2012年

7 劉華玲;基于完備空間數(shù)據(jù)擾動的隱私保護理論方法研究及應用[D];東華大學;2013年

8 朱澤德;網(wǎng)絡(luò)雙語語料挖掘關(guān)鍵技術(shù)研究[D];中國科學技術(shù)大學;2014年

9 張浩;基于位置服務(wù)的信息隱私保護技術(shù)研究[D];中國科學技術(shù)大學;2014年

相關(guān)碩士學位論文 前10條

1 趙蓮;大規(guī)模中英可比較語料庫構(gòu)建[D];大連理工大學;2010年

2 謝鳳宏;基于復雜網(wǎng)絡(luò)理論的文本聚類和關(guān)鍵詞提取方法研究[D];遼寧師范大學;2011年

3 王馳;基于海量網(wǎng)絡(luò)輿情信息的熱點發(fā)現(xiàn)[D];電子科技大學;2011年

4 劉成帥;中文領(lǐng)域術(shù)語自動獲取方法的研究[D];南京郵電大學;2011年

5 姜舟;關(guān)鍵短語抽取及相關(guān)技術(shù)研究[D];哈爾濱工業(yè)大學;2010年

6 王浩成;基于細菌覓食優(yōu)化的k-medoids文本聚類方法[D];河北大學;2011年

7 宋宇峰;一種基于DB&IR的融合查詢機制的研究與實現(xiàn)[D];南京農(nóng)業(yè)大學;2010年

8 謝晉;基于詞跨度的中文文本關(guān)鍵詞提取及在文本分類中的應用[D];浙江工業(yè)大學;2011年

9 賈洪強;面向海量短文本的輿情系統(tǒng)實現(xiàn)[D];北京郵電大學;2012年

10 徐文海;文本單元向知識單元轉(zhuǎn)化的模型與映射算法[D];西安電子科技大學;2008年



本文編號:2471245

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/guanlilunwen/ydhl/2471245.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cd11e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com