中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

基于商業(yè)知識圖譜的新聞輿情系統(tǒng)設(shè)計與實現(xiàn)

發(fā)布時間:2021-01-11 09:09
  在當今信息化社會,輿情分析的主戰(zhàn)場從傳統(tǒng)媒體轉(zhuǎn)移到了以論壇、網(wǎng)絡(luò)新聞、微博等為代表的網(wǎng)絡(luò)媒體。這些網(wǎng)絡(luò)媒體主要以文本形式存在,具有信息突發(fā)性強、傳播速度快、片面性強、報道存在偏差等特點,在商業(yè)領(lǐng)域有舉足輕重的影響,尤其是權(quán)威媒體發(fā)布的新聞,往往對商業(yè)領(lǐng)域的企業(yè)或個人決策造成影響;谏虡I(yè)領(lǐng)域的需要,本文提出了一個基于商業(yè)領(lǐng)域知識圖譜的新聞輿情系統(tǒng)。系統(tǒng)組成部分有爬蟲系統(tǒng)、知識圖譜、數(shù)據(jù)挖掘模塊,其中數(shù)據(jù)挖掘模塊由實體鏈接和情感分析模塊組成。本文的主要貢獻和創(chuàng)新如下:(1)為了保證商業(yè)輿情分析從文本識別實體的準確性,并解決傳統(tǒng)基于支持向量機SVM或PageRank的方法需要手工提取特征、構(gòu)建周期長、人力成本高的問題,本文提出了結(jié)合知識圖譜的實體鏈接方法。方法首先對知識圖譜進行需求分析,對知識圖譜的概念、實體、準則(Schema)進行定義,并構(gòu)建商業(yè)領(lǐng)域的知識圖譜,其中包含實體的稱呼、屬性以及實體之間的關(guān)系;接著基于實體的信息,使用神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)文本到知識圖譜的鏈接。(2)為了保證輿情系統(tǒng)正確識別新聞等長文本對實體造成的影響,并解決傳統(tǒng)基于支持向量機SVM、邏輯回歸等對于特定實體情感分... 

【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景
    1.2 研究現(xiàn)狀
    1.3 主要研究內(nèi)容
    1.4 論文章節(jié)安排
第二章 數(shù)據(jù)挖掘相關(guān)技術(shù)及理論
    2.1 中文分詞技術(shù)
    2.2 文本表示
        2.2.1 詞袋模型
        2.2.2 詞的分布式表示法
    2.3 實體鏈接
        2.3.1 指稱識別
        2.3.2 實體消歧
    2.4 情感分析
        2.4.1 文本整體情感分析
        2.4.2 特定目標情感分析
        2.4.3 基于方面情感分析
    2.5 神經(jīng)網(wǎng)絡(luò)模型
        2.5.1 卷積神經(jīng)網(wǎng)絡(luò)
        2.5.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.5.3 Transformer中的self-attention
第三章 基于神經(jīng)網(wǎng)絡(luò)的實體鏈接模型
    3.1 商業(yè)知識圖譜構(gòu)建
        3.1.1 需求分析
        3.1.2 數(shù)據(jù)采集
    3.2 實體鏈接模型
        3.2.1 基于詞典的指稱識別
        3.2.2 文本預(yù)處理
        3.2.3 實體消歧GBLL模型
        3.2.4 實驗結(jié)果及分析
    3.3 實體鏈接模塊測試
    3.4 本章小結(jié)
第四章 基于神經(jīng)網(wǎng)絡(luò)的情感分析模型
    4.1 特定實體相關(guān)內(nèi)容提取
    4.2 文本預(yù)處理
    4.3 基于神經(jīng)網(wǎng)絡(luò)的情感分析模型
        4.3.1 情感分析模型結(jié)構(gòu)
        4.3.2 情感編碼器
        4.3.3 損失函數(shù)
    4.4 實驗結(jié)果分析
        4.4.1 實驗語料數(shù)據(jù)
        4.4.2 情感分析評價指標
        4.4.3 模型參數(shù)與對比實驗設(shè)計
        4.4.4 對比實驗結(jié)果和分析
    4.5 情感分析模塊測試
    4.6 本章小結(jié)
第五章 系統(tǒng)實現(xiàn)
    5.1 系統(tǒng)架構(gòu)設(shè)計與實現(xiàn)
    5.2 知識圖譜存儲和維護
        5.2.1 數(shù)據(jù)的存儲
        5.2.2 知識圖譜維護
    5.3 爬蟲系統(tǒng)
        5.3.1 服務(wù)器組件
        5.3.2 客戶機組件
    5.4 數(shù)據(jù)挖掘模塊
        5.4.1 實體鏈接模塊
        5.4.2 情感分析模塊
    5.5 系統(tǒng)測試
        5.5.1 爬蟲系統(tǒng)測試
        5.5.2 用戶頁面測試
第六章 總結(jié)和展望
參考文獻
致謝


【參考文獻】:
期刊論文
[1]漢語詞語情感傾向自動判斷研究[J]. 張靖,金浩.  計算機工程. 2010(23)
[2]中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J]. 柳位平,朱艷輝,栗春亮,向華政,文志強.  計算機應(yīng)用. 2009(10)
[3]面向互聯(lián)網(wǎng)評論情感分析的中文主觀性自動判別方法研究[J]. 葉強,張紫瓊,羅振雄.  信息系統(tǒng)學(xué)報. 2007(01)
[4]基于HowNet的詞匯語義傾向計算[J]. 朱嫣嵐,閔錦,周雅倩,黃萱菁,吳立德.  中文信息學(xué)報. 2006(01)

碩士論文
[1]基于深度學(xué)習(xí)的短文本分類研究[D]. 胡可奇.電子科技大學(xué) 2018
[2]網(wǎng)絡(luò)輿情分析關(guān)鍵技術(shù)研究與實現(xiàn)[D]. 吳娛.電子科技大學(xué) 2011



本文編號:2970494

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/shekelunwen/shgj/2970494.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2bd66***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com