中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

面向網(wǎng)絡(luò)評論信息的自動摘要技術(shù)研究與應(yīng)用

發(fā)布時間:2024-10-04 21:46
  隨著智能互聯(lián)網(wǎng)時代的到來,人們大量使用移動設(shè)備對購物、旅游等活動發(fā)表自己的看法和評論。這些評論的數(shù)目急速增長,很多網(wǎng)站的評論數(shù)目達(dá)到千萬量級甚至更多。由于數(shù)量巨大,用戶在瀏覽時非常費(fèi)時,急需對大量評論做有效摘要以緩解閱讀壓力。不同于一般的文本摘要,在對評論進(jìn)行摘要時,用戶對評論對象的aspect以及相應(yīng)的評價意見信息尤為關(guān)注,因此,需要特別進(jìn)行這些信息的抽取和挖掘,并在此基礎(chǔ)上開展評論的摘要。為此,本文在分析相關(guān)工作的基礎(chǔ)上,從評論信息抽取和摘要兩方面開展工作,其主要內(nèi)容包括:提出了一種基于多關(guān)聯(lián)自舉的評論信息抽取算法。定義并量化了評論句中三種aspect詞和意見詞之間的關(guān)聯(lián)關(guān)系,基于此構(gòu)建了半監(jiān)督自舉算法。該算法首先從給定的評論語料中抽取一組候選aspect詞和一組候選意見詞作為初始種子集,依據(jù)定義的三種關(guān)聯(lián)關(guān)系,循環(huán)提取與種子集合有強(qiáng)關(guān)聯(lián)的詞語。實(shí)驗(yàn)結(jié)果顯示在手機(jī)評論語料集上的F-measure為78.8%,比基線DP模型高9.6%,表明算法能夠較有效提取aspect詞及其對應(yīng)的意見詞,且實(shí)驗(yàn)對比曲線表明算法對于種子集的規(guī)模要求較低,降低了標(biāo)注成本。提出了一種基于潛在狄利克雷(LDA...

【文章頁數(shù)】:112 頁

【學(xué)位級別】:博士

【文章目錄】:
摘要
ABSTRACT
第一章. 引言
    1.1 研究背景及意義
    1.2 研究現(xiàn)狀
        1.2.1 評論分析
        1.2.2 文本自動摘要
        1.2.3 問題分析
    1.3 研究內(nèi)容與貢獻(xiàn)
    1.4 章節(jié)安排
第二章. 基礎(chǔ)模型
    2.1 隱馬爾可夫模型
    2.2 主題模型
        2.2.1 隱含狄利克雷分布
        2.2.2 Gibbs抽樣及推理
        2.2.3 句法建模
        2.2.4 利用HMM的LDA模型
    2.3 深度學(xué)習(xí)
        2.3.1 LSTM模型
        2.3.2 注意力機(jī)制
    2.4 本章小結(jié)
第三章. 基于多關(guān)聯(lián)自舉的評論信息抽取算法
    3.1 引言
    3.2 任務(wù)描述
        3.2.1 描述
        3.2.2 符號說明
    3.3 算法描述
        3.3.1 三種關(guān)聯(lián)關(guān)系
        3.3.2 兩種量化關(guān)聯(lián)關(guān)系模型
        3.3.3 基于多關(guān)聯(lián)的自舉算法
    3.4 實(shí)驗(yàn)
        3.4.1 實(shí)驗(yàn)數(shù)據(jù)
        3.4.2 實(shí)驗(yàn)設(shè)置
        3.4.3 實(shí)驗(yàn)結(jié)果及分析
    3.5 本章小結(jié)
第四章. 基于LDA的評論信息主題建模
    4.1 引言
    4.2 基于LDA的評論信息主題建模
        4.2.1 模型簡介
        4.2.2 符號說明及模型的圖表示
        4.2.3 模型的形式化描述
    4.3 推理方法
    4.4 超參數(shù)估計
    4.5 實(shí)驗(yàn)
        4.5.1 實(shí)驗(yàn)數(shù)據(jù)
        4.5.2 實(shí)驗(yàn)設(shè)置
        4.5.3 實(shí)驗(yàn)結(jié)果及分析
    4.6 本章小結(jié)
第五章. 基于層次注意力機(jī)制的摘要句子提取
    5.1 引言
    5.2 模型
        5.2.1 句子編碼器
        5.2.2 文檔編碼器
        5.2.3 句子輸出器
        5.2.4 摘要句子排序
    5.3 實(shí)驗(yàn)
        5.3.1 實(shí)驗(yàn)數(shù)據(jù)
        5.3.2 實(shí)驗(yàn)設(shè)置
        5.3.3 摘要的評估方法
        5.3.4 實(shí)驗(yàn)結(jié)果及分析
    5.4 本章小結(jié)
第六章. 在線評論的自動摘要原型系統(tǒng)實(shí)現(xiàn)
    6.1 原型系統(tǒng)
        6.1.1 系統(tǒng)設(shè)計
        6.1.2 系統(tǒng)實(shí)現(xiàn)
    6.2 摘要的層次展示設(shè)計
        6.2.1 摘要句子相似度測量
        6.2.2 摘要中的子主題聚類
        6.2.3 聚類結(jié)果及分析
    6.3 系統(tǒng)展示
    6.4 本章小結(jié)
第七章. 總結(jié)與展望
    7.1 工作總結(jié)
    7.2 下一步研究展望
參考文獻(xiàn)
附錄一 縮略詞表
附錄二 TripAdvisor數(shù)據(jù)集aspect詞
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄



本文編號:4007181

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/ruanjiangongchenglunwen/4007181.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2b335***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com