国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

貝葉斯統(tǒng)計(jì)在文本挖掘的若干研究

發(fā)布時(shí)間:2020-12-19 00:40
  隨著信息時(shí)代的發(fā)展,越來(lái)越多非結(jié)構(gòu)化的文本信息不斷出現(xiàn),我們需要新的工具來(lái)整理、搜索和理解這些文本信息,以便獲取有價(jià)值的信息。文本挖掘(text mining)是解決這一系列問(wèn)題的有效工具。在文本挖掘中,最常使用的是文本分類(Text classification)。文本分類是文本挖掘中有監(jiān)督的學(xué)習(xí)過(guò)程,目的是基于文檔內(nèi)容將文檔分配到一個(gè)或者多個(gè)預(yù)定義類別。由于文本信息構(gòu)造復(fù)雜性、變化多樣性和高維性,這給文本分類任務(wù)有效地提取文本特征帶來(lái)了極大的挑戰(zhàn)。概率主題模型(probabilistic topic models)是文本挖掘中提取文本特征的有效工具。主要是通過(guò)貝葉斯統(tǒng)計(jì)方法發(fā)現(xiàn)文本中的隱藏語(yǔ)義結(jié)構(gòu),進(jìn)而獲取有效的特征。因此,文本分類和概率主題模型是文本挖掘中非常有意義的研究課題。本文不僅關(guān)注文本分類,并探索了基于貝葉斯非參數(shù)的概率主題模型在文本分類中特征表示及其特征選擇,主要工作如下:(1)波利亞罐子(Polya urn)模型是廣泛應(yīng)用于統(tǒng)計(jì)和文本挖掘的基本模型,大多數(shù)訓(xùn)練模型的算法都非常緩慢和復(fù)雜,因此通常很難適應(yīng)大數(shù)據(jù)集。本文對(duì)波利亞罐子模型的極大似然估計(jì)(MLE)提出了一種新... 

【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:112 頁(yè)

【學(xué)位級(jí)別】:博士

【文章目錄】:
摘要
ABSTRACT(英文摘要)
主要符號(hào)對(duì)照表
第一章 引言
    §1.1 研究背景
    §1.2 研究現(xiàn)狀
        §1.2.1 特征表示與特征選擇
        §1.2.2 機(jī)器學(xué)習(xí)分類方法
        §1.2.3 深度學(xué)習(xí)分類方法
        §1.2.4 主題模型的研究現(xiàn)狀
    §1.3 研究的主要內(nèi)容
第二章 波利亞罐子模型及其在文本分類上的應(yīng)用
    §2.1 引言
    §2.2 波利亞罐子模型
    §2.3 參數(shù)估計(jì)
        §2.3.1 極大似然估計(jì)
        §2.3.2 一個(gè)新的計(jì)算算法
        §2.3.3 極大似然估計(jì)的漸進(jìn)性質(zhì)
    §2.4 隨機(jī)模擬
    §2.5 波利亞罐子模型在文本分類上的應(yīng)用
        §2.5.1 數(shù)據(jù)描述
        §2.5.2 文本預(yù)處理
        §2.5.3 分類方法和評(píng)估準(zhǔn)則
        §2.5.4 結(jié)果比較
    §2.6 定理證明
        §2.6.1 定理3.1的證明
        §2.6.2 定理3.2的證明
第三章 基于分層狄利克雷過(guò)程的圖挖掘主題模型
    §3.1 引言
    §3.2 相關(guān)模型分析
        §3.2.1 隱狄利克雷分配模型
        §3.2.2 圖挖掘模型
        §3.2.3 分層狄利克雷過(guò)程
    §3.3 基于分層狄利克雷過(guò)程的圖挖掘主題模型
    §3.4 后驗(yàn)推斷
    §3.5 實(shí)例分析
        §3.5.1 數(shù)據(jù)描述
        §3.5.2 實(shí)驗(yàn)設(shè)計(jì)
        §3.5.3 評(píng)估準(zhǔn)則
        §3.5.4 結(jié)果分析
        §3.5.5 閾值的選擇
    §3.6 后驗(yàn)分布的推導(dǎo)及相關(guān)定理證明
        §3.6.1 基于分層狄利克雷過(guò)程的圖挖掘主題模型的后驗(yàn)分布推導(dǎo)
        §3.6.2 定理4.1的證明
第四章 基于隱馬爾可夫模型的Pitman-Yor先驗(yàn)概率主題模型
    §4.1 引言
    §4.2 模型及估計(jì)方法
        §4.2.1 符號(hào)
        §4.2.2 Pitman-Yor過(guò)程和相關(guān)的貝葉斯非參數(shù)過(guò)程
    §4.3 相關(guān)的模型
        §4.3.1 隱馬爾可夫主題模型
        §4.3.2 分層Pitman-Yor過(guò)程主題模型
    §4.4 基于隱馬爾可夫模型的Pitman-Yor先驗(yàn)概率主題模型
        §4.4.1 模型構(gòu)建
    §4.5 基于隱馬爾可夫模型的Pitman-Yor先驗(yàn)概率主題模型的變量推斷
        §4.5.1 后驗(yàn)推斷
        §4.5.2 參數(shù)估計(jì)
        §4.5.3 迭代算法的收斂性
    §4.6 實(shí)例分析
        §4.6.1 數(shù)據(jù)集
        §4.6.2 實(shí)驗(yàn)設(shè)置
        §4.6.3 結(jié)果分析
    §4.7 變量推斷的相關(guān)證明
第五章 基于句子的分層Pitman-Yor主題模型
    §5.1 引言
    §5.2 相關(guān)的工作回顧
        §5.2.1 基于句子的隱狄利克雷分配模型
        §5.2.2 Pitman-Yor過(guò)程及分層Pitman-Yor過(guò)程
    §5.3 基于句子的分層Pitman-Yor主題模型
    §5.4 基于句子的分層Pitman-Yor主題模型的后驗(yàn)推斷
    §5.5 實(shí)列分析
        §5.5.1 文本建模
        §5.5.2 文本分類
第六章 結(jié)論與展望
參考文獻(xiàn)
致謝
在學(xué)期間的研究成果及發(fā)表的論文



本文編號(hào):2924913

資料下載
論文發(fā)表

本文鏈接:http://lk138.cn/guanlilunwen/tongjijuecelunwen/2924913.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶80806***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
天天日AV DVD| 日韩AV伦理电影网站| 日韩综合成人一区| 天天爱天天搞天天爽av| 日韩久久日韩| 精品久久xx| 欧美一级黄片一区二区三区| 逼逼被操翻视频| 国产大陆欧美日韩另类| 精品91国产视频| 亚洲综合图片区在线| 色蜜臀91在线| AⅤ天堂伊人| 天天av综合| 亚洲产精无码久久久久久久高韩| AV 综合色色| 91热精品视频| 韩国伦理精品福利视频| 亚洲精品国产区一区| 日本中文一区二区三区免费在线观看| 日本母乳电影久久| 亚洲欧美另类激情在线视频| 欧美精品操逼照片| 欧美在线综合十区| 这里只有精品91麻豆| 成人精品四区| 人妻在家中文字幕精品一区二区三区| 亚洲黄色在线女| 麻豆国产免费| 久久综合99| 天天干天天天爽天天爽天天爽天天| 日本无码人妻丰满熟妇 | 歐美日韓性愛視頻| 少妇AV三区四区| 国产高清久久久资源站| 亚洲精品综合在线影院| 91亚洲成人精品| 国产精品一区二区老师| 午夜99精品小电影| 日韩福利手机在线播放| 久久久久久 九色AV|