深度學(xué)習(xí)與多元特征相結(jié)合的事件檢測與摘要研究
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1主題模型生成文檔集示例
圖2-1主題模型生成文檔集示例2-1中C表示整個語料庫上的所有詞語在每篇文檔中的概率分布有詞語在每個不同主題下的概率分布矩陣,而Θ則表示所有主題檔下的概率分布矩陣。整個圖2-1通過矩陣相乘的形式示例了按)服從概率分布先生成主題,再根據(jù)主題生成詞語集合,最終生成過程....
圖2-2LDA和BTM模型生成文檔圖例
而文檔d關(guān)于biterm項(xiàng)的條件概率由經(jīng)驗(yàn)統(tǒng)計(jì)獲得,見公式(2jNjjjdbbpbd1##(|)其中代表biterm項(xiàng)jb在文檔d中出現(xiàn)的次數(shù)。通過上述計(jì)算可以獲得每個文檔關(guān)于所有主題的條件概率,由此該文檔的主題分布。因?yàn)椴煌臋n對應(yīng)的biterm集....
圖2-3兩條數(shù)據(jù)構(gòu)建的graph-of-wordsgraph-of-words一旦構(gòu)建完畢,就可以通過k-degeneracy的方式獲得簇內(nèi)關(guān)鍵詞,根據(jù)關(guān)鍵詞的權(quán)重對每條數(shù)據(jù)打分進(jìn)而輔助進(jìn)行摘要環(huán)節(jié)的推文抽取任
圖2-3兩條數(shù)據(jù)構(gòu)建的graph-of-wordsgraph-of-words一旦構(gòu)建完畢,就可以通過k-degeneracy的方式獲得簇內(nèi)關(guān)鍵詞,根據(jù)關(guān)鍵詞的權(quán)重對每條數(shù)據(jù)打分進(jìn)而輔助進(jìn)行摘要環(huán)節(jié)的推文抽取任務(wù)。2.3.2.2k-degeneracy與core....
圖2-4degeneracy示例
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文的k-core即為按權(quán)重降序的top-K個關(guān)鍵詞。4為例,假設(shè)K=5,則根據(jù)上述算法,依次刪),NODE(final),NODE(gotz);剩余的點(diǎn)NODE(win)ni),NODE(argentina),NODE(score)等....
本文編號:4006389
本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/4006389.html