基于文本特征與關(guān)聯(lián)分析的新聞主題句提取研究
發(fā)布時間:2024-11-14 20:36
隨著互聯(lián)網(wǎng)技術(shù)飛速發(fā)展,新聞信息數(shù)量快速增長和傳播。海量新聞信息的產(chǎn)生和迅速傳播豐富了人們的生活,但是也會帶來信息過載問題,人們在獲取信息過程中浪費了大量的時間。隨著人工智能及自然語言處理技術(shù)的發(fā)展,新聞主題句提取研究和應(yīng)用很好的解決了這一問題。新聞主題句提取是自動文本摘要等文本自動處理應(yīng)用的基礎(chǔ)工作,是自然語言處理領(lǐng)域中重要研究課題,其旨在提取出能夠精簡、準(zhǔn)確的描述新聞文檔主旨內(nèi)容的句子,F(xiàn)有的主題句提取研究,大多都基于句子或詞的特征分析提取主題句,僅考慮文本統(tǒng)計特征或者位置特征而忽視文本的語義信息及主題信息,也沒有充分考慮到文本的上下文背景信息,影響了主題句提取的效果。或者基于圖模型分析文檔內(nèi)部句子和詞的關(guān)聯(lián)關(guān)系,以迭代的方式對語句的重要度進(jìn)行排序。普通的圖模型僅表示了句子和詞的二元關(guān)系而忽視了文檔中句子和句子、詞和詞、詞和句子之間存在多元關(guān)系。新聞的主題句不僅是準(zhǔn)確表示新聞主題內(nèi)容的語句,還是新聞文檔中重要的語句;诂F(xiàn)有研究的局限以及新聞主題句的特點,本文提出基于文本特征與關(guān)聯(lián)分析的新聞主題句提取研究方法,將主要從以下兩個方面進(jìn)行研究:1)文本特征提取的研究。從新聞文本向量表示入...
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:4012071
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于文本特征與關(guān)聯(lián)分析的新聞主題句提取研究102)Φ作為每個主題與詞先驗參數(shù)服從Dirichlet(β)分布,即Φ<sup>D</sup>irichlet(β),即表示主題~詞分布,總共抽取K個主題詞。3)對于文本集中的每個文檔d以及每個詞w進(jìn)行如下處理:a)生成一個主題z服從參....
本文編號:4012071
本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/4012071.html
上一篇:基于人工智能的課程答疑系統(tǒng)的研究
下一篇:沒有了
下一篇:沒有了
最近更新
教材專著