中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

面向“問題-方法”利用的科技文本知識挖掘研究

發(fā)布時間:2024-07-10 20:31
  科技文本內(nèi)容的分析和利用一直是情報學(xué)科研究的關(guān)鍵問題。當(dāng)前,科學(xué)技術(shù)進入快速發(fā)展階段,各領(lǐng)域積累了大量科技文獻,傳統(tǒng)以文獻為粒度的文本挖掘方式不利于用戶獲取和利用科技文獻中的知識內(nèi)容。為更深入有效地利用科技文本,就必須突破這種以單篇文本為粒度的挖掘方案,從更細(xì)粒度的角度深入到對科技文本潛在知識內(nèi)容的挖掘?萍嘉谋镜耐诰蚝屠脤φ麄科學(xué)的發(fā)展起著重要的作用,特別是人們所重點關(guān)注的科技文本中的研究問題、解決方法等細(xì)粒度、深層次內(nèi)容,這些都是人類重要的知識積累。鑒于此,本文面向科技論文中“問題-方法”相關(guān)知識的利用,進行科技文本的知識挖掘研究,具體分為兩個部分,包括知識單元和知識關(guān)聯(lián),對于一個特定領(lǐng)域的細(xì)粒度知識挖掘,它們常分別對應(yīng)于實體和實體關(guān)系。本文以人工智能領(lǐng)域為實證對象,以科技文獻摘要為數(shù)據(jù)源,進行“研究問題”、“解決方法”對應(yīng)的知識單元與知識關(guān)聯(lián)抽取研究。綜合使用基于通用神經(jīng)網(wǎng)絡(luò)(如Bi-LSTM)的方法和基于預(yù)訓(xùn)練語言模型(如BERT、Sci Bert)的方法,開展研究問題、解決方法實體的識別和抽取研究,并綜合比較各模型在人工智能領(lǐng)域?qū)嶓w識別上的效果。隨后,以人工智能領(lǐng)域知識演化...

【文章頁數(shù)】:80 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖3.1科技文獻摘要中的問題和方法示例

圖3.1科技文獻摘要中的問題和方法示例

3人工智能領(lǐng)域科技文本研究問題和解決方法實體識別碩士學(xué)位論文掘的精準(zhǔn)性以及文本處理的高效性優(yōu)勢,其任務(wù)實質(zhì)為序列標(biāo)注問題。


圖3.3LSTM網(wǎng)絡(luò)單元結(jié)構(gòu)圖[92]

圖3.3LSTM網(wǎng)絡(luò)單元結(jié)構(gòu)圖[92]

3人工智能領(lǐng)域科技文本研究問題和解決方法實體識別碩士學(xué)位論文20長距離依賴關(guān)系。在t時刻單個LSTM網(wǎng)絡(luò)單元的更新公式如式(3.1)所示。=(++(1)+)=(++(1)+)=(++(1)+)=(++(1)+)=(1)+=()其中,W和b分別表示權(quán)重矩陣和偏置矩陣,it、ft、o....


圖3.7BERTCRF結(jié)構(gòu)示意圖[46]

圖3.7BERTCRF結(jié)構(gòu)示意圖[46]

3人工智能領(lǐng)域科技文本研究問題和解決方法實體識別碩士學(xué)位論文243.3.2基于預(yù)訓(xùn)練語言模型的方法由綜述部分可知,BERT是在大規(guī)模語料上預(yù)訓(xùn)練所得,蘊含豐富的文本語義信息;诖,在應(yīng)用到本文研究問題和解決方法實體識別任務(wù)中,想必可起到不錯的效果。實踐中,文本輸入包括三方面內(nèi)容....


圖3.8實驗部分語料導(dǎo)入示意圖

圖3.8實驗部分語料導(dǎo)入示意圖

3人工智能領(lǐng)域科技文本研究問題和解決方法實體識別碩士學(xué)位論文26圖3.8實驗部分語料導(dǎo)入示意圖圖3.9實驗部分語料基于種子詞的自動初標(biāo)注示意圖



本文編號:4004692

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/tushudanganlunwen/4004692.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶746d4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com