中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

面向“校園百事通”的藏文問題分類研究

發(fā)布時(shí)間:2020-11-21 13:13
   當(dāng)前問答系統(tǒng)已經(jīng)成為廣大院校和研究機(jī)構(gòu)的一個(gè)研究熱點(diǎn),而研究問題分類是做好問答系統(tǒng)的前提。如今中文問題分類的研究已經(jīng)趨于成熟,對(duì)于藏文問題分類的研究則寥寥無幾。本文選擇西北民族大學(xué)這個(gè)特定領(lǐng)域,研究民族院校問答系統(tǒng)中藏文問題分析模塊中的問題分類。本文首先分析了藏文問句與普通文本的區(qū)別以及藏文問句的特點(diǎn),然后結(jié)合問題集的特點(diǎn)對(duì)現(xiàn)有的語(yǔ)料進(jìn)行分類。由于本文所使用的語(yǔ)料是來自西北民族大學(xué)的藏文校園問題集,考慮到本文的語(yǔ)料較小,且問句較短,特征較少,若將類別劃分的太細(xì)則導(dǎo)致特征無法識(shí)別,類與類之間區(qū)分度降低。文章將全部問題共劃分為四大類。這四大類分別為學(xué)校概況、教育教學(xué)、民大文化和服務(wù)保障。將語(yǔ)料整理完成之后就是對(duì)語(yǔ)料進(jìn)行預(yù)處理,文章采用了西北民族大學(xué)祁坤鈺老師的藏文分詞系統(tǒng)進(jìn)行分詞處理。其次本文在問題文本表示方面選擇了詞向量表示方法,用word2vec技術(shù)中Skip-gram模型將問題文本轉(zhuǎn)化為低維且稠密的詞向量。該方法可以解決因維數(shù)稀疏造成的維數(shù)災(zāi)難問題,同時(shí)也可以用來衡量詞與詞之間的相似性。問題文本轉(zhuǎn)化為詞向量表達(dá)形式后,將每條問題以二維矩陣的形式輸入到卷積神經(jīng)網(wǎng)絡(luò)模型中去。文章根據(jù)問題集的特點(diǎn)和大小將卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)設(shè)計(jì)為一個(gè)輸入層、一個(gè)卷積層、一個(gè)池化層和一個(gè)全連接層。在CNN模型中用卷積層和池化層提取問句特征,最后用softmax分類器完成問句分類的工作。為了證明卷積神經(jīng)網(wǎng)絡(luò)對(duì)藏文問題分類的效果,文章將其與機(jī)器學(xué)習(xí)中樸素貝葉斯和KNN分類方法進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)模型的分類效果優(yōu)于機(jī)器學(xué)習(xí),對(duì)藏文問題分類具有良好的效果。
【學(xué)位單位】:西北民族大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:H214;TP391.1
【部分圖文】:

網(wǎng)絡(luò)結(jié)構(gòu)圖,局部連接,平移不變性,感受野


4.2 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)其實(shí)是一種前饋神經(jīng)網(wǎng)絡(luò),是通過生物學(xué)中的感受野機(jī)制所出的。具有局部連接、權(quán)值共享和子采樣的特點(diǎn),這三個(gè)特點(diǎn)使得模型參數(shù)少,并具有平移不變性。卷積神經(jīng)網(wǎng)絡(luò) CNN的網(wǎng)絡(luò)結(jié)構(gòu)如圖 2.1 所示。

語(yǔ)料,搜集與整理,問題集,藏文


圖 3.1 中文版問題語(yǔ)料本文是先搜集與整理的中文版問題集,然后本文將中文版的問題語(yǔ)料藏文版,其藏文版的問題集格式如圖 3.2所示。圖 3.2 藏文版問題語(yǔ)料由于本文主要是研究藏文版西北民族大學(xué)的校園問題集,屬于特定領(lǐng)

搜集與整理,語(yǔ)料,問題集,藏文


藏文版問題語(yǔ)料由于本文主要是研究藏文版西北民族大學(xué)的校園問題集,屬于特定領(lǐng)域問
【參考文獻(xiàn)】

相關(guān)期刊論文 前8條

1 柔特;;藏文問答系統(tǒng)中問句的分類方法研究[J];計(jì)算機(jī)工程與科學(xué);2015年07期

2 熊富林;鄧怡豪;唐曉晟;;Word2vec的核心架構(gòu)及其應(yīng)用[J];南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版);2015年01期

3 周練;;Word2vec的工作原理及應(yīng)用探究[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2015年02期

4 袁曉潔;師建興;寧華;于士濤;;問題分類中基于句法和語(yǔ)義信息的特征選擇[J];計(jì)算機(jī)工程與應(yīng)用;2008年33期

5 祁坤鈺;;信息處理用藏文自動(dòng)分詞研究[J];西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2006年04期

6 格桑央京;;漢語(yǔ)藏語(yǔ)疑問句對(duì)比[J];西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2006年02期

7 文勖;張宇;劉挺;馬金山;;基于句法結(jié)構(gòu)分析的中文問題分類[J];中文信息學(xué)報(bào);2006年02期

8 張宇,劉挺,文勖;基于改進(jìn)貝葉斯模型的問題分類[J];中文信息學(xué)報(bào);2005年02期


相關(guān)博士學(xué)位論文 前2條

1 焦志成;基于卷積神經(jīng)網(wǎng)絡(luò)的生物醫(yī)學(xué)信號(hào)分類與重構(gòu)[D];西安電子科技大學(xué);2018年

2 周小強(qiáng);基于深度學(xué)習(xí)的交互式問答技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2017年


相關(guān)碩士學(xué)位論文 前10條

1 齊凱凡;基于卷積神經(jīng)網(wǎng)絡(luò)的新聞文本分類問題研究[D];西安理工大學(xué);2018年

2 程穎濤;基于深度學(xué)習(xí)的自然語(yǔ)言處理中問題分析的研究[D];西安郵電大學(xué);2018年

3 李鴻宇;養(yǎng)老保險(xiǎn)領(lǐng)域問答系統(tǒng)關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2018年

4 張倩;問句分類方法及其在問答系統(tǒng)中的應(yīng)用研究[D];鄭州大學(xué);2018年

5 劉洋;基于深度學(xué)習(xí)的問題分類組合模型研究[D];華中師范大學(xué);2018年

6 高森;農(nóng)業(yè)問答系統(tǒng)中問題分類和相似度計(jì)算的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2018年

7 崔霞霞;基于機(jī)器學(xué)習(xí)的分類問題研究[D];中北大學(xué);2018年

8 謝文杰;基于卷積神經(jīng)網(wǎng)絡(luò)的問句分類研究[D];安徽大學(xué);2018年

9 王前;基于卷積神經(jīng)網(wǎng)絡(luò)的中文問句分類方法研究[D];昆明理工大學(xué);2018年

10 王子木;基于語(yǔ)義網(wǎng)的站內(nèi)搜索引擎模塊的研究與實(shí)現(xiàn)[D];華北電力大學(xué);2018年



本文編號(hào):2893051

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/wenyilunwen/yuyanxuelw/2893051.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶59345***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com