国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

當(dāng)前位置:主頁 > 文藝論文 > 語言學(xué)論文 >

面向“校園百事通”的藏文問題分類研究

發(fā)布時間:2020-11-21 13:13
   當(dāng)前問答系統(tǒng)已經(jīng)成為廣大院校和研究機構(gòu)的一個研究熱點,而研究問題分類是做好問答系統(tǒng)的前提。如今中文問題分類的研究已經(jīng)趨于成熟,對于藏文問題分類的研究則寥寥無幾。本文選擇西北民族大學(xué)這個特定領(lǐng)域,研究民族院校問答系統(tǒng)中藏文問題分析模塊中的問題分類。本文首先分析了藏文問句與普通文本的區(qū)別以及藏文問句的特點,然后結(jié)合問題集的特點對現(xiàn)有的語料進行分類。由于本文所使用的語料是來自西北民族大學(xué)的藏文校園問題集,考慮到本文的語料較小,且問句較短,特征較少,若將類別劃分的太細(xì)則導(dǎo)致特征無法識別,類與類之間區(qū)分度降低。文章將全部問題共劃分為四大類。這四大類分別為學(xué)校概況、教育教學(xué)、民大文化和服務(wù)保障。將語料整理完成之后就是對語料進行預(yù)處理,文章采用了西北民族大學(xué)祁坤鈺老師的藏文分詞系統(tǒng)進行分詞處理。其次本文在問題文本表示方面選擇了詞向量表示方法,用word2vec技術(shù)中Skip-gram模型將問題文本轉(zhuǎn)化為低維且稠密的詞向量。該方法可以解決因維數(shù)稀疏造成的維數(shù)災(zāi)難問題,同時也可以用來衡量詞與詞之間的相似性。問題文本轉(zhuǎn)化為詞向量表達(dá)形式后,將每條問題以二維矩陣的形式輸入到卷積神經(jīng)網(wǎng)絡(luò)模型中去。文章根據(jù)問題集的特點和大小將卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)設(shè)計為一個輸入層、一個卷積層、一個池化層和一個全連接層。在CNN模型中用卷積層和池化層提取問句特征,最后用softmax分類器完成問句分類的工作。為了證明卷積神經(jīng)網(wǎng)絡(luò)對藏文問題分類的效果,文章將其與機器學(xué)習(xí)中樸素貝葉斯和KNN分類方法進行了對比。實驗結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)模型的分類效果優(yōu)于機器學(xué)習(xí),對藏文問題分類具有良好的效果。
【學(xué)位單位】:西北民族大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:H214;TP391.1
【部分圖文】:

網(wǎng)絡(luò)結(jié)構(gòu)圖,局部連接,平移不變性,感受野


4.2 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)其實是一種前饋神經(jīng)網(wǎng)絡(luò),是通過生物學(xué)中的感受野機制所出的。具有局部連接、權(quán)值共享和子采樣的特點,這三個特點使得模型參數(shù)少,并具有平移不變性。卷積神經(jīng)網(wǎng)絡(luò) CNN的網(wǎng)絡(luò)結(jié)構(gòu)如圖 2.1 所示。

語料,搜集與整理,問題集,藏文


圖 3.1 中文版問題語料本文是先搜集與整理的中文版問題集,然后本文將中文版的問題語料藏文版,其藏文版的問題集格式如圖 3.2所示。圖 3.2 藏文版問題語料由于本文主要是研究藏文版西北民族大學(xué)的校園問題集,屬于特定領(lǐng)

搜集與整理,語料,問題集,藏文


藏文版問題語料由于本文主要是研究藏文版西北民族大學(xué)的校園問題集,屬于特定領(lǐng)域問
【參考文獻】

相關(guān)期刊論文 前8條

1 柔特;;藏文問答系統(tǒng)中問句的分類方法研究[J];計算機工程與科學(xué);2015年07期

2 熊富林;鄧怡豪;唐曉晟;;Word2vec的核心架構(gòu)及其應(yīng)用[J];南京師范大學(xué)學(xué)報(工程技術(shù)版);2015年01期

3 周練;;Word2vec的工作原理及應(yīng)用探究[J];科技情報開發(fā)與經(jīng)濟;2015年02期

4 袁曉潔;師建興;寧華;于士濤;;問題分類中基于句法和語義信息的特征選擇[J];計算機工程與應(yīng)用;2008年33期

5 祁坤鈺;;信息處理用藏文自動分詞研究[J];西北民族大學(xué)學(xué)報(哲學(xué)社會科學(xué)版);2006年04期

6 格桑央京;;漢語藏語疑問句對比[J];西北民族大學(xué)學(xué)報(哲學(xué)社會科學(xué)版);2006年02期

7 文勖;張宇;劉挺;馬金山;;基于句法結(jié)構(gòu)分析的中文問題分類[J];中文信息學(xué)報;2006年02期

8 張宇,劉挺,文勖;基于改進貝葉斯模型的問題分類[J];中文信息學(xué)報;2005年02期


相關(guān)博士學(xué)位論文 前2條

1 焦志成;基于卷積神經(jīng)網(wǎng)絡(luò)的生物醫(yī)學(xué)信號分類與重構(gòu)[D];西安電子科技大學(xué);2018年

2 周小強;基于深度學(xué)習(xí)的交互式問答技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2017年


相關(guān)碩士學(xué)位論文 前10條

1 齊凱凡;基于卷積神經(jīng)網(wǎng)絡(luò)的新聞文本分類問題研究[D];西安理工大學(xué);2018年

2 程穎濤;基于深度學(xué)習(xí)的自然語言處理中問題分析的研究[D];西安郵電大學(xué);2018年

3 李鴻宇;養(yǎng)老保險領(lǐng)域問答系統(tǒng)關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2018年

4 張倩;問句分類方法及其在問答系統(tǒng)中的應(yīng)用研究[D];鄭州大學(xué);2018年

5 劉洋;基于深度學(xué)習(xí)的問題分類組合模型研究[D];華中師范大學(xué);2018年

6 高森;農(nóng)業(yè)問答系統(tǒng)中問題分類和相似度計算的研究[D];中國科學(xué)技術(shù)大學(xué);2018年

7 崔霞霞;基于機器學(xué)習(xí)的分類問題研究[D];中北大學(xué);2018年

8 謝文杰;基于卷積神經(jīng)網(wǎng)絡(luò)的問句分類研究[D];安徽大學(xué);2018年

9 王前;基于卷積神經(jīng)網(wǎng)絡(luò)的中文問句分類方法研究[D];昆明理工大學(xué);2018年

10 王子木;基于語義網(wǎng)的站內(nèi)搜索引擎模塊的研究與實現(xiàn)[D];華北電力大學(xué);2018年



本文編號:2893051

資料下載
論文發(fā)表

本文鏈接:http://lk138.cn/wenyilunwen/yuyanxuelw/2893051.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶59345***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
海外三级网站| 国产农村妇女AA片多毛| 亚洲欧美色色色色| 亚洲成人97一区| 日韩美女被黑人后插入| 国产,亚州,欧美另类超级乱伦视频| 男人免费视频小说| 99久久久精品伊人大线蕉| 日韩欧美一区二区黄片| 欧美一区 亚洲一区| 久久近距离鸡巴在线看| 九九在线免费视频| 极品人妻国产| 91论坛一区二区| 国产AV美国AV| 久久午夜免费| 国产高清午夜视频网站| 伊人一二三av| 日韩精品91亚洲二区在线观看| 三级久久性| 665566综合日韩精品| 欧美亚洲 porn| 日本久久久久久一级片| 欧美AⅤ午夜一区二区三区| 日日伦理久久久| 欧美二区第7页| 一级aⅴ日本美国| 亚洲中文字幕久久在线| 欧洲免费独立网站一区二区三区| 黄色影片中文字幕| 日本a观看不卡| 日本不拉一区二区| 婷婷久久不卡热| www性欧美| 超碰成人地址一地址二| 蜜臀av性久久久久蜜臀aⅴ流畅| 自拍偷拍三| 91青青草免费| 人妻被下药一区二区三区| 亚洲av网站在线观看大全| 日韩无码调教拘束拷问综合网|