山西朔州方言語音識別方法研究

發(fā)布時間：2024-03-05 06:25

　　語音作為人機交互的最重要的手段和研究形勢之一,隨著科學(xué)技術(shù)的發(fā)展,自動語音識別(Automatic Speech Recognition,ASR)已經(jīng)應(yīng)用于日常生活之中。但目前山西朔州的語音識別系統(tǒng)大多為普通話識別,各地方言用戶只有以近似標(biāo)準(zhǔn)的普通話發(fā)音才能得到較好的識別結(jié)果。加之方言語音語料數(shù)據(jù)采集成本高,僅有少量的資源可用于研究。在低資源條件下的語音識別相關(guān)系統(tǒng)識別率低。所以為滿足大眾的交互需求和實現(xiàn)高識別率,針對山西朔州方言的研究與應(yīng)用就顯得十分必要。在此背景下,本文一方面對現(xiàn)有的模型進(jìn)進(jìn)行對比,另一方面對低資源數(shù)據(jù)進(jìn)行整理,從而提高山西朔州方言的語音識別系統(tǒng)識別率。首先,本文對語音識別的發(fā)展史和基本原理進(jìn)行了簡要的介紹,隨后對語音識別從模擬信號的處理到聲學(xué)模型的構(gòu)建以及識別等每一項關(guān)鍵技術(shù)進(jìn)行了闡述。之后,對聲學(xué)模型和語言模型進(jìn)行著重研究,包括:高斯混合模型和隱馬爾可夫模型(GMM-HMM)、基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型(DNN-HMM)以及N-gram等模型。最后,本文對山西朔州方言的語言特征、低資源和小區(qū)域進(jìn)行了分析研究,對各個模型下山西朔州方言的識別進(jìn)行了對比實驗。本文共搭...

【文章頁數(shù)】：69 頁

【學(xué)位級別】：碩士

【部分圖文】：

圖1-1語音識別系統(tǒng)基本框架

中北大學(xué)學(xué)位論文41.3語音識別系統(tǒng)的框架簡單來說，語音識別就是將一段音頻例如一條語音，一段電話，通過目前已有的一系列技術(shù)操作，將語音序列識別為對應(yīng)的單詞或者漢字。目前基于統(tǒng)計的模式識別是一種主流方法。給定觀察序列O={1,2,…,},然后采用MAP求解最優(yōu)序列:)|(maxar....

圖1-2方言下的語音識別框架圖

中北大學(xué)學(xué)位論文7通話的語音識別對方言識別率較低，人機交互低，對工作的效率影響較大，因此本文研究方言識別用于地方語音識別來提高人機交互性能。圖1-2方言下的語音識別框架圖Fig1-2Dialectspeechrecognitionframework1.6論文主要研究內(nèi)容和工作安排....

圖2-2預(yù)加重之后對比圖

中北大學(xué)學(xué)位論文102.1.2語音信號中的預(yù)加重通過研究分析人體發(fā)音器官及語音信號可知，由于受到聲門激勵和口鼻輻射的影響，單位頻帶內(nèi)的語音信號功率，將會從800HZ以上的高頻段信號按6dB/倍頻程跌落[23]，因此需要預(yù)加重處理。在語音信號數(shù)字化處理之后，使用一階數(shù)字濾波器實現(xiàn)[....

圖2-3三個窗口圖

中北大學(xué)學(xué)位論文11深入研究語音分析，所以假設(shè)這個短時平穩(wěn)信號存在。分幀是為了能讓語音信號可以通過使用穩(wěn)定的信號處理辦法。為了得到短時的語音信號，就需要進(jìn)行加窗操作，加窗操作也可以防止頻域的泄露。將窗函數(shù)的寬度定義為語音的幀長。窗函數(shù)每在語音信號中滑動一截，語音信號就分為一幀，重....

本文編號：3919822

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://lk138.cn/shoufeilunwen/xixikjs/3919822.html

上一篇：引進(jìn)版日本文學(xué)類圖書出版研究
下一篇：面向深度學(xué)習(xí)模型的安全測試平臺的研究與實現(xiàn)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

山西朔州方言語音識別方法研究