中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

山西朔州方言語音識別方法研究

發(fā)布時間:2024-03-05 06:25
  語音作為人機(jī)交互的最重要的手段和研究形勢之一,隨著科學(xué)技術(shù)的發(fā)展,自動語音識別(Automatic Speech Recognition,ASR)已經(jīng)應(yīng)用于日常生活之中。但目前山西朔州的語音識別系統(tǒng)大多為普通話識別,各地方言用戶只有以近似標(biāo)準(zhǔn)的普通話發(fā)音才能得到較好的識別結(jié)果。加之方言語音語料數(shù)據(jù)采集成本高,僅有少量的資源可用于研究。在低資源條件下的語音識別相關(guān)系統(tǒng)識別率低。所以為滿足大眾的交互需求和實現(xiàn)高識別率,針對山西朔州方言的研究與應(yīng)用就顯得十分必要。在此背景下,本文一方面對現(xiàn)有的模型進(jìn)進(jìn)行對比,另一方面對低資源數(shù)據(jù)進(jìn)行整理,從而提高山西朔州方言的語音識別系統(tǒng)識別率。首先,本文對語音識別的發(fā)展史和基本原理進(jìn)行了簡要的介紹,隨后對語音識別從模擬信號的處理到聲學(xué)模型的構(gòu)建以及識別等每一項關(guān)鍵技術(shù)進(jìn)行了闡述。之后,對聲學(xué)模型和語言模型進(jìn)行著重研究,包括:高斯混合模型和隱馬爾可夫模型(GMM-HMM)、基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型(DNN-HMM)以及N-gram等模型。最后,本文對山西朔州方言的語言特征、低資源和小區(qū)域進(jìn)行了分析研究,對各個模型下山西朔州方言的識別進(jìn)行了對比實驗。本文共搭...

【文章頁數(shù)】:69 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖1-1語音識別系統(tǒng)基本框架

圖1-1語音識別系統(tǒng)基本框架

中北大學(xué)學(xué)位論文41.3語音識別系統(tǒng)的框架簡單來說,語音識別就是將一段音頻例如一條語音,一段電話,通過目前已有的一系列技術(shù)操作,將語音序列識別為對應(yīng)的單詞或者漢字。目前基于統(tǒng)計的模式識別是一種主流方法。給定觀察序列O={1,2,…,},然后采用MAP求解最優(yōu)序列:)|(maxar....


圖1-2方言下的語音識別框架圖

圖1-2方言下的語音識別框架圖

中北大學(xué)學(xué)位論文7通話的語音識別對方言識別率較低,人機(jī)交互低,對工作的效率影響較大,因此本文研究方言識別用于地方語音識別來提高人機(jī)交互性能。圖1-2方言下的語音識別框架圖Fig1-2Dialectspeechrecognitionframework1.6論文主要研究內(nèi)容和工作安排....


圖2-2預(yù)加重之后對比圖

圖2-2預(yù)加重之后對比圖

中北大學(xué)學(xué)位論文102.1.2語音信號中的預(yù)加重通過研究分析人體發(fā)音器官及語音信號可知,由于受到聲門激勵和口鼻輻射的影響,單位頻帶內(nèi)的語音信號功率,將會從800HZ以上的高頻段信號按6dB/倍頻程跌落[23],因此需要預(yù)加重處理。在語音信號數(shù)字化處理之后,使用一階數(shù)字濾波器實現(xiàn)[....


圖2-3三個窗口圖

圖2-3三個窗口圖

中北大學(xué)學(xué)位論文11深入研究語音分析,所以假設(shè)這個短時平穩(wěn)信號存在。分幀是為了能讓語音信號可以通過使用穩(wěn)定的信號處理辦法。為了得到短時的語音信號,就需要進(jìn)行加窗操作,加窗操作也可以防止頻域的泄露。將窗函數(shù)的寬度定義為語音的幀長。窗函數(shù)每在語音信號中滑動一截,語音信號就分為一幀,重....



本文編號:3919822

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/shoufeilunwen/xixikjs/3919822.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7b7d1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com