基于HMM和DNN混合模型研究的語音識(shí)別技術(shù)

發(fā)布時(shí)間：2024-06-29 00:14

　　隨著大數(shù)據(jù)和人工智能的快速發(fā)展,語音識(shí)別的相關(guān)應(yīng)用變得越來越普及,如今很多電子產(chǎn)品都通過語音交互進(jìn)行操作,這讓人們更加方便地享受到了現(xiàn)代化智能服務(wù)。如何更加高效的實(shí)現(xiàn)語音交互,減少噪聲對(duì)系統(tǒng)識(shí)別性能的影響,提高系統(tǒng)的識(shí)別準(zhǔn)確性是研究的重點(diǎn)所在。本文首先研究了語音信號(hào)的預(yù)處理和特征參數(shù)提取過程,針對(duì)梅爾頻率倒譜系數(shù)(MFCC)只能反映聲音信號(hào)的靜態(tài)特性,而經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)能夠更細(xì)致地刻畫信號(hào)的非平穩(wěn)特性,本文將EMD融入到MFCC特征提取中。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的特征參數(shù)提取方法有效地提高了系統(tǒng)的識(shí)別效果,在不同的信噪比下識(shí)別率最大提高了3.15%。在傳統(tǒng)的聲學(xué)建模中,高斯混合模型(GMM)和隱馬爾科夫(HMM)混合模型一直占主導(dǎo)地位,本文在MATLAB上建立小詞匯量識(shí)別系統(tǒng)進(jìn)行實(shí)驗(yàn),對(duì)比分析可得GMM-HMM相對(duì)于單一的HMM來說,對(duì)訓(xùn)練數(shù)據(jù)量的要求不高且具有更好的識(shí)別性能。針對(duì)GMM對(duì)復(fù)雜數(shù)據(jù)的建模能力不足的問題,在此混合模型的基礎(chǔ)上采用具有更強(qiáng)建模能力的深度神經(jīng)網(wǎng)絡(luò)(DNN)來代替GMM得到新的模型結(jié)構(gòu),在Linux系統(tǒng)上創(chuàng)建kaldi語音識(shí)別工具箱,基于THCHS-30語音數(shù)...

【文章頁數(shù)】：76 頁

【學(xué)位級(jí)別】：碩士

【部分圖文】：

圖1-1未來語音交互市場(chǎng)發(fā)展趨勢(shì)

2右。圖1-1未來語音交互市場(chǎng)發(fā)展趨勢(shì)隨著5G技術(shù)的到來以及物聯(lián)網(wǎng)的推廣，人工智能將再次掀起科技前沿的浪潮，語音識(shí)別作為其中最重要的一環(huán)，具有非常廣闊的市場(chǎng)應(yīng)用前景。目前很多行業(yè)可能還沒有意識(shí)到語音識(shí)別技術(shù)所帶來的改革力量，但是就現(xiàn)在的發(fā)展形勢(shì)而言，這項(xiàng)技術(shù)的廣泛應(yīng)用，在未來人類....

圖1-2語音識(shí)別基本框圖

3圖1-2語音識(shí)別基本框圖人類對(duì)語音識(shí)別的研究和探索始于20世紀(jì)50年代。1952年，貝爾實(shí)驗(yàn)室的Davis等人利用模擬電子器件完成了最早的識(shí)別系統(tǒng)Audrey，該系統(tǒng)是基于特定人的孤立詞識(shí)別，提取發(fā)音中每個(gè)元音的共振峰信息，然后通過簡(jiǎn)單的模板匹配實(shí)現(xiàn)的[5]，能夠準(zhǔn)確識(shí)別10個(gè)....

圖2-1語音識(shí)別技術(shù)原理圖

9第2章語音信號(hào)的分析和預(yù)處理對(duì)語音信號(hào)進(jìn)行分析和預(yù)處理是語音識(shí)別的基礎(chǔ)環(huán)節(jié)，對(duì)后續(xù)的識(shí)別來說是至關(guān)重要的一步。預(yù)處理操作可以有效地減少噪聲和無關(guān)信息的干擾，有利于提取到最有用的特征信息。2.1語音識(shí)別基本原理語音識(shí)別屬于模式識(shí)別的范疇，其過程主要分為訓(xùn)練和識(shí)別兩個(gè)階段。具體過程....

圖2-2單個(gè)斜三角波及其頻譜

10Rosenberg觀察出這種脈沖波幾近于斜三角形的脈沖波，也就是說，可以把間斷的脈沖波作為一個(gè)由多個(gè)斜三角形波構(gòu)成脈沖串，并且以基音周期為周期。單個(gè)斜三角波的表達(dá)式為：()()()11121121/21cos/,0cos/2,0,nNnNgnnNNNnNNππ≤≤=≤≤+其他....

本文編號(hào)：3996873

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://lk138.cn/kejilunwen/xinxigongchenglunwen/3996873.html

上一篇：基于深度學(xué)習(xí)的5G Massive MIMO信道特征和下行干擾水平預(yù)測(cè)研究
下一篇：粗糙體散射特性及合成孔徑激光雷達(dá)成像仿真研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

基于HMM和DNN混合模型研究的語音識(shí)別技術(shù)