中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于HMM和DNN混合模型研究的語音識別技術

發(fā)布時間:2024-06-29 00:14
  隨著大數(shù)據(jù)和人工智能的快速發(fā)展,語音識別的相關應用變得越來越普及,如今很多電子產品都通過語音交互進行操作,這讓人們更加方便地享受到了現(xiàn)代化智能服務。如何更加高效的實現(xiàn)語音交互,減少噪聲對系統(tǒng)識別性能的影響,提高系統(tǒng)的識別準確性是研究的重點所在。本文首先研究了語音信號的預處理和特征參數(shù)提取過程,針對梅爾頻率倒譜系數(shù)(MFCC)只能反映聲音信號的靜態(tài)特性,而經驗模態(tài)分解(EMD)能夠更細致地刻畫信號的非平穩(wěn)特性,本文將EMD融入到MFCC特征提取中。實驗結果表明,改進的特征參數(shù)提取方法有效地提高了系統(tǒng)的識別效果,在不同的信噪比下識別率最大提高了3.15%。在傳統(tǒng)的聲學建模中,高斯混合模型(GMM)和隱馬爾科夫(HMM)混合模型一直占主導地位,本文在MATLAB上建立小詞匯量識別系統(tǒng)進行實驗,對比分析可得GMM-HMM相對于單一的HMM來說,對訓練數(shù)據(jù)量的要求不高且具有更好的識別性能。針對GMM對復雜數(shù)據(jù)的建模能力不足的問題,在此混合模型的基礎上采用具有更強建模能力的深度神經網絡(DNN)來代替GMM得到新的模型結構,在Linux系統(tǒng)上創(chuàng)建kaldi語音識別工具箱,基于THCHS-30語音數(shù)...

【文章頁數(shù)】:76 頁

【學位級別】:碩士

【部分圖文】:

圖1-1未來語音交互市場發(fā)展趨勢

圖1-1未來語音交互市場發(fā)展趨勢

2右。圖1-1未來語音交互市場發(fā)展趨勢隨著5G技術的到來以及物聯(lián)網的推廣,人工智能將再次掀起科技前沿的浪潮,語音識別作為其中最重要的一環(huán),具有非常廣闊的市場應用前景。目前很多行業(yè)可能還沒有意識到語音識別技術所帶來的改革力量,但是就現(xiàn)在的發(fā)展形勢而言,這項技術的廣泛應用,在未來人類....


圖1-2語音識別基本框圖

圖1-2語音識別基本框圖

3圖1-2語音識別基本框圖人類對語音識別的研究和探索始于20世紀50年代。1952年,貝爾實驗室的Davis等人利用模擬電子器件完成了最早的識別系統(tǒng)Audrey,該系統(tǒng)是基于特定人的孤立詞識別,提取發(fā)音中每個元音的共振峰信息,然后通過簡單的模板匹配實現(xiàn)的[5],能夠準確識別10個....


圖2-1語音識別技術原理圖

圖2-1語音識別技術原理圖

9第2章語音信號的分析和預處理對語音信號進行分析和預處理是語音識別的基礎環(huán)節(jié),對后續(xù)的識別來說是至關重要的一步。預處理操作可以有效地減少噪聲和無關信息的干擾,有利于提取到最有用的特征信息。2.1語音識別基本原理語音識別屬于模式識別的范疇,其過程主要分為訓練和識別兩個階段。具體過程....


圖2-2單個斜三角波及其頻譜

圖2-2單個斜三角波及其頻譜

10Rosenberg觀察出這種脈沖波幾近于斜三角形的脈沖波,也就是說,可以把間斷的脈沖波作為一個由多個斜三角形波構成脈沖串,并且以基音周期為周期。單個斜三角波的表達式為:()()()11121121/21cos/,0cos/2,0,nNnNgnnNNNnNNππ≤≤=≤≤+其他....



本文編號:3996873

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/xinxigongchenglunwen/3996873.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶21362***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com