基于小波包全頻分解的耐噪聲紋識別算法
【文章頁數(shù)】:8 頁
【部分圖文】:
圖1本研究說話人識別總體框架
說話人聲紋是一種生物特征信息,和人臉、指紋及虹膜一樣具有典型可區(qū)分性.聲紋識別是通過對語音波形中包含的個人信息自動識別說話人的過程.由于聲帶頻率、聲道寬窄、喉頭大小、唇齒及鼻腔結(jié)構(gòu)等發(fā)聲器官因人而異,說話人的語音特征(或組合特征)具有唯一性.當(dāng)前國內(nèi)外的研究主要致力于說話人語音特....
圖2三層小波包分解
小波包按照完全最優(yōu)二叉樹方式分解,節(jié)點對應(yīng)小波包頻率系數(shù),順序?qū)?yīng)時域信息.本研究采用Daubechies小波包進(jìn)行3層的dB6小波包分解,其樹形結(jié)構(gòu)如圖2.三層小波包變換可分解出8個節(jié)點,每一次分解對應(yīng)式(6)和式(7),小波包變換重構(gòu)后的第i個頻帶頻率作為Gammatone濾....
圖3說話人識別卷積網(wǎng)絡(luò)
為有效訓(xùn)練和預(yù)測說話人文本無關(guān)的語音特征信息,本研究結(jié)合所設(shè)計的特征提取方法,采用卷積神經(jīng)網(wǎng)絡(luò)設(shè)計說話人深度識別網(wǎng)絡(luò),如圖3.在輸入層將64個Gammatone濾波器重疊構(gòu)成64通道濾波器組,實現(xiàn)耳蝸濾波功能,進(jìn)而將語音信號由時域轉(zhuǎn)換到頻域,因此,每個說話人的語音信號就會在語音特....
圖4純凈數(shù)據(jù)集上的聲紋識別精度對比
第1組實驗中在干凈實驗環(huán)境下,采用不同數(shù)據(jù)集比較以上3種語音特征提取算法的識別正確率,實驗結(jié)果如圖4所示.在輸入層將64個Gammatone濾波器重疊構(gòu)成64通道濾波器組,實現(xiàn)耳蝸濾波功能,進(jìn)而將語音信號由時域轉(zhuǎn)換到頻域,因此,每個說話人的語音信號就會在語音特征處理之后得到64×....
本文編號:3981222
本文鏈接:http://www.lk138.cn/kejilunwen/xinxigongchenglunwen/3981222.html