中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于小波包全頻分解的耐噪聲紋識別算法

發(fā)布時間:2024-05-24 20:55
  目前多數(shù)說話人識別算法均在干凈環(huán)境下進(jìn)行,在噪聲環(huán)境下的效果較差.為提升噪聲環(huán)境下說話人識別的正確率,提出一種新的特征提取方法與識別模型WPGT.利用小波包分解高頻和低頻信號,Gammatone濾波器組模擬人耳聽覺系統(tǒng)處理非線性信號,從而提取更完備的說話人語音特征,采用卷積神經(jīng)網(wǎng)絡(luò)對特征進(jìn)行訓(xùn)練并完成說話人識別.基于開源語音數(shù)據(jù)集、噪聲融合數(shù)據(jù)集,將本研究方案與常用的聲紋特征提取方法MFCC和Gammatone進(jìn)行對比.實驗結(jié)果表明,在噪聲環(huán)境下,本研究所提WPGT方法的聲紋識別精度相較于MFCC和Gammatone分別提升10.63%和16.91%,具有更好的抗噪聲能力.

【文章頁數(shù)】:8 頁

【部分圖文】:

圖1本研究說話人識別總體框架

圖1本研究說話人識別總體框架

說話人聲紋是一種生物特征信息,和人臉、指紋及虹膜一樣具有典型可區(qū)分性.聲紋識別是通過對語音波形中包含的個人信息自動識別說話人的過程.由于聲帶頻率、聲道寬窄、喉頭大小、唇齒及鼻腔結(jié)構(gòu)等發(fā)聲器官因人而異,說話人的語音特征(或組合特征)具有唯一性.當(dāng)前國內(nèi)外的研究主要致力于說話人語音特....


圖2三層小波包分解

圖2三層小波包分解

小波包按照完全最優(yōu)二叉樹方式分解,節(jié)點對應(yīng)小波包頻率系數(shù),順序?qū)?yīng)時域信息.本研究采用Daubechies小波包進(jìn)行3層的dB6小波包分解,其樹形結(jié)構(gòu)如圖2.三層小波包變換可分解出8個節(jié)點,每一次分解對應(yīng)式(6)和式(7),小波包變換重構(gòu)后的第i個頻帶頻率作為Gammatone濾....


圖3說話人識別卷積網(wǎng)絡(luò)

圖3說話人識別卷積網(wǎng)絡(luò)

為有效訓(xùn)練和預(yù)測說話人文本無關(guān)的語音特征信息,本研究結(jié)合所設(shè)計的特征提取方法,采用卷積神經(jīng)網(wǎng)絡(luò)設(shè)計說話人深度識別網(wǎng)絡(luò),如圖3.在輸入層將64個Gammatone濾波器重疊構(gòu)成64通道濾波器組,實現(xiàn)耳蝸濾波功能,進(jìn)而將語音信號由時域轉(zhuǎn)換到頻域,因此,每個說話人的語音信號就會在語音特....


圖4純凈數(shù)據(jù)集上的聲紋識別精度對比

圖4純凈數(shù)據(jù)集上的聲紋識別精度對比

第1組實驗中在干凈實驗環(huán)境下,采用不同數(shù)據(jù)集比較以上3種語音特征提取算法的識別正確率,實驗結(jié)果如圖4所示.在輸入層將64個Gammatone濾波器重疊構(gòu)成64通道濾波器組,實現(xiàn)耳蝸濾波功能,進(jìn)而將語音信號由時域轉(zhuǎn)換到頻域,因此,每個說話人的語音信號就會在語音特征處理之后得到64×....



本文編號:3981222

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/xinxigongchenglunwen/3981222.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5476c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com