基于小波包全頻分解的耐噪聲紋識別算法

發(fā)布時間：2024-05-24 20:55

　　目前多數(shù)說話人識別算法均在干凈環(huán)境下進行,在噪聲環(huán)境下的效果較差.為提升噪聲環(huán)境下說話人識別的正確率,提出一種新的特征提取方法與識別模型WPGT.利用小波包分解高頻和低頻信號,Gammatone濾波器組模擬人耳聽覺系統(tǒng)處理非線性信號,從而提取更完備的說話人語音特征,采用卷積神經(jīng)網(wǎng)絡(luò)對特征進行訓(xùn)練并完成說話人識別.基于開源語音數(shù)據(jù)集、噪聲融合數(shù)據(jù)集,將本研究方案與常用的聲紋特征提取方法MFCC和Gammatone進行對比.實驗結(jié)果表明,在噪聲環(huán)境下,本研究所提WPGT方法的聲紋識別精度相較于MFCC和Gammatone分別提升10.63%和16.91%,具有更好的抗噪聲能力.

【文章頁數(shù)】：8 頁

【部分圖文】：

圖1本研究說話人識別總體框架

說話人聲紋是一種生物特征信息,和人臉、指紋及虹膜一樣具有典型可區(qū)分性.聲紋識別是通過對語音波形中包含的個人信息自動識別說話人的過程.由于聲帶頻率、聲道寬窄、喉頭大小、唇齒及鼻腔結(jié)構(gòu)等發(fā)聲器官因人而異,說話人的語音特征(或組合特征)具有唯一性.當(dāng)前國內(nèi)外的研究主要致力于說話人語音特....

圖2三層小波包分解

小波包按照完全最優(yōu)二叉樹方式分解,節(jié)點對應(yīng)小波包頻率系數(shù),順序?qū)?yīng)時域信息.本研究采用Daubechies小波包進行3層的dB6小波包分解,其樹形結(jié)構(gòu)如圖2.三層小波包變換可分解出8個節(jié)點,每一次分解對應(yīng)式(6)和式(7),小波包變換重構(gòu)后的第i個頻帶頻率作為Gammatone濾....

圖3說話人識別卷積網(wǎng)絡(luò)

為有效訓(xùn)練和預(yù)測說話人文本無關(guān)的語音特征信息,本研究結(jié)合所設(shè)計的特征提取方法,采用卷積神經(jīng)網(wǎng)絡(luò)設(shè)計說話人深度識別網(wǎng)絡(luò),如圖3.在輸入層將64個Gammatone濾波器重疊構(gòu)成64通道濾波器組,實現(xiàn)耳蝸濾波功能,進而將語音信號由時域轉(zhuǎn)換到頻域,因此,每個說話人的語音信號就會在語音特....

圖4純凈數(shù)據(jù)集上的聲紋識別精度對比

第1組實驗中在干凈實驗環(huán)境下,采用不同數(shù)據(jù)集比較以上3種語音特征提取算法的識別正確率,實驗結(jié)果如圖4所示.在輸入層將64個Gammatone濾波器重疊構(gòu)成64通道濾波器組,實現(xiàn)耳蝸濾波功能,進而將語音信號由時域轉(zhuǎn)換到頻域,因此,每個說話人的語音信號就會在語音特征處理之后得到64×....

本文編號：3981222

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://lk138.cn/kejilunwen/xinxigongchenglunwen/3981222.html

上一篇：小型化寬波束全向圓極化天線
下一篇：基于緩存的地面與空地?zé)o線異構(gòu)網(wǎng)絡(luò)容量分析與優(yōu)化

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

基于小波包全頻分解的耐噪聲紋識別算法