中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于小波包全頻分解的耐噪聲紋識(shí)別算法

發(fā)布時(shí)間:2024-05-24 20:55
  目前多數(shù)說(shuō)話(huà)人識(shí)別算法均在干凈環(huán)境下進(jìn)行,在噪聲環(huán)境下的效果較差.為提升噪聲環(huán)境下說(shuō)話(huà)人識(shí)別的正確率,提出一種新的特征提取方法與識(shí)別模型WPGT.利用小波包分解高頻和低頻信號(hào),Gammatone濾波器組模擬人耳聽(tīng)覺(jué)系統(tǒng)處理非線(xiàn)性信號(hào),從而提取更完備的說(shuō)話(huà)人語(yǔ)音特征,采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)特征進(jìn)行訓(xùn)練并完成說(shuō)話(huà)人識(shí)別.基于開(kāi)源語(yǔ)音數(shù)據(jù)集、噪聲融合數(shù)據(jù)集,將本研究方案與常用的聲紋特征提取方法MFCC和Gammatone進(jìn)行對(duì)比.實(shí)驗(yàn)結(jié)果表明,在噪聲環(huán)境下,本研究所提WPGT方法的聲紋識(shí)別精度相較于MFCC和Gammatone分別提升10.63%和16.91%,具有更好的抗噪聲能力.

【文章頁(yè)數(shù)】:8 頁(yè)

【部分圖文】:

圖1本研究說(shuō)話(huà)人識(shí)別總體框架

圖1本研究說(shuō)話(huà)人識(shí)別總體框架

說(shuō)話(huà)人聲紋是一種生物特征信息,和人臉、指紋及虹膜一樣具有典型可區(qū)分性.聲紋識(shí)別是通過(guò)對(duì)語(yǔ)音波形中包含的個(gè)人信息自動(dòng)識(shí)別說(shuō)話(huà)人的過(guò)程.由于聲帶頻率、聲道寬窄、喉頭大小、唇齒及鼻腔結(jié)構(gòu)等發(fā)聲器官因人而異,說(shuō)話(huà)人的語(yǔ)音特征(或組合特征)具有唯一性.當(dāng)前國(guó)內(nèi)外的研究主要致力于說(shuō)話(huà)人語(yǔ)音特....


圖2三層小波包分解

圖2三層小波包分解

小波包按照完全最優(yōu)二叉樹(shù)方式分解,節(jié)點(diǎn)對(duì)應(yīng)小波包頻率系數(shù),順序?qū)?yīng)時(shí)域信息.本研究采用Daubechies小波包進(jìn)行3層的dB6小波包分解,其樹(shù)形結(jié)構(gòu)如圖2.三層小波包變換可分解出8個(gè)節(jié)點(diǎn),每一次分解對(duì)應(yīng)式(6)和式(7),小波包變換重構(gòu)后的第i個(gè)頻帶頻率作為Gammatone濾....


圖3說(shuō)話(huà)人識(shí)別卷積網(wǎng)絡(luò)

圖3說(shuō)話(huà)人識(shí)別卷積網(wǎng)絡(luò)

為有效訓(xùn)練和預(yù)測(cè)說(shuō)話(huà)人文本無(wú)關(guān)的語(yǔ)音特征信息,本研究結(jié)合所設(shè)計(jì)的特征提取方法,采用卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)說(shuō)話(huà)人深度識(shí)別網(wǎng)絡(luò),如圖3.在輸入層將64個(gè)Gammatone濾波器重疊構(gòu)成64通道濾波器組,實(shí)現(xiàn)耳蝸濾波功能,進(jìn)而將語(yǔ)音信號(hào)由時(shí)域轉(zhuǎn)換到頻域,因此,每個(gè)說(shuō)話(huà)人的語(yǔ)音信號(hào)就會(huì)在語(yǔ)音特....


圖4純凈數(shù)據(jù)集上的聲紋識(shí)別精度對(duì)比

圖4純凈數(shù)據(jù)集上的聲紋識(shí)別精度對(duì)比

第1組實(shí)驗(yàn)中在干凈實(shí)驗(yàn)環(huán)境下,采用不同數(shù)據(jù)集比較以上3種語(yǔ)音特征提取算法的識(shí)別正確率,實(shí)驗(yàn)結(jié)果如圖4所示.在輸入層將64個(gè)Gammatone濾波器重疊構(gòu)成64通道濾波器組,實(shí)現(xiàn)耳蝸濾波功能,進(jìn)而將語(yǔ)音信號(hào)由時(shí)域轉(zhuǎn)換到頻域,因此,每個(gè)說(shuō)話(huà)人的語(yǔ)音信號(hào)就會(huì)在語(yǔ)音特征處理之后得到64×....



本文編號(hào):3981222

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/xinxigongchenglunwen/3981222.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)5476c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com