基于深度學習的說話人識別技術應用
【文章頁數(shù)】:94 頁
【學位級別】:碩士
【部分圖文】:
圖2-1?MFCC提取及轉(zhuǎn)置流程圖??1..數(shù)模轉(zhuǎn)換(A/D?conversion)??
?電子科技大學碩士學位論文???第二章背景知識與相關理論??2.1語音信號的特征提取??2.1.1梅爾倒頻系數(shù)??MFCC至今仍是最優(yōu)秀的語音特征集之一,其主要優(yōu)點是能夠在短時功率譜??中對聲道進行建模。39維的MFCC特征是現(xiàn)有語音研究中的常用特征,此維數(shù)小??到足夠?qū)W習到音頻....
圖2-2實際頻率與梅爾頻率的映射關系圖??
隨窗:函數(shù)的選擇變化,Hamming窗’??取值為0.46164,Hanning窗取值為0.5。??4.離散傅里葉變換??采用DFT提取頻域中的信息,由公式(2-4)完成時域信號到頻域信號的轉(zhuǎn)換。??耶]=2〇n]e_/27rfc/W?(2-4)??5.梅爾濾波器組??設備的測量....
圖2-3三角濾波器工作原理示意圖??
?電子科技大莩碩土學位論文???接下來使用三角帶通濾波器將頻率信息轉(zhuǎn)換成為人耳接收的模擬債息》首先??對DFT轉(zhuǎn)換的輸出求乎方,這反應了每個頻率的語音功率,稱之為DFT功率譜。??之后使用H角梅爾濾波器組將該能量鐠轉(zhuǎn)換為梅爾功率譜,每個梅爾能養(yǎng)譜槽的??輸出代表其覆蓋的多個頻帶的....
圖2-4?GMM-UBM模型訓練-識別流程圖??
UniversalBackgroundModel,UBM).?[36,37]。UBM?代表了除了?目標說??話人之外的每個人,從本質(zhì)上來說是一個大型的GMM。UBM是通過EM算法對??大量說話人語音訓練出來的獨立于說話人的背景模型,該模型表示了特征向量與??說話人無關的分布g當新....
本文編號:3967790
本文鏈接:http://www.lk138.cn/kejilunwen/xinxigongchenglunwen/3967790.html