中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于遷移學(xué)習(xí)的低資源度語(yǔ)音識(shí)別聲學(xué)建模研究

發(fā)布時(shí)間:2020-04-06 10:35
【摘要】:自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition,ASR)能將人類(lèi)語(yǔ)音經(jīng)過(guò)計(jì)算機(jī)處理為文字的過(guò)程,是人與機(jī)器更順暢交流的關(guān)鍵技術(shù)。在自動(dòng)語(yǔ)音識(shí)別中,聲學(xué)模型的主流框架為深度神經(jīng)網(wǎng)絡(luò)-隱馬爾可夫混合模型(Deep Neural Network Hidden Markov Model,DNN-HMM)。隨著技術(shù)的發(fā)展,在海量語(yǔ)音數(shù)據(jù)加持下的深度神經(jīng)網(wǎng)絡(luò)自動(dòng)語(yǔ)音識(shí)別系統(tǒng)取得了接近人類(lèi)語(yǔ)音轉(zhuǎn)寫(xiě)能力的優(yōu)異成績(jī)。目前世界上的語(yǔ)言約有7000多種,具有海量語(yǔ)音數(shù)據(jù)的語(yǔ)種僅有英語(yǔ)、漢語(yǔ)普通話等幾種語(yǔ)言,大部分其它的語(yǔ)種由于語(yǔ)音資源采集成本較高,僅有少量的語(yǔ)音資源可供研究,然而在低資源環(huán)境下的深度神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別系統(tǒng)效果往往表現(xiàn)不佳。隨著社會(huì)發(fā)展的需要,將語(yǔ)音識(shí)別技術(shù)應(yīng)用于低資源語(yǔ)種的需求越來(lái)越大。遷移學(xué)習(xí)是一種能夠從一種或多種相似的任務(wù)中學(xué)習(xí)到知識(shí),并利用這些學(xué)到的知識(shí)快速構(gòu)建其他類(lèi)似新任務(wù)的方法,稱(chēng)之為遷移學(xué)習(xí)。在基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別中DNN聲學(xué)模型的每一層輸出都是語(yǔ)音特征的深度表示,這種特征表示包含了人類(lèi)語(yǔ)音的聲學(xué)特征共性,通過(guò)調(diào)整網(wǎng)絡(luò)參數(shù)很容易遷移為其它語(yǔ)種的聲學(xué)模型,這為低資源語(yǔ)音識(shí)別能夠通過(guò)遷移學(xué)習(xí)而獲得較強(qiáng)的聲學(xué)模型成為可能。為了提升基于深度神經(jīng)網(wǎng)絡(luò)的低資源語(yǔ)音識(shí)別聲學(xué)模型的性能,本文對(duì)聲學(xué)模型的遷移進(jìn)行了若干方面研究。具體內(nèi)容包括:跨語(yǔ)種的聲學(xué)模型遷移是否有效;語(yǔ)種之間的相似性對(duì)聲學(xué)模型遷移的影響;基礎(chǔ)模型的數(shù)據(jù)量對(duì)遷移效果的影響;遷移聲學(xué)模型的訓(xùn)練方式;單音素聲學(xué)模型能否遷移到三音素聲學(xué)模型;大數(shù)據(jù)量多語(yǔ)音共享隱層聲學(xué)模型的遷移等。本文用資源豐富的漢語(yǔ)、英語(yǔ)訓(xùn)練基礎(chǔ)聲學(xué)模型,用維吾爾語(yǔ)作為低資源語(yǔ)種開(kāi)展了各項(xiàng)實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,遷移學(xué)習(xí)能夠通過(guò)遷移基礎(chǔ)模型來(lái)提高低資源語(yǔ)種聲學(xué)模型的性能。
【圖文】:

語(yǔ)音識(shí)別,人類(lèi),貝爾實(shí)驗(yàn)室,說(shuō)話人


圖 1-1 人機(jī)對(duì)話流程圖隨著人類(lèi)計(jì)算能力的不斷進(jìn)步和人類(lèi)對(duì)美好生活的不斷向往,語(yǔ)音識(shí)別的很早就被提出,發(fā)展距今已有 60 余載。20 世紀(jì) 50 年代,最開(kāi)始的語(yǔ)音識(shí)別聚焦于搭建簡(jiǎn)單基于模版匹配的孤立音識(shí)別系統(tǒng)。1952 年,AT&T 貝爾實(shí)驗(yàn)室 Davis 等人開(kāi)發(fā)了 Audrey 系統(tǒng)[音識(shí)別以模擬元器件提取元音共振峰頻率變化信息為依據(jù)對(duì)特定說(shuō)話人的

語(yǔ)音識(shí)別系統(tǒng),語(yǔ)音識(shí)別,資源


圖 1-2 語(yǔ)音識(shí)別系統(tǒng)基本框架1.3 低資源語(yǔ)音識(shí)別研究現(xiàn)狀目前世界上的語(yǔ)言約有 7000 種左右,使用人口最多的英語(yǔ)、漢語(yǔ)普通話等語(yǔ)音資源優(yōu)先得到了采集,大部分其它的語(yǔ)種由于語(yǔ)音數(shù)據(jù)采集成本較高,目前語(yǔ)音資源較為匱乏[27]。然而,在目前主流的 DNN-HMM 語(yǔ)音識(shí)別系統(tǒng)都需要大量的語(yǔ)音數(shù)據(jù)進(jìn)行訓(xùn)練,低資源環(huán)境下的 DNN-HMM 語(yǔ)音識(shí)別系統(tǒng)由于訓(xùn)練數(shù)據(jù)不足,聲學(xué)模型不能夠充分地進(jìn)行訓(xùn)練,導(dǎo)致語(yǔ)音識(shí)別效果不如人意。數(shù)據(jù)資源在語(yǔ)音識(shí)別系統(tǒng)中有著至關(guān)重要的作用,在語(yǔ)音識(shí)別中,語(yǔ)音、標(biāo)注、字典等資源的不足或缺失都屬于低資源語(yǔ)音識(shí)別。近年來(lái),全世界各大研究機(jī)構(gòu)開(kāi)始著重關(guān)注低資源語(yǔ)音識(shí)別,在國(guó)際上,2011 年初美國(guó) IARPA(Intelligence AdvancedResearch Projects Activity)機(jī)構(gòu)開(kāi)始實(shí)行低資源語(yǔ)音識(shí)別的 Bable 計(jì)劃[28],該計(jì)劃的參與者有 MIT、劍橋、CMU、JHU 等知名語(yǔ)音方面的研究機(jī)構(gòu),主要研究語(yǔ)
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:TN912.34;TP181

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 周弘燁;;語(yǔ)音識(shí)別大揭秘:計(jì)算機(jī)如何處理聲音?[J];中國(guó)新通信;2019年04期

2 程建軍;胡立志;;關(guān)于深度學(xué)習(xí)的語(yǔ)音識(shí)別應(yīng)用研究[J];科技經(jīng)濟(jì)導(dǎo)刊;2019年12期

3 桑亞超;李龍杰;袁傳青;霍慶磊;張樂(lè);;關(guān)于語(yǔ)音識(shí)別在空調(diào)上的應(yīng)用與改善[J];日用電器;2019年07期

4 牛洪波;王婉君;劉華楠;;語(yǔ)音識(shí)別專(zhuān)利技術(shù)綜述[J];河南科技;2019年24期

5 向暉;;數(shù)字語(yǔ)音識(shí)別與合成[J];電子世界;2019年15期

6 姜姝姝;;語(yǔ)音識(shí)別64年大突破[J];機(jī)器人產(chǎn)業(yè);2016年06期

7 吳俊宇;;語(yǔ)音識(shí)別為何“叫好不叫座”?[J];通信世界;2016年16期

8 徐鑫;;語(yǔ)音識(shí)別的未來(lái)之路[J];通信世界;2016年16期

9 張連仲;;帶著使命感出發(fā)[J];英語(yǔ)學(xué)習(xí);2017年01期

10 張凱;;榮威eRX5靜態(tài)體驗(yàn) “人性化”語(yǔ)音識(shí)別是亮點(diǎn)[J];新能源汽車(chē)新聞;2017年01期

相關(guān)會(huì)議論文 前10條

1 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語(yǔ)音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年

2 于東;賈磊;徐波;;面向語(yǔ)音識(shí)別錯(cuò)誤恢復(fù)的澄清式疑問(wèn)句生成[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

3 邢安昊;黎塔;顏永紅;;利用二重打分方法的激活詞語(yǔ)音識(shí)別[A];中國(guó)聲學(xué)學(xué)會(huì)第十屆青年學(xué)術(shù)會(huì)議論文集[C];2013年

4 文成義;何海燕;張玉扶;;基于新型神經(jīng)網(wǎng)絡(luò)的不定人語(yǔ)音識(shí)別[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC1992)論文集[C];1992年

5 杜笑平;楊啟綱;楊家沅;;過(guò)零周期轉(zhuǎn)移概率矩陣語(yǔ)音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC1992)論文集[C];1992年

6 潘勝昔;劉加;江金濤;王作英;陸大金;;基于多模式及集成判決的穩(wěn)健電話語(yǔ)音識(shí)別算法研究[A];第五屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC1998)論文集[C];1998年

7 杜利民;;語(yǔ)音識(shí)別中的魯棒性問(wèn)題[A];第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2001年

8 宋君;葛余博;;應(yīng)用于魯棒語(yǔ)音識(shí)別的置信度加權(quán)特征丟失法[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年

9 張明新;倪宏;陳國(guó)平;張東濱;;一種用于并行模型噪聲魯棒語(yǔ)音識(shí)別的特征構(gòu)造方法[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

10 熊軍軍;馬瑞堂;李成榮;;兒童語(yǔ)音識(shí)別的研究現(xiàn)狀[A];第九屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2007年

相關(guān)重要報(bào)紙文章 前10條

1 通訊員 魏霈侃;從學(xué)霸、學(xué)者到創(chuàng)業(yè)者的華麗轉(zhuǎn)身[N];中國(guó)教育報(bào);2016年

2 特約撰稿人 Lamont Wood 編譯 Charles;語(yǔ)音識(shí)別成長(zhǎng)起來(lái),并走向移動(dòng)應(yīng)用[N];計(jì)算機(jī)世界;2018年

3 本報(bào)記者 陶力;阿里全資收購(gòu)先聲互聯(lián) 推動(dòng)語(yǔ)音識(shí)別場(chǎng)景落地[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2018年

4 洪蕾;阿里研發(fā)高工業(yè)噪聲環(huán)境下語(yǔ)音識(shí)別及傳輸技術(shù)[N];中國(guó)信息化周報(bào);2018年

5 本報(bào)記者 郭科;登月早已實(shí)現(xiàn),同期啟動(dòng)的語(yǔ)音識(shí)別還在路上[N];科技日?qǐng)?bào);2018年

6 本報(bào)記者 王星平;語(yǔ)音識(shí)別商用尷尬 應(yīng)用場(chǎng)景垂直化路有多遠(yuǎn)[N];中國(guó)企業(yè)報(bào);2016年

7 本報(bào)記者 余建華;從“綠皮車(chē)時(shí)代”邁入“高鐵時(shí)代”[N];人民法院報(bào);2017年

8 陳宗周;機(jī)器在聆聽(tīng)[N];電腦報(bào);2017年

9 本報(bào)記者 黃旭 熊雯琳;云知聲:與巨頭共舞,,成為AI領(lǐng)域BAT的密碼[N];電腦報(bào);2017年

10 本報(bào)記者 錢(qián)一彬;手機(jī)“黑科技”為何叫好不叫座[N];人民日?qǐng)?bào);2017年

相關(guān)博士學(xué)位論文 前10條

1 屠彥輝;復(fù)雜場(chǎng)景下基于深度學(xué)習(xí)的魯棒性語(yǔ)音識(shí)別的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2019年

2 賀蘇寧;基于語(yǔ)音識(shí)別基元聲學(xué)整體結(jié)構(gòu)特征的識(shí)別模型研究[D];電子科技大學(xué);2005年

3 陳立偉;基于HMM和ANN的漢語(yǔ)語(yǔ)音識(shí)別[D];哈爾濱工程大學(xué);2005年

4 徐金甫;基于特征提取的抗噪聲語(yǔ)音識(shí)別研究[D];華南理工大學(xué);2000年

5 寧更新;抗噪聲語(yǔ)音識(shí)別新技術(shù)的研究[D];華南理工大學(xué);2006年

6 沈海峰;語(yǔ)音識(shí)別中的環(huán)境補(bǔ)償研究[D];北京郵電大學(xué);2006年

7 李小兵;高效簡(jiǎn)約的語(yǔ)音識(shí)別聲學(xué)模型[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年

8 孫f

本文編號(hào):2616401


資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/zidonghuakongzhilunwen/2616401.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c53f8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com