基于跨語言詞向量的句子對齊方法研究
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1維基百科的“社會語言學(xué)”詞條的中文與英語網(wǎng)頁節(jié)選Fig.1-1ExcerptsfromtheChineseandEnglishentryofSociolinguisticsonthewebpagesofWikipedia
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-2-中可比語料成為了平行語料資源的重要補(bǔ)充資源,研究者們提出了一系列的句子對齊方法,從網(wǎng)絡(luò)上大量存在的可比語料中抽取出可用于跨語言自然語言處理任務(wù)的平行語料。圖1-1維基百科的“社會語言學(xué)”詞條的中文與英語網(wǎng)頁節(jié)選Fig.1-1Excerptsfr....
圖2-1兩種基于神經(jīng)網(wǎng)絡(luò)的句子對齊方法結(jié)構(gòu)
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-9-進(jìn)行英語和德語間的雙向的翻譯。在訓(xùn)練好NMT模型后,丟棄解碼器,使用編碼器將任意語言的句子表示為一個(gè)固定長度的連續(xù)的向量表示,得到句子的向量表示后計(jì)算向量間的距離作為句對的相似度得分[17-21]。a)雙編碼器結(jié)構(gòu)b)編碼器-解碼器結(jié)構(gòu)a)Th....
圖2-2四個(gè)西班牙詞的上下文相關(guān)的詞向量的二維主成分分析示例圖
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-12-下文相關(guān)的詞向量ELMo的訓(xùn)練方法,訓(xùn)練一種源語言s和一種目標(biāo)語言t的上下文相關(guān)的詞向量,然后在此基礎(chǔ)上提出了三種語義向量對齊方法,將兩種語言的上下文相關(guān)的詞向量進(jìn)行語義空間上的對齊。圖2-2四個(gè)西班牙詞的上下文相關(guān)的詞向量的二維主成分分析示....
圖3-1基于跨語言詞向量的句子相似度計(jì)算方法整體流程
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-16-別上,我們提出了一種結(jié)合向量角度和絕對距離兩者的優(yōu)勢的詞向量相似度計(jì)算方法。其次,在句子級別上,我們基于上一步詞級別的相似度計(jì)算方法,提出了基于聚合方法的雙語句對的相似度計(jì)算方法。最后介紹了基于邊距的方法,并在句子相似度實(shí)驗(yàn)上驗(yàn)證我們提出的方....
本文編號:3994793
本文鏈接:http://www.lk138.cn/kejilunwen/shengwushengchang/3994793.html