中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

當(dāng)前位置:主頁 > 科技論文 > 計算機應(yīng)用論文 >

基于映射的無監(jiān)督跨語言詞向量模型研究

發(fā)布時間:2024-06-25 19:01
  詞向量(Word Embedding)是現(xiàn)今單詞的主流表示方法;谟成涞臒o監(jiān)督跨語言詞向量(Unsupervised Cross-lingual Emeddings)旨在不使用任何跨語言知識,將源語言和目標(biāo)語言的詞向量映射到同一向量空間中,使得不同語言下語義相同的詞具有較高的相似度。研究該問題對于解決資源匱乏的語言的信息鴻溝問題和跨語言自然語言處理任務(wù)有著重大意義。近年來,各國學(xué)者在該方向上的研究取得了許多成果。不過現(xiàn)有的無監(jiān)督方法存在著兩個不足(1)沒有處理一次多義的問題;(2)模型在實際應(yīng)用場景中的魯棒性不足,尤其是對于距離遙遠(yuǎn)的語言對。針對以上問題,本文的主要研究工作包含以下內(nèi)容:1.分析了造成無監(jiān)督魯棒性不足的原因,發(fā)現(xiàn)無監(jiān)督方法所依賴的同構(gòu)性假設(shè)在實際應(yīng)用場景中是不成立的。之后量化的分析了無監(jiān)督方法的魯棒性,并提出了語言詞向量模型的距離度量方法。該度量方法成功地表現(xiàn)出了語言模型在語言學(xué)知識下的距離性質(zhì),不同語系的語言較同一語系下的語言有著更大的距離值。然后研究表明了語言距離與無監(jiān)督模型的性能存在著線性關(guān)系,關(guān)系較遠(yuǎn)的語言在無監(jiān)督模型的件能上有著明顯的下降。2.本文提出從構(gòu)建...

【文章頁數(shù)】:62 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖1-1英語和西班牙語中數(shù)字詞向最與動物詞向鋒之間的呈現(xiàn)了相似的幾何關(guān)??系[2】??

圖1-1英語和西班牙語中數(shù)字詞向最與動物詞向鋒之間的呈現(xiàn)了相似的幾何關(guān)??系[2】??

?〇???〇?*??}??J???.?.?1?〇do>(two)??"j*???'????U?M?M?t;?"Xi?I??J?。?13??#?'???4r?IS??〇?horse?〇?cabalo?(horse)???,?,J?ovaca?(cow)??m?‘?〇?cow?(J....


圖2-1?Word2Vec的連續(xù)詞袋模型和跳字模型結(jié)構(gòu)圖[55]??(1)?Skip-gram?模型??

圖2-1?Word2Vec的連續(xù)詞袋模型和跳字模型結(jié)構(gòu)圖[55]??(1)?Skip-gram?模型??

FastText模型。??2.3.1.1?Word2Vec??谷歌(Google)公司在2013年開源發(fā)布了一種可以將單詞轉(zhuǎn)換為向量形式??的計算工具W〇rd2VeC[2],它基于分布假設(shè)的思想,可以根據(jù)詞忙間的距離或相似??度表示出單詞間的關(guān)系,從而發(fā)掘出語言詞?I:結(jié)構(gòu)和關(guān)系....


圖2-2?Word2Vec下的跳寺模型[55]??如圖2-2所示,Skip-gram可以看做是由輸入層、隱藏層(也稱為投射層)、??輸出M構(gòu)成的三雇網(wǎng)絡(luò):輸入層是由中心詞構(gòu)成的V維的獨熱編碼的向量s中??

圖2-2?Word2Vec下的跳寺模型[55]??如圖2-2所示,Skip-gram可以看做是由輸入層、隱藏層(也稱為投射層)、??輸出M構(gòu)成的三雇網(wǎng)絡(luò):輸入層是由中心詞構(gòu)成的V維的獨熱編碼的向量s中??

?哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文???它距離不超過2的背景詞“method”、“for”、“word”、“embeddings”的條件概率。??/〇?Output?layer??T?,?Awt??Input?layer?/?/??layer/??〇?wrxJV?ht?i??F-d....


圖2-3?Word2Vec的連續(xù)詞袋模型[55]??_?skip-gram模III類似,CBOW模塑的結(jié)構(gòu)同枰是一個三屬的全連接神經(jīng)網(wǎng)??絡(luò),同樣它只有一個隱藏層

圖2-3?Word2Vec的連續(xù)詞袋模型[55]??_?skip-gram模III類似,CBOW模塑的結(jié)構(gòu)同枰是一個三屬的全連接神經(jīng)網(wǎng)??絡(luò),同樣它只有一個隱藏層

?哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文???Input?layer??J\??^^mdde^^g011,iayer??X2k?〇?^ht?^'n^V?〇?yj????/?/?F-dim??%?w^/??-;/??5/?CxF-dim??圖2-3?Word2Vec的連續(xù)詞袋模型[55]?....



本文編號:3995763

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/shengwushengchang/3995763.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶96974***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com