基于映射的無監(jiān)督跨語言詞向量模型研究
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1英語和西班牙語中數(shù)字詞向最與動物詞向鋒之間的呈現(xiàn)了相似的幾何關(guān)??系[2】??
?〇???〇?*??}??J???.?.?1?〇do>(two)??"j*???'????U?M?M?t;?"Xi?I??J?。?13??#?'???4r?IS??〇?horse?〇?cabalo?(horse)???,?,J?ovaca?(cow)??m?‘?〇?cow?(J....
圖2-1?Word2Vec的連續(xù)詞袋模型和跳字模型結(jié)構(gòu)圖[55]??(1)?Skip-gram?模型??
FastText模型。??2.3.1.1?Word2Vec??谷歌(Google)公司在2013年開源發(fā)布了一種可以將單詞轉(zhuǎn)換為向量形式??的計算工具W〇rd2VeC[2],它基于分布假設(shè)的思想,可以根據(jù)詞忙間的距離或相似??度表示出單詞間的關(guān)系,從而發(fā)掘出語言詞?I:結(jié)構(gòu)和關(guān)系....
圖2-2?Word2Vec下的跳寺模型[55]??如圖2-2所示,Skip-gram可以看做是由輸入層、隱藏層(也稱為投射層)、??輸出M構(gòu)成的三雇網(wǎng)絡(luò):輸入層是由中心詞構(gòu)成的V維的獨熱編碼的向量s中??
?哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文???它距離不超過2的背景詞“method”、“for”、“word”、“embeddings”的條件概率。??/〇?Output?layer??T?,?Awt??Input?layer?/?/??layer/??〇?wrxJV?ht?i??F-d....
圖2-3?Word2Vec的連續(xù)詞袋模型[55]??_?skip-gram模III類似,CBOW模塑的結(jié)構(gòu)同枰是一個三屬的全連接神經(jīng)網(wǎng)??絡(luò),同樣它只有一個隱藏層
?哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文???Input?layer??J\??^^mdde^^g011,iayer??X2k?〇?^ht?^'n^V?〇?yj????/?/?F-dim??%?w^/??-;/??5/?CxF-dim??圖2-3?Word2Vec的連續(xù)詞袋模型[55]?....
本文編號:3995763
本文鏈接:http://www.lk138.cn/kejilunwen/shengwushengchang/3995763.html
下一篇:沒有了