国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

一種基于詞素媒介的漢蒙統(tǒng)計(jì)機(jī)器翻譯方法

發(fā)布時(shí)間:2018-05-02 07:59

  本文選題:中間語(yǔ)言 + 詞素; 參考:《中文信息學(xué)報(bào)》2017年04期


【摘要】:漢蒙語(yǔ)形態(tài)差異性及平行語(yǔ)料庫(kù)規(guī)模小制約了漢蒙統(tǒng)計(jì)機(jī)器翻譯性能的提升。該文將蒙古語(yǔ)形態(tài)信息引入漢蒙統(tǒng)計(jì)機(jī)器翻譯中,通過(guò)將蒙古語(yǔ)切分成詞素的形式,構(gòu)造漢語(yǔ)詞和蒙古語(yǔ)詞素,以及蒙古語(yǔ)詞素和蒙古語(yǔ)的映射關(guān)系,彌補(bǔ)漢蒙形態(tài)結(jié)構(gòu)上的非對(duì)稱(chēng)性,并將詞素作為中間語(yǔ)言,通過(guò)訓(xùn)練漢語(yǔ)—蒙古語(yǔ)詞素以及蒙古語(yǔ)詞素-蒙古語(yǔ)統(tǒng)計(jì)機(jī)器翻譯系統(tǒng),構(gòu)建出新的短語(yǔ)翻譯表和調(diào)序模型,并采用多路徑解碼及多特征的方式融入漢蒙統(tǒng)計(jì)機(jī)器翻譯。實(shí)驗(yàn)結(jié)果表明,將基于詞素媒介構(gòu)建出的短語(yǔ)翻譯表和調(diào)序模型引入現(xiàn)有統(tǒng)計(jì)機(jī)器翻譯方法,使得譯文在BLEU值上比基線(xiàn)系統(tǒng)有了明顯提高,一定程度上消解了數(shù)據(jù)稀疏和形態(tài)差異對(duì)漢蒙統(tǒng)計(jì)機(jī)器翻譯的影響。該方法是一種通用的方法,通過(guò)詞素和短語(yǔ)兩個(gè)層面信息的結(jié)合,實(shí)現(xiàn)了兩種語(yǔ)言在形態(tài)結(jié)構(gòu)上的對(duì)稱(chēng),不僅適用于漢蒙統(tǒng)計(jì)機(jī)器翻譯,還適用于形態(tài)非對(duì)稱(chēng)且低資源的語(yǔ)言對(duì)。
[Abstract]:The differences of Chinese and Mongolian morphology and the small size of parallel corpus restrict the improvement of statistical machine translation performance. In this paper, the morphological information of Mongolian language is introduced into the statistical machine translation of Han and Mongolian languages. By dividing Mongolian language into morpheme forms, this paper constructs the mapping relationship between Chinese words and Mongolian morphemes, as well as Mongolian morphemes and Mongolian morphemes. In order to make up for the asymmetry in morphology and structure of Han and Mongolian, and take morpheme as the intermediate language, a new phrase translation table and order model are constructed by training the morpheme of Chinese and Mongolian and the statistical machine translation system of morpheme and morpheme in Mongolian. Multipath decoding and multi-feature approach are used to integrate the statistical machine translation of Han and Meng. The experimental results show that the phrase translation table and the orchestration model based on morpheme medium are introduced into the existing statistical machine translation methods, and the BLEU value of the translation is significantly higher than that of the baseline system. To some extent, the effects of data sparsity and morphological differences on statistical machine translation in Han and Mongolia are eliminated. This method is a general method. By combining morpheme and phrase information, the two languages are symmetrical in morphology and structure, which is not only suitable for the statistical machine translation of Han and Mongolian. It also applies to asymmetric and low resource language pairs.
【作者單位】: 中國(guó)科學(xué)技術(shù)大學(xué)自動(dòng)化系;中國(guó)科學(xué)院合肥智能機(jī)械研究所;
【基金】:國(guó)家自然科學(xué)基金(61502445,61572462) 中國(guó)科學(xué)院信息化專(zhuān)項(xiàng)(XXH12504-1-10)
【分類(lèi)號(hào)】:H085.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前1條

1 馮志偉;;《統(tǒng)計(jì)機(jī)器翻譯》述評(píng)[J];外語(yǔ)教學(xué)與研究;2013年04期

相關(guān)會(huì)議論文 前2條

1 付雷;呂雅娟;劉群;;基于句型模板和統(tǒng)計(jì)機(jī)器翻譯技術(shù)的翻譯方法[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

2 柴春光;宗成慶;;影響統(tǒng)計(jì)翻譯系統(tǒng)性能的因素分析[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年

相關(guān)碩士學(xué)位論文 前1條

1 修馳;統(tǒng)計(jì)機(jī)器翻譯語(yǔ)料預(yù)處理中的問(wèn)題研究[D];北京語(yǔ)言大學(xué);2009年

,

本文編號(hào):1833049

資料下載
論文發(fā)表

本文鏈接:http://lk138.cn/wenyilunwen/yuyanyishu/1833049.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)f5207***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
婷婷中文在线一区| 欧美亚洲人妻精品偷拍在线观看| 欧美美女久久精品一二三区| 大香蕉日本国产在线视频| 欧美自拍一区偷拍自拍| 人人爽午夜免费| 天天臊国产一区二区| 老熟妇做爰视频| 中文字幕一二三区不卡视频| 国产大尺度在线| 噢美日韩三级免费关看网络| 91精品国产偷拍| 在线 看 片 午夜| 523大香蕉网站大香蕉综合伊| 欧美日一级特黄大片| Av一区二区欢迎您| 亚洲偷拍欧| 国产日韩在线一区观看不卡| 伦理 一区二区三区久久| 高清在线不卡色色无码av免费| 国产在线看欧美 xxx tube| av日韩人妻| 91久久精晶国产91久久| 女人高潮被爽到呻吟的网站91| 国产AV色一区| 日韩无码人妻欧美| 久久99久久精品免视国产| 国产一本道一区一区| 美女裸体让男人桶出水| 91国内偷偷| 蜜桃福利一区| av中文字幕精品| 日韩欧美国产精品成人一区| 国产an日韩无码| 欧美高清一区二区三区欧美| 特黄久久日韩| 亚洲三级久久一区| 麻豆最新视频苏语棠在线播放| 一级性特黄片| www大香蕉在线播放| 日本啪啪视频免费看|