【摘 要】
:
神经网络技术伴随着深度学习研究的兴起与发展使得机器翻译取得了巨大的进展。但是,由于汉文与蒙古文在词法、句法等方面都有着较大的差异,汉蒙机器翻译研究存在着较多的研究难点,有些关键技术亟待突破,对翻译的关键模型也需要进一步优化。本文主要实现了一个汉蒙神经网络的机器翻译系统,并针对蒙古文译文的后处理技术以及模型优化方法进行了研究与实现。本文工作具体内容如下:(1)构建了一个汉蒙神经机器翻译模型。分别利用
论文部分内容阅读
神经网络技术伴随着深度学习研究的兴起与发展使得机器翻译取得了巨大的进展。但是,由于汉文与蒙古文在词法、句法等方面都有着较大的差异,汉蒙机器翻译研究存在着较多的研究难点,有些关键技术亟待突破,对翻译的关键模型也需要进一步优化。本文主要实现了一个汉蒙神经网络的机器翻译系统,并针对蒙古文译文的后处理技术以及模型优化方法进行了研究与实现。本文工作具体内容如下:(1)构建了一个汉蒙神经机器翻译模型。分别利用循环神经网络(Recurrent Neural Network,RNN)、卷积神经网络(Convolutional Neural Networks,CNN)、Transformer网络结构,使用现有的汉蒙平行语料进行训练,完成汉蒙翻译模型的构建。(2)针对蒙古文变体符等特殊字符进行设计并实现后处理方法,减少在训练过程中由这些字符导致的译文错误问题,从而提升了蒙古文译文的质量。(3)对模型压缩方法进行实现,将其运用到神经网络机器翻译模型任务当中,在保证模型性能的情况下,减少模型所需的内存空间占用量。(4)构建翻译系统。采取B/S架构,实现浏览器端、Web服务器端以及翻译服务器端三个部分组合而成的翻译系统,在完成基本翻译功能的同时添加相应的译文修改功能,用于在后续工作中提高翻译系统的性能。最终,加入后处理技术使得使用6万语料构建的基于RNN、CNN以及Transformer的汉蒙神经机器翻译模型的BLEU值分别提升至23.21(+2.17)、24.74(+0.71)和25.57(+0.91)。同时在使用26万语料训练得到的CNN模型中也得到了验证。使用模型压缩方法使得模型压缩率达到了75%,翻译速度也有很大的提升。最后基于以上研究完成了符合用户需求的汉蒙翻译系统。
其他文献
“向深化改革要活力”,这是党代会上代表讨论时的强音。$$围绕深化行政审批制度改革、推动农业供给侧结构性改革、完善长期护理保险制度等改革创新的重点领域,代表积极建言献策
近年来,贵州旅游业的发展取得了显著的成就,但也存在一定的问题。实施旅游精品战略,是更好更快地发展贵州旅游业的必然选择。要强化旅游精品战略意识、打造特色旅游精品,以旅
塑性图是由卡萨格兰德于1942年首次提出的,该图将阿太堡界限(液限、塑限)应用于土质分类。本文根据塑性图判别理论并应用塑性图,对陕西省特殊土(黄土、三趾马红土、膨胀土等)进行了判别
<正> 固定资产贷款具有投资多、周期长、风险大的特点.国家对固定资产投资项目从项目建议书和可行性研究报告到设计任务书、初步设计、列入年度计划、施工建设、竣工投产验收
目的探讨结构式心理干预对围手术期食管癌患者的影响。方法对60例食管癌手术患者于围手术期实施结构式心理干预。干预内容包括健康教育、应激处理、应对技巧及心理支持。结果
由于制度稳定性、环境变动性和人们追求利益极大化三者之间存在持久的冲突,原本均衡的制度将会产生变迁。我国村镇银行是我国金融体系服务三农的制度创新,随着制度的演变,村镇银
房地产中介一直是一个备受争议的行业,“中天置业”东窗事发再次把地产中介推上了风口浪尖,中介行业遭遇信誉低谷。地产中介真应如此被动吗?本文作者从房地产中介市场作用的
芥川龙之介借用中国的古典小说《杜子春传》创作的《杜子春》,但他不是机械的照搬原先的故事情节,更多的是把自己的心情和对人生的看法,对母亲的爱融入到了其中,把自己积极,
论文研究了多级模糊数学综合评价方法在企业技术创新能力评价中的应用,建立了以投入能力、研究开发能力、生产能力、营销能力、管理能力和综合性指标为主体的评价指标体系,给
基因治疗的本质是通过基因导入系统将外源基因导入靶细胞,通过遗传或分子生物学技术纠正或补偿基因缺陷和异常,以达到治疗疾病的目的。作为一种新的治疗手段,基因治疗可以克服包