【摘 要】
:
机器翻译一直是自然语言处理领域的热点和难点,在实现不同语言的交流方面具有重要的意义。近年来,随着我国对纳西少数民族语言文字信息应用的日渐重视,实现纳西语言与汉语言
论文部分内容阅读
机器翻译一直是自然语言处理领域的热点和难点,在实现不同语言的交流方面具有重要的意义。近年来,随着我国对纳西少数民族语言文字信息应用的日渐重视,实现纳西语言与汉语言的互通互译就显得尤为重要。其中,利用机器翻译来完成这一目标成为了比较重要的途径之一。但由于汉语和纳西语在语言的句法结构方面存在很大的差异,所以,简单的利用基于词或基于短语的统计机器翻译方法并不能取得很好的翻译效果。.因此,针对汉语-纳西语的句法特点,本文分别利用两种语言在句法结构上的依存关系,开展汉语-纳西统计机器翻译研究,主要取得了以下成果:(1)融合改进依存树到串模板的汉语纳西翻译方法。翻译模板是提高统计机器翻译系统效果的重要基础和手段。本文以汉语和纳西语为研究对象,对基于汉语-纳西语统计机器翻译系统所需的依存树到串翻译模板进行了改进。在进行翻译模板的构建时,提出了添加归并操作的翻译模板抽取方法及相应的解码算法,并根据解码算法,将该翻译模板融入到汉语-纳西语统计机器翻译系统的解码阶段,完成翻译。实验表明,在一定规模的改进依存树到串翻译模板的支持下,基于汉语-纳西语的统计机器翻译效果有大幅度的提升。(2)构建基于纳西语的依存语言模型并对解码效果进行约束。针对纳西语的句法特点,将纳西语句法结构信息融入模型并提出训练方法,在对解码候选翻译结果进行选择时,对正常解码的NBEST候选翻译结果重新计算得分并对其序列顺序进行调整,以提升翻译结果的准确率。最终实验结果表明提出的基于依存句法关系的语言模型对于最佳翻译结果的选择有很大的帮助。(3)利用已有的词语对齐、句法分析等基础软件,结合改进的依存树到串翻译模板、解码算法以及依存语言模型,搭建基于依存句法的汉语-纳西语统计机器翻译原型系统。
其他文献
自从2002年FCC开放了3.1GHz到10.6GHz的频段以后,超宽带无线通信受到了广泛的关注,也使UWB天线得到前所未有的重视。相反对UWB天线的设计要求也提出了各种各样新的挑战,提出了小
本论文阐明了山西省气象培训网站的设计与实现过程,网站以提高山西省气象干部培训中心的信息化程度,在我省气象部门搭建一个功能完善的远程教学平台为目的。资源共享为网站基本
用聚对苯二甲酸乙二醇酯废料 ( PET)和辛醇为原料 ,通过降解酯交换反应制备对苯二甲酸二辛酯。研究了一种用共沸溶剂从反应体系中连续不断排除和分离乙二醇的新工艺 ,有效的
当今时代知识经济迅猛发展,信息量高度膨胀,人们对于信息的需求和控制欲越发强烈。随着计算机技术的普及,使人们具有了处理大量的、复杂的、无序的信息的能力,并且随着网络技术逐
电力负荷预测是电力系统安全经济规划、调度、设计研究的必要和前提。准确的负荷预测,不仅能够帮助电力部门有效合理的制定发配电计划,还能够帮助电力部门减少能源浪费,从而降低
三维扫描技术与获取技术的不断发展,使得三维几何造型技术广泛地应用在计算机辅助设计,计算机辅助制造,逆向工程等多个领域。获取海量的三维点云数据信息成为了现实,但拥有大规模
中医认为,药食同源、药食同性。纵观各代医家,均根据病人原来的体质来指导病人用药及饮食,长期的饮食习惯亦影响着体质的形成。文章论述了食疗与体质的关系,从临床研究与基础
随着网球运动在我国不断地发展,目前学术界对网球运动研究的文章越来越多,涉及的范围也越来越广。尤其是研究生扩招以来,我国网球硕士研究生论文逐年增长,而对网球类文章整体研究
365/24,这个数字对于大部分人来说意味着一年365天、一天24小时。全年无休的工作时间,就是大多数媒体人的工作时间表,这个行业的辛苦与压力可以说都浓缩在了这个数字中。任何
侦查协作具有较强的实务性,长期以来受到各级公安机关的重视。从我国的现状来看,当前侦查协作的水平仍然较低。造成这一现象的根本原因是缺少长效的侦查协作机制,需要通过构