基于浅层句法分析的翻译模板自动获取研究

被引量 : 0次 | 上传用户:caep315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的EBMT(Example-Based Machine Translation,基于实例的机器翻译)方法是建立在大规模的实例库基础之上的,存在着精确匹配率不高,模糊匹配时产生译文质量较差等缺点。利用翻译模板可以有效的解决翻译实例的数据稀疏问题、简化实例库的规模并提高实例匹配的精确率。因此,本文提出了基于两级翻译模板的方法,提出了两级翻译模板的体系结构并给出了定义,给出了从句子对齐的双语语料库自动抽取两级翻译模板的方法,并设计了利用模板库进行模板匹配的算法。文中首先对机器翻译的重要技术尤其是基于EBMT的翻译方法进行了整理和分析,其次,概括了翻译模板提出的意义,提出了本文翻译模板的定义和研究策略。最后,在此基础上实现了两级翻译模板的抽取。基于模板的翻译方法的核心问题是模板的抽取与匹配算法。本文在抽取翻译模板的过程中采用了浅层句法分析方法,主要运用了组块识别。浅层句法分析的优点是可以识别出确定性高的部分分析结果,减少句法分析中的歧义,从而降低句法分析的难度。具体方法是:在模板抽取过程中首先对翻译实例进行浅层句法分析,得到双语组块信息,并确定实例的框架,根据对齐约束提取短语翻译模板,在此基础上,提取出句子级的翻译模板。在模板匹配过程中首先对输入句进行组块分析,然后在系统模板库中检索匹配模板。检索过程中兼顾模板的结构信息及子块信息。
其他文献
计算诗学是计算语言学的一个研究领域,计算诗学的研究不仅可以给计算机科学领域增添诗情画意,而且还有助于推动诗学、计算语言学、人工智能等学科的发展。本文以计算机辅助研
文化现代化是城市现代化的重要内容、重要特征。在大力加快城市化的发展战略中 ,必须把文化作为优先发展的重点。加强城市文化建设 ,必须注重培育具有现代素质的市民 ,建筑具
目的:探讨综合护理干预对慢性肾脏功能衰竭患者的临床意义。方法:回顾性分析我院治疗的106例慢性肾脏功能衰竭患者的临床资料,根据对患者的护理方式不同分为护理干预组和对照
目的探讨难治性癫痫持续状态的有效治疗方案。方法对我院2005年1月—2009年7月收治的3例难冶性癫痫持续状态患者进行回顾性分析。结果咪达唑仑联用丙戊酸钠和中药安宫牛黄丸
人脸识别是模式识别领域中一个困难而又具有实用价值和广阔应用前景的研究领域。目前大多数人脸识别系统利用可见光图像进行人脸识别,其识别性能容易受到光照变化的影响,在户
利用酰胺化反应,合成pH敏感性单体甲基丙烯酸二异丙胺基乙酯(DPA)和亲水性单体N-(2-羟丙基)甲基丙烯酰胺(HPMA),并通过可逆加成—断裂链转移聚合(RAFT)制备pH敏感两亲性二嵌
隐喻是思维及语言的中心问题,近几年隐喻计算研究开始受到人工智能研究者的关注。在隐喻现象中,有一大类现象表现出来的特征是搭配关系的超常性,如“My car drinks gasoline
宋词作为中国古代文学历史上一颗璀璨的明珠,古往今来,无数的学者和研究人员对其投入了大量的研究精力。而对宋词风格的研究更是这些研究中较为重要的一个方面,然而,目前这方
2001年《国际燃油污染损害民事责任公约》(以下简称燃油公约)的制定,为减少和控制污染海洋环境提供了一种预防措施,为燃油污染海洋环境造成的损害提供了一种赔偿机制。之所以
近年来,中国作为全球最热的市场之一,吸引着越来越多的跨国公司进入投资。由于企业发展首先依靠的是优秀的人力资源,各企业在激励争夺产品市场的同时,对于人才的竞争也趋于白