基于浅层句法信息的英汉翻译实例获取方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhangyinalv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
翻译实例是基于实例的机器翻译译文的来源,翻译实例获取方法研究也是提高译文质量的关键环节。作为机器翻译进一步发展所不可或缺的知识,目前汉语中的相关研究还很薄弱。探索研究翻译实例获取方法对机器翻译研究来说具有重要的研究意义和应用前景。现有的翻译实例获取技术还存在很多不足之处。近年来,浅层句法分析技术得到了广泛的关注和研究,其进展为翻译实例的获取提供了实例划分的依据。本文正是利用了现有的英语和汉语浅层句法分析技术对平行语料库进行处理,在此基础上寻找更有效的翻译实例的获取方法。本文研究了利用浅层句法信息获取翻译实例的方法,主要从如下方面展开:1.本文利用统计方法,研究和改进了标志词的确定方法。标志词集合经确定后,能够不依赖句法知识,仅仅依靠词是否是标志词而完成对翻译实例的划分,该研究对实例的获取效率和质量都具有十分重要的意义。2.在基于单语浅层句法分析结果的基础上,本文探索了四种翻译实例获取方法,并且又分别从英语单语语块和汉语单语语块出发,进行了实验和研究,取得了较好的效果,并在此基础上分析得出了翻译实例粒度和实例库质量的关系,为实例获取的研究提供了指导。3.根据英汉双语句对的浅层句法信息,本文研究了三种基于英汉翻译实例的获取方法的方法。探索了词语对齐概率依赖方法,完全词典概率依赖方法,以及词语对齐辅助的词典概率依赖方法,并进行了交叉实例的合并研究,得到了较好的效果,同时也进一步确定和验证了实例粒度和实例质量之间的关系。4.在对各类翻译实例获取方法进行对比分析的基础上,本文探索和实现了一种多类翻译实例融合和过滤的算法。本文对实例的融合策略进行了对比研究,目前的实验已经能够表明经过融合和过滤的实例效果远远超出了其所融合的单一方法获取的实例效果,最终得到了多组实例获取方法的组合,评测结果较之三个对比系统高出很多。实验说明,这种新的算法取得了非常好的效果,是翻译实例获取的一种可行之道。
其他文献
光伏并网系统中,为了抑制逆变器参数不确定和外界干扰对输出电能的影响,提出了鲁棒双闭环控制策略。首先设计电压环线性化自抗扰鲁棒控制器,以稳定直流侧母线电压;其次建立系
通过选用透明度高、太阳能吸收率高的丙烯酸树脂和高亮度、长余辉时间的镝和铕稀土离子共掺杂的稀土硅酸盐光致发光粉末材料aCaO·bZnO·cBaO·dMgO·nSiO2:Eu,Dy,制备出了具
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
近日,江苏靖江暖通空调行业高质量发展推进会暨空调小镇专题招商会召开。靖江市空调行业协会在全国行业内率先发表绿色制造“5G”标准宣言,组建“绿色制造标准化联盟”,通过构建綠色制造标准化体系,打造绿色制造典范,加快推动暖通空调产业高质量发展。
变电站复杂的电磁环境有时会对变电站电气试验工作产生干扰。基于对干扰信号的分析,讨论了自适应滤波器的基本原理,围绕最小均方误差准则以及最小均方(LMS)算法,设计了一种自
目的:建立白芍微粉细胞破壁率的检测方法。方法:采用细胞计数法,以薄壁细胞为评价指标,考察超细粉碎技术对白芍细胞破壁率的影响,测定白芍微粉的细胞破壁率。结果:白芍细粉称样量与
飞机排班是航空公司制定生产计划的一项基本内容。首先通过对排班问题的分析,建立了排班问题的均衡模型;其次通过对航班连线和飞机分别标号,将一种新的差值排序算法引入飞机