论文部分内容阅读
翻译实例是基于实例的机器翻译译文的来源,翻译实例获取方法研究也是提高译文质量的关键环节。作为机器翻译进一步发展所不可或缺的知识,目前汉语中的相关研究还很薄弱。探索研究翻译实例获取方法对机器翻译研究来说具有重要的研究意义和应用前景。现有的翻译实例获取技术还存在很多不足之处。近年来,浅层句法分析技术得到了广泛的关注和研究,其进展为翻译实例的获取提供了实例划分的依据。本文正是利用了现有的英语和汉语浅层句法分析技术对平行语料库进行处理,在此基础上寻找更有效的翻译实例的获取方法。本文研究了利用浅层句法信息获取翻译实例的方法,主要从如下方面展开:1.本文利用统计方法,研究和改进了标志词的确定方法。标志词集合经确定后,能够不依赖句法知识,仅仅依靠词是否是标志词而完成对翻译实例的划分,该研究对实例的获取效率和质量都具有十分重要的意义。2.在基于单语浅层句法分析结果的基础上,本文探索了四种翻译实例获取方法,并且又分别从英语单语语块和汉语单语语块出发,进行了实验和研究,取得了较好的效果,并在此基础上分析得出了翻译实例粒度和实例库质量的关系,为实例获取的研究提供了指导。3.根据英汉双语句对的浅层句法信息,本文研究了三种基于英汉翻译实例的获取方法的方法。探索了词语对齐概率依赖方法,完全词典概率依赖方法,以及词语对齐辅助的词典概率依赖方法,并进行了交叉实例的合并研究,得到了较好的效果,同时也进一步确定和验证了实例粒度和实例质量之间的关系。4.在对各类翻译实例获取方法进行对比分析的基础上,本文探索和实现了一种多类翻译实例融合和过滤的算法。本文对实例的融合策略进行了对比研究,目前的实验已经能够表明经过融合和过滤的实例效果远远超出了其所融合的单一方法获取的实例效果,最终得到了多组实例获取方法的组合,评测结果较之三个对比系统高出很多。实验说明,这种新的算法取得了非常好的效果,是翻译实例获取的一种可行之道。