论文部分内容阅读
近年来,机器翻译技术的快速发展从很大程度上得益于自动评价方法的研究,但是它同样也受到了评价方法性能的制约。在分析已有方法优缺点的基础上,本文提出了一种新的评价方法,并且研究了文档信息在评价方法中的应用。首先,本文提出了基于短语的评价方法—PBE。该方法以语言学短语为基本评价单位,评价过程分为三个模块:短语权重分配、短语相似度计算以及寻找最大相似度匹配。本文分别采用了ngram、tf.idf和C-value三种权重计算方法,提出基于WordNet的短语相似度计算公式,并使用KM算法寻找具有最大相似度的短语匹配。其次,本文研究了使用文档信息提高文档级评价的效果。本文使用的第一种文档信息是文档的主题模型。使用主流的主题模型工具LDA得到每个文档及其词的主题分布之后,本文计算出短语的主题分布;然后本文采用一种通用的计算框架将短语主题分布与PBE中的权重以及相似度函数进行融合。本文使用的第二种文档信息是反映文档连贯性的词汇衔接。在已有LC评价方法的基础上,本文提出了基于权重的WLC,该方法在文档词图上运行PageRank算法获得词汇权重。本文进一步提出pos-WLC评价方法,该方法利用词性信息使得PageRank算法在分配权重时对某些词有所偏向。最后本文将文档的词汇衔接评价与已有的主流方法以及PBE进行融合,以提高它们在文档评价上的性能。在MTC2(LDC2003T17)和MTC4(LDC2006T04)评价数据集的实验表明,本文提出的PBE与人工评价的Spearman相关系数显著地高于目前最主流的方法BLEU。融合文档主题信息后,PBE评价性能在MTC2和MTC4的一些系统上有了进一步提高。词汇衔接部分的实验也表明本文提出的WLC和pos-WLC在文档评价上优于LC,并且它们在多数情况下给出了最好的融合评价效果。