融合文档信息的机器翻译自动评价研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:toughlee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,机器翻译技术的快速发展从很大程度上得益于自动评价方法的研究,但是它同样也受到了评价方法性能的制约。在分析已有方法优缺点的基础上,本文提出了一种新的评价方法,并且研究了文档信息在评价方法中的应用。首先,本文提出了基于短语的评价方法—PBE。该方法以语言学短语为基本评价单位,评价过程分为三个模块:短语权重分配、短语相似度计算以及寻找最大相似度匹配。本文分别采用了ngram、tf.idf和C-value三种权重计算方法,提出基于WordNet的短语相似度计算公式,并使用KM算法寻找具有最大相似度的短语匹配。其次,本文研究了使用文档信息提高文档级评价的效果。本文使用的第一种文档信息是文档的主题模型。使用主流的主题模型工具LDA得到每个文档及其词的主题分布之后,本文计算出短语的主题分布;然后本文采用一种通用的计算框架将短语主题分布与PBE中的权重以及相似度函数进行融合。本文使用的第二种文档信息是反映文档连贯性的词汇衔接。在已有LC评价方法的基础上,本文提出了基于权重的WLC,该方法在文档词图上运行PageRank算法获得词汇权重。本文进一步提出pos-WLC评价方法,该方法利用词性信息使得PageRank算法在分配权重时对某些词有所偏向。最后本文将文档的词汇衔接评价与已有的主流方法以及PBE进行融合,以提高它们在文档评价上的性能。在MTC2(LDC2003T17)和MTC4(LDC2006T04)评价数据集的实验表明,本文提出的PBE与人工评价的Spearman相关系数显著地高于目前最主流的方法BLEU。融合文档主题信息后,PBE评价性能在MTC2和MTC4的一些系统上有了进一步提高。词汇衔接部分的实验也表明本文提出的WLC和pos-WLC在文档评价上优于LC,并且它们在多数情况下给出了最好的融合评价效果。
其他文献
无线传感器中的节点能量有限,但是其工作环境往往十分恶劣,在目前的科技条件下,通过配备高容量的电池来提高节点能源的方法可行性不高。因此,能量问题是阻挠无线传感网络快速发展
随着计算机和因特网技术的迅猛发展,从各种各样应用中收集到的数据量越来越庞大,若不采用有效工具挖掘需要信息,这些海量数据信息将超出人类的理解范畴。长此以往将演变为数据量
近年来大城市的交通拥挤、交通事故等现象层出不穷,对人们的生活产生了极大地负面影响。智能交通系统被认为是解决这一问题最好的方案。路径诱导系统是智能交通系统中重要的组
如今互联网快速发展,关键字搜索技术为网页搜索等方面提供了关键技术支持,这是如今网页搜索获得巨大成功的关键,使得用户可以用简单的自己熟知的关键字在网上寻找自己需要的
由于医疗领域的特殊性、诊疗过程的复杂性以及医患间信息的不对称性,临床诊疗不合理现象使得医患间的矛盾日益加剧。临床异常现象指医疗行为偏离了正常诊疗路径,而医疗行为的不
随着中国的发展,社会进入了老龄化阶段,慢性非传染性疾病已成为影响人们生活质量和人体健康的主要因素。慢性病病人健康状况的改善也是一个长期的过程,它不仅需要合理的治疗,
分类在数据挖掘中是一项非常重要的任务,目前在商业领域得到广泛应用。分类的目的是根据数据集的特点构造一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项
偏微分方程是图像处理的主流方法之一,基于偏微分方程的图像修复模型可以较好地对非纹理图像进行修复。Euler弹性修复模型通过引入Euler弹性项,采用光滑的曲线对图像进行修复
身份安全问题是现代社会的一个重要话题,传统的身份识别手段己跟不上现代社会的步伐,新兴的生物特征识别技术依靠其独特的优势越来越受到广大使用者的欢迎。在众多生物特征识别
SNS (Social Network Site),即社交网站。近几年,网络上掀起了一股社交网站的风潮,由于国内社交网站发展较晚,是借鉴外国Facebook的模式发展起来的,所以在发展的同时也带来了