论文部分内容阅读
语篇分析系统是分析自由文本中存在的语义关系的系统,包括显式关系与隐式关系,两者的区别在于语义关系中间的连接词是否在文本中明文出现。语篇分析在确定文本单元之间的关系及位置,以确定文本块、句子以至于段落之间的关系上有着极其重要的作用。语篇分析分为若干子任务,包括确定连接词,确定连接词连接的两部分文本块之间的关系,确定被连接的文本单元区间等,而长久以来无论是显式还是隐式关系,各个部分的实验结果并不够使人满意。各项结果还有比较大的提升空间。机器翻译是利用了现代计算机系统,完成了在不同自然语言之间进行文本的自动转换,具体是将输入的某种语言的句子翻译成另外一种语言中意思尽可能相同的句子的任务。这在信息学方面有重要的应用。经过多年来大批研究员几十年的不懈努力,机器翻译的研究取得了长足发展,翻译效果不断提升,但机器翻译的结果还是差强人意,在很多应用场合中并不能直接使用。主要缺陷是,传统的机器翻译是基于短语或词的统计机器翻译,作为一种机器学习任务,其模型结构复杂,训练及翻译过程非常耗时,而且经过几十年的发展,翻译质量已经达到瓶颈,很难再有显著的提升。本文研究了语篇分析与机器翻译两个不同的领域,分别对两者进行了研究。在语篇分析方面,根据国内外现有的工作以及自身的创新研究,制定出了直观高效的语篇分析策略,致力于提高语篇分析各个子任务的效果,比如识别准确率。在机器翻译方面,研究领域内表现优秀的神经网络模型,进行提升与改进,完成更高效的神经机器翻译系统。然后将语篇分析与机器翻译进行了结合,把语篇分析的特征引入到机器翻译系统中,以提高机器翻译系统的翻译结果。本文对两个部分的实验系统的结果分别进行了评测,实验结果也证明了语篇分析对优化机器翻译结果的有效性。