语篇分析及其在神经机器翻译的应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:magutosh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语篇分析系统是分析自由文本中存在的语义关系的系统,包括显式关系与隐式关系,两者的区别在于语义关系中间的连接词是否在文本中明文出现。语篇分析在确定文本单元之间的关系及位置,以确定文本块、句子以至于段落之间的关系上有着极其重要的作用。语篇分析分为若干子任务,包括确定连接词,确定连接词连接的两部分文本块之间的关系,确定被连接的文本单元区间等,而长久以来无论是显式还是隐式关系,各个部分的实验结果并不够使人满意。各项结果还有比较大的提升空间。机器翻译是利用了现代计算机系统,完成了在不同自然语言之间进行文本的自动转换,具体是将输入的某种语言的句子翻译成另外一种语言中意思尽可能相同的句子的任务。这在信息学方面有重要的应用。经过多年来大批研究员几十年的不懈努力,机器翻译的研究取得了长足发展,翻译效果不断提升,但机器翻译的结果还是差强人意,在很多应用场合中并不能直接使用。主要缺陷是,传统的机器翻译是基于短语或词的统计机器翻译,作为一种机器学习任务,其模型结构复杂,训练及翻译过程非常耗时,而且经过几十年的发展,翻译质量已经达到瓶颈,很难再有显著的提升。本文研究了语篇分析与机器翻译两个不同的领域,分别对两者进行了研究。在语篇分析方面,根据国内外现有的工作以及自身的创新研究,制定出了直观高效的语篇分析策略,致力于提高语篇分析各个子任务的效果,比如识别准确率。在机器翻译方面,研究领域内表现优秀的神经网络模型,进行提升与改进,完成更高效的神经机器翻译系统。然后将语篇分析与机器翻译进行了结合,把语篇分析的特征引入到机器翻译系统中,以提高机器翻译系统的翻译结果。本文对两个部分的实验系统的结果分别进行了评测,实验结果也证明了语篇分析对优化机器翻译结果的有效性。
其他文献
本研究探讨雷帕霉素对白血病细胞株的增殖抑制作用及其对细胞周期的影响,并分析该药作用前后mTOR mRNA表达水平的变化。采用四唑氮蓝比色试验(MTT)观察雷帕霉素对白血病细胞株KG
骨髓增生异常综合征(MDS)是一组异质性克隆性疾患,迄今其病因和发病机制尚知之不多。近年来发现MDS患者存在表观遗传调节子(epigenetic regulator)基因如TET2、ASXL1、EZH2、DNMT
作为钢中重要的微合金元素,钛既可以细化钢的晶粒,又具有良好的第二相强化作用,同时还具备明显的成本优势,因此低碳钛微合金钢在工程建设领域获得了广泛的应用。作为钢中重要