基于神经网络的成分句法分析

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:sjtwwf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在自然语言处理领域中,相比于分词、词性标注、命名实体识别等浅层自然语言理解任务,句法分析等深层自然语言理解任务越来越受到关注。句法分析就是分析一个给定句子的内部句法结构,并把其转化成一棵句法树。利用句法分析,可以使计算机更深层的理解句子的组织结构、词和词之间的关系,在机器翻译、摘要生成、智能问答等领域都有着广泛的应用。所以句法分析性能的提升,对自然语言理解及其众多应用都有着极大的帮助。  随着深度学习的兴起,基于深度学习的方法在许多任务上都取得了很好的效果,相比传统方法,深度学习的方法在特征抽取、特征表示、序列生成都有天然的优势。本文探讨了利用深度学习的方法,如何更好的解决句法分析这三个问题:如何表达更丰富的树特征,如何使神经网络能够更好的容错,如何利用更深的网络对句子进行建模。具体方法如下:  1.在基于移进规约神经网络句法分析中抽取更加丰富的树结构特征。在基于移进规约的句法分析方法中,往往抽取特征模板的方法要考虑栈与队列的各种词信息,词性信息和树的标签信息及其组合,由于组合特征及句法树等离散特征不仅抽取复杂需要人工定义,而且有很强的稀疏性,限制了句法分析的性能。但是在使用神经网络方法在句法分析应用时,可以把词、词性、树标签等特征转化为向量,这些连续的向量可以很好的解决稀疏性问题,并且神经网络的建模方法也可以很好的避免传统方法中的组合特征的人工定义,各个特征的组合模式已经蕴含在了神经网络的结构之中,因此使用神经网络的方法对栈和队列的大量一元特征的抽取成为了可能。本文还讨论对栈中的句法树片段抽取结构特征建模的方法来提高句法分析的效果,这种方法不仅对单一词和单一标签建模,也对句法树的结构特征进行了建模,从而可以提高句法分析的性能。  2.提高神经网络句法分析的容错性。在使用序列到序列学习时,往往会出现错误传播的问题,即前一个词汇输出错误导致后面的序列也出现了错误,尤其在长句子上的生成表现更加明显。其原因是在序列到序列的学习过程中,使用循环神经网络的方法,其每次输出的结果都依赖于前面输出。在训练过程中,每次的输入是标准的标注词汇,并不是上一步模型的自输出结果。在测试时,由于没有标准答案词汇,只能把自己的模型上一步的输出作为输入,但这种情况却没有在训练中出现过,在神经网络句法分析的训练和测试阶段存在着不一致的情况。本部分以提高句法分析的容错性为目标,提出了带有容错门的神经单元(Fault TolerantUnit,FTU),相比于传统的循环神经网络单元,该单元可以在训练时接受自己的上一步输出,并且可以通过门控机制,自适应调节上一步输出与标准答案的比例,从而使得序列到序列句法分析系统具有更好的容错性和性能。  3.对序列进行更深层次的建模。在使用序列到序列学习时,使用深层神经网络可以对序列进行更好的建模,拥有更好的性能,但是深层神经网络尤其是循环神经网络在训练时,由于使用了大量的非线性函数,在使用错误回传梯度下降训练算法时,底部的参数不容易训练,效果会出现回退现象。针对这个问题,本文在长短时记忆单元(Long Short Term Memory,LSTM)的基础上,设计了一个新的循环神经网络单元-自适应长短时记忆单元(Adaptive Long Short Term Memory,ALSTM)。该单元是LSTM神经网络单元在深度神经网络上的推广,该单元有线性和非线性两个核心,并且通过门控机制来自适应的调节这两个核心的比例,若全部由非线性核心输出则退化为LSTM,若全部由线性核心输出,则变为前馈线性神经网络,该网络对深层神经网络具有很好的适应性,并在句法分析任务上有更好的表现。
其他文献
该文针对中国教育科研网内蒙古地区网络的管理问题,提出了一个分布式网络管理的体系结构,采用总控中心下辖若干子控中心的结构,对主干网和园区网的责权进一步划分,按照数据和
随着移动互联网的飞速发展,激增的Web服务业务量,使得Web应用的架构从简单的单机环境演变为复杂的集群环境。如何高效地部署、管理、运维Web集群成为热点问题。通过云计算和虚
多机器人协作是机器人研究领域的一个重要课题。本论文以多移动机器人协作完成“围捕”任务为背景,对多机器人协作问题中的系统体系结构、系统任务层的协作与协调、行为层的规
内容中心网络(Content Centric Networking,简称CCN)是一个以信息互联的网络体系结构,中间节点缓存内容,在内容获取过程中,用户与应用只关心内容本身,而不需要关心内容所在的网络位
CAD系统的信息共享与CAX系统信息集成的需求不尽相同,为每一个需求都实现特定的方案并不现实,因此,使系统内在地支持信息的集成与共享,进而提高CAD系统的适用性已成为迫在眉
当前对IDS的研究大多集中在检测机制上,缺乏有效的响应机制来阻止已经发现的攻击行为,防范未来可能进一步发生的类似攻击事件.结合研究小组己有的研究结果,分析了一个基于被
在目前的计算环境中,如何有效的存储和管理日益增长的数据是我们面临的挑战.为了解决这个问题,存储区域网应运而生.在存储区域网分布式文件系统中,存储共享冲突问题是关键问
在对软件体系结构的概念进行了介绍之后,分析了常用的软件开发模型,在此基础上详细阐述了基于体系结构的软件开发模型,并提出了基于体系结构的软件复用方法和过程,而且用WRIG
第三代搜索引擎有如下几个特点:索引数据库的规模继续增大,一般的商业搜索引擎都保持在几千万甚至几十亿个网页;由于搜索返回数据量过大,检索结果相关度评价成为研究的焦点.
该文采用虚拟现实的行为建模方法,在对可编程实验环境的操作过程分析的基础上建立基于软硬件协同处理环境的SHCB(SoftwareHardwareCooperation Behavior)模型.SHCB模型以虚拟