基于依存树核函数的语义角色标注研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:pdswzjhxr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一直以来,自动语义分析是自然语言理解的主要目标之一,然而由于深层语义分析的复杂性,人们目前更关心浅层语义分析,一种简化的语义分析形式,它只分析与句子中谓词有关成分的语义角色,如施事、受事、地点和时间等。语义角色标注(Semantic Role Labeling,简称SRL)是对于给定句子中的每个谓词,分析出谓词的语义成分,是浅层语义分析的一种实现方式,具有定义清晰,便于评价的优点。近年来受到越来越多的关注,并已被广泛应用于更高级的自然语言处理相关任务,如机器翻译、信息抽取和问答系统等。目前,主流的语义角色标注研究有两种方法:基于特征向量的方法和基于树核函数的方法。基于特征向量的方法的研究已经较为成熟而且取得了很好的性能,然而,随着越来越多特征的加入,特征之间的影响越来越严重,使得系统性能增长逐渐趋缓,发展遇到了瓶颈。另一种研究趋势是探索基于树核函数的SRL。树核函数方法能够有效的利用结构化信息而避免复杂的特征工程工作。树核函数中使用的句法分析树可分为短语结构句法树和依存句法树。目前常用的基于树核函数的语义角色标注研究主要集中在短语结构句法分析树上。本文在依存句法分析的基础上,使用树核函数方法进行语义角色标注,研究内容主要包括三个方面:1.研究依存句法树结构化信息的表达形式。提出了一种新的依存树表达形式,称之为:依存关系驱动的成分句法树(Dependency Relation-driven Constituent Parse Tree, DR-CPT),该结构类似于短语结构句法树,但同时包含了依存关系类型信息,相当于在短语结构句法树上,将成分类型节点替换成依存关系类型。这样,新的依存树表达形式就同时具有两者的优点。2.研究基于依存树核函数的名词性谓词语义角色标注。结合名词性谓词语义角色标注特点和提出的DR-CPT结构,设计了三种不同的结构化信息裁剪策略,并使用树核函数方法分别在正确和自动句法树上进行实验,实验结果表明,在正确句法树上,系统取得了目前已知的最好性能。3.研究基于依存树核函数的动词性谓词语义角色标注。以CoNLL2009评测为基础,分别进行了谓词词义识别和语义角色标注两个任务,语义角色标注阶段同样提出了三种裁剪策略。实验结果表明,系统取得的性能与CoNLL2009评测报告的最好性能相当。
其他文献
随着网络技术的不断发展,互联网应用领域也在迅速的发展。人们不再仅仅要求信息应用的功能富集化,对服务质量也提出更多要求,特别要求应用的稳定性和安全性。Web ActiveX组件作
字符串匹配问题是文本信息处理领域中的一门非常重要的课题。随着网络和信息技术高速发展,极度膨胀的信息量,使得对信息处理的性能和效率要求越来越高,在某种程度上,字符串匹
自动布图技术在航空航天等领域应用广泛,准确快速的自动布图系统可以极大的提高航天设计人员的工作效率。本文针对航天自动布图工作中实际遇到的潜通路检测问题及电缆网研制问
分子动力学(Molecular Dynamics)是在原子级模拟固态、液态物质的主要计算方法,用于研究物质微观结构、热力学性质及平衡输运性质等,广泛应用于物理科学、材料科学、生命科学
图像去噪是图像处理的经典主题。我们的目标是从噪声污染的图像中还原出一个干净的图像。几十年来,发表了很多处理噪声的算法,去噪性能一直稳步提高。这其中的大多数针对的是常
当今社会,互联网中所包含的种类繁多内容丰富的知识资源,为我们日常学习和工作中面对问题时寻求帮助和获取信息提供了很大的方便。目前的Google和百度等搜索引擎是人们从网络
随着物联网技术的深入发展,无线传感器网络(Wireless Sensor Network,WSN)和Internet的互联问题逐渐凸显,如何无缝地实现这两种网络的互联互通成为应用中的技术瓶颈。由于WSN
人脸识别作为生物特征识别的一个重要分支,近年来受到广大研究者的关注,取得了较快的发展。在一些实际应用中,每人只能获得一张图片作为训练样本,但大多数人脸识别方法在单个训练
半个世纪以来,随着研究的不断深入,已有多种模型用于基因调控网络的构建,包括布尔网络模型、贝叶斯网络模型、微分方程模型等,并取得了一些成果。20世纪90年代,基因芯片等高通量生
增强现实是将计算机生成的虚拟信息与真实世界的叠加,而全景视频是将拍摄到的视频拼接后可任意角度拖动观看的动态视频。在一些受到保护且不便让用户进入的场景(如文物古迹、