一种汉语句子中A-is-B模式的隐喻识别方法

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:jianghong_jones
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐喻这种表达方式在日常生活以及各场合下使用的语言中频繁出现,同时也是自然语言处理中的一大挑战,若隐喻识别技术无法进步,那自然语言处理领域的发展也会受到限制。而由于A-is-B模式的隐喻句出现情况更加灵活,导致A-is-B模式隐喻识别又是隐喻识别的难点。目前A-is-B模式隐喻识别的研究有以下几个瓶颈:第一,源域词范围更加广泛。A-is-B模式隐喻句中,A和B的范围都非常宽泛。第二,上下文更敏感。同一个A-is-B模型隐喻句在不同的语境下会表现不同的意义。第三,代词的影响。A-is-B模型隐喻句中,A往往是代词,识别隐喻时有必要将代词转化具体的名词或名词短语。第四,死喻的存在,有些源域词因为隐喻意表现太突出,人们在使用过程中已默认该源域词固有该隐喻意,导致源域词成了一个多义词。本文选择汉语文本中的A-is-B模式的隐喻句作为研究对象,针对A-is-B模式隐喻识别难的问题,提出了一种基于LSTM和多特征融合的神经网络分类器方法,实现了对A-is-B模式隐喻句的自动识别。本文主要研究内容如下:(1)A-is-B隐喻句的特征提取。分别使用基于上下位关系库、基于句模、基于类词以及基于Word2Vec相似度的四种方法对句子提取特征。在上下位关系库中,对《同义词词林》中的上下位关系进行了扩充,并且利用递推性对上下位关系进行了排歧;在句模中,提出了非隐喻句模和比喻句模两种句模的匹配方法;在类词中,提出了一种基于种子迭代获取类词的方法,通过对种子内部信息挖掘来扩充类词;在Word2vec中,采用提取尾词的方法,提高相似度判断的合理性。(2)A-is-B隐喻句的分类。采用一种基于LSTM和多特征融合的神经网络分类器算法,该方法用LSTM神经网络对整个句子提取特征,将该特征与本文四种特征提取方法得到的六种特征合并起来,使用全连接神经网络产生最终的分类结果,然后对比标注的真实结果,调整该算法神经网络部分的参数。实验结果表明,与使用SVM分类器和LSTM分类器的方法进行对比,使用基于LSTM和多特征融合的神经网络方法具有更好的正确率和召回率,分别为96.7%和93.1%,但预测一个句子的时间开销更大。根据本文的实验结果分析,改进后的方法取得了良好效果。
其他文献
人们往往从制度层面去理解和解释农村信用问题中的信贷失信行为,并提出要加强信用制度建设等举措。然而,实际情况是失信行为的治理状况并不理想。原因是,相比于以理性为主导的现代社会市场经济环境,农村的市场经济发展并不成熟,经济基础薄弱,制度的建设与完善相对缓慢,与城市现代社会各方面都有着较大差距。因此,现代城市社会所拥有的在我们看来成熟有效的举措可能对于农村社会并不适用。特别地,基于“血缘”、“地缘”的人
随着中间品贸易的盛行,越来越多的国家参与到全球生产分工体系中。通过服务外包这种方式使得包括研发、金融、信息、设计等服务价值内嵌到出口制成品中,成为国际分工的重要形式。中国制造业近年来发展迅速,但由于人口红利逐渐丧失,制造业出口正面临着来自国内和国外的“双重挤压”。这要求中国制造业必须转型升级,而服务外包是一条重要的解决途径。通过服务外包提升中国制造业的出口复杂度,对于提升中国出口质量、实现高质量发
在相当长的一段时期内,由于我国金融和资本市场体系发展不够完善,市场上有大量的散户投资者,形成的投资格局是散户为主,机构投资者为辅,这种不健康的投资格局一度被认为是市场频繁出现异常现象的主要因素。为引导广大投资者进行理性投资从而维护我国金融和资本市场的稳定性,证监会于2000年底提出要大力发展机构投资者的策略,根本目的就是改变现状。在国家政策方针的正确指引下,我国金融和资本市场体系发展逐渐完善。与此
目前中国经济正处于转变发展方式的关键阶段,“民生问题”自被提出以来越来越受到关注,各地的民生性财政支出也有了增加的趋势。财政支出作为总需求的一部分,对经济增长存在一定的影响作用,而民生性财政支出作为财政支出中的组成部分,有别于其他类型的财政支出,对于经济的增长产生怎样的影响是值得深思的;且西部地区相比较于东、中部地区而言经济落后,发展较为缓慢,因此如何更好地发挥民生性财政支出对经济增长的作用,是值
随着互联网技术的发展和普及,网络在给人类带来极大便利的同时,网络攻击的目的、技术手段也变得更加多样,从而导致网络攻击愈加难以预测。被动预测已经不能满足网络攻击防御的需求,主动预测成为现今网络防御发展的主要方向。本文在现有网络攻击预测模型研究基础上,提出了一种攻击图模型NAPG。该模型引入攻击增益,对攻击行为进行可行性分析,消除冗余路径,提高攻击图中节点可达概率计算的准确度。除此之外,NAPG模型又
功能梯度材料(functionally gradient materials,FGM)是两种或多种材料复合而成的一种新型复合材料,且成分和结构呈连续梯度变化。通过其各个组分的控制,可以满足各种特殊环
本文关注在经济全球化与中国经济转型的动态环境下,企业如何利用反馈寻求行为,保持企业的竞争优势,为服务化转型提供助力。随着信息技术的快速发展,制造业竞争日益激烈,创新
中国制造业就其规模而言已居世界第一,但在国际分工中,由于所从事的大部分为价值链低端的加工组装环节,产品技术含量相对较低,可替代性较高,长远来看不利于我国制造业的健康发展。而服务业作为与制造业紧密相连的产业,在我国的发展前景广阔,2004-2017年,我国服务业实际利用外资额从140.5亿美元上升到889.8亿美元,并在2011年赶超制造业FDI成为外商投资额最多的产业。由此看来,在制造业吸引外资能
本论文研究了手性(6-甲基吡啶)-(咪唑啉)NCN’钳形钯化合物的合成及表征,并初步探索了其在催化亚胺与丙烯腈的不对称aza-Morita-Baylis-Hillman反应中的应用。主要研究内容如
由于专家经验和专业知识的局限性和决策环境的复杂性,不确定性现象广泛存在于实际决策问题中。如何应用合适的理论和方法来处理这类不确定性现象变得十分必要和迫切。模糊集