多模态英文动词性和形容词性隐喻识别研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:jay1222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐喻是一种十分普遍的语言现象,它反映的不只是人对语言的使用方式,更是人对事物的认知方式。隐喻在自然语言处理中处于十分重要的地位。语义的矛盾是隐喻的标志和信号,隐喻识别模型需要利用词语的特征,找到词语间的矛盾来识别隐喻。多模态的方法使用词语的文本信息和图像信息获取特征,它可以让隐喻识别模型获得更丰富的词语特征。词语可以按抽象度分为具体词和抽象词,具体词具有实体,使用图像信息可以获得更丰富的特征,而抽象词不具备实体,难以使用图像信息。本文把词语的抽象度和多模态方法结合起来,为具体词和抽象词选择合适的模态信息。很少有抽象度计算方法会考虑到词语的词性对抽象度的影响。而不同词性的词语具有不同的词义,这会导致抽象度的不同。因此本文提出了一种区分词性的抽象度获取方法,为隐喻识别模型提供支持。在文本模态特征获取方面,本文使用词语的词性抽象度作为特征信息。在图像模态特征获取方面,本文利用互联网获得词语的图像模态信息,使用卷积神经网络模型获得图像模态的特征向量,再计算出概念的图像模态相似度信息。在词语的区分词性抽象度计算方面,本文首先在权威抽象度数据库中获取只具有单一词性的词语,把它们作为种子词,再使用多词义词向量模型获得词语的词性向量,使用词性向量与种子词之间的语义距离获得各词性的抽象度。获取词语在文本模态和图像模态的特征以及词语的词性抽象度后,本文实现了一个多模态的英文动词性和形容词性短语的隐喻识别模型。模型首先根据短语中名词概念的词性抽象度把它分成具体概念和抽象概念,之后对具体概念和抽象概念使用不同的识别策略。隐喻识别模型对具体名词使用文本模态和图像模态的特征;对抽象名词仅使用文本模态的特征。综上所述,本文结合了词语的区分词性抽象度以及词语的多模态特征,提出了面向英文形容词性和动词性短语的隐喻识别方法。实验表明我们的隐喻识别方法是有效的,为隐喻计算研究提供了新的思路。
其他文献
固体氧化物燃料电池(Solid Oxide Fuel Cell,简称SOFC)作为一种绿色高效的发电装置,其发展对控制环境污染具有重要意义。SOFC在高温下的结构可靠性和运行寿命方面仍存在问题,
汽车作为代步工具已经进入了大众的生活,随着汽车的普及,汽车安全问题日益突出,其中,断裂问题的研究对于提高汽车安全性具有重要的意义。有限元方法在处理断裂问题时存在着缺
对企业生产过程质量进行在线控制是提高企业产品质量的有效途径。统计过程控制(SPC)是对企业生产过程质量进行在线控制的重要理论基础。在统计过程控制理论中,当企业产品质量特性数据可以由一个因变量和多个自变量的函数关系来描述时,就称这种质量特性数据为轮廓(Profile)数据。对企业生产过程中表现出轮廓类型的质量特性数据进行控制,是企业产品质量管理中研究的热点。本文针对企业生产过程中的实际问题,主要就轮
背景:研究表明,炎症与恶性肿瘤密切相关,多数情况下,恶性肿瘤伴有局部或全身炎症反应,而诸如中性粒细胞、白细胞、淋巴细胞、血小板、C-反应蛋白、血浆白蛋白、前白蛋白、白细胞介素-6等炎症指标则反映癌症患者的炎症状态;中性粒细胞与淋巴细胞比率(Neutrophil-to-lymphocyte ratio,NLR)、格拉斯哥预后评分(Glasgow Prognostic Score,GPS)、血小板与淋
图像质量评价(Image Quality assessment,IQA)因能够快速、准确、客观、自动的评价图像的质量,为相关计算机视觉任务提供评价标准,使其成为计算机视觉领域的研究热点之一。图像质量相关的特征提取是影响IQA方法性能的关键,其中深度学习因其自适应提取特征的能力,成为当前IQA领域的主流方法,值得深入研究,具体表现在:1)目前大多数IQA方法中仅考虑失真图像与参考图像的特征距离来度量
随着我国社会的快速发展,人们的生活质量逐步提升,物质需要得到极大的满足,人们不只局限于物质需要的满足。党的十八大报告提炼了我国社会主义核心价值观,总结了包括“爱国、诚信、敬业、友善”在内的24字核心价值观。人们对美好生活的要求越来越广泛,友善和谐的社会关系可以充分消解社会矛盾,营造人与人之间互帮互助,友好相待的社会氛围,以此满足人们日益增长需要。武术孕育于中华传统文化,武术中的武德精神与人为善精神
本文介绍了一种用3D打印机打印图像的方法,该方法可以让用户获得任意一张图片双色的立体模型。我们将二值图转换成3维模型,导入到3D打印机的软件中,生成可被打印机识别的工作指令,依照指令,打印机便能自动制造出模型。我们首先利用非真实感图像渲染技术将输入图像转换成黑白色调的二值图,接着用线刻画方法提取图像特征并且将其与原始图像的黑白色块结合,从而产生整洁的且边界光滑的大片黑白色块。然后将上述二值图像转换
现场图作为刑事案件现勘记录的重要组成部分,是进行犯罪现场重建的重要依据,是侦查破案的重要信息来源。在目前大数据技术、人工智能技术飞速发展的背景下,使用计算机辅助方法对刑事案件现场图中信息归类分析将成为未来“信息化勘查”的发展趋势。现场图的自动分类则为实现此目标奠定了基础。本文依据时代背景提出了现场图自动分类的研究问题,并且提出了基于卷积神经网络的现场图自动分类方法。首先,通过查阅相关资料,总结了现
目的:通过检测甲状腺髓样癌(medullary thyroid carcinoma,MTC)中错配修复(mismatch repair,MMR)蛋白的表达情况,并根据MMR蛋白阴性或阳性的表达组合确定其微卫星不稳定性(microsatellite instability,MSI),来了解MTC患者中可能从抗程序性死亡受体1(programmed cell death protein 1,PD-1)
在地震多发地区,对新建的建(构)筑物进行抗震设计,对于减小建(构)筑物破坏至关重要。某新建港口位于地震多发地区,拟建港口场地含有一层松砂,为确保防波堤等重要构筑物安全,需对