【摘 要】
:
事理图谱本质上是一个事理逻辑知识库,描述了事件之间的演化规律与模式。在事件预测、常识推理、商业推荐等领域具有重要的应用价值。事理图谱定义为一个有向有环图。图中的
论文部分内容阅读
事理图谱本质上是一个事理逻辑知识库,描述了事件之间的演化规律与模式。在事件预测、常识推理、商业推荐等领域具有重要的应用价值。事理图谱定义为一个有向有环图。图中的结点代表事件,边代表事件间的逻辑关系,主要包括顺承关系、因果关系。构建事理图谱包括两项任务,事件抽取和事件关系识别。在进行事理图谱构建的过程中,现有的自然语言处理预训练-微调模型仅编码字词之间的关系,而忽略了字词本身的内部含义。本文将义原信息融合到现有的预训练微调模型中,并基于义原融合的方法对事理图谱构建工作展开研究。事件抽取是识别出事件触发词并判断事件的施事方和受事方。针对事件抽取问题,本文采用基于Bert的序列标注方法。义原作为最小的语义单位,对于每个字词最底层的含义进行标注。本部分将义原信息融入到预训练模型微调模型中,提出了基于义原矩阵分解的模型BBSMF和基于字义原预测BBSP的模型。两种模型的主要思想是在进行事件抽取任务时同时进行义原任务训练,使得义原任务调整Bert的编码结果,从而在事件抽取问题上取得更好的效果。事件抽取任务采用上述两种模型进行实验,结果显示融合义原的两种模型比融合前基于Bert的模型F1值均有提高。事件关系识别是对抽取出的事件进行特定关系的判断。针对事件顺承关系识别问题,本文采用基于Bert的句子级分类方法。由于上述两种义原融合方法是对字进行相关融合,不适用于句子级分类任务,故本部分提出了句子级义原融合的BBSSP模型。主要思想是通过Bert句子分类的标志位来预测序列中存在的义原,从而使得拥有顺承关系、逆顺承关系的两个句子序列在特征空间中更加相似,并使他们与无关系的两个句子序列区分开来。事件顺承关系识别任务采用上述模型进行实验,结果显示融合义原的模型相比于Bert模型的F1值有所提高。
其他文献
图像文本检测是指从图像中定位出文本区域,该技术广泛应用于图像检索、智能教育等领域。本课题源于移动应用广告文案分析的实际需求,此场景下文本多为水平分布或者接近水平分
环境保护公私协作契约是指公主体与私主体为明确其在环境保护合作中的权利义务而订立的以实现环境污染治理、生态环境修复以及环境保护公共产品与公共服务供给为目的的合同。
本世纪以来,随着生活与科技水平的提升,民众对健康问题的关注日益增多。智能医疗问答系统,能够快速反馈用户所需的专业医学信息,具有非常重要的研究与应用价值。目前,大多数
分子通信(Molecular Communication,MC)是利用生物化学信号在系统之间实现信息交换的通信技术,涉及通信理论、生物技术和化学的交叉学科领域。与传统的电磁波通信相比,以分子
区块链作为数字货币的技术支撑,具有去中心化、减信任、防篡改的特性,其采用密码学、分布式和博弈论等相关技术,解决中心化公司的高成本、低效率和数据所有权被垄断的问题。
很多学者从混沌系统的非线性特性、物理学特性、动力学特性等不同方面,研究出各种新型方法来产生如多翼混沌系统、多涡卷混沌系统、时滞混沌系统等功能各异的混沌系统,而利用
现实生活中往往存在一些计算机难以处理或者处理效果不佳的问题,如给图像打标签、判断两个记录是不是同一个实体等。众包直接将这些问题发布到互联网上,通过集合互联网上的未
高能反应中产生的末态夸克(或胶子)转变为实验可观测强子的过程称为强子化。由于支配它的非微扰量子色动力学(NPQCD)仍未解决,其机制至今只能以唯象模型与实验的互动研究进行探索
目的:探讨IFT80(Intraflagellar transport 80)对胃癌细胞SGC-7901和MKN-45增殖、凋亡和侵袭的影响,以及IFT80过表达上调神经生长因子受体p75NGFR从而使MMP9表达增加以促进胃
目的本文在肝癌细胞(HepG2)和正常肝细胞(L02)中鉴定UHRF2的磷酸化修饰差异位点,并探究UHRF2的磷酸化修饰差异位点对其生物学功能的影响。方法本文通过LC-MS-MS技术定量分析U