融合多元信息的多方对话情感识别方法研究

来源 :北京信息科技大学 | 被引量 : 0次 | 上传用户:dfsdasdas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着人工智能与大数据技术的发展,智能对话助手的应用场景越来越广泛,人们不再满足于智能对话助手简单的问答功能,赋予智能对话助手情感成为人们下一步的研究目标,对话情感识别也因此受到了研究者们的关注。公用对话数据集的涌现和多媒体处理技术的发展也为对话情感识别任务提供了便利的条件。本文基于多方对话情感识别数据集MELD和多方对话关系抽取数据集Dialog RE展开研究,针对多方对话中的说话者,上下文以及多模态信息构建模型,主要贡献包括以下三点:首先,本文提出了基于角色指代的多方对话关系抽取模型CGAT。将一段对话形式化成异构图,定义不同节点以及节点之间的连接方式。模型首先使用层次化的编码方法,获取话语的特征作为图中话语节点的初始表示;然后使用图注意力网络进行编码,获得对话更全面的表示。实验结果表明,CGAT这种引入对话中的人物角色指代信息并基于图网络进行对话建模的方式,增强了对话中人物信息的表示。相较于基线模型,CGAT模型在验证集上的F1值高出2.9%,在测试集上的F1值高出4.6%。其次,结合多方对话文本中的说话者和上下文特征,本文提出了融合说话者人际关系的多方对话情感识别模型SSR-GAT:(1)将角色关系作为情感识别任务的外部知识库引入;(2)使用图网络将对话构造成图,说话者信息和话语信息作为属性存储在话语节点上,话语节点之间的边上信息使用说话者之间的人际关系进行初始化;(3)使用图注意力网络进行编码获取对话中的情感特征。SSR-GAT模型强调了多方对话中说话者的重要性,在同样的对话场景中,不同说话者之间由于人际关系的不同,在话语中对情感的表达和解读可能有很大差异。实验结果表明,本文所提出的SSRGAT相较于基线模型有一定的提升,F1值达到了62.4%。最终,结合多方对话中的说话者、上下文和多模态特征,本文提出了融合多模态特征的多方对话情感识别模型MMCAN。模型将重点聚焦在模态间的融合,先将文本和音频特征经过单模态编码器进行模态内的特征编码,进一步通过多模态交叉注意力模块进行多模态间的交互计算,增强对话中话语及上下文的表示。MMCAN致力于对多模态特征进行深度融合,通过音频信息补足由文本信息不足造成的对话情感偏差,从而提升模型对话情感识别的能力。实验结果表明,MMCAN模型有效提升了对话情感识别任务的性能,在情绪七分类任务上,F1值提升至62.9%,在情感三分类任务上,F1值提升至70.6%。
其他文献
在社会经济持续增长的同时,企业面临的挑战也越来越艰巨,管理层需要更为果断清醒的决策力,来保障企业在激烈的竞争中存活下来,不被时代的洪流淹没。但部分公司过度寻求多元化进行盲目扩张,不但没有实现原本的雄心壮志,反而得不偿失分散了核心业务,企业的发展受限,运营效率大打折扣,丧失了核心竞争力。因此,许多上市公司为缓解财务危机选择资产剥离,调整战略重整旗鼓。然而,资产剥离的动因和实际情况具备多样性,不同企业
学位
目的:探讨基于扩散峰度成像(Diffusionkurtosisimaging,DKI)、动脉自旋标记(Arterial spin labeling,ASL)成像、纵向弛豫时间定量(T1-mapping)成像、横向弛豫时间定量(T2-mapping)成像评估对比剂相关的急性肾损伤(Contrast-associated acute kidney injury,CA-AKI)向持续性肾功能不全(Per
学位
人体的生理系统在运行过程中会产生包含丰富生理信息的信号,而全面且准确的探测生物体内生理环境是诊断治疗各种疾病的重要基础。随着现代医学的发展,健康已成为人类生活关注的焦点。近年来,能够有效将人体生理信息转化为可分析的电信号的多种传感器在现代医学中得到了广泛的应用。在众多的生理学指标中,血压具有重要的研究意义。当前,有关血压监测的研究在产业领域及科研领域受到越来越多的关注。而植入式血压监测器件能够在临
学位
全无机钙钛矿纳米晶(Cs Pb X3NCs,X=Cl,Br,I)因量子效率高、半高宽窄、可见光全光谱带隙可调、吸收系数大(10~5cm-1)等优异的特性,广泛应用于LED照明、背光显示、微激光、光电探测、太阳能电池、电致发光等诸多领域。然而,作为一种离子型晶体,易受到氧、水、热、光等外部环境影响,从而产生离子键解离等现象。这不仅影响了钙钛矿纳米晶的光学性能,而且严重制约了其应用。近年来,离子掺杂、
学位
研究背景哺乳动物骨骼系统由骨组织与软骨组织组成,主要起源于三种不同胚层的细胞,通过两种骨化方式发育而成:即膜内成骨和软骨内成骨。其中,软骨内成骨是躯干骨和四肢骨的主要成骨方式;在软骨内成骨的过程中,软骨细胞的增殖、成骨细胞的分化及血管的生成紧密协调并介导软骨组织到骨形成的转变,软骨发育异常或骨形成障碍均能导致骨发育不良、矮小畸形等。在骨发育过程中,成骨过程受到包括转录因子、细胞因子及激素等的严密调
学位
“碳达峰·碳中和”已成为全球发展目标,我国化工生产过程中存在着大量能源消耗、浪费的现象,尤其是制糖企业,大多存在因设备老旧,技术更新慢,运行效率低以及大量的余(废)热不能充分利用的现象,不利于企业、行业乃至社会的可持续发展。而制糖过程中能量消耗最为显著的环节在锅炉和煮糖工段。基于此背景,本文展开了糖厂锅炉和煮糖工段能量分析和能效提升的研究,基于糖厂锅炉能效测试数据分析了锅炉的能效现状、影响因素及节
学位
近年来,随着人类科技革命的快速发展,对于能源存储的研究变得越来越重要,但目前便携式的储能技术主要由电池完成。人们需要适时寻找电池的位置、更换电池以及检测电池是否正常工作。在这种情况下,一种可能的解决方案就是转化电子器件所在环境中的能量为电能。摩擦纳米发电机(TENG)作为一项新兴的能源转化技术,已被证实了可以将环境中低频的、杂乱的、分布的机械能转化为电能。TENG具有材质选用范围广、制造工序简便、
学位
锂离子电池具有高能量密度和良好长时循环稳定性等优点,已被广泛用作可便携式设备、电动车和电动汽车的储能装置。随着相关电子设备的大规模推广应用,对锂离子电池的性能提出了更高的要求。高放电容量、良好倍率性能,长时循环稳定的电极材料始终受到人们的关注。由于锂的储量有限,锂价格逐年快速上升,限制锂离子电池在未来大规模储能中的应用。与锂离子电池具有相似工作原理、成本低廉的钠离子电池有望成为锂离子电池的替代品。
学位
半胱氨酸(Cys)作为一种重要的硫醇生物分子,在蛋白质的合成、酶的活性位点以及维持氧化还原平衡等基本生理活动中发挥着重要作用。因此,构建一系列具有高灵敏度的分子成像探针,并用于体外和体内半胱氨酸的定量检测和可视化,对于研究半胱氨酸在人类生理学和病理学中的作用具有重要意义。可激活型近红外(NIR)成像探针由于具有强组织穿透力、高信号背景比、高灵敏度以及特异性等突出优势而广泛应用于检测和生物成像领域。
学位
多环芳烃具有较低的水溶性、高脂溶性以及致癌、致畸、致突变性,被定义为持久性有机污染物,是土壤、自然水体和废水中最普遍的有机污染物之一。目前有机污染场地常用的修复技术有热脱附、生物修复和化学氧化修复,其中化学氧化修复技术在国内有机污染场地修复中所占比例逐年快速增加,但是残留氧化剂、副产物等产生的再利用潜在腐蚀风险问题也引起了研究人员的关注。通过实际调研和网络检索对国内137个实际修复案例进行研究分析
学位