基于深度学习的视觉问答方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:xiaoxi21175
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多模态数据的积累和深度学习的飞速发展,以视觉问答为代表的跨模态学习任务得到了广泛的关注和研究。视觉问答是指给定图像和自然语言的问题,对图像的视觉元素进行推理以推断出正确的答案。该任务是一项具有挑战性的多模态学习任务,因为它需要同时理解文本和视觉模态。因此,以细粒度的方式表示问题和图像在模型性能的提升上起着至关重要的作用。为了获得细粒度的表示方式,本文以注意力机制为基础设计了端到端的深度神经网络模型,以共同学习问题和图像特征。本文的主要工作内容包括:
  1.针对传统协同注意力机制不能准确定位问题中的重要词汇和相关视觉区域的不足,本文提出了CAQT模型。CAQT包括协同注意力机制,该机制包括基于自注意力的文本注意力和问题引导的视觉注意力。基于自注意力的文本注意力可找出问题中重要的词汇,并获得具有区分性的问题表示。然后,利用该问题特征引导视觉注意力计算,该机制可根据文本信息定位出与问题相关的图像区域。另外,本文在CAQT模型中引入了问题类型,并将数据集VQAv1.0和VQAv2.0中的问题分为8个类别。本文将问题类型的独热编码直接拼接至多模态特征之后,可使模型在答案预测之前知道问题类型,减小答案的查找范围,从而提高模型性能。
  2.针对经注意力模块计算得到的特征可能与参与计算的Query无关的不足,本文提出了双层注意力机制。DAtt的注意力模块由基于文本的双层注意力和基于视觉的双层注意力两部分组成。双层注意力机制可保证经注意力计算得到的特征和参与注意力计算的Query相关,能重点关注与问题语义相关的输入信息,从而减少无关信息的干扰。
  3.本文在VQAv1.0和VQAv2.0两个公开数据集上进行实验验证,CAQT模型中的协同注意力机制和问题类型模块都能提升答案准确率;DAtt模型中基于文本的双层注意力和基于视觉的双层注意力也能改善模型性能。
其他文献
学位
随着全球气候剧变、水污染、城市雾霾横行等环境问题愈发严重,給人们的生活带来了巨大的威胁和挑战,全球环境规制日益严格,公众的环保意识也不断增强,但环境问题一直桎梏约束着经济发展。制造业作为我国经济社会发展的主体地位,随着规模的不断扩大,是我国制造业极易往高消耗、高污染的发展轨道上前行。当前我们所面临的最主要问题是:如果推动工业制造与生态保护的和谐共处,如何破解经济增长与生态环境保护之间的矛盾。然而在
学位
近年来,中国高技术产业保持着较为快速的发展态势,在推进经济可持续发展、加快制造业转型升级、打造产业科技创新高地的进程中,发挥着引擎作用。在创新驱动发展与供给侧结构性改革的背景下,中国高技术产业创新取得了一定进展,但自主创新能力仍有待提升,核心技术的掌握仍是一个难题,技术获取仍然需要一定技术引进,重生产轻技术开发的问题依然存在。产业创新系统是国家创新体系的重要组成部分,是区域创新系统与企业创新系统的
突发事件不被期待,却年年造访;猝不及防,毫无征兆。近年来突发事件发生的频率在全球范围内呈现递增的态势,带来的危害和损失也越来越大。为了尽可能的避免、减少人员伤亡和经济损失,需要在应急管理过程中重点关注应急设施系统的规划。应急设施的规划设计是突发事件应急响应效率的基础,其缺陷无法通过后期的应急管理进行弥补。因此,如何进行应急设施的合理布局成为降低突发事件损失的关键所在。目前,我国对应急设施选址的规划
学位
学位
学位
学位
近年来随着对港口环保的要求不断提升,船舶岸电技术在靠港船舶中的应用越来越广泛。船舶岸电是指船舶靠港后停止使用船舶柴油机机发电,而采用港口岸电系统向船舶提供电力,从而减少大气污染物排放。船舶岸电的监控与运维一体化技术研究,对提高港口岸电系统运行的稳定性和高效性具有重要意义。  本文针对船舶岸电监控与运维一体化系统展开了研究,设计了监控与运维系统的总体架构和系统功能,研究了岸电并网运行过程中船舶负载变
学位
目前,国内的造船企业对于船体外板的加工成形,都是依赖于经验丰富的工人手工加工来完成。随着我国造船业的蓬勃发展和订单量的增加,传统的手工加工方式在造船质量与造船速度都无法满足日益增长的需求,造船技术亟需现代化升级。同时,在2016年国务院发布的《中国制造2025》发展战略中明确提出了智能制造、绿色制造的诉求,并将海洋工程装备和高技术船舶这两个领域作为未来十年的发展重点之一。因此,研究船体外板的曲面成
学位
随着物联网技术的发展,越来越多的传感器出现在日常生活和工业领域中,海量传感器产生的时间序列数据具有动态性、异构性、大规模性以及时间依赖性等特点,增加了在不同物联网应用中的决策的艰难性。对物联网时序数据进行分析时,需要综合考虑多种类型的传感器数据来提升时序数据预测性能。同时,对物联网中传感器产生的大量数据存在的异常进行检测,也是亟需解决的问题,通过对物联网时序数据进行异常检测,可以降低异常造成的损失
学位