基于多关注度模型与拷贝机制的视觉场景理解方法研究

来源 :西安邮电大学 | 被引量 : 1次 | 上传用户:lqlcug
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多领域交叉学习趋势日益增强,趋向于实用化的研究日益增多。其中,最受学者关注的一项研究是在辅助医疗、辅助教育等领域存在巨大潜力的视觉场景理解技术。目前,对于视觉场景理解任务已经开展了大量研究,而基于深度学习的视觉场景理解模型是目前研究的重点。该模型引入机器翻译相关思想,并引入了编码-解码框架,它不仅改变了基于目标检测的传统模型,还将视觉场景理解任务转化为端到端的“翻译”任务;随后向视觉场景理解任务中引入机器翻译另一重要模型——注意力模型,该模型通过在不同时刻,对同一组特征图谱的不同区域进行重要程度打分,并使用打分结果的高低决定下一关注位置。但是在实际应用中系统或用户所要面对的对象和场景是变化的、不可预知的,而现有数据集纵使包含多种对象类别和应用场景也不能改变描述性能受限于数据集与语言模型的现状。若从扩充数据集入手解决这个问题不仅极为困难,而且也会带来过度的研究损耗。因此,为了提高视觉场景理解模型的泛化能力和鲁棒性,本文从多特征融合与多模型联合两种角度提出了两种视觉场景理解模型的改进方案。(1)针对传统的视觉场景理解模型在编码阶段使用最后一层卷积层特征编码上下文向量而引起的图像语义缺失,图像关注位置定位不准确等问题,提出了基于多注意力机制的视觉场景理解模型。该模型主要考虑了注意力机制在不同时刻对同一特征图谱的不同区域具有不同注意力的特性,将空间注意力模型和语义注意力模型引入视觉场景理解任务,并从隐藏层和特征通道两方面入手以提高对象定位准确度;另外,本模型借鉴目标检测中使用多层特征来提高模型性能的经验将多层特征融合技术加入到视觉场景理解模型中,并使用新生成的特征图谱编码上下文向量。实验结果表明,改进后的网络模型不仅解决了图像关注位置不准确的问题,还提高了描述准确度。(2)传统视觉场景理解模型在相继增加编码-解码框架、注意力机制后已取得突破性进展,但描述性能过分依赖于训练数据集和语言模型的问题依然没有解决。针对此问题,本文提出基于正则化与拷贝机制的视觉场景理解模型。该模型首先借鉴人们交流中往往会“拷贝”对方话语中的词汇或长短语来完成对话,因此在本模型中考虑增加一个称为拷贝机制的辅助网络来实现图像内容向描述结果的拷贝。另外,为了保证解码过程中图像信息的完整性引入正则化机制,该机制可以通过重构上一时刻的隐藏状态来激励当前隐层获得更完整的图像信息,并对LSTM网络起到正则作用。随后,通过在Flickr30K和MSCOCO数据集上的实验对该模型进行充分了验证,并证明该模型有效的解决了描述泛化能力不强等问题。
其他文献
保障性住房开发商的合理利润率,应依据其所承担的风险来确定。根据开发商所承担市场风险的不同,保障性住房分为开工前定价和竣工后定价两类。运用资本资产定价模型测度不同类
本文以湖北省恩施州来凤县实施整村推进扶贫工作为例进行阐述、分析、总结扶贫过程中出现的问题,并在此基础上提出相应的对策,从而确保整村推进扶贫成效和模式的可持续发展,
现今世界,能源问题是最大的难题之一,对于绿色能源的需求日益增强。甲烷作为化学品和清洁化石能源的原料已经引起广泛的关注。此外,由于人口日益增多且工业化进程的加快导致
跨界民族因素是中缅边界谈判过程中一个重要但常被学界忽略的议题,对中缅边界谈判的进程、结果产生了重要影响。新中国对中缅边界划分涉及跨界民族事宜的处理原则和方法,包括
<正>随着人们生活质量的提高以及食品种类的增多,越来越多的保健食品、新资源食品、转基因食品流入市场,食品市场出现新的变化。与此同时,食品新原料、新的食品添加剂、不规
本文采用文献资料、录像观察法和数理统计法等研究方法,对中国女排的主攻手朱婷与国外优秀女排主攻手在近3年世锦赛、世界杯和奥运会排球赛中竞技水平进行比较分析。主要结论
目的:探讨预见性护理在早期肝性脑病患者中的应用方法和效果。方法:将142例早期肝性脑病患者随机分为干预组和对照组各71例,对照组采用常规护理措施,干预组实施预见性护理干
职业足球联赛发展蓬勃,吸引了世界各地各个行业的研究人员的注意力。自1969年起就有不少学者将目光投向职业足球比赛所蕴藏的巨大经济效益。然而,由于一些历史、政治因素的影
面对“中国热”和“汉语热”的持续升温,2009年11月,国家汉办/孔子学院总部在改革旧HSK的基础上,正式推出新HSK(新汉语水平考试),以满足外国人汉语测评的需要。新HSK重点考查
追求教育公平,是教育的基本要义。随着我国义务教育阶段就近入学政策的普及,适龄学子能上什么类型的初中,更多的取决于制度和政策因素,而非个人学习成绩,但在非义务教育的高中以及高等教育,优质教育资源的选择标准主要还是依据学生的学习成绩。然而不同家庭中子女接受的教育机会、教育条件是不同的,从而导致子女学习成绩的差异。与此同时,被国际学术界称为“影子教育”的课外补习项目在中国迅速发展,各种培训学校应运而生,