基于语义理解的手绘图像检索技术研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:jtgdz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手绘图像检索是一种通过手绘图像检索自然图像的检索技术。允许用户通过线条随心所欲地描绘头脑中想要表达的事物以作为检索输入,这是手绘图像检索最为主要的优势之一,然而手绘图像绘制过程中的主观性会带来语义模糊问题,这同样给手绘检索带来了挑战。手绘图像缺少颜色、纹理等细节信息,一般仅包含物体轮廓,因此通过整体视角进行观察,对于手绘图像语义理解至关重要。然而,本文通过调研发现,手绘图像的整体性在现有工作中并未得到广泛挖掘。鉴于深度学习强大的特征表达能力,本文以关注手绘图像整体性为出发点,通过改进神经网络结构的方式,提取更具语义判别力的特征,进一步提高手绘检索精度。本文主要内容如下:1.本文对手绘检索现有工作进行了充分调研,分析了手绘图像整体性对手绘图像语义理解的重要性,并对现有网络结构在手绘图像检索任务上的不足进行了讨论,并提出解决方法。2.为扩大卷积神经网络的感受野,本文设计了非局部网络模块,使得网络在浅层也能够挖掘特征之间的全局依赖关系,以获取更具全局性的特征表达。3.针对手绘图像稀疏性的特点,本文设计了基于可变形卷积的网络结构,打破标准卷积操作对于手绘图像的局限性,使得网络能够更关注到手绘图的轮廓信息。4.针对手绘图像所含细节信息较少的特点,本文将梯度图引入手绘检索框架作为手绘图的补充,并在此基础上设计了双分支网络结构,使网络能够获得更加鲁棒的特征表达。在公共数据集上的实验表明,本文基于非局部网络与可变形卷积的方法是可行的、有效的。
其他文献
干扰对齐是一种非常有前景的有效管理干扰的技术,能够利用有限的频谱极大地提高系统总速率。干扰对齐的实现需要通过有限反馈的方式完成信道状态信息、预编码矩阵和解码矩阵在系统中的传递,传统的全反馈拓扑模型需要大量的反馈比特才能实现完整的自由度,产生了巨大的反馈负载。集中式有限反馈模型优化了反馈拓扑,极大地减轻了反馈负载,是目前干扰对齐普遍使用的反馈拓扑。然而,集中式有限反馈模型采用了等比特分配的方案,而没
学位
原油从地层开采到管线运输常伴随有轻烃组分的溶解和逸出,在压力和溶解气体的共同影响下,含蜡原油的析蜡点、凝点以及粘度等均有一定程度的改善效果。除此之外,压力和轻组分对于原油中析出蜡晶的微观结构的影响也不容忽视;最大类间方差法、分形维数等方法提供了表征析蜡点和析出过程变化的定量依据。因此本文从溶气原油蜡晶微观参数测试及其宏观流变性质测试两方面,对饱和溶气原油中析蜡对流动性的影响开展研究。主要研究内容与
学位
超音速分离技术是一项新兴的气体处理技术,被广泛地应用于天然气脱水、脱烃、脱酸、液化及烟气碳捕集等领域。该技术将气体膨胀液化、气液分离和温度及压力恢复等多过程整合于超音速分离管,具有密闭紧凑、简单可靠、无需化学添加剂、适合无人站场、投资运行成本低等优点。目前在混合气体超音速分离工艺过程模拟研究方面尚无研究,本文主要研究工作和成果如下:首先,建立了超音速分离工艺流程并提出工艺性能评价方法。对超音速分离
学位
湿气输送管线内夹带的自由水及因管线沿程温度、压力变化产生的凝结水可与气体形成气液两相流,受气体流速、管道倾角等多种因素的影响,水以液膜的形式呈不同的厚度分布在管道内壁面的不同位置。当与气体伴生存在的CO2等腐蚀性气体溶于水,将导致管道内壁面的腐蚀破坏,影响管道输送的经济运行,危害周边的环境及人身安全。当前关于天然气管道内的CO2腐蚀研究还主要集中在体相溶液,结合液膜特征开展的研究则相对较少,对腐蚀
学位
近年来,随着科学技术的飞速发展,当今社会开始进入了大数据时代,而图像、视频数据作为信息的主要载体更是占据了重要的地位。人体行为识别成为了现如今热门的研究领域,已取得了丰富的研究成果,并在视频监控、公共安全、环境控制和检测、运动分析等领域得到实际应用。在行为识别的研究范畴中,大致可分为基于单人的行为识别、基于双人的行为识别和基于多人的行为识别。基于单人的行为识别已有很多研究成果,而与单人行为相比,双
学位
随着无线网络技术的迅猛发展,以及我国将物联网作为战略性新兴产业上升为国家发展重点,工作在ISM频段的无线网络设备数量呈指数型增长。这推动着单一网络环境向异构网络环境不断演进。在这一过程中,对于异构网络中不同设备之间相互通讯的需求不断增加。然而,传统的数据分发方案受限于单个节点的通讯范围和不同网络设备之间冲突等诸多方面的影响导致数据分发的效率不断降低,同时也不适用于异构网络所特有的网络模式。针对这些
学位
链路预测有助于人们高效地从复杂网络中挖掘出丢失数据、新生数据以及虚假数据。基于网络拓扑结构相似性的链路预测算法是链路预测的热点研究方向,但是该类算法目前仍存在预测精度不够高的问题,主要原因是该类算法忽略了实际网络存在演化特性和算法自身不具备网络自适应预测能力,于是本论文提出了基于未来共同邻居的相似性链路预测模型。因此本论文的创新点和主要工作如下:1.通过分析现实网络连边形成的机制和网络的动态演变过
学位
大多数复杂疾病都与基因相互关联,寻找与疾病相关的易感基因是分析和了解相关疾病可能发病的机理、设计相关疾病的易感基因诊断方法的重要理论基础。全基因组关联研究(Genome-Wide Association Study,GWAS)是一种系统性地搜寻与人类相关疾病易感遗传基因的生命科学研究方法。该方法通过对于人体的全部的基因组的关联分析,可以全面地揭示与疾病的发生、发展与其治疗密切相关的易感基因。传统的
学位
基于视频的人体行为识别是计算机视觉领域的重要研究方向之一,能够应用于智能监控、人机交互、视频内容检索等众多领域中,具有非常广泛的应用前景。在互联网技术快速发展的今天,网络视频数量呈现爆发式增长的趋势,对视频数据处理的效率与质量提出了更高的要求。由于人体行为在时间上的连续性以及动作的复杂性等问题,如何高效准确地从视频中提取人体行为的特征仍面临巨大的挑战。近年来,深度学习技术在图像分类、目标检测等任务
学位
去中心化是区块链技术的核心价值,该特性保证了区块链系统的安全性,但也为其数据管理带来了众多问题,如数据存储完整性、隐私泄露和存储性能差等。该类问题导致区块链应用在设计开发过程中代码量骤增或冗余,以至于开发效率降低。设计模式是软件开发过程中一般问题的解决方案,它的引入可以为解决区块链数据管理相关问题提供便捷的途径,对其进行服务封装更可以提高应用开发效率。论文对基于区块链的数据管理设计模式与服务进行了
学位