卷积特征选择在图像检索中的应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:yaoyao115711
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索是计算机视觉的一个重要分支领域。图像检索的一般流程是,首先提取训练集中图像的特征,然后提取待检索图像的特征,接着计算待检索图像特征和训练集中图像特征的相似度,最后根据相似度大小排序并返回检索的图像。图像特征提取方法广泛采用基于尺度不变特征变换(Scale-invariant feature transform,SIFT)的提取方法,但是SIFT特征提取方法的主要问题在于:提取的特征过于底层,和图像底层纹理、轮廓结构有较大相关性,与人们对于图像理解的高层语义关系较弱。随着深度学习模型在计算机视觉中的广泛使用,一些研究者将深度学习和图像检索结合起来,利用预训练卷积神经网络提取图像特征,从而替代基于SIFT的特征提取方法,在一定程度上解决SIFT不能表达图像高层语义的问题。然而,大部分研究者直接使用从卷积神经网络中提取的特征,并没有对这些特征进行挑选。考虑到卷积神经网络一般都以分类任务作为目标进行网络权重的训练,因此训练好的卷积神经网络权重可能更适合做分类任务而不是图像检索。基于此,本文提出选择卷积特征融合法(Selective Convolution Feature Fusion,SCFF)和空间通道增强选择卷积特征融合法(Space Channel Enhancement SCFF,SCE-SCFF)来解决特征选择问题。本文主要工作如下:(1)提出SCFF算法。选择卷积特征融合法,是和其他两种特征融合法相比较而言的,其中一种是最大池化特征融合法(Max Pooling Feature Fusion,MPFF),另外一种是累加池化特征融合法(Sum Pooling Feature Fusion,MPFF)。SCFF通过计算得到一个二维平面向量的掩码(mask),然后使用掩码挑选出和图像检索相关的特征,从而将和检索不相关的特征过滤掉。最后使用累加池化特征融合法将挑选出的特征融合成为一个特征向量,以此作为图像特征向量的表达。(2)提出SCE-SCFF算法。空间通道增强选择卷积特征融合法,是在SCFF的基础上对模型的进一步修改和完善。考虑到选择出来的特征通道所占权重可能不相同,因此参考SENet(Squeeze-and-Excitation Networks,SENet)模型对卷积通道进行权重建模的思想,在SCFF基础上构造每个卷积特征通道的权重,从而使得挑选出来的特征再次进行空间通道上的加强,最后使用累加池化特征融合法将已经通过空间通道增强的卷积特征融合成为一个特征向量进行图像检索。(3)将本文提出的SCFF和SCE-SCFF分别在常用的图像检索的数据集Paris6K、Oxford5K、Holiday上面进行实验测试,并与使用SIFT特征进行图像检索的方法、使用卷积神经网络来提取图像特征进行图像检索的大量优秀方法,进行了不同维度图像检索结果对比,其中图像特征向量维度为256时,在Oxford5K数据集和Paris6K数据集上面均获取最好的效果,图像平均检索精度(mean Average Precision,mAP)分别是71.0%和79.3%,图像特征向量维度为512时,在Oxford5K数据上面取得最好的检索效果,mAP是73.0%。
其他文献
钙钛矿锰氧化物作为一种强关联电子材料,具有庞磁电阻效应,磁熵效应,电荷有序,磁有序和相分离等丰富的物理现象。因此对稀土锰氧化物进行掺杂改性,探讨其复杂的物理机制,具有
经济的快速发展和居民生活水平的显著提高,一定程度上使得牙齿疾病的发病率和就诊率越来越高,牙齿疾病已经成为一种常见病和多发病,而且相比于以前牙齿保护意识弱的情况,当前
近年来受欧洲五大联赛“金元”理念影响,越来越多的加纳足球运动员在离开加纳高级联赛加入欧洲足球职业联赛,造成加纳足球超级联赛整体实力下滑严重,使得加纳高级组俱乐部已
随着光纤通信、光信息处理和磁光记录等技术的高速发展,对基于磁光克尔效应的电子自旋器件以及量子器件的需求越来越广泛,磁光材料、器件和测量技术等已成为国际关注的焦点。
电子本身迁移率及弛豫时间等多种因素,限制了电信系统的速度和带宽。而光学器件的运行速度仅受光速的限制,所以超高速大容量的全光网络是一种有效的解决电信系统瓶颈的办法,
无线通信的核心问题是信息传输的效率与可靠性。信道编码技术是解决可靠性问题的重要手段之一。因为具有灵活的码本结构设计、线性复杂度的编码算法、并行化的译码结构和接近
在自然界中几乎不会发现纯净的氢气,必须通过各种化学方法从其他化合物中制备。生产方式多样是氢能的主要优势之一,因为它增加了能源安全性并减少了对某些原材料的依赖性。不
随着半导体外延和芯片技术的快速发展,紫外LED的技术与应用已成为产业的研究热点。本课题结合地方特色产业,主要针对近紫外LED在鞋服皮革照明与建材领域的光催化去甲醛方面的
图像分割是根据不同应用需要将图像分割成若干个具有独特性质且互不重叠的区域,进而将感兴趣区域与背景分离的过程,由于图像的多样性和复杂性,图像分割一直是图像理解和计算
我国的耐磨钢球生产技术水平相对较为落后,生产的磨球普遍存在着质量差、寿命短的问题,极大地加剧了矿业消耗。因此,制备高性能的磨球,具有十分重要的经济价值和社会意义。针