论文部分内容阅读
随着移动互联网和数字化技术的迅速发展,人们越来越热衷于在社交网络上分享图片,进而在线图片出现了爆炸性地增长。如何从大规模图像中检索出相似图片,一直是图像检索领域研究的热点问题,而图像特征的选取很大程度上影响到图像检索的性能。而含更多隐含层的深度卷积神经网络(Convolutional neural Networks,CNN)具有更复杂的网络结构,与传统特征提取方法相比具有更强大的特征学习和特征表达能力。论文尝试将AlexNet分类模型用于图像检索领域并做了以下工作:1.提出了一种基于卷积神经网络的概率语义图像检索算法。首先,在大规模图像数据集(ImageNet)上利用开源的Caffe CNN库预训练AlexNet卷积神经网络模型,并利用目标图像库对预训练的AlexNet模型参数进行微调,进而提取出图像中层特征,然后这些中层特征通过softmax分类器获得图像的语义标签概率。最后,通过计算两张图像的语义标签概率来度量他们之间的相似度,进而检索出相似图像。2.为了解决CNN特征维度较高和检索时间长给图像检索带来的难题,提出一种基于深度卷积神径网络学习二进制哈希编码的方法,该方法的优点是提高了图像检索的计算和存储效率,并通过融合本文提出的概率语义检索算法,提出了一个基于CNN的概率语义哈希检索方法,并设计了一种新型的端到端监督学习框架,该框架能够同时学习语义特征和哈希特征以实现图像的快速检索。3.在三个公开图像库,即Oxford、Holidays和ImageNet,对比分析了传统基于SIFT的检索算法和其他基于CNN的在图像检索算法在任务中的性能表现。实验结果表明本文提出的算法在综合检索效果和检索时间的情况下要优于其他对比算法。