论文部分内容阅读
现代互联网和移动设备已经广泛普及,各式各样的图像在网络中随处可见,充斥着人们的工作和生活。同样,现阶段人们对于图像的获取需求也大大增加,图像检索成为了最主要的图像获取方式。而因为图像数量多、人工标记工作量大等困难,当前图像检索的主要方法已转变为基于内容的图像检索,实现以图搜图。该检索方法主要利用图像底层特征来衡量相似度,未针对查询图像的高层语义,不能有效地搜索到符合要求的图像。因此,研究一种能够根据查询图像兴趣区域的图像检索方法成为了当前的研究热点之一。现有图像检索方法通常采用单一特征或者全局特征进行检索。能够融合多种图像特征,兴趣区域与图像全局互补的图像检索方法有待研究。所以,结合当前图像处理方面的机器学习算法,提出基于兴趣区域的图像检索方法,可以进一步提高图像检索的查准率与查全率,体现查询者意图。本文依赖兴趣区域,针对图像检索方面,对图像的特征提取方法、兴趣区域划分、相似度计算以及图像检索框架等进行研究,具体研究成果如下:(1)为了实现图像检索中图像的语义关联,研究了一种基于兴趣区域和特征融合的半监督学习图像检索方法。运用角点检测方法划分图像的感兴趣区域,提取区域加权的多种底层特征。把图像特征向量与类标记进行半监督学习,映射图像和类标签间的语义关系。对于颜色和纹理特征分别选择二次式距离和改进的堪培拉距离计算图像间相似度,并通过正反馈的方式对特征空间中的图像类中心进行迭代反馈。实验结果表明,本文基于兴趣区域融合特征的图像检索算法在性能上有一定提高。(2)提出了一种基于多视觉词典与显著性加权相结合的图像检索方法,引入了图像的综合显著性加权稀疏表示。按照采样要求划分图像为小块,并提取其多种底层特征,作为输入向量通过非负稀疏编码分别学习图像块多种特征对应的视觉词典,将得到的图像块稀疏向量经过显著性汇总方法引入空间信息并作显著性加权处理,形成整幅图像的稀疏表示,最后采用提出的SDD距离方式计算图像检索的相似度。在Corel和Caltech通用图像集上进行仿真实验,与单一视觉词典的方法对比,结果表明,本文方法能够有效提高图像检索效率。(3)提出了一种基于稀疏编码和最优成分相似聚合的图像识别方法。一个人脸图像的不同部分具有不同的判别能力,理应在图像识别中赋予不同的权重。通过将每个图像划分成互不重叠和相等大小的成分,学习稀疏表示参数和查询图像各成分的重构误差,构建了一个损失值矩阵。基于该损失值矩阵,提出了多种加权线性聚合方法,来计算查询图像与每个类相关的重构误差。实验结果表明,在大多数人脸图像数据库上最优加权聚合方法优于传统的SRC方法。