论文部分内容阅读
基于内容的图像检索,是根据图像自身所包含的颜色、纹理、形状、空间关系等各种物理特征,在图像数据库中检索具有相似特征的图像。由于计算机自动抽取的图像特征和人所理解的语义之间存在巨大的差异,因此引入相关反馈机制,可通过多次交互反馈信息,获取用户的查询意图,从而提高检索性能。相关反馈固然能够提高检索系统的正确率,但是系统的整体性能还受到分类算法的影响。作为现代神经科学和统计学的研究成果,人工神经网络模型的一个重要应用就是不同类型数据的分类。目前已有很多成熟的神经网络模型,极限学习机是近期出现的一种改进的单层前馈网络,也是一种典型的监督学习算法。与传统的神经网络算法相比,极限学习机在确保较高泛化性能的同时,具有更快的处理速度,已经受到了广泛的关注。在图像检索领域,对海量图像数据的标记工作需要耗费大量的人力物力,因此,不可能全部利用有标记的图像对学习机进行训练,并且由于图像数据维数较高,传统的检索算法处理速度较慢。本文针对上述问题进行了深入的研究,主要获得以下研究成果:(1)提出了一种基于协同训练的极限学习机算法,利用协同训练对极限学习机进行改进,使其能够同时利用有标记和无标记数据进行学习,成功实现了半监督极限学习机。(2)提出了半监督极限学习机与相关反馈相结合的基于内容的图像检索方法。首先对图像进行低层特征提取,然后将用户反馈信息作为新的训练集,不断训练半监督极限学习机,重新对图像库进行检索,从而提高检索正确率。本文在Cancer、Waveform、Waveform、Car Evaluation、Satellite Image等多个UCI数据集和Corel图像库上进行仿真实验,结果表明本文算法可以有效地实现基于相关反馈的图像检索。