论文部分内容阅读
随着多媒体和Intemet网络技术的迅速发展,图象数据不断增加。为了对这些数据进行有效的管理和分析,帮助用户快速准确地找到所需内容的图象,基于内容的图象检索(CBIR)正成为当今多媒体技术研究的热点。本文综述了近年来基于内容图象检索领域的发展现状与研究趋势。针对当前CBIR在特征提取、相似度模型和相关反馈学习等方面存在的主要问题,本文的主要贡献如下:
(1)利用基于曲线多边形近似的连续傅里叶变换方法快速计算傅里叶描述子,并通过形状的主方向消除边界起始点相位影响的方法定义了新的具有旋转、平移和尺度不变性的归一化傅里叶描述子。与使用离散傅里叶变换和模归一化的传统傅里叶描述子相比,新的归一化傅里叶描述子同时保留了模与相位特性,因此能够更好地识别物体的形状。为了进一步提高检索的速度和精度,提出了基于层次的形状检索方法。
(2)基于一阶区域特征约束和二阶空间关系约束,提出了使用概率方法估计区域匹配权重的图象检索方法(CRM)。由于分割的区域与图象中的物体有着紧密的联系,因而局部特征有可能获得比全局特征更好的检索效果。与IRM等基于区域的图象检索方法相比,提出的CRM方法对于图象分割具有更强的鲁棒性和更准确的相似度模型。
(3)提出了基于自适应树相似度模型的图象检索方法。自适应树相似度模型是用户查询概念层次的、非线性的和布尔的表示。树中的每一条路径是用户反馈图象的一个聚类模式,由于每个聚类模式附近的特征子空间可以近似为线性,自适应滤波器能够在路径内更好地学习。这种自适应学习方法不需要任何先验知识,具有递推学习、计算量小、快速收敛等优点。
为了检验提出方法的性能,本文在大图象库上进行了大量的对比性实验。实验结果验证了所提出方法的有效性。