论文部分内容阅读
随着计算机和网络社交媒体的快速发展,海量的多媒体数据在互联网上大量涌现,这给包括图像检索在内的多媒体信息处理带来巨大挑战。传统的基于内容的图像检索技术建立在底层视觉特征的基础上,无法准确描述图像数据中复杂的对象、事件、行为和场景等信息;同时,用户的检索意图需用思维中较高层次的语义概念来进行表达,由此便产生了底层视觉特征和高层语义之间的“语义鸿沟”。对于图像检索,关键问题是如何减小“语义鸿沟”,解决问题的思路在于使用有效的方法增强对图像语义的描述和解释能力。本文围绕基于语义的图像检索的中几个问题,提出基于机器学习理论的图像检索算法。归纳起来,本文的主要内容包括:受损图像的视觉和语义信息都受到破坏,特别当受损区域较大时,会对图像检索性能造成影响。考虑图像修复中的结构重建和纹理修复,利用图像分解技术,将图像分解成为结构和纹理两部分;通过分析两部分在两个频率域的特征分布,利用低秩矩阵填充,使用观测数据构建超完备矩阵分别实现图像的结构重建和纹理修复。结果显示,相对于传统图像修复方法,我们的方法可以更好的恢复原始信息。针对图像检索存在的准确度和效率问题,本文提出一种改进的局部特征保持的图像索引算法。通过分析图像像素内在约束关系,利用流形学习技术,在局部结构保持的前提下获得高维特征在低维子空间的数据表达;设计基于比特级的检索机制,在降维数据的基础上进一步将其转化为二进制编码。实验结果表明,本章方法可以同时在检索准确率和效率两方面取得良好的效果。对于仅含边缘的图像,由于视觉信息少,使得语义描述和检索模型难以构建。利用视觉词袋模型,提出了一种新的基于积量化和稀疏编码的草图检索方法,以准确获取图像的语义信息。通过使用最新的边缘特描述算法,对于特定结构的、仅含边缘信息的图像进行特征化描述,借鉴积量化方法,设计一种具有高区分度的视觉词袋模型,有效解决原始输入图像信息量少、识别模型构建困难的问题;同时在量化过程中考虑残差信息,最大限度的减少量化过程中的信息损失,进而可以得到查询草图和测试数据的最优化的表达;通过计算由查询草图和测试数据的特征直方图来计算相似度并得到最终的结果。异构媒体数据通常具有不同的维度和特征分布,这使得跨媒体检索难以实现良好的性能。利用异构特征增强的方法解决跨媒体检索中的异构域适应问题。使用源域和目标域的数据训练出增强的分类器,这种分类器使用了来自目标域中的知识,因而具有更好的性能,能够实现文本→图像和图像→文本间实现跨媒体搜索;利用相关反馈机制,分析原始搜索结果的语义关联,通过构建词袋模型和相似度计算进行重排序以获得优化的查询结果,解决跨媒体搜索中准确率较低的问题。