论文部分内容阅读
随着社会信息化的发展和便携式智能图像获取设备的普及,一方面人们作为图片的创造者可以随时随地分享图片,造成互联网海量图像资源的形成,另一方面人们作为图片的使用者,需要从这海量的资源中寻找满足自己需求的图片。这给图像资源的管理、组织与检索带来了挑战。因此,图像相关技术的研究越来越多,图像检索就是其中的一个方面。目前,图像检索研究已经取得相当不错的成果。但从研究的学科分布来看,主要集中于计算机科学领域,且注重于技术层面的改进,而图书情报领域对图像检索稍有研究,且主要集中于理论层面的探讨。因此,本论文拟立足于图书情报领域,在保证图像检索精度的同时,对图像检索的研究进行一些新的尝试,如通过“图文结合”方式组织图像检索。本文首先对国内外现有相关研究文献进行了比较全面的调研与梳理,归纳与总结了现有图像检索技术和图像语义自动标注方法的优势与不足。其次,选取人们日常生活中比较关注的多个主题(雾霾、内涝、花卉和秋叶)作为研究对象,从互联网采集各个主题带有“文字说明”的图像。然后,对图像及文本信息分别进行处理,主要包括三个方面:(1)处理图像的描述文本信息,形成图像语义特征标注,主要涉及关键词提取和关键词语义扩展。(2)对图像特征进行处理,形成图像视觉特征标注,主要包括本文提出的改进颜色直方图算法、现有的LBP纹理特征和灰度共生矩阵算法提取过程,重点描述了改进算法,即利用局部颜色熵对分块图像进行自适应加权来改进颜色直方图。(3)综合图像视觉特征构造SVM多分类模型,主要是为了将所构造的图像分类模型用于基于内容的图像检索,通过在图像低层视觉特征和语义类别间建立关联,缩小这种图像检索方式带来的语义鸿沟,以提高检索性能。最后,在图像标注的基础上,设计并实现了图像检索系统,支持多种检索方式:基于文本的图像检索和基于内容的图像检索(以图搜图)以及两者组合检索方式,重点对以图搜图中的关键技术进行探讨,并提供“图文结合”的方式组织图像检索结果,希望这种更加细粒度的结果呈现方式能够改善用户体验。另外,文章通过相关实验验证了系统的可行性和所提方法的有效性。