论文部分内容阅读
随着计算机技术和Internet的高速发展,各种各样的信息被存放于互联网这个巨大的信息库里。由于Internet的资源共享和快速通信的强大功能,使得Internet的普及率日益提高,人们越来越多地利用Internet查找和搜索各种信息,这其中,不仅仅有简单的文本数据,更加包括了大量的图像。图像不同于文本,它具有丰富的视觉特征,可以将抽象的数据更加形象化、真实化,有助于用户更加直观、生动地对知识的深入理解。然而,图像的视觉信息非常丰富,由于不同人的感知能力与知识结构等的不同,对相同图像的视觉信息的理解必然存在差异,如何快速、准确地从海量Web图像资源中查找用户需要的图像,成为一个非常具有挑战性的任务。目前主要的Web图像检索方法大致分为两种:一种是基于文本的图像检索(TBIR),另一种是基于内容的图像检索(CBIR)。基于文本的图像检索方法具有人工注解工作量巨大、主观性强以及文本注解无法完全涵盖图像内容的缺陷,而基于内容的图像检索方法虽然有效地克服了人工描述图像的主观性,提高了图像检索的工作效率,但图像的低层视觉特征和高层语义特征之间存在着难以逾越的“语义鸿沟”,大大影响了图像检索的质量。针对上述两种图像检索方法的缺陷和Web图像自身的特点,本文提出了一种改进的Web图像检索方法:把从Web图像所在网页包含的文本信息中提取的文本特征,和从Web图像低层视觉特征中抽取的高层语义特征相结合的Web图像检索。基于以上提出的图像检索方法,首先,本文利用语义相似性计算技术作为语义信息的度量手段,来度量Web图像中文本信息的相似度,并为后面研究Web图像的文本信息和视觉信息(即从低层视觉特征中抽取的高层语义特征)的结合,提供基础和平台。其次,Web图像的低层视觉特征和高层语义特征之间存在着难以逾越的“语义鸿沟”,针对语义鸿沟问题,本文提出了一个基于分类的Web图像内容自动标注方法,来提取图像的高层语义特征;然后,利用语义相似性计算技术,来度量提取出的高层语义特征的质量,并进一步将图像内容的高层语义特征和Web图像文本信息的更好地结合在一起。接着,为了充分利用从Web图像中提取的文本信息和从Web图像低层视觉特征中抽取的高层语义特征,把这两部分的内容放在具有多信息源融合能力的贝叶斯推理网上,将它们充分地结合在一起,实现基于文本信息与视觉信息相结合的Web图像检索方法。基于上述研究,本文设计并实现了一个Web图像检索原型系统,把从Web图像文本信息中提取的文本特征,和从Web图像内容中提取的高层语义特征放入该系统,使两者充分结合实现Web图像检索,研究结果验证了本文提出的方法在Web图像检索中更加有效。