基于文本信息与视觉信息相结合的Web图像检索

被引量 : 0次 | 上传用户:liongliong589
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和Internet的高速发展,各种各样的信息被存放于互联网这个巨大的信息库里。由于Internet的资源共享和快速通信的强大功能,使得Internet的普及率日益提高,人们越来越多地利用Internet查找和搜索各种信息,这其中,不仅仅有简单的文本数据,更加包括了大量的图像。图像不同于文本,它具有丰富的视觉特征,可以将抽象的数据更加形象化、真实化,有助于用户更加直观、生动地对知识的深入理解。然而,图像的视觉信息非常丰富,由于不同人的感知能力与知识结构等的不同,对相同图像的视觉信息的理解必然存在差异,如何快速、准确地从海量Web图像资源中查找用户需要的图像,成为一个非常具有挑战性的任务。目前主要的Web图像检索方法大致分为两种:一种是基于文本的图像检索(TBIR),另一种是基于内容的图像检索(CBIR)。基于文本的图像检索方法具有人工注解工作量巨大、主观性强以及文本注解无法完全涵盖图像内容的缺陷,而基于内容的图像检索方法虽然有效地克服了人工描述图像的主观性,提高了图像检索的工作效率,但图像的低层视觉特征和高层语义特征之间存在着难以逾越的“语义鸿沟”,大大影响了图像检索的质量。针对上述两种图像检索方法的缺陷和Web图像自身的特点,本文提出了一种改进的Web图像检索方法:把从Web图像所在网页包含的文本信息中提取的文本特征,和从Web图像低层视觉特征中抽取的高层语义特征相结合的Web图像检索。基于以上提出的图像检索方法,首先,本文利用语义相似性计算技术作为语义信息的度量手段,来度量Web图像中文本信息的相似度,并为后面研究Web图像的文本信息和视觉信息(即从低层视觉特征中抽取的高层语义特征)的结合,提供基础和平台。其次,Web图像的低层视觉特征和高层语义特征之间存在着难以逾越的“语义鸿沟”,针对语义鸿沟问题,本文提出了一个基于分类的Web图像内容自动标注方法,来提取图像的高层语义特征;然后,利用语义相似性计算技术,来度量提取出的高层语义特征的质量,并进一步将图像内容的高层语义特征和Web图像文本信息的更好地结合在一起。接着,为了充分利用从Web图像中提取的文本信息和从Web图像低层视觉特征中抽取的高层语义特征,把这两部分的内容放在具有多信息源融合能力的贝叶斯推理网上,将它们充分地结合在一起,实现基于文本信息与视觉信息相结合的Web图像检索方法。基于上述研究,本文设计并实现了一个Web图像检索原型系统,把从Web图像文本信息中提取的文本特征,和从Web图像内容中提取的高层语义特征放入该系统,使两者充分结合实现Web图像检索,研究结果验证了本文提出的方法在Web图像检索中更加有效。
其他文献
创立于1996年的凤凰卫视,将新闻评论节目视为频道的立台之本、强台之路,不断创新,个性鲜明,旗下的多个新闻评论节目深受观众和电视业界的欢迎。本文从凤凰卫视评论节目的创办
随着Internet的迅速发展,WWW已发展为一个庞大的信息空间,为人们供了极其丰富的信息资源。然而一个网页的正文四周,通常会夹杂着许多与正文不相关的“噪音信息”,这些内容往
具有展示窗结构的瓦楞纸箱是一种小型的、用于展示内部商品的包装形式,由微型瓦楞纸板制成,使用环境多为超市货架堆码。然而纸箱在堆码过程中会变形失稳,影响内装产品的销售
产业需求不断推动着文化产业转型升级,而"互联网+"时代的来临,加快了文化产业转型升级的步伐,"互联网+"具有的优势,为文化产业创造了更多发展的可能。"互联网+"与武汉文化产
防渗加固施工是水利工程堤坝施工的重要环节,堤坝的防渗性能直接影响水利堤坝工程的整体安全性能和质量。针对水利工程堤坝渗漏类型进行分析,并探析防渗加固技术在水利工程堤坝
从提高千岛湖森林景观价值,美化生态环境,促进林业和旅游事业发展出发,对湖区林相改造的指导思想、改造原则、改造范围和改造方法等进行了初步研究,并对林相改造所涉及的问题,提出
目的探讨急诊时间窗内一体化救治重症多发伤(SMI)的效果。方法回顾性分析2004年1月—2018年12月深圳市人民医院收治SMI患者(ISS评分≥16分)2 861例。自2010年6月笔者医院启动
随着经济社会的发展,环鄱阳湖区农村面源污染日益严重,且已成为该区域主要的水体及土壤污染源,不仅退化了农业生态系统,危害农业安全,也通过水和食品污染损害到居民健康,给环
网络语言的产生,引起了很多语言学者的关注,他们从各个层面进行了详细的描写。通过语言研究文化,首当其冲的是语言的词汇。词汇本身就是一个文化成果,每一个词都是对客观事物