基于文本语义和视觉内容的图像检索技术研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:walker1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字成像、数据存储等技术的飞速发展以及互联网的普及,各种各样的图像正以惊人的速度增长,日益丰富的图像资源使用户难以在浩如烟海的数据库中找到其真正需要的信息,因而有效的图像检索技术成为近年来研究界关注的热点。现有的图像检索技术主要可分为两种:基于文本信息的图像检索与基于视觉信息的图像检索。前者主要依赖于图像的文本标注信息进行检索,但面对数以万计的图像,手工标注的代价太过昂贵,使得此种检索方案渐已不能满足现实的应用需要;后者主要利用视觉特征提取和高维索引技术进行检索,但因为语义鸿沟的存在,视觉特征相似的图像很可能在语义上是不相关的,使得很多情况下此种检索方案难以满足用户的信息需求。为了充分发挥两种检索方案各自的优势同时降低它们的缺陷,学者们研究了多种方法来结合这两种技术以进行检索,这些工作都显著地提高了图像检索的性能。本文在此基础上就如何融合视觉内容与文本语义进行图像检索做了一些研究工作,主要分为以下几点:1研究了图像视觉内容的描述方法。针对使用传统的SIFT特征来描述图像视觉内容速度较慢、效率较低等缺陷,提出了使用改进的DSIFT特征结合词袋模型以构造视觉单词的方式来描述图像的视觉内容。2研究了一种如何根据图像视觉内容自动获取其语义信息的方法。针对依赖人工标注来获取图像语义信息需耗费较大代价的问题,提出了一种基于概率隐语义分析模型的图像语义自动获取方法,它将图像视为一系列文本信息与视觉信息的潜在主题混合,先通过拟合两个PLSA模型来分别学习文本信息和视觉信息,再使用一种自适应不对称学习方式来建立两种信息间的联系,如此即可以根据图像的视觉内容来自动获取其语义信息。3研究了一种将文本信息与视觉信息结合起来进行图像检索以提高检索精度的方法。提出了分层检索的思想,先依据自动获取的语义信息初步检索筛选出语义相关的图像,再根据提取的视觉特征进行第二层细化检索对图像按相关度由大到小排序输出。在自主设计的检索原型系统上,针对图像数据集Corel1K进行的一系列实验表明,本文所做的研究工作确实提高了图像检索的性能。
其他文献
目前,国内制造业的自动化需求不断提升,工业机器人技术、视觉伺服技术和气动技术等随之发展日益成熟,越来越多的自动化生产设备将这些技术应用其中。在现今的电子制造业中,受
目的:对比分析小夹板外固定与石膏外固定治疗桡骨远端骨折的临床价值.方法:本次研究共选取研究对象72例,均为2017年5月-2018年11月在我院住院治疗桡骨远端骨折的患者,采用随
摘要:多集中质量的离散固支弹性板结构在机械、电子和航空航天等领域都应用广泛,研究其动态特性可为系统结构的可靠性分析、故障诊断、优化设计以及动力学模型的修正提供重要的参数支持。本文将解析模态分析、有限元模态分析和试验模态分析三种方法相结合,对多集中质量的离散固支弹性板结构的动态参数进行深入研究与分析,完成研究内容如下:(1)多集中质量离散固支弹性板结构数学模型的建立。以弹性板弯曲的相关理论为基础,结
目的:研究经跗骨窦切口微创有限切开复位内固定术治疗跟骨骨折的治疗效果.方法:选取2016年3月-2018年12月我院收治的52例跟骨骨折患者为研究对象,随机将52例患者分为对照组与
目的:探讨手术治疗与非手术治疗锁骨中段移位骨折效果.方法:选取2015年5月-2018年5月进入我院进行治疗的出现锁骨中段移位骨折的48例患者作为研究对象,随机将其分为观察组与
目的:探讨超声引导下肌间沟臂丛神经阻滞联合颈浅丛神经阻滞对锁骨骨折内固定术患者的麻醉效果.方法:选取102例2017年8月-2018年8月在我院治疗的锁骨骨折患者,所有患者均行内
下肢外骨骼助力腿是由人类穿着,并为穿戴者提供助力功能的人机一体化系统。下肢外骨骼助力腿是多种高新科技的集成,涉及自动控制、机电工程、生物工程以及人工智能等多学科领域,是近年来比较热门的研究领域之一。针对下肢外骨骼助力腿智能控制内容,本文主要做了以下几个方面的研究。首先,对比目前国内外下肢外骨骼助力腿的研究现状,分析下肢外骨骼助力腿的研究趋势,选择借鉴适合本系统的设计理念。对构成下肢外骨骼助力腿的机