基于交互式语义推理的图像检索算法研究

来源 :大连海事大学 | 被引量 : 2次 | 上传用户:hellobaby54088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体与互联网技术的迅猛发展,图像数据的种类和数量与日剧增,使得基于内容的图像检索(Content-Based Image Retrieval, CBIR)技术吸引了国际学术界和商界的广泛关注,并在军事侦查、生物医学、信息安全、遥感技术,及艺术鉴赏等多个领域中发挥着重要作用.然而,图像的视觉内容与其欲传达的语义信息之间存在严重的语义鸿沟,进而导致现有的CBIR技术难以达到应用的要求.交互式语义推理技术将人的参与引入到检索过程中,并借助统计学习方法推断图像的语义信息,已成为了可有效缩小语义鸿沟、改善图像检索性能的重要手段之一.本文对交互式语义推理的技术要点及其发展现状进行了深入、系统的探讨和综述,并针对该领域中亟需解决的3个关键问题进行了研究,包括增强推理模型在小样本训练集上的泛化能力、设计面向不对称数据集的语义推理方法,以及合理、高效地结合长、短期学习.本文的创新性研究成果可概括如下:(1)提出了基于偏袒性半监督提升框架的SVM主动学习算法SA2S2.该算法结合了半监督学习、集成学习和主动学习三种方法的技术特点(本文称之为混合学习范式),以增强学习系统的泛化性能.此外,采用了偏袒性集成思想,使得学习系统对语义相关图像给予更多的关注.实验结果表明,混合学习及偏袒性集成策略可有效改善CBIR系统的检索性能.(2)提出了基于偏袒性半监督集成框架的SVM主动学习算法(SE)2A.类似于SA2S2,该算法亦采用了混合学习和偏袒性集成策略.但不同之处在于,(SE)2A根据图像库中正、负样本之间的不对称分布特点,使用非常简单的学习策略挑选未标记图像,并采用了并行的集成结构,从而大大降低了混合学习的计算复杂度.实验结果表明,(SE)2A学习速度快、泛化能力强,在性能上优于目前一些常用的语义推理方法.(3)通过对已有长、短期学习方法的分析和总结,指出了结合使用长、短期学习技术亟需解决的关键问题--检索结果的“错位(dislocation)问题”.针对该问题,提出了一种视觉内容与隐含语义之间的协同学习算法CoSim.该算法首先从反馈日志中挖掘图像间的语义相关性,并以此形成先验知识;然后借助这些先验知识为短期学习挑选可信的未标记图像,以增强视觉相似性学习;最后,协同相似性由语义相关性和视觉相似性之间的非线性组合产生,并用于图像检索.理论分析及实验结果表明,CoSim可有效处理检索结果的“错位”问题,且其性能明显优于已有的一些交互式语义推理算法.
其他文献
青岛市是山东省主要花生产区和加工出口基地,常年播种面积为109khm^2,占山东省花生播种面积的11%左右,单产与总产均居全省第一位。花生生产机械化水平的提高,对改善我市花生生产条
知识吸收能力是企业不断创新、保持竞争优的关键因素.知识吸收能力是一个企业用于获取、吸纳、转化和开发利用外部知识的技能和知识的集合.企业知识吸收能力可以从企业成员个
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
环保行业在我国国民经济占有重要的地位.它的发展对整个社会环境有重大影响。面对当前全球的金融风暴,环保行业可能在绿色能源、环境贸易壁垒、绿色消费等方面面临一定的挑战,同
民生类监督新闻小事不小,关系着千家万户的幸福感,也考验着记者的业务素养。要求记者在海量的信息里挖掘有价值的新闻线索,同时能够快速抵达信源,通过采编联动完成一次次新闻
十九大报告中指出:弘扬劳模精神和工匠精神。实现中华民族伟大复兴梦,经济高质量发展及人生出彩需要弘扬工匠精神。
以兼职教研员和名优教师为核心力量,创新区域教研管理机制和运行模式,"互动激发,聚力共生,流动共享"优质教研资源,成都高新区构建起"基于校本,校际联动,聚力成势"的区域"集群
隐写的定量和定位分析是隐写分析技术研究的热点和难点。目前,隐写的定量和定位分析方面已有许多优秀的成果,但距离实际应用需求还存在很大差距。本文主要针对数字图像隐写的定
准确快速的鉴别个人身份、保证信息安全是当今信息化时代亟待解决的一个关键问题。随着计算机技术的进步和发展,基于生物特征的身份识别技术已成为一种重要的个人身份鉴别技