图像语义解析的相关技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:mowill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和智能终端的快速发展,用户可以方便快捷地产生高质量的图像与视频数据,并利用互联网进行快速传播,图像与视频数据呈现出爆炸式的增长。数据的迅速增长给图像与视频查询和分析带来了巨大的挑战与机遇,对图像与视频数据进行智能分析与处理成为了研究的热点。  图像语义解析,是对图像中包含的内容进行高层语义解析,它不仅指出图像具有的语义标签,还要对语义标签进行定位,为图像提供像素级别标注。与传统图像分类、标注任务相比,图像语义解析提供更细粒度的区域语义信息;与传统基于底层特征的分割任务相比,图像语义理解为图像区域提供高层语义信息。图像语义解析是解决“语义鸿沟”问题的一项关键技术。  图像语义解析问题,根据解析粒度不同可分为目标检测、目标分割和图像语义分割三类。本文主要针对后面两类问题,围绕特征表示学习、目标协同分割、弱监督图像语义分割以及视频图像语义分割等方面开展研究。本文主要研究内容和贡献如下:  1.基于结构化约束的特征表示学习。本文基于字典重构的基本框架,提出了一种特征矩阵可保持块对角结构的特征学习方法,这种块对角结构化约束,使得学到的特征表示有效地保持了同类样本的相似性,并提高了不同类样本的可分性。本文联合优化特征矩阵的稀疏性、低秩性以及块对角结构特性,学习到的特征表示具有鲁棒性、紧致性和强判别力。  2.联合显著性检测和判别式学习的目标协同分割。目标协同分割是给定同类目标图像集合的情况下,对集合中共有的目标前景实现分割。本文通过引入显著性检测算法,有效地解决了协同分割问题中存在的背景一致性问题。通过引入判别式学习,提取出图像集合中共有的显著性区域。本文将显著性检测与判别式学习联合到统一的框架中进行优化,最终获得共有的显著性区域作为目标前景。  3.基于弱监督受限玻尔兹曼机的图像语义分割。弱监督语义分割是指给定图像级别标签情况下,实现图像像素级别语义标注。本文在受限玻尔兹曼机的基础上,对隐层节点分块,各分块与图像的语义标签具有一一对应关系,对未在该图像中出现的标签所对应的隐层节点响应进行抑制。此外,本文引入了一致性约束,外观相似的图像区域具有相似的隐层表示。最终通过学习构建起视觉底层特征到高层语义的映射关系。  4.基于反卷积网络的视频图像语义分割。本文提出了基于反卷积网络的视频图像语义分割模型,更好地保留物体边缘信息,对物体边缘实现精细划分。本文在反卷积网络基础上引入了帧间融合层,对视频的帧间关系进行建模,通过邻近帧图像信息辅助当前帧图像语义分割,取得了更好的视频图像语义分割结果。此外,本文引入了基于目标区域的样本增强方法,学习到的反卷积网络对目标区域取得了更好的分割结果。  5.基于目标语义解析的商品图像检索。本文提出了基于目标语义解析的商品图像检索方法。该方法对图像目标语义进行判断并完成定位,有效地克服了商品图像中存在的复杂背景、商品交叠等问题。该方法对图像中目标区域进行索引并标记目标语义。实验结果表明,该方法获得的检索结果不仅具有视觉相似性,而且具有一致的语义信息。
其他文献
可编程控制器(PLC)技术作为一种以微处理器及其存储器为控制中心的自动化装置,在工业自动化控制领域发挥着越来越重要的作用。然而,PLC的发展与计算机技术、半导体技术、控制技术、数字技术以及网络通讯技术等高科技的发展有着紧密的联系。任何一项技术的发展都有可能直接导致PLC技术的革新。 PLC发展到今天,其迅猛的发展势头为我们所有目共睹。与此同时,随着工业制造技术的不断进步以及过程的不断复杂化,
本文的研究内容是围绕国家“863”计划支持项目“可重构星球探测机器人的研究”展开的。其目的是以星球探测为背景,研制一种模块化可重构轮手一体机器人,其结构紧凑,在自身手臂
现场指纹,即从犯罪现场直接提取的指纹,是犯罪嫌疑人非故意地遗留在接触的物体表面,进而被用化学处理或拍照的方式提取而得到的指纹。不同于滚动式或按压式的指纹,现场指纹往往有
脑-机接口(Brain-Computer Interface,BCI)系统的发展为人们提供一个研究脑功能与认知科学的交互平台,随着对人脑理解加深、认知神经科学与技术的发展,也将直接推动人们对认知机
随着INTERNET的迅速普及,电子商务必将蓬勃发展,电子商务的虚拟购物环境既为企业提供了新的发展机遇,但同时也提出许多新的要求和挑战,其中为用户提供个性化推荐服务越来越成
变电站运行安全监控中的智能视觉分析是用摄像机代替人眼、用计算机代替人脑、自动地对监控相机采集的图像序列进行分析,实现对监控场景中设备运行状态和环境安全自动监控的技
本文首先详细分析了模糊神经网络和软测量技术的原理方法及其各自的发展状况,在此基础上,分析补偿模糊逻辑的原理,将补偿模糊推理系统与前馈神经网络结合起来,建立一种新型补偿模
随着现代化工工业向大型化、集成化和精细化发展,生产的安全性、稳定性和可靠性问题就愈显重要,因此迫切需要建立性能良好的故障诊断检测和诊断系统。本文针对化工过程故障诊断
近年来,随着多媒体技术、计算机网络与通信技术的快速发展,传统的视频监控系统也不断地朝着数字化、网络化、集成化的方向更新与发展,出现了集多媒体技术、计算机网络与通信技术
粒子群优化(PSO)算法是一种新兴的优化技术,其思想来源于人工生命和演化计算理论。PSO算法通过粒子追随自己找到的最好解和整个群的最好解来完成优化,其有诸如简单的表达方式,较