基于弱监督学习的图像语义建模技术研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zshuangjiamin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和便携式移动设备的发展,互联网中的图像,视频数量呈现爆炸式的增长。例如,据Facebook统计,2019年Facebook平均每天新增3.5亿张图片。面对海量的数据,如何高效地处理新增的图像成为一个亟待解决的问题。图像语义建模可以使计算机正确地理解图像的语义内容,例如图像中的人,车辆等,为图像视频分类,识别以及检索提供了有效的解决方案。早期的图像语义建模方法通常只关注于底层特征,具体包括局部特征和全局特征两类。然而,基于底层特征的方法存在“语义鸿沟”的问题,它不能很好地反映人类对于图像语义上的理解。随着深度学习的发展,基于高层视觉特征的图像语义建模方法取得了卓越的效果。但是由于逐像素级的语义标注耗费大量的人力资源,在实际应用中不能得到很好的推广。为此,基于图像级语义标签的弱监督学习的图像建模方法吸引了研究者的广泛关注。本文主要研究基于弱监督学习的图像语义建模技术,结合图像显著性分析和人类视觉感知,实现最大限度的精准训练图像数据的深度模型,满足图像处理的多种应用。本文的主要工作如下:1.分析了现有图像语义建模算法的优势和不足。为了减少人工标注数据标签的工作量,本文提出采用流形学习算法将图像级语义标签自动地传递到图像的像素区域中,算法无需依赖外部检测器和对数据集的先验知识。2.由于图像级语义标签可能存在着潜在的噪声(例如标注错误或者未标注),本文提出生成式模型构建微图并建立对象图描述符来发现微图类别,采用贝叶斯分类进行未知微图类别的标注,并去除同一已知微图类别中的异常标签,进而增强图像语义建模的噪声容限。3.本文利用构建的图像语义模型,在VOC2012和MSRC数据集上进行了图像分类实验,验证了基于弱监督学习的图像语义建模的优越性以及噪声环境下基于弱监督学习的图像语义建模的有效性。
其他文献
在未来,电力系统为了提高自身效率和经济价值,其运行可能会更接近稳定极限,大量新能源的接入,以及电力市场化的改革使得系统动态变化更加复杂,基于模型的传统电力系统稳定评
在形式化验证领域,下推系统(pushdown systems)常用来建模单线程递归程序,良结构迁移系统(well-structured transition systems),比如向量加法系统(vector addition systems)
随着科学技术的发展,对现代控制技术的研究也逐渐深入,自动控制理论在工程应用中有不少实际应用,但是伴随着问题规模的不断变大,对系统的功能要求越来越复杂,传统的集中式控
分布式任务调度问题在大数据时代具有重要的地位,同构处理器环境下的任务调度问题是此类复杂问题的基础。它所研究的是如何将多个具有先后顺序约束关系的任务分配到可用处理器上进行执行,达到最小化调度长度(Makespan)的目的。此问题是NP难度的,除非P=NP,否则在多项式时间内不能得到精确解。该问题得到了学者们的广泛研究,并致力于找到高效、简单且占用资源少的方法来解决该问题。国内外代表性的求解思路包括基
口腔白斑(OLK)是一种癌前病变,由于其与口腔内健康组织有视觉相似性,导致难以准确区分。目前对OLK的诊断主要来自专业医生的经验,但这种方式效率低,诊断受主观影响大。本文希
目前,信息化在各行各业已经发展起来,成为经济发展的重要力量。但是由于计量检定业务的专业性与特殊性,计量行业的信息化发展水平明显落后于社会信息化平均水平。云计算技术
高光谱遥感技术从20世纪80年代以来发展迅速,由于其具有“图谱合一”以及光谱分辨率高的特点,被广泛应用于农业生产、环境监测、城市规划和军事勘探等领域,并发挥着越来越重
《渡人越境者》这本书属于纪实文学,作者是拉斐尔·克拉夫特,2017年由Bucbet Chastel出版社出版。这本书讲述了来自非洲和中东地区的难民来到法国寻求帮助,或是想穿过法国去往另一个国家。拉斐尔·克拉夫特是一名自由记者,1974年出生在法国。出于人道主义精神,他希望帮助难民,但法律禁止难民跨越边境,因为大量难民的涌入会造成严重的社会问题。我选择了这本书的前六章来翻译。近年来,难民问题引起了越
在机器学习算法中分类作为数据分析的手段已被广泛的应用在工商业以及科学研究中。由于数据多元化的结构特征使得很多数据呈现了多视角的特性。多视角数据相比于单视角数据而
本文研究了15 keV C~-离子在玻璃直管和锥形毛细管中的传输过程。实验发现低能负离子束在输运过程中可以形成稳定的出射束流,且散射过程和电荷交换过程在负离子的传输过程中