基于深度卷积神经网络的纹理分类方法研究

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:cgrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
纹理作为一种重要的视觉线索,广泛存在于自然界各种物体的表面,在图像中表现为特征值强度的某种局部重复模式的宏观表现。纹理图像分类研究有超过50多年的历史,期间提出了许多理论和算法,主要包括基于传统手工描述符的算法与基于深度学习的方法。传统手工描述符方法通常是基于对纹理的一些假设而手工制作的特征,由于不同的纹理数据集包含不同类型的纹理,因此,手工描述符的表现通常是因数据集而异。与此同时部分纹理数据集的图像是在实验室环境理想状态下获得的,没有考虑在复杂的现实世界中获取的纹理图像,所以传统手工描述符在复杂的纹理数据集上表现显得差强人意。虽然深度学习方法相较传统手工描述符方法有较强的泛化能力,但是由于纹理数据集数据量的匮乏,使用深度学习方法进行纹理分类时通常会出现严重的过拟合问题。针对以上问题本文首先提出一种新的卷积神经网络模型用于纹理分类。随后提出了一个新的损失函数Texture Loss来缓解深度学习模型上过拟合的问题。最后提出一种深浅层特征向量的融合方法与一种噪声类数据增强方法用于纹理分类任务。具体内容如下:1.本文提出了一种基于混合尺度密集连接SE注意力连接块的卷积神经网络用于纹理分类问题。本文使用混合尺度卷积操作替换了原来的3×3卷积操作,以便于可以轻松地捕捉更多不同尺度的特征。同时,本文在每层输出特征图后加入Squeeze-and-Excitation attention(SE注意力),将整个空间特征编码汇聚在一个通道上作为一个全局特征来增强重要信息,同时抑制不重要的信息。2.在纹理分类任务中,使用深度神经网络训练时通常会出现严重的过拟合问题。本文提出了一个新的损失函数Texture Loss来缓解纹理分类任务上过拟合问题。与传统分类任务中的标准交叉熵损失函数相比,Texture Loss在交叉熵损失函数的基础上增加了动态正则化项。通过减少分类不好的样本上的正则项,增加分类好的样本上的正则项,可以减缓过拟合的问题,从而提高分类的正确率。3.提出一种深浅层特征向量的融合的方法。首先,本文对网络的浅层与中层输出的特征图分别执行空间金字塔池化操作,将不同尺寸的特征图输出为同一维度,随后再对每一个输出的特征向量进行两次线性变换得到深浅层的特征向量。最后,将深浅层的特征向量进行级联操作后得到最终的特征向量送入分类器。同时,本文还提出一种数据增强方法,将Cartoon GAN生成一对一配对的FMD的卡通数据集作为第十一个类别加入到FMD数据集中。为了出现避免验证集中出现训练集中的配对的数据集的情况,本文先将原始的FMD数据集随机分割为训练集和验证集,然后将所有训练集匹配的卡通图像作为一个新的类别加入到数据集中。
其他文献
当前,随着数据分析技术、机器学习等信息技术的快速发展和应用,信息技术为人们解决一个又一个模糊、复杂的问题。为了对这些难以判定的问题做出清晰的评价、研究产生问题的因素对于决策目标的影响程度。因此,绩效评价方法开始受到研究者们的广泛关注。同时,通过对绩效评价结果的优劣来衡量在完成决策目标的执行过程中存在的不足,并根据评价结果对过程环节进行分析,以期拟补不足,达到提高绩效评价结果的目的,从而推动预定绩效
学位
粒子群算法PSO(Particle swarm optimization)是从自然界生物活动和群体觅食过程中获取灵感,而演变成的一种随机搜索算法。凭借其结构简单、寻优速度快等优点,现在已广泛应用于科学和工程领域。大量的研究表明,粒子群算法在处理连续空间和离散空间问题时表现出不错的全局搜索能力,但在实际的应用过程中,粒子群算法也存在着随机搜索算法比较普遍的缺点。本文主要对粒子群算法的缺点进行改进研究
学位
随着多媒体、网络技术的发展,图像的应用日益广泛,其成为了互联网中信息的主要载体。但是,由于对图像的质量要求越来越高,导致维数灾难。高维图像数据不仅要占用大量内存空间,而且信息的冗余程度很高,将会影响后续图像识别的性能。特征提取是图像识别中的关键步骤。如何从图像的原高维空间中找出潜在的本质低维结构信息对图像识别等是非常有意义的。低秩表示作为高维数据信息表征的有效工具,在图像识别领域取得了不错的效果。
学位
近年来,随着计算机图像处理技术的不断进步,带动了传统中医新一轮诊疗方式的客观化研究。舌诊是中医望诊领域的主要内容,其诊断方法独具特色,在判断病人病情方面具有极为重要的作用。传统中医辨别舌色、苔色、裂纹等舌象特征,主要通过中医师的视觉观察和经验分析,所以在判断标准上,会受到诊治医生主观因素和周围环境等因素的影响。这些因素制约了舌诊的应用与发展,所以使舌诊信息客观化,诊断标准化是当前舌诊自动化研究的重
学位
随着现代制造业的不断发展,我国工业生产领域逐渐地趋于自动化,电网是工业生产领域发展依靠的基础,而变压器的稳定运行是维护电网安全的关键。因此,加强变压器运行状态的检测,及时发现其潜伏性故障,并制定具有前瞻性、预见性的故障诊断策略,对于提升电网的安全可靠运行具有重要的意义。通过对变压器故障诊断方法的深入研究,为解决传统比值法易出现比值边界模糊、编码缺失等问题,弥补智能算法在小样本上易过拟合的不足,论文
学位
纹理是不同的计算机视觉任务和应用程序的重要特征,是人类感知世界的重要视觉线索,和我们的生活息息相关。因为纹理分类在理解纹理识别过程中发挥着重要作用,所以纹理分析的主要问题之一就是纹理分类。在纹理分类任务中,局部二值模式(Local Binary Pattern,LBP)是应用最广泛的一种分类方法。局部二值模式是一种用于提取局部纹理信息的简便且鲁棒的纹理描述符,而且局部二值模式具有光照不变性和旋转不
学位
随着智能电网的快速发展,电网在运行过程中积累了各种类型的巨量数据,运用数据分析技术对这些巨量数据进行分析可以获得很多平时所注意不到的信息,将这些信息用于指导电网运行中的日常工作可以极大的提高电网运行的质量。而电网负荷预测作为电网运行过程中重要的管理手段,预测的精准度直接影响了电网运行的成本、电网运行方式以及电网设备的检修维护计划等。但因为不同地区的电网负荷变化规律是受多种外在因素共同影响的,比如当
学位
语义分割作为图像处理的一个重要基础任务。其基本思想是以像素为单位,将图像中所包含的各类物体逐一进行分类,并把同属一类别的像素标记为相同的颜色。图像语义分割的出现,可以帮助计算机更好的理解图像中所表达的内容。近几年,相继提出了许多基于卷积神经网络改进的语义分割方法,语义分割精度也不断提高。但是大多数的语义分割模型都存在计算复杂、参数过多等缺点。基于以上研究现状,本文以实现分割精度和推断速度的平衡为目
学位
红外目标跟踪作为计算机视觉的一项基本任务,在智能监控、辅助驾驶和红外制导等领域发挥着重要的作用。在实际应用中,红外目标易受到形变、背景干扰以及遮挡等因素的影响,使得红外目标的稳定跟踪成为一项极具挑战的任务。为了增强红外目标跟踪的鲁棒性,本文以孪生网络为基本跟踪框架,从模型训练、特征融合以及遮挡预测三个方面进行研究,具体内容如下:(1)在有限的训练资源下,使用CIOU(Complete Inters
学位
微博的快速发展使得信息的传播更加快速和便捷,但是虚假信息的传播可能会对广大网民产生负面影响,造成平台管理困难,社会动荡,严重情况下甚至会对国家的发展造成冲击,因此对微博中的内容进行可信度评估具有重要意义。在充满数据的时代,深度学习技术中的循环神经网络、卷积神经网络等模型具有出色的数据挖掘能力,通过对已有数据进行特征挖掘,预测新数据的可信情况,但是微博中蕴含大量不同类型的数据,在特征挖掘时还存在一系
学位