【摘 要】
:
图像分类算法具有很高的科学研究价值,更是近年来计算机学科的研究重点。伴随着深度学习的高速发展,基于卷积神经网络的图像分类技术正在广泛的应用于大众日常生活当中。在服装图像分类任务中,由于服装的多样性、易遮挡、易褶皱和易变形等性质,使得实现准确的服装图像分类成为一个挑战。因此将基于卷积神经网络的算法与服装图像分类任务相结合具有重要意义。近些年,由于国内外学者对服装图像领域的关注,以及对卷积神经网络的不
论文部分内容阅读
图像分类算法具有很高的科学研究价值,更是近年来计算机学科的研究重点。伴随着深度学习的高速发展,基于卷积神经网络的图像分类技术正在广泛的应用于大众日常生活当中。在服装图像分类任务中,由于服装的多样性、易遮挡、易褶皱和易变形等性质,使得实现准确的服装图像分类成为一个挑战。因此将基于卷积神经网络的算法与服装图像分类任务相结合具有重要意义。近些年,由于国内外学者对服装图像领域的关注,以及对卷积神经网络的不断深入研究,卷积神经网络在服装图像任务上的应用日趋成熟。通过将计算机分类处理技术与服装图像相结合,服装图像的属性预测、类别分类等任务准确率不断提升。但由于服装具有独特特性,卷积神经网络在服装图像领域的算法研究仍存在广阔的提升空间。本文主要任务是应用香港中文大学团队提出的Deep Fashion数据集,提出基于卷积神经网络在服装分类和特征预测的算法,在此基础上对其进行优化。针对因服装具有的独特属性导致服装图像与其他类型图像的差异性,本文使用服装关键标记预测分支,利用服装数据集中的关键位置标记点对服装图像应用网络强化训练。再将服装关键标记点预测分支提取到的关键位置信息与基础卷积神经网络生成的全局特征融合,以此方式搭建基于vgg16的服装分类算法结构,用于后续的服装图像分类研究中。在用卷积神经网络提取图像特征过程中,浅层的卷积神经网络更易提取到服装图像相关信息,但提取语义信息能力较弱。随着卷积层数不断增加,卷积神经网络结构对图像提取的语义信息更为丰富,但会发生部分图像信息丢失的现象。因此本文提出利用融合残差特征方式优化vgg16服装分类算法,将底层图像信息与高层语义信息融合,用于提取全局性更强的服装图像特征信息。除此之外,由于不同尺度的卷积核提取到的图像特征有所差异,多尺度卷积核对图像特征的提取更加全面,因此,本文提出利用多卷积核提取特征方式优化vgg16服装分类算法,目的是提升算法在图像分类任务上的准确性。除此之外,重点关注图像中的重点区域可以提升算法准确性。因此本文阐述了注意力机制的作用和分类,并且利用基于空间域的注意力机制和基于通道域的注意力机制对服装分类算法进行优化。对于基于通道域的注意力机制,本文提出了利用多种池化融合方式优化通道注意力模型,利用多尺度核卷积方式优化通道注意力模型,以及利用自适应尺度卷积核的方式优化通道注意力模型三种优化方式,并将优化后的模型用于对基于vgg16的服装分类算法改进中,最终完成了提高服装图像分类准确率的目标。
其他文献
黑龙江省嫩江县三峰山地区地处中亚造山带东段,贺根山-黑河断裂带西侧,成矿区隶属于三矿沟-多宝山铜金多金属成矿带。研究区出露的地层以早古生代奥陶纪和志留系为主,岩浆岩主要为燕山期侵入岩。区内构造以NW向和NE向断裂、褶皱、韧性剪切带为主。区内铜金矿化主要呈细脉状产于志留系黄花沟组地层之中,矿(化)体产出受NW向断裂控制。围岩蚀变类型包括硅化、青磐岩化、绢云母化、碳酸盐化、高岭土化等,根据矿物组合及矿
本文以松辽盆地滨北地区晚古生代为研究对象,应用地质、地震、钻井等资料对松辽盆地滨北地区晚古生代的地层分布特征、构造特征、成藏条件进行了研究。首先应用野外实测剖面、钻井、地震资料确定松辽盆地滨北地区晚古生代地层分布范围。然后结合地层分布特征,地球化学,地震资料对研究区烃源岩开展研究,在此基础上结合生储盖发育特征研究。探讨研究区成藏特征并指出有利区带。(1)结合区域地质背景、岩性特征和钻井、地震资料分
在人工智能研究领域,计划生成问题是研究热点之一。计划是指挥决策的重要内容,尤其在作战领域当中,现代战争形式逐渐转向以网络为中心的信息化联合作战,作战计划的自动生成是其中重要的一环。计划制定的关键步骤就是合理规划行动序列(Course of Action,COA)。COA本体作为描述计划相关概念的知识模型,为行动规划提供支持。传统的计划生成技术是对COA本体中的行动、状态实例进行匹配,组成行动序列方
人脸检测作为计算机视觉中的重要研究方向之一,得益于硬件设备的进步、深度学习技术的快速发展,其性能也得到了不断的提高。从传统的人脸检测方法发展到现今的基于深度学习的人脸检测方式,不仅仅在检测效果上有了一定的提升,而且在检测速度上有了很大的提高。在人脸检测的应用场景中会存在很多非受限的场景,在这些相对复杂的场景下,对于人脸检测的准确度有着很大的挑战,例如人脸遮挡、人脸模糊和小尺度人脸等。这些环境下的人
地磁异常判定是地磁学研究的重要分支,其主要目的是从地磁异常的角度进行地震前兆分析,进而为地震预报提供有效依据。目前,由江苏省地震局开发的地磁分析预报软件是国内实现地磁异常判定的主要工具。据统计,目前使用地磁分析预报软件进行地磁异常判定,进而实现地震预报的准确率约为50%,这一数值尚不能满足地磁异常与地震的准确对应。而奇异谱分析和ARMA模型拟合在强化原始数据特征、去除噪声等方面具有显著效果。因此,
造山型金矿床在世界上占据重要的地位。这类矿床形成于太古代到新生代时期,主要分布于活动大陆边缘地区,形成于挤压或者向挤压转换的构造环境中。在不同的垂向深度上可连续形成金矿,并且大多经历了绿片岩相变质作用。这类矿床是受控于脆韧性断裂体系的脉型或者浸染型金矿床。青沟子锑矿床位于华北克拉通的东部边缘。研究区位于辽吉活动带中,北临龙岗地块,南接郎林地块。该矿床经历了多期变形作用,形成了一系列的逆冲断层和正断
本文对吉林省和黑龙江省东部的延边-东宁地区晚三叠世-早侏罗世火山岩进行了锆石U-Pb年代学、地球化学、全岩Sr-Nd同位素及锆石原位O同位素的研究,查明了火山岩的形成时代和岩浆源区性质,探讨了延边-东宁地区晚三叠世-早侏罗世火山岩形成的构造背景及深部动力学机制。锆石U-Pb年代学结果显示,延边-东宁地区晚三叠世罗圈站组和天桥岭组火山岩的形成时代分别为213~206 Ma和221 Ma,早侏罗世南村
作为机器学习领域的重要分支,分类问题旨在训练阶段根据有标签的训练集训练一个模型,在分类阶段用该模型为无标签样本分配一个类标签。目前,在实际应用中广泛使用的有监督分类器有很多,贝叶斯网络分类器(Bayesian network classifier,BNC)由于其模型可解释性和优异的分类性能广为流行。朴素贝叶斯(Naive Bayes,NB)由于假设特征间互相独立,成为了最简单高效的BNC之一。NB
本次研究区位于中国西北新疆天山乡,剖面地层自下而上为中二叠世早期芦草沟组,中二叠世中期红雁池组,中二叠世晚期—晚二叠世早期泉子街组,共采集孢粉样品40个。研究发现,芦草沟组和红雁池组可见少量孢粉化石,泉子街组孢粉化石较丰富,通过分析对比孢粉化石与母体植物,自下而上划分了4个孢粉组合。根据植物生态学,尝试恢复该研究区的古气候和古环境。得到以下认识:1、芦草沟组上段的孢粉化石共计8属9种:Cyclog
近年来,随着生产力能力的飞速发展,生活水平逐渐提高,健康问题成为了当下人们关注的重点问题,尤其是视网膜眼底血管疾病成为了困扰当今世界千千万万人的主要眼科疾病。视网膜血管的长度、宽度、弯曲度、分支模式和角度等特有的医疗属性,可以用作诊断、筛选、治疗和评估各类心血管和眼科疾病。随着深度学习的快速发展,深度神经网络已经在计算机视觉任务和应用中展现出强大的特征提取能力,尤其是在医学图像分割领域上,效果十分