【摘 要】
:
随着电子商务的快速发展,越来越多的消费者倾向于在网上购买商品。目前,电商平台主要通过关键字匹配的方式来检索服装,这些服装由卖家拍照并采用人工的方式进行分类。作为服装检索过程中的一个重要环节,服装分类直接影响商品的销售和用户的消费体验。由于服装图像数量庞大,服装分类是一项繁琐而艰巨的任务,采用人工分类的方式效率低下、错误率高。因此,基于计算机视觉的服装图像分类已成为目前工业服装分拣、电子商务等领域的
论文部分内容阅读
随着电子商务的快速发展,越来越多的消费者倾向于在网上购买商品。目前,电商平台主要通过关键字匹配的方式来检索服装,这些服装由卖家拍照并采用人工的方式进行分类。作为服装检索过程中的一个重要环节,服装分类直接影响商品的销售和用户的消费体验。由于服装图像数量庞大,服装分类是一项繁琐而艰巨的任务,采用人工分类的方式效率低下、错误率高。因此,基于计算机视觉的服装图像分类已成为目前工业服装分拣、电子商务等领域的一个重要研究方向。本文针对现有卷积神经网络对图像不同类型信息的描述能力弱、泛化能力弱、表征能力受限等问题,提出了基于卷积神经网络和视觉注意力机制的新型特征重校准分类算法,主要工作如下:(1)为了提高卷积神经网络对图像中不同类型信息的描述能力,受视觉注意力机制启发,本文根据通道注意力(Channel Attention)机制和空间注意力(Spatial Attention)机制设计了两种单维特征重校准模块,分别是通道特征重校准模块(CFRM)和空间特征重校准模块(SFRM)。通过特征重校准操作,CFRM能在特征图通道维度上捕获图像中重要的信息,SFRM能在空间维度上加强图像中有关联的信息。为了提高DenseNet的图像分类精度,本文设计了两种新型的Dense Block结构,提出了通道特征重校准DenseNet(CFR-DenseNet)和空间特征重校准DenseNet(SFR-DenseNet)两种单维特征重校准网络。通过在CIFAR数据集上的实验表明,本文提出的CFR-DenseNet和SFR-DenseNet图像分类精度均略高于DenseNet,这证明单维特征重校准模块可以提升DenseNet的图像分类精度。(2)为了进一步提高DenseNet的图像分类精度,针对单维特征重校准模块提升DenseNet图像分类精度能力有限的问题,本文提出了能同时在特征图通道和空间进行特征重校准操作的双维特征重校准模块,即并联式通道及空间特征重校准模块(PCSFRM)和串联式通道及空间特征重校准模块(TCSFRM)。通过设计两种新型的Dense Block结构,本文提出了并联式通道及空间特征重校准DenseNet(PCSFR-DenseNet)和串联式通道及空间特征重校准DenseNet(TCSFR-DenseNet)两个双维特征重校准网络。在CIFAR数据集上的实验结果表明,PCSFR-DenseNet和TCSFR-DenseNet的图像分类精度明显高于DenseNet、CFR-DenseNet和SFR-DenseNet,这证明了双维特征重校准模块可以更明显地提高DenseNet图像分类精度。(3)为了验证所提出模型对服装图像的分类性能和模型的泛化能力,本文在服装图像数据集Fashion_MNIST进行了大量实验。CFR-DenseNet、SFR-DenseNet、PCSFR-DenseNet和TCSFR-DenseNet的图像分类精度分别为95.52%、95.57%、95.63%和95.60%。实验结果证明,本文所提出的模型能对服装图像进行准确分类且具有较强的泛化能力。
其他文献
甲状腺是人体最大的内分泌腺体,甲状腺结节则是甲状腺内部的肿块,可分为良性和恶性两类。我国的甲状腺结节发病率高居全球前列,属于高发性疾病,患者基数大。超声检查由于其高效且无创的特点成为了筛查诊断甲状腺结节的主要手段。甲状腺超声报告通常描述了甲状腺腺体、局灶性病变和淋巴结的形态及血流特征,这些特征是临床医生进行结节良恶性诊断的主要依据。因此,利用人工智能技术对甲状腺超声特征进行深度学习,建立甲状腺结节
移动互联网的飞速发展和智能终端设备的广泛使用使人们的工作和生活方式逐步被网络化,“远程”和“共享”成为人们社会生活方式的主要组成部分。而且随着计算机科学、通信等传统产业的融合,多媒体正逐步深入人类社会的每一个角落。图像是一种可视化的多媒体信息,是最主要的多媒体形式之一,也是传递信息的重要媒介之一。因此,图像传输的安全性引起了研究者的关注。目前保证图像安全传输的方法有两种:图像加密和信息隐藏。本文主
目前肝脏恶性肿瘤依然是世界上最普遍的癌症之一,它也是人类死亡的主要原因,对人类健康构成了巨大的威胁。为了有效降低癌症死亡率,患者依然需要提前对身体进行全面的检查以及尽早接受治疗。然而由于肝肿瘤与其周围软组织之间的对比度较低,分界不明显,而且对于不同的病人,肝肿瘤的形状,体积,数量和位置等差异明显,同时多种扫描方案导致CT图像存在噪声干扰等问题。由于肝肿瘤分割难度较大,仅仅依赖医生的肉眼检测很难得到
速度快、准确度高的车辆检测系统不仅能够帮助交通指挥员加强对道路交通系统的管理,而且能够在交通事故等紧急事件中快速提取出事故车辆的信息,提高处理紧急事件的效率。可见,提高车辆检测的精度和速度对增强城市道路交通管理系统具有重要意义和应用价值。本文深入研究了Mask R-CNN网络模型,对其主干网络和Ro I Align进行改进,提出了CA-PS Mask R-CNN网络模型,完成以城市道路为实际背景的
随着国家经济实力的腾飞和科学技术的突飞猛进,各行各业对数据重视程度日益提高,大量生产、交易、医疗等数据被收集起来,用于企业产品升级或服务转型等诸多方面研究。面对具有高度复杂、体量大、易变性等特点的海量数据,如何对其进行精准检测和快速分析,从中挖掘出具有的潜在价值,已成为当今数字化时代研究的热点问题。作为大数据领域中的一个重要研究分支,时序数据的异常检测与快速分析技术主要利用整体数据的分布状态,找出
由于当下的中小学生握笔手势不规范,导致写字质量不高、坐姿不良、眼睛近视以及手指关节增生等问题,对其身心健康造成不良影响。针对握笔手势的问题,我国研究者们已经对其进行了较多的理论研究,国家也出台了《关于在中小学加强写字教学的若干意见》等一系列文件,不仅强调了学生使用正确的握笔手势进行书写的重要性,而且明确定义了中小学生正确书写时的握笔手势。然而当前的握笔手势和书法教学主要采用面授和视频教学,缺乏自动
随着互联网的不断普及和服装电子商务的兴起,越来越多的用户通过电商平台购物服装,网上购买服装已经逐渐成了人们的重要消费方式之一,如何在海量的服装商品中高效准确地检索出用户心仪的服装成为了热门的研究方向。目前“以图搜图”技术主要依赖于整张图像特征提取的结果,不能关注到服装的部件,并且服装图像拍摄时背景一般比较复杂,导致服装图像检索准确率低,因此,本文提出一种基于部件检测与分割的服装图像检索方法。本文调
点击率预测一直是在线广告和产品推荐领域中非常受欢迎的问题,点击率的小幅增长可以带来可观的利润回报。近年来,由于机器学习和人工智能技术在自然语言处理及计算机视觉等众多领域中取得了令人瞩目的成绩,各研究机构和互联网企业纷纷将相关知识应用于点击率预测问题,并为此做了许多研究和探索,取得了诸多出众的成果。本文通过综述近年来点击率预测相关的论文发现:点击率预测的准确性主要受到数据特征规模大、维度高和稀疏性等
在筒子纱染色领域,卷绕密度的测量主要为传统的人工理想化计算和利用硬度计间接测量,存在测量结果准确性不理想、测量过程耗时较长等问题,且仅能以抽样测量的方式进行,以样本数据代替整体,无法对全体对象实现精确测量,导致对筒子纱染色质量的控制存在不确定性,完全不能满足生产的高效率、高精度、高质量需求,且生产环境较恶劣,对工作人员的健康存在安全隐患。研究高精度、高性能的筒子纱卷绕密度自动化测量技术,可解决传统
我国社会正逐渐步入老龄化,以阿尔兹海默症为代表的精神疾病正在危害老龄人群的生命健康。海马体作为大脑神经系统的重要组成部分,其体积结构的变化正是诸多精神类疾病早期病灶的临床特征之一,所以实现海马体MRI图像的有效分割对于相关精神疾病的诊断与治疗有着十分重要的意义。然而传统通过人工的方式对海马体图像进行分割,不仅对操作人员的专业水平要求高,而且易受主观因素等影响出现误分割情况。因此如何利用深度学习技术