基于深度学习的服饰图像识别定位及检索的研究

来源 :广东工业大学 | 被引量 : 1次 | 上传用户：fibiya

【摘要】

：

近年来,服饰图像的研究随着计算机视觉技术在视觉时尚领域的快速发展而引起越来越多人的关注。当前,在服饰时尚领域主要围绕服饰图像识别、关键点检测、服饰推荐、检索和搭配

【作者】

：

周文波

【出处】

：

广东工业大学

【发表日期】

：

2020年01期

【关键词】

：

服饰识别关键点检测空洞卷积特征融合

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,服饰图像的研究随着计算机视觉技术在视觉时尚领域的快速发展而引起越来越多人的关注。当前,在服饰时尚领域主要围绕服饰图像识别、关键点检测、服饰推荐、检索和搭配等方向进行研究。这些研究可为服饰在生产、制造、库存、销售等环节提供决策支持并带来全新的购物体验。但在服饰图像现实的应用场景中,仍面临如服饰风格、质地、剪裁、变形、环境及摆放方式和姿态等变化带来的挑战,使得在识别、定位、推荐等应用中效果往往并不理想,本文基于深度学习的方法围绕服饰识别、关键点检测和服饰检索等任务进行研究,主要完成了以下工作:(1)本文归纳总结了图像识别和深度学习的国内外研究成果及现状,分析了服饰图像的研究方向,并着重研究基于深度学习的服饰图像识别算法和服饰关键点检测算法,在经典网络结构的基础上针对识别和检测的单一任务分别构建服饰识别网络和服饰关键点检测网络,并在m AP、MSE等评价指标上进行了算法性能对比。(2)在上述研究基础上,针对存在服饰图像因遮挡、变形、光照以及复杂姿势对识别准确率和关键点定位精度的影响问题,结合SE模块、空洞卷积和特征融合思想将服饰识别和关键点检测两个单任务相结合,构建了能同时进行服饰图像识别和关键点预测的多任务网络,网络中利用空洞卷积代替普通卷积操作,通过空洞卷积的扩张率增大特征图对应原图的感受野,同时采用特征融合的方法将不同阶段提取的图像特征进行融合以增加多尺度的表达能力。通过验证集上的实验和分析,结果显示相比单任务网络在m AP评价指标上Top-3和Top-5服饰识别准确率分别提升了0.031和0.025,在MSE均方误差关键点评价指标上下降了0.022,实验证明结合特征融合的多任务网络能有效的增强特征表达能力,提升网络对服饰识别和定位的性能。(3)用上述训练好的网络模型进行服饰特征提取用于图像检索,实验中为了消除复杂背景的影响,使用Faster-Rcnn算法进行了服饰主体检测,将检索数据库图像作为特征库,采用待检索图像特征和特征库进行相似度计算、排序以完成图像检索任务,并在此算法的基础上开发了适用于服饰图像的检索系统,该系统可用于相似服饰图像的检索任务。

其他文献

英语专业本科生说明文与记叙文语言复杂度发展的比较研究

二语写作研究中,由于句子复杂性、词汇多样性是衡量一篇作文质量的重要标准,因此,复杂度已成为评估二语学习者书面语语言发展的重要指标。本研究采用纵向跟踪法对英语专业本科生说明文和记叙文语言复杂度进行长达两年的跟踪研究。本研究通过对英语专业本科生写作进行两年的跟踪研究来探索英语专业本科生说明文与记叙文写作的发展趋势以及体裁差异。研究以江西某高校英语专业本科生为研究对象,从两个英语专业自然班中抽取20名学

学位

复杂度二语学习体裁

基于完全卷积的高分辨率指纹汗孔提取方法

现阶段的指纹识别技术主要依靠提取指纹上的细节点特征进行个人身份的匹配和验证,然而基于细节点匹配的方式有一定的局限性和安全性问题。高分辨率指纹图像上的汗孔特征由于

学位

深度学习指纹识别汗孔提取指纹质量增强

长链非编码RNA ODRUL调控骨肉瘤阿霉素耐药的机制研究

背景:骨肉瘤是儿童和青少年中最常见的原发性恶性骨肿瘤,化疗是其最重要的辅助疗法,然而阿霉素耐药的出现极大地阻碍了其治疗。长链非编码RNA在肿瘤发生、发展中发挥关键调控

学位

骨肉瘤长链非编码RNAlncRNA耐药化疗抵抗

基于多通道盲去卷积算法的单透镜图像复原技术研究

目前,光学成像系统为了满足人们对图像质量的要求,其结构设计、系统研发和后期处理变得越来越先进。传统复杂光学系统为消除透镜成像的图像模糊,结构设计越来越复杂,这提高了

学位

单透镜图像复原多通道盲去卷积点扩散函数

功能性鼻内镜手术中三叉神经-心脏反射发生率的回顾性研究

目的:探讨功能性鼻内镜手术中三叉神经-心脏反射(trigemino-cardiac reflex,TCR)的发生率、临床特征、相关危险因素及处理措施。方法:回顾性分析2016年1月至2017年12月于武汉协和医院连续收治的在全身麻醉下行功能性鼻内镜手术的患者,收集所有患者的临床资料,根据手术医生的不同分为A组和B组,根据术前诊断的不同分为鼻腔、鼻窦、鼻咽和其他手术组。根据电子麻醉记录单采集的生命体

学位

功能性鼻内镜手术三叉神经-心脏反射危险因素用药情况

网络寻衅滋事犯罪若干问题探析

随着信息时代的到来,互联网对人类社会的影响日益加深,一些违法犯罪活动也将触角伸向了网络空间,网络寻衅滋事犯罪就是其中一种,它是传统寻衅滋事犯罪在网络空间的异化,也是

学位

网络空间寻衅滋事公共场所起哄闹事公共秩序虚假信息

基于改进BP神经网络的RFID指纹室内定位算法研究

随着通信技术的发展,生活中基于位置的服务应用越来越广泛,使得室内定位技术的研究越来越受到重视。由于室内的环境相对复杂,干扰众多,如何提高室内定位精度是目前室内定位领

学位

室内定位RFID指纹室内定位算法混合滤波算法BP神经网络烟花爆炸算法

单桥“寄生中频”双频感应加热电源的研究

感应加热技术是利用法拉第电磁感应定律,在时变的磁场中产生涡流,从而给工件进行加热,目前广泛应用在冶金、机械加工、国防等工业领域中,相比于传统的直接加热技术,具有加热

学位

感应加热寄生中频同步双频频率跟踪

胸腺五肽对胃肠道恶性肿瘤手术患者围手术期免疫状态及近期疗效影响的临床研究

目的:本研究收集我院60例胃肠道恶性肿瘤手术患者,探讨应用胸腺五肽对患者围手术期免疫功能的影响,并分析患者免疫功能的变化对其术后近期疗效(术后感染发生率、吻合口瘘的发生率和胃肠功能恢复时间、术后住院时间)的影响,并评估临床应用价值。方法:我们从2017年6月至2018年10月于我院行腹腔镜下胃肠道恶性肿瘤根治术的患者60例,数字随机表法随机分为两组,观察组30例(常规治疗+胸腺五肽肌肉注射10mg

学位

胸腺五肽胃肠道肿瘤围手术期免疫功能并发症

基于生成对抗网络的异质人脸图像转换

异质人脸图像的转换指将人脸图像从一类视觉域,经过合成算法转换到另一类视觉域。随着计算机视觉和深度学习算法的不断发展,异质人脸图像转换在公安安防系统、智能美妆、社交

学位

异质人脸图像转换无监督学习深度学习生成对抗网络

基于深度学习的服饰图像识别定位及检索的研究

其他学术论文