【摘 要】
:
在过去的几十年中,由于电子商务平台的快速发展,互联网或移动应用程序等社交媒体上出现了大量服装数据。而由于服装的颜色、纹理、样式和类别的多样化,人们在线上购物时选择合适服装的难度将大大增加。服装属性识别作为用户描述服装特征的关键技术,将有助于解决这一问题。目前大多数方法都是先检测多件衣服,然后裁剪出衣服,并反馈到一个额外的网络进行衣服属性识别。这种两阶段的方法比较耗费时间和资源。另一方面,通过将服装
论文部分内容阅读
在过去的几十年中,由于电子商务平台的快速发展,互联网或移动应用程序等社交媒体上出现了大量服装数据。而由于服装的颜色、纹理、样式和类别的多样化,人们在线上购物时选择合适服装的难度将大大增加。服装属性识别作为用户描述服装特征的关键技术,将有助于解决这一问题。目前大多数方法都是先检测多件衣服,然后裁剪出衣服,并反馈到一个额外的网络进行衣服属性识别。这种两阶段的方法比较耗费时间和资源。另一方面,通过将服装检测和属性识别集成到端到端框架中,单阶段方法可以提供有效和高效的解决方案。但单阶段方法倾向于使用基于锚框的检测器,这将导致对超参数的高灵敏度和对密集锚框的高计算复杂性。此外,由于服装检测分支和属性识别分支需要不同的优化特征,因此在训练过程中也可能面临优化矛盾问题。为了解决上述问题,本文旨在开发一种新的且有效的服装属性识别方法。本文完成的主要工作内容如下:1.为了解决两阶段方法的问题和基于锚框的方法的局限性,本文开发了基于无锚检测框架的服装属性识别网络。它是一个单阶段的端到端无锚框架,包含一个额外的分支,用于联合服装检测和属性识别任务。网络中两个任务分支共享骨干网络特征,以并行的方式进行计算,大大提高了识别速率。2.为了进一步提高预测精度,本文在识别分支中引入了属性分组注意力模块。它可以自适应地将属性类型间的互斥与关联关系集成到特征学习中,其在网络中的有效性也通过大量实验进行了相应的验证。此外,在识别分支的学习过程中,本文采用了适合于多标签分类任务的损失函数,进一步提高网络学习效果。3.为了处理两个任务分支中的优化矛盾,本文提出了一个骨干特征解耦模块。它将骨干特征编码为像素级密集Query特征,并通过可变形Transformer将其解码为输出特征,分别输入服装检测和属性识别分支。这样,检测和识别分支的特征可以解耦,优化矛盾可以自然得到解决。4.最后,本文探索了服装属性文本与图像的相似度匹配问题。本文基于CLIP模型搭建了一个图文匹配网络。该网络涉及图像与文本两个模态,它将图像编码为特征向量,将文本描述编码为句向量。本文采用对比学习方法进行训练,将图像与文本映射到同一语义空间,最后将其应用到基于属性文本的服装图像检索任务中。相关实验表明,本文构建的图文匹配网络对相关属性文本具备一定匹配和判别能力。
其他文献
探视地下结构的方法多种多样,地表的裂隙、破碎带可以直接观察,并通过各种器材进行定量测量和描述;至于岩体内的构造情况,则必须借助特定的技术手段加以观测,而岩体内的构造情况则是决定岩石地层构造特性的关键因素,对地质工程研究有着很重要的意义。前视钻孔摄像系统可以获取岩体内部钻孔图像和视频,是观测岩体内部结构的重要手段,如何利用这些钻孔图像和视频数据来直接识别裂缝是一项重要的研究课题。本文设计了一种前视钻
<正>元素周期表是高中化学学习的重点内容,元素周期表内各非金属元素含氧酸的酸性强弱规律是学生学习的重点。在日常教学中,教师对各含氧酸的酸性强弱问题处理比较简单,只区分了强酸、弱酸,而对酸如何电离出氢离子的过程认识不足,不少教师不能用简单直接的语言解释和总结各种常见含氧酸的酸性强弱递变规律。那么无机含氧酸产生H+的本质原因是什么?如何定性、定量地比较无机含氧酸的酸性强弱?尤其是如何向学生简单地解释各
随着我国经济社会的快速发展,国民理财意识逐渐增强,人们对于资产保值升值的需求越来越大。M银行作为一家较早开展个人理财业务的股份制银行,有着较好的口碑。但是随着国家“资管新规”实施,以及外资银行和国有银行的不断发展以及互联网金融企业如雨后春笋般快速崛起,商业银行的零售理财业务承受着巨大的压力和威胁。在此背景下,M银行石家庄分行的理财产品亟待发挥股份制银行特色,完善自身营销体系,增强市场竞争力。本文在
随着移动计算的普及化,终端设备无处不在且每天都在执行计算,但是这些终端设备受到电池容量和计算资源的限制,不能满足计算密集型和延迟敏感型的智能应用程序(例如,增强现实和人脸识别)在服务可靠性方面的需求。移动边缘计算应运而生,它将云计算能力下沉到网络边缘,贴近终端用户,带来超低时延和高带宽。终端设备主要通过任务卸载的方式,将本地产生的任务传输到边缘服务器上计算。然而,移动边缘计算系统内的资源有限,尤其
人工智能的分支之一——专家系统,是常用于智能系统中决策分析的重要理论工具。数学平面几何定理的机器证明是专家系统在数学和计算机结合应用上的一种方法。本文在分析了专家系统的结构和产生式推理系统的基础上,采用了RETE算法作为核心算法构建了一个使用正向推理作为常规推理决策的平面几何推理系统,并且在系统中实现以反向推理为推理决策的推理方法,减少了在常规正向推理中产生的和目标结论无直接关系的事实数量。本文的
民事在线庭审检察监督正发生着由案件监督向数据监督、事后监督向全程监督、人力监督向算法监督的转变。以《人民法院在线诉讼规则》《人民法院在线运行规则》《人民法院在线调解规则》为规范基础,民事在线庭审在我国迅速发展并成为法庭审理的重要形式,但从司法实践中看,其在极大地便利当事人的同时也出现了适用范围局限、信息安全保障不到位、法庭秩序易失控、异步庭审中当事人辩论权无法保障、质证效果虚化等问题,严重阻碍了民
三维重建一直是计算机视觉领域研究的热点方向,目前三维重建已经广泛应用于机器人、AR、工业制造等相关领域。传统的目标识别和定位项目中采用的是二维图像,但二维图像容易受到环境光照和物体表面反射等情况的影响,从而目标识别的精度和效率会降低。由于三维点云数据中包含大量三维信息,所以采用三维点云数据进行目标识别,可以准确表达目标对象的几何特征,同时在获取点云数据的过程中不易受到光照等环境因素的影响,因此,可
当前,世界范围进行新一轮产业结构调整,以经济全球化、信息化为主要特征,重心由第二产业向第三产业转移。中国政府瞄准这一趋势,大力鼓励企业发展服务外包,承接离岸外包业务;并在2020年适时提出“双循环”发展战略,鼓励在岸外包,利用大数据、人工智能、物联网等技术,助力国内产业转型升级。经过三十余年的快速发展,中国承接离岸服务外包规模稳居世界第二位,对全球价值链具有重要的影响;同时随着国内人力成本提升、人
随着海洋科学的发展,海藻多糖因为具有较强的生物活性、开发价值和应用前景被科学界日益关注。但海藻多糖具有易凝的特点,在应用上受到限制,而其降解产物海藻寡糖分子量较小,易于被动植物利用,弥补了海藻多糖在应用上的缺陷。褐藻胶裂解酶作为一种用途广泛的工具酶,常用于降解海藻多糖,在制备低分子量的海藻寡糖时反应条件温和,专一性强,得率高,逐渐成为生产寡糖的主要方式。为高效降解海带,并有效利用其中的海藻寡糖,本
组合设计理论是组合数学中的重要分支,与编码理论和密码学等有着广泛的联系.可分组t-设计(t-GDD)是一类十分经典的组合设计,是构造其它类型组合设计的重要工具.本文在可分组t-设计的基础上研究可分组t-填充(t-GDP)的存在性问题.已经知道型为gn的GDP(t,k,gn)可用于构作重量为k,码长为n,最小汉明距离为k-t+1的g+1元常重码.因此,可分组t-填充受到了人们广泛的关注.因问题难度的