基于注意力机制的商标检索方法研究及应用

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:shushuclover1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
商标作为知识产权中重要的一环,在社会经济发展中发挥着无可替代的作用。作为商品和厂家的重要标志,商标不仅象征着商品的质量,也代表了商家的名誉,因此受到越来越多的重视。与此同时,随着商标图像数量的爆炸性增长,如何有效且高效地对商标进行检索已然成为知识产权保护和应用领域的难题。现有的商标检索方法还存在数据标注成本高、有效特征提取难等问题,为了更好地学习商标特征信息,获得更好的检索结果,本文提出了一种基于注意力机制的无监督商标检索方法,该方法基于实例区分框架,引入可实现局部跨通道交互的轻量级注意力机制,为关键特征分配更合理的学习权重。在METU数据集上进行的对比实验验证了提出的方法能够以无监督学习的方式得到更好的商标特征表示,有助于提高商标检索的性能。本文的主要研究内容如下:(1)介绍实例区分和注意力机制。首先针对无监督学习展开相关研究,阐述了无监督学习的相关方法,分析无监督学习,并在此基础上讨论商标检索工作中应用无监督学习的必要性,着重介绍了一种基于实例判别的无监督方法:实例区分,并阐述了该方法应用在商标领域中的可行性与实际意义。接着针对注意力机制展开相关研究,从单域注意力、混合域注意力、自注意力三个方面阐述现有的注意力方法,介绍各个方法应用于在相应领域的优点及局限性。将讨论的重心聚焦于针对SENet模型的不足提出的ECANet,阐述了该模型避免降维,以及实现局部跨通道交互的意义和具体方法,并将其引入商标检索工作中。(2)提出一种基于注意力机制的无监督商标检索方法。针对现有的商标检索方法中,还存在着标注数据成本高、对图像特征无法有区分性地进行学习的问题,本文提出一种基于注意力机制的无监督商标检索方法,该方法通过在实例区分框架中引入一种可实现局部跨通道信息交互的轻量级通道注意力模块,使网络能够在避免降维的同时实现通道之间的信息关联,达到了在无监督条件下更准确学习商标图像重要特征的目的。在公开的METU数据集上,所提出的方法与传统方法及深度学习方法进行对比实验,验证所提出的方法的有效性。(3)开展无监督商标检索方法的参数影响分析实验并对所提出方法进行优化。对不同的通道交互范围即不同k值、不同层数设置下的方法进行相应的对比实验,分析并讨论其对商标检索结果的影响。同时,针对所提出方法中,标准卷积结构对解析图像信息可能带来的局限性进行讨论,并引入金字塔卷积结构进行优化,通过对比实验验证所提出的优化方法的有效性。
其他文献
依托第五代移动通信网络的应用部署和物联网的快速发展,大量低功耗设备的应用越发广泛,从而使无线携能通信技术越来越受到关注。无线携能通信技术可以利用同一个频段,同时对能量接收机和信息接收机进行能量和信息传输,在保证通信质量的同时解决低功耗设备的能源问题。但是,由于使用的无线频段越来越高,无线信号会因距离或者障碍物等因素限制信号的覆盖范围。另外,在物联网应用中,系统中的信息接收机往往较密集,严重的信号干
移动机器人作为当前科技领域的集大成者,集成了电子信息、计算机科学等多个学科的高精尖技术,其软件系统由感知系统、决策与规划系统、控制系统等多个模块组成,关键技术的重点难点之一就是决策与规划。本文首先介绍了一种结合端到端路径规划技术的自主建图方法,并对其中采用的端到端路径规划算法进行了改进,最后通过仿真实验验证其可行性。针对项目要求的清洁机器人,本文提出一种基于回溯法的双向完全遍历路径规划方法,对工作
现有制造车间的大型设备复杂度高,越来越依赖监控系统对其进行实时性管理。而伴随着车间智能终端设备的迅速增加,目前依靠云计算的设备监控系统所需传输的数据量越来越大,车间需要紧急响应的告警信息容易出现延迟,导致设备不能正常运行,严重会造成设备停机等问题,进而影响车间生产线的生产效率。因此,加入边缘计算模型的云边协同数据处理方式逐渐得到重视。当前基于云计算的智能车间设备监控通常把监控数据全部传输到云端进行
超分辨技术是计算机视觉等领域的重要与热门研究方向,在医疗成像等众多领域有广泛的应用。基于深度学习的超分辨重建技术在近几年中发展迅速,神经网络模型对高分辨图像的重构性能越来越强,充分体现了使用深度学习解决超分辨任务的优势。但基于深度学习的超分辨重建技术在提升系统性能时很多是依靠堆叠大量神经网络和设计各种复杂的网络来实现的。同时训练后得到的部署模型存在推理时间长、参数量多等问题。这导致了设计的许多神经
深度预测和相机姿态估计一直以来是计算机视觉领域重要的研究方向之一,是指计算机通过二维图像估计出场景的深度信息和相机姿态信息,广泛应用于自动驾驶、服务型机器人和无人机等人工智能领域。传统基于几何的深度预测方法和相机姿态估计方法虽然在一定程度上能得到场景的深度信息和相机的姿态信息,但是存在计算过程复杂、场景适应性差等问题。目前,基于深度学习的深度预测和相机姿态估计方法一般以卷积神经网络和循环神经网络为
受脑科学、神经计算科学研究的启发,脉冲神经网络作为模仿生物大脑机理的计算模型,在仿生视觉、嗅觉、记忆等应用场景中暂露头角,并逐渐成为脑模型研究的主流。脑科学研究表明,生物大脑的神经元突触个数比其神经元数量大3-4个数量级,生物大脑每周期的生物实时处理时间大概为1-10 ms,大脑工作过程伴随着大量脉冲信号的传递。因此,脑模型的生物实时仿真可抽象为超大规模的图计算和海量微小脉冲包的通信问题,给传统冯
随着大数据时代的飞速发展,现实生活中的许多数据呈现出高数据量和高维度的特点。由于这些现实数据含有特定的物理意义,通常都具有非负性,被统称为非负张量数据。现实的非负张量数据经常呈现“高维,大规模和异构”等形态,其有价值的信息蕴含在复杂的潜在结构中,随着数据规模的不断增大,数据分析所需的存储和计算成本也相应增加。此外,流形学习技术指出,观测到的数据实际上是通过内在流形结构映射到高维空间的。但现有的经典
由于可以制成体积小、重量轻、能量密度大的可穿戴便携产品为数码设备、动力汽车等提供能量,锂离子成为了是当下应用最广泛的储能设备。电极材料是锂离子电池的重要组成部分,其容量也是决定电池性能的关键因素。为满足新能源汽车、航空航天及国防等高耗能场合对于动力电池的需求,研发高容量、环保且性价比高的负极材料显得尤为重要。锡基材料因为价格低廉、无毒且具有高理论比容量(Sn:994m Ah/g,SnO2:1494
在当今的大数据时代,个人隐私数据的丢失尤为严重,这给个人和社会产生了非常恶劣的影响。因此,研究在大数据环境下如何保护数据安全已经成为最重要的问题之一。只有处理好信息安全的瓶颈,信息技术才能讯速、广泛地发展。本文旨在研究如何快速将敏感数据从成千上万的数据中区分出来,并对敏感的私有数据进行加密以实现保护的目的。目前,对于大数据加密算法领域,普遍存在着较短的密钥长度、加密速度慢等缺点。本文在研究原有的数
在信息化时代,每个互联网用户都可以在网上发布内容。但是这导致各大应用程序上信息过载,人们难以在内容丰富的应用中很快找到自己感兴趣的内容,于是各大视频应用开始使用推荐系统。推荐系统能够主动推送用户可能会喜欢的内容,进而解决视频应用内信息过载,以及用户不知道自己想看什么的问题。推荐系统需要根据已有的用户数据进行推荐,但是一旦数据难以收集,就会出现数据稀疏的问题。传统的视频推荐算法在面对稀疏的数据时表现