基于小样本学习的目标检测与识别算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ifeelart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测与识别是计算机视觉领域的基础任务和热点研究问题。目前,大多数的方法基于图像数据充足的假设。但是当训练数据稀少时,即小样本情况下,模型的训练精度会因为过拟合和泛化能力差而急剧下降。为了解决上述问题,本课题分别从改进网络表示能力和损失函数两个角度进行研究。具体内容如下:现有的小样本目标检测方法主要针对已有的目标检测网络设计新的训练策略,忽略了网络表示能力的重要性。本课题从改进网络结构出发,提出了一种新的网络模型HOSENet,在网络的前向过程中引入高阶语义增强模块(如二阶池化模块)。先用基类数据对网络进行训练,再用新类数据对网络进行微调,用微调后的模型检测新类的对象。在PASCAL VOC和MS COCO数据集上的实验表明,在不影响基类检测精度的情况下,我们的方法在新类中的检测精度显著优于其他方法。随后,针对京剧表演艺术中的梅派手势识别这一实际应用,本课题提出了一种新颖的梅派手势识别方法,该方法基于小样本,采用元学习(Meta Learning)的思想,构建基于向量空间距离与余弦距离的损失函数。首先,收集梅派53种手势图片以及数字0~10的手势图片形成数据集,并对数据集进行预处理和划分。然后,构建网络模型提取数字手势图片的特征,设计损失函数优化模型参数。最后,用新类(梅派手势)数据对网络模型进行微调,使用微调后的网络模型进行梅派手势识别。实验结果验证了该方法的有效性,为梅派手势的传承和发展提供了强有力的技术支持。
其他文献
随着网络空间不断扩展,其中传播的信息的可靠性和真实性变得愈发重要,特别是在电子商务方面,这是因为潜在消费者在做出购买决定之前会优先查看在线评论。这些评论可以通过相关网站轻易获取,但由于缺乏对其真实性的验证引发了人们对其可靠性的担忧。此外,一些用户通过发布虚假评论,误导其他用户购买目标产品造成一定经济损失。为了维护网络空间的经济秩序,能够有效地检测出不可靠和虚假的评论具有重要的现实意义。本文从评论数
“互联网+健康”模式的兴起以及移动物联网、云计算、大数据、5G等信息技术与医药行业的深度融合加快医药行业的发展进程,药事服务迅速成为学术界和产业界的研究热点。针对目前药事服务资源增多、服务资源孤岛化碎片式、服务质量不高、用户体验不佳等问题,本文聚焦药事服务场景,通过建立药事服务资源协同认知的关联模型对药企、医院和患者三个主体的药事服务资源进行协同调度,主要研究药企和医院之间药事服务资源协同认知的双
随着“互联网+”概念的提出,在线教育行业迅猛发展。MOOC作为在线教育的主流形式,以其方便快捷、资源丰富的优势而广受大众青睐。然而,MOOC在快速发展的过程中,也面临着一些困难和挑战。虽然MOOC的用户规模庞大,但是在实际的学习过程中,经常会出现学生中途辍学的情况,这限制了MOOC的进一步发展。为了解决MOOC高辍学率问题,深入研究学生的行为数据,并建立相应的分析模型具有重要的现实意义。本文的研究
随着O2O(Online to Offline,线上到线下)网上订餐平台的普及,餐饮外卖行业得到了迅速的发展。外卖成为人们继在家做饭、餐厅堂食外的第三种常规就餐方式。面对不断增长的餐厅外卖市场,O2O网上订餐平台为了提高配送效率,导致的“骑手困境”问题在社会上引发了热议。为了缓解不断增加的订单数量带给骑手团队的压力,各个网上订餐平台提出采用无人机来提高即时外卖的配送效率。当前研究成果中,将无人机与
网络巨大的传播能力和数据易于被复制的特点给数字产品版权安全带来了挑战。非法拷贝严重侵犯了知识产权,阻碍了数字产业经济的发展。在版权保护技术中,数字指纹的应用最为广泛。为了给数字产品选取合适的数字指纹,数字指纹性能评估受到广泛关注。准确的评估结果可以为数字指纹的选取提供依据进而减少经济损失,不准确的评估结果可能会带来巨大的利益损失。数字指纹性能评估研究相对滞后于指纹算法的研究,数字指纹算法设计只是整
网络流量数据是网络运营和网络管控最为关键的参数之一,主要原因是网络流量数据中隐含大量对网络流量工程有深刻指导意义的信息。网络运营、管理、规划以及优化依赖于完整且精确的流量数据,但在现实的网络流量工程中,通过直接测量获得网络的全部流量数据代价高昂,实际操作也是不可行的,尤其是对于大规模的骨干网络环境。一般的解决办法是通过采样部分流量数据,然后利用流量数据估计算法进一步得到完整的流量数据。因此如何高效
在知识经济时代,互联网的迅猛发展推动了数字资源的使用和传播,但由于数字产品本身易于传播的特性,数字产品很容易被泄密,给内容提供商造成损失。为了解决这个问题,数字指纹技术应运而生。通过将唯一的指纹序列秘密地嵌入到每一份分发出去的数字拷贝中,内容提供商可以追踪盗版者,保护数字产品的版权并且维护自身合法利益。目前对于数字指纹技术的研究已经取得了部分进展,但仍然存在一些亟待解决的问题,尤其是抗共谋指纹构造
现如今,大数据技术已经成为了互联网技术中至关重要的一部分,如何运用数据分析方法挖掘出数据背后的价值是大数据技术的核心问题。与此同时,数据的安全分发问题显得尤为重要,而关系型数据库作为一种重要的数据存储手段,它在分发时也面临着种种挑战。关系型数据库在分发时容易发生泄密,如何在关系型数据库发生泄密后对泄密者进行溯源追踪成为了研究重点。针对关系型数据库分发后可能出现的泄密问题,本文提出了两种分别适用于数
软件产品和我们日常的工作生活息息相关,一旦软件中存在缺陷,可能会带来严重后果。由于软件本身是一种逻辑实体,并且软件产品开发过程中往往涉及人员、技术、管理及成本等多方面,缺陷往往难以避免。目前应对缺陷的主流方法是软件测试技术,但随着软件和信息技术服务业的蓬勃发展,软件规模越来越大和软件复杂度越来越高,导致测试资源紧张和测试速度过慢。随着发现缺陷时间点的延长,修复缺陷的代价呈指数级增长,因而尽可能早地
如今的人类社会,多芯线缆的应用非常广泛。如桥梁斜拉索,高压电缆,光缆和数据电缆等。这些应用在各个领域各个角落的线缆,将整个人类社会连接起来,其重要性不言而喻。这些线缆若是出现损伤,又无法及时准确得检测出来,将会给社会与国民经济造成重大损失。以高压电缆为例。近年来电力系统中的高压多芯线缆因为退化、随机过载和腐蚀等原因造成的损伤,直接威胁电力系统的安全。在此背景下,对多芯线缆进行损伤检测具有重要意义。