基于卷积神经网络的人耳检测方法研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:www136768
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过去的几十年见证了生物特征识别领域的蓬勃发展。生物特征一般包括虹膜、指纹、脸部、DNA等可测量的、独特的和永久的生物特性。人耳在生物特征领域是一个比较新的特征,人耳的结构不仅是独特的,而且是永久的,并且人耳的外观在人类生活中不会轻易改变。想通过图像来获得某一可靠的生物特征进而进行身份的识别,目标检测是一种必不可少的手段。由于人耳具有以上这些非常良好的特性,自动人耳检测最近在生物特征社区引起了极大的关注。人耳对于身份识别来说是一种非常有效的特征,当监控视频中的人的面部受到遮挡时,人耳可以做为一种补充特征辅助识别。自2012年,卷积神经网络模型在Image Net 2012竞赛中获得冠军后,最近几年卷积神经网络在物体检测方面又陆续取得了非常好的成果。本文尝试使用卷积神经网络来进行人耳检测,提出了融合卷积神经网络与直接回归进行人耳检测的方法。本文主要进行了以下三个方面的研究:(1)在人耳分类器方面,本文利用迁移学习的思想,使用已有的人耳图像微调我们设计好的分类网络来获得人耳分类器。人耳分类器主要用于为后续人耳检测器提取人耳特征。同时,本文对比分析了不同深度的网络模型在分类测试集上的准确度(Accuracy),实验表明,深度的增加可以带来准确度的提升。同时将本文设计的人耳分类器与目前比较流行的卷积神经网络及传统方法进行了对比,在人耳分类任务上,本文的网络模型优于基它方法。(2)在人耳检测器方面,本文提出Conv Tran层用于人耳检测。将上面训练好的人耳分类器网络最后特有的Softmax层换成Conv Tran层来进行人耳检测。人耳检测器与人耳分类器使用相同的主网络,共享网络权重,本文利用这种方法来加速网络训练。Conv Tran主要利用边界框回归和由k-means生成锚的思想来实现人耳检测的任务。同时为了提高人耳检测的精度,本文还采用了非极大值抑制(NMS)的方法。将本文提出的人耳检测方法与传统的基于特征的人耳检测的方法和基于卷积神经网络的人耳检测方法进行对比,实验结果表明本文的方法在人耳检测中具有良好的性能,Average Precision(AP)高于其他方法。(3)在人耳位置对齐方面,当将人耳检测器用在图像序列上时,发现检测框的抖动有些严重,为此本文提出Location-Alignment模型用于对框的位置进行进一步的精修。主要思想是将检测到的人耳框在原图上扩充一部分送到卷积神经网络中进而得到更加准确的人耳框。在预测的时候,模型还使用了原始图片的信息使得预测结果的准确性进一步提升。本文对原始检测框与经过location-alignment进一步精修过的框进行了对比,后者检测框的平均IOU高于前者,在图像序列上表现更加稳定。
其他文献
据统计,我国每年食物中毒的人数约为20万至40万人次,其中超过70%的食物中毒事件来自食品经营单位。由此看出,食品经营单位的食品安全情况不容忽视,而如何预防或减少食物中毒事件的发生,如何加强对食品经营单位的监管,且在发生食物中毒事件后如何做好应急处置工作,是政府监督部门亟待解决的重要课题。本研究从食品经营单位食物中毒应急处置角度出发,对目前食物中毒应急处置的地区现状、法律法规依据、原因分析、事后处
在我国的教育发展迅速的今天,民族地区的教育水平依然处于较为落后的状态。民族地区的教育水平之所以落后,不仅因为民族地区大多处在边疆偏远地区各种硬件设施不够发达,最重
异步电机具备结构简单、造价低廉、工作可靠等诸多优点,因此在现代社会的各个领域中都有着广泛的运用。但异步电机的起动性能并不是十分理想,直接起动时会产生很大的冲击电流,对电机本身及所带负载造成严重损害。为了抑制异步电机起动时的冲击电流,改善异步电机起动性能,本文采用模糊PID控制算法,以STM32单片机为核心处理器对异步电机软起动器进行设计。本文首先介绍了异步电机软起动器的背景以及国内外研究现状,然后
多年来,泰国新毕业生青年失业问题的信息被广泛接受为需要解决的严重问题。根据国家统计发现,青年失业率最高的是本科生或新毕业生。尽管如此,在2016年,青年失业率开始下降,
由于科学技术的快速发展,人们获取的信息量也随之爆炸式增长。而图像是人类获取信息的重要途径。为了有效的利用图像中的信息,需要用到图像分割技术提取图像中关键信息。图像
从移动在线支付到网络直播,无处不在的移动互联网极大地方便了人们的生活。由于用户数量与需求的日益膨胀,如何使得传输层协议更好的适用于无线链路成为研究者关注的问题。目
由于嵌入各式各样传感器的智能手机、平板电脑等移动终端设备爆炸式普及,人们已经变成了一个个“传感器”,人与移动设备构成了“移动传感网络”,其中移动设备作为基本感知单
无线传感器网络(Wireless Sensor Network,WSN)是由大量微型廉价的传感器节点构成的分布式网络。网络中的传感器节点可对监测区域内的目标进行监测,并利用无线通信技术,以单
本文主要研究解决神经元形态自动重建中分支点检测的问题。神经元形态自动重建是研究神经系统工作原理甚至探究大脑奥秘的重要手段。现有的一类最常用有效的重建算法,局部追
教育数据挖掘(Educational Data Mining,EDM)是数据挖掘、机器学习、统计测量和教育心理学的交叉研究领域。EDM旨在挖掘从教育场景中自动获取的学生学习行为或者与之相关的大