【摘 要】
:
近年来,视频监控在社会生活中的重要性日益凸显,而如何有效处理不同真实场景下的数据给研究人员来带来了挑战。伴随着深度学习给计算机视觉领域带来的重大改变,基于神经网络
论文部分内容阅读
近年来,视频监控在社会生活中的重要性日益凸显,而如何有效处理不同真实场景下的数据给研究人员来带来了挑战。伴随着深度学习给计算机视觉领域带来的重大改变,基于神经网络的图像和视频处理算法成为了研究的热点。本课题旨在对真实监控场景下的人脸检测及人脸识别算法进行研究。对现实环境中光照变化、成像模糊和无约束行人运动等问题进行了分析,以深度学习为基础,对算法进行了探讨和改进,使得其能够在特定环境下快速准确地完成面部检测及识别。本文的主要贡献包括:针对网络训练中特定场景数据不足的问题,提出一种基于Cycle GAN的改进人脸图片生成方法。使用基于浅层卷积神经网络设计的判别器和基于Res-Unet设计的生成器,引入L1像素损失、身份损失和结构相似性损失(Structural Similarity Index),并添加梯度惩罚项,有效提升了模型在人脸图片风格迁移和形状改变任务中的表现;针对检测模型小型化和本地适配的需求,提出一种基于MTCNN的改进人脸检测算法。使用分组卷积和可分离卷积减少网络参数数量,使用对数双曲余弦损失作为人脸边界框损失函数,结合运动物体检测算法减少检测时间,使用网络数据集和本地数据集对检测网络进行训练,提升了其对自然人像的检测能力和在真实监控环境下的准确性;针对识别网络体积和识别速度的需求,提出一种基于注意力模型和VGG网络的人脸识别算法。使用注意力模型替换VGG中的高层网络,结合像素域信息和通道域信息生成注意力掩膜,使用一维瓶颈结构(Bottleneck)取代部分全卷积层并提取不同维度的语义信息,使用融合三元组损失(Triplet loss)和大间隔余弦损失(Large Margin Cosine Loss)的损失函数训练特征提取层,加快了提取模型的收敛速度,有效降低了类内间距,加大了类间间距,在本地监控数据集的识别率达到99.61%,在LFW和YTF数据集上的验证准确率分别为99.06%和95.12%。
其他文献
对癌症进行早期诊断,并及时治疗对于癌症患者来说非常重要。以乳腺癌为例,现行的诊断方式,如乳腺钼靶X射线摄影检查、超声检测、X射线计算机断层扫描等技术,虽具有一定的成效
近几年随着计算机和智能手机的发展,当今社会已经逐渐步入人工智能时代。语音是人类最便捷的交流方式,这使得人机语音交互成为研究热点,许多科学家开始关注人机语音交互,实现
随着社会的发展和城市化进程的加快,伴随而来的环境污染、生态破坏等问题也日益严重,其中,雨水问题以及其所引发的城市内涝、水质污染等一系列问题严重影响人们的生产生活。
人体姿态估计是当前计算机视觉中重要的组成部分,是动作识别的关键步骤。随着深度学习的迅速流行,使得实现快速且准确的人体姿态估计任务成为可能。研究如何使得人体姿态估计
随着遥感卫星平台的多样化以及图像空、时、谱分辨率的提升,空间遥感探测技术的不断突破。基于遥感图像的大视场目标检测技术在军事、民用领域有着迫切的应用需求,尤其在当前
虚拟试衣是近几年逐渐兴起的重要课题,其最终目标是使用户能够方便查看自己试穿特定衣服的效果,在网上购物等领域都有很重要的应用。虚拟试衣分为基于图形的虚拟试衣和基于图
互联网的发展和电视终端技术的进步,推动了智能电视终端产业的浪潮,改变了人们传统的生活方式。智能电视终端界面设计逐渐偏向年轻化和技术化,功能与使用方式也越来越复杂,忽
地质构造是影响矿井水害的重要因素,多数矿井突水都与地质构造相关。本次研究通过探讨研究区经历的构造运动与构造发育规律,研究构造对矿井充水的控制作用,并通过分析各含水层间的水力联系,预测和评价各煤层受顶底板水害威胁的程度。主要取得以下成果:(1)太行矿地层奥陶系、石炭系—三叠系均有出露。矿区总体构造形态为倾向NE的单斜,走向NW,倾角1020°,一般在16°左右,断裂构造比较发育,构造复杂程度为中等类
文字在人类的历史发展中处于极其重要的位置,作为文明沟通的桥梁,文字的出现对人类的工作以及生活都带来了巨大的影响。近几年随着视觉技术的发展,文字也受到越来越多研究者的关注,场景文字检测与识别,文字的风格化迁移,文字擦除等研究方向也在不断的发展,但是目前的研究方向中却鲜见文字编辑类型的工作。文字编辑在目前的工作生活中有着非常大的应用,不论是信息隐藏,海报广告复用,或者是视觉场景翻译如AR翻译等等,都需
随着科技强军政策的颁布和国家海洋战略的深化,我国海军对舰船抗打击能力的要求与日俱增。舰载设备的抗冲击能力是体现舰船生命力的重要指标,推进轴系作为舰船动力执行机构,