基于深度学习的吸烟实时检测技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:wjmwjm009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
吸烟有害健康,在公共场所吸烟,不仅污染空气,还有着造成火灾等灾害的隐患。对于一些严禁吸烟的场所,如机场、加油站、化工仓库等,需要采取监督和检测手段监视吸烟行为。通过人工监管或者烟雾传感器等手段检测,不仅耗费人力物力,检测效果也不甚理想。为解决吸烟检测问题,本文设计了基于机器视觉的吸烟检测算法,通过摄像头捕捉视频帧,使用基于深度学习的目标检测算法检测吸烟行为。本文创新工作如下:首先,针对实时性检测问题,本文提出了一种针对吸烟检测模型的轻量化特征提取网络优化方法。该方法对负责提取图像特征的卷积神经网络骨干网络进行结构优化,实现了一个轻型却不失特征提取能力的网络。不仅减少了模型参数量与计算量、加快模型推演速度,进而提高检测速度,还能将该结构用于计算资源受限的场景中。通过实验,本文的特征提取骨干网络起到了一定的加速作用。模型在自制数据集对比YOLOv3使用的darknet-53特征提取结构具有更快的检测速度FPS(Frame Per Second)和更高的检测准度m AP(mean Average Precision)。其次,针对小目标难以检测问题,本文提出了基于单阶段算法的小目标吸烟检测模型。具体做法是在特征提取网络添加注意力机制,包括空间位置、特征通道等方面的注意力机制。通常浅层特征图能够保留更多的细节信息,据此本文利用多尺度融合,使用较小的感受野发现那些较为细微的物体,通过特征向量拼接的方式,将小物体的特征语义纳入到最终的分类和定位过程中,从而增强小目标物体检测效果。对于模型的损失函数,本文优化使用了DIo U(Distance Intersection over Union)边框回归损失函数,使用了Drop Block正则化方法缓解模型过拟合问题,模型的激活函数选择了Mish激活函数。通过实验,本文的模型对比YOLOv3等经典目标检测算法在本文自制数据集和TT100K交通标志数据集以及PASCAL VOC数据集上拥有更高的m AP与FPS。最后,本文针对嵌入式环境提出了一个吸烟检测方法。该方法通过对常规吸烟检测网络模型进行剪枝,实现了一个相应的更加轻型的检测模型。本文在局域网络中将其部署在NVIDIA Jetson TX2板卡上执行吸烟检测。在模型的训练阶段,优化了锚框的聚类算法,在模型的推演阶段提出非极大值抑制算法优化版本,使用其来选取最接近真值的预测框。通过实际场景的实验,该模型较之于Tiny YOLO算法具有更高的m AP与FPS。
其他文献
合成孔径雷达(Synthetic Aperture Radar,SAR)图像舰船目标检测技术可以自动标注SAR图像中舰船所在位置,其在军事和民用领域都具有重要应用价值。SAR高分辨率成像技术的不断发展,丰富了目标特征信息,为深度学习技术在SAR图像检测领域的应用提供了数据基础。SAR图像具有场景大目标小的特点,并且图像中舰船目标尺寸跨度大,舰船形态多样,多种尺度的舰船目标给检测过程增加了一定难度。
学位
线性调频(Linear Frequency Modulated,LFM)信号,以其低截获率(Low Probability of Intercept,LPI)特性被广泛应用于各种雷达系统中,是一种应用极其广泛的辐射源信号。LFM信号的检测与参数估计算法已经相对成熟,不同的算法适用于不同的电磁场景,但它们大多只能估计LFM信号时频脊线的调制参数,而且存在估计精度与计算效率之间的矛盾。对于雷达系统中的
学位
由于浅海声传播特性复杂多变,因此浅海环境下水声目标定位技术一直是水声学领域的热点和难点。该技术的典型代表是匹配场处理,其在海洋环境参数已知条件下通过水声传播模型生成拷贝声场,与阵列接收数据进行匹配,实现目标定位。然而在实际应用中,海洋环境参数(声速剖面、海深、海底地质参数等)存在诸多不确定性,使得拷贝声场计算不准确,导致匹配场处理性能急剧恶化甚至失效。随着计算机图形处理单元运算性能的提高以及深度学
学位
随着人工智能和计算机视觉领域的快速发展,深度学习作为人工智能下的子学科在视觉分析任务中占据了重要位置。深度学习用包含大量神经元的神经网络来提取图像中有用的特征进行信息分析。利用深度学习的方法来进行图像分析已经形成了较为规范的分析框架,包括对网络模型的训练,学习输入到输出的关系映射,从而对未知的输入进行模式预测。该框架具有很强的通用性,通过较少的调整就能解决很多图像上类似的问题。医学是一个数据急剧增
学位
当前,随着数据以指数形式增长,大量的信息蕴含在其中,如何有效地利用其中的有用信息,从海量文本数据中自动的抽取出有用的信息,更为具体地,如何从文本中抽取出潜在的语义关系元组则成为了关键的问题。关系元组抽取任务就是为了专门研究和解决这一问题而提出的。根据预先定义的关系的种类数目的不同,关系元组抽取任务可以分为单关系元组抽取和多关系元组抽取。在单关系元组抽取任务中,本文以情感原因对的提取为例,针对现有模
学位
唇读,旨在通过说话者嘴唇及其周围区域的视觉信息,解码其所说文本内容,是计算机视觉领域的一个重要问题,在公共安防、健康医疗、军事情报等领域有着广泛的应用价值。近年来,深度学习技术的兴起、大规模唇读数据集的构建和计算机算力的提升极大推动了唇读研究进展,取得里程碑式的突破。本课题围绕唇部运动规律和深度网络结构特点,对基于深度学习的唇读方法进行探索研究,分别对当前主流唇读方法的特征提取前端网络和序列建模后
学位
电动舵传动系统是装备中用于高精度、高响应控制运行轨迹的关键设备系统。舰船电动舵传动系统的传动机构受盐碱环境腐蚀,其轴承等关键零部件出现的故障将对装备安全可靠服役产生重大影响。本文以电动舵传动系统为背景,重点研究低速往复运动的模拟实验台设计及滚动轴承智能故障诊断算法。文章首先提出了针对一维振动信号的多尺度卷积神经网络智能诊断模型,利用西储大学的轴承数据集验证了其优秀性能,并基于某型电动舵传动系统工作
学位
为了更加直观和清晰地观察患者体内正常和病变组织(即肿瘤),医师通常需要借助医学影像的辅助,为患者临床诊断和制定针对性的手术方案提供科学依据和必要准备。医生在进行手术之前,可以借助医学影像分割技术,从患者的影像学资料中,得到人体的器官与病变组织分割结果。分割技术能够增加医生对肿瘤病变情况的了解程度,同时帮助医生在完全切除肿瘤病变区域的前提下,尽量保护肿瘤周围的血管、神经等正常组织,并以此增加手术的成
学位
文学作品能够引发读者对于人性真、善、美的思考,因而具有独特的育人价值。本文聚焦英文小说类语篇,结合教学实例探讨如何挖掘小说类语篇的育人价值。在教学设计和实施中,教师可将育人与小说类语篇的文体特征及语言特点相结合,引导学生在探究语篇主题意义的过程中,辨析矛盾冲突,剖析人物心理和探析故事结局,学会认识和分析人性真、善、美及人与人之间关系的一些基本问题,从而促进思维的发展,达到育人目的。
期刊
当前,计算机相关技术在医学领域扮演了越来越重要的角色。而医学图像作为医学诊断中重要的组成部分,对于病患的病情判定,疾病的严重程度评估,以及康复预测等方面,都具有极其重要的意义。医学图像分割可以快速且准确的将医学图像中的病患区域和背景区域分割开,对于临床治疗和医学研究都有很好的辅助作用。深度学习的兴起大大提高了医疗图像分割的准确度,同时可以提取出医生很难定性定量的病理特征,甚至探究尚未发现的医学原理
学位