小规模数据集下的建筑垃圾检测方法研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:keremslr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,城镇化进程加快,建筑垃圾数量呈指数级增长,优化建筑垃圾处置工艺实现垃圾智能回收,提高资源回收率迫在眉睫。基于浅层特征与分类器的传统视觉检测方法在复杂的建筑垃圾应用场景中稳健性不足。深度卷积神经网络作为一种基于数据驱动的学习模型,具有更强的特征提取能力与表征能力,在建筑垃圾分拣中有重要应用价值。但它对数据丰富的依赖性与建筑垃圾样本数据构建困难的矛盾制约了其适用性。本课题旨在研究小规模数据集下的建筑垃圾检测方法,在传送带环境下实现建筑垃圾的自动识别与检测,具体工作如下:(1)构建了包含7个类别的小规模建筑垃圾数据集,研究了小规模数据集下易产生过拟合现象的机理。结合建筑垃圾存在分布密集、有遮挡的特点,对比了5种数据增强方法,选取了随机旋转、水平镜像以及Cutout三种方法,扩展了建筑垃圾数据集的样本分布空间。(2)搭建了基于自注意力机制和加权特征融合的建筑垃圾检测网络CoTR。以融入自注意力机制的Co TNet作为Backbone,Bi FPN加权特征融合金字塔作为neck,采用Retina Net分类和回归检测头。利用Co TNet建立了Query和Key之间的依赖关系,提高了模型对上下文信息的理解。引入Bi FPN进行特征融合学习权重强化语义信息,以及深度可分离卷积计算,减小了网络参数量,提升了模型的推理速度。在PASCAL VOC2007 test达到83.4%m AP和26FPS,自制建筑垃圾数据集上达到92.5%m AP和25FPS。(3)研究了目标检测模型推理阶段的后处理方法——非极大值抑制(NMS),并对其进行了改进。传统的NMS存在筛选阈值固定,难以适应变化的建筑垃圾分布场景的问题。因此本文提出了自适应的D-NMS算法,通过设计的密度预测模块对建筑垃圾分布密度进行预测,使NMS筛选阈值自适应变化,有效的提升了检测器在目标遮挡场景的鲁棒性,将检测精度从92.5%提高到93.9%。
其他文献
图像语义分割是一项关键视觉技术,其目的是为图像中所有像素分配对应的语义标签。经过多年发展,图像语义分割已取得了不少成果,但由于分割任务的复杂性、以及深度学习的局限性等原因,仍有许多问题待解决。例如,无法很好保存边缘细节特征;在提取语义上下文和充分利用特征信息方面效果不佳,导致特征表达能力不足;网络参数量过大。因此,针对以上问题,本文对基于卷积神经网络的图像语义分割进行深入研究,并从解决皮肤镜图像病
学位
核事故发生时,由于核环境内部辐射剂量过大,人类无法进入现场进行后续操作,核应急作业机器人作为少数能进入核事故现场的机器,在解决事故时起到重要作用。部分核应急作业机器人上带有图像采集模块,采集到的图像数据是机器人对内部环境感知的重要依据。然而,核环境中的高能粒子会同图像采集模块中的半导体材料发生辐射效应,导致采集到的图像中含有大量核噪声亮斑。本论文针对灰度核噪声和彩色核噪声分别提出了对应的降噪算法,
学位
作为非语音音频分类任务中最重要的研究领域之一,声音事件识别被广泛应用于音频监控、音频场景分析、生物声学监测、医疗诊断等领域。声音是信息传播的主要途径,通过分析声音中携带的信息指导人类的生活和生产,提高生活生产效率。传统的特征提取器在设计的时候需要研究者具有大量的先验知识以及进行复杂的计算;传统的人工设计的网络模型对声音进行建模,其精度难以达到令人满意的结果。本文将使用深度学习的方法解决声音事件识别
学位
现代社会中,人们对安全隐私更为看重,对独居老人的看护系统也愈加智能化与人性化,深度学习算法的融入也使得其市场应用前景更为广阔。看护系统中人体异常行为识别算法也同时成为了大量国内外学者的热门研究内容。为了提升老人看护系统的精确性且同时能够保障用户的隐私安全,本文提出了一种基于红外光场景的家庭看护的异常行为智能识别方案,此方案由人体目标提取处理、训练行为识别网络以及异常行为判别等环节组成。在人体目标提
学位
由于生物特征识别技术在保持便携性的同时,比传统的个人身份验证方式有更高的安全性,所以得到了广泛的关注。其中,依靠手指静脉图像进行身份识别的技术因在现有的生物特征识别技术中拥有更高的安全性而快速发展起来。人工设计算子表达手指静脉图像中纹理信息的方法由于处理步骤繁琐并且鲁棒性和泛化性较弱,逐渐被特征提取能力更强的卷积神经网络方法替代,但是与此同时,这也提高了对运行设备算力的要求。因此,需要研究卷积神经
学位
人体异常行为监测对公共区域安全及城市安防建设意义重大。传统监控方式主要通过人工复检,易出现误检、漏检等问题。同时固定监控摄像头监测范围有限,灵活性不足。针对上述问题,面向航拍场景结合对环境变化鲁棒性较好的人体姿态信息,本文研究了基于图卷积的航拍人体异常行为识别。(1)针对嵌入式平台存储与运算性能有限的问题,设计了一种轻量化人体姿态估计网络。基于高分辨率表征学习网络(High-Resolution
学位
推进剂是火箭发射的重要组成部分,研究推进剂燃烧过程中的气体成分、温度和充分燃烧条件具有重要的指导意义,也是推进剂高效有序燃烧的基础。在燃烧场诊断技术中,温度是研究燃烧机理的重要参数之一。定性或定量研究推进剂燃烧过程中的二维温度场分布,对深入了解火焰燃烧形态、火焰燃烧成分检测和燃面制备等具有重要意义。本文将利用双色平面激光诱导荧光测温技术测量酒精灯和推进剂的燃烧火焰二维温度。设计双色平面激光诱导荧光
学位
随着全球气候变暖和环境污染日益严重,节能减排已成为全世界关注的问题。锂电池因其具有良好的电化学性能,已大规模应用于光伏储能电站、新能源汽车等场景。在不同的应用场景下,所使用的荷电状态(SOC,State of Charge)区间及充放电倍率不一致,而使用合适的区间及充放电倍率可有效减缓锂电池的老化,因此明确锂电池工作的SOC区间及充放电倍率对其老化的影响程度是目前需解决的关键问题之一。本文针对不同
学位
随着科技的发展,数字图像已成为人们获取信息的重要载体,然而由于采集设备的固有缺陷或传输设备的影响,所获取的图像通常会受到噪声的污染,可能导致后续对图像的理解产生偏差。为从图像中获取准确的信息,对图像进行去噪处理的研究应运而生。在各类图像去噪问题中,医学超声图像中存在的斑点噪声影响了图像的质量,不利于医生对图像关键信息的准确掌握。因此,抑制医学超声图像中的斑点噪声是一项重要的研究内容。在现有的众多超
学位
随着科技和社会的发展,机器人逐渐走进柔性制造、医疗康复、仓储零售、农业采摘、家庭服务等应用领域。智能抓取是机器人实现智能化的关键技术之一,也是保障机器人适应复杂作业场景必须要解决的关键问题。但在复杂非结构化环境中,存在物体种类多样、位姿随机、物体间遮挡堆叠的情况,严重影响了机器人目标识别与抓取能力。本课题围绕多物体堆叠场景下目标检测识别和物体抓取位姿估计等技术进行了研究,实现了一种堆叠场景下机器人
学位