【摘 要】
:
目标检测算法被广泛应用于交通管控,视频监控,无人驾驶以及医疗图像识别等任务,以上各种实际的应用场景中,由于场景复杂度高,目标在复杂背景下检测精度被干扰,小目标检测的速度较慢,同时特征提取与融合部分中对小目标的关注度不足,有效的小目标信息很难最终被检测器接收,因此小目标的检测更成为检测难题,其平均精度始终不超过25%。该文针对复杂场景中小目标检测精度不高,检测系统实时性较差等问题展开研究,主要研究工
论文部分内容阅读
目标检测算法被广泛应用于交通管控,视频监控,无人驾驶以及医疗图像识别等任务,以上各种实际的应用场景中,由于场景复杂度高,目标在复杂背景下检测精度被干扰,小目标检测的速度较慢,同时特征提取与融合部分中对小目标的关注度不足,有效的小目标信息很难最终被检测器接收,因此小目标的检测更成为检测难题,其平均精度始终不超过25%。该文针对复杂场景中小目标检测精度不高,检测系统实时性较差等问题展开研究,主要研究工作和研究成果如下:1)提出一种基于特征金字塔的多尺度可切换空洞卷积SPC,将该模块与YOLOv4基线网络的Neck部分结合,在特征金字塔中构建出3-D卷积,使用不同步幅变化的共享卷积核对不同金字塔层级中相同目标进行检测,该模块对卷积层进行了优化,通过不同大小的卷积核对同一图像进行特征提取,再使用Switch函数对提取结果进行选择并整合,有效扩大了卷积核的视场,在多尺度上实现了对目标特征的重复观察。有效解决了小目标检测在复杂场景下特征提取困难、检测精度低的问题。随后应用改进后的focal loss损失函数进一步解决网络模型中样本分类数以及样本分布不均衡的问题。本文提出的方法在MS COCO数据集上表现良好,在Yolov4的基础上提升了5.4%的平均精度,达到了48.9%,在608×608的图像中FPS达到了29.6。2)在完成目标检测任务后,进一步改进系统使其进行更细微化的图像实例分割任务,基于U-net网络框架对YOLOv4网络进行改进,在head部分增加掩码分支以进行实例分割任务,设计出多尺度注意力模块并与YOLOv4 neck部分相结合,用以提高网络对小目标的实例分割分割精度。设计出一种用于实例分割的复合损失函数,达到同时解决样本不平衡以及网络过拟合的问题。该文提出的多尺度注意力-YOLOv4网络在MS COCO数据集上以24.6 FPS的获得了39.7%的平均分割精度,并且对小目标的检测结果达到了22.5%,相对于基线网络提升了2.0%。
其他文献
空间激光通信是以激光为载波,携带信息进行无线传输的通信方式,由于其传输速率高、免电磁干扰、传输距离远等优点逐渐成为通信领域研究的热点。但是,由于大气湍流的影响,携带调制信息的激光束在传输过程中会受到各种效应影响,导致传统的解调方案难度增加,系统整体性能下降。盲优化技术可以不借助额外训练序列,仅通过接收端信号的先验信息来优化信道特性,使得输出序列尽可能逼近发送序列,应用在激光通信领域具有一定优势。因
我国是世界上自然灾害种类最多的国家,自然灾害的发生往往对社会以及人民生活造成不可逆转的损失与危害,是人类历史上面临的最严峻的挑战之一。野外自然灾害长期无人值守系统大多采用锂电池等传统电源供能,由于其存在定期充电问题,不能满足监测系统长期工作的需求。摩擦纳米发电机的问世彻底打开了微能源领域的大门,为实现自供电无线监测系统提供了可能,如何高效采集环境能并满足监测节点长期无人值守供能需求成为了一个挑战。
近年来,我国高度重视人工智能技术的发展,加快人工智能行业布局规划,各地积极部署、实施和完善人工智能政策,推动保障相关行业的高速发展。目前,计算机视觉技术(Computer Vision,CV)已较为成熟,在算法、算力和数据量上均有较大的进展和突破。然而,高维(High Dimensional,HD)数据的特征提取仍然是目前人工智能机器学习算法中的难点问题和重点关注焦点之一。本文针对高维图像数据,研
随着计算机图形学的不断发展,布料动画在游戏、动画电影、虚拟试穿等方面有着广泛的应用,因此逐渐成为了虚拟现实领域的研究热点之一。布料是一种柔性物体,极易发生形变,并产生丰富的褶皱现象,为了得到逼真的仿真效果,通常需要用高精度网格对布料进行建模,然而高精度网格包含上千个顶点和面片,在仿真中计算量大、耗时长,因此,如何平衡布料动画中的逼真度与效率,始终是该领域的研究热点和难点之一。近年来的研究使用多精度
水下图像是人类探索海洋世界的重要信息来源,在海洋工程领域有着广泛的应用。由于水下环境的复杂性,水下图像受到水体和水中悬浮物对光线吸收和散射作用的影响,导致水下图像通常呈现出对比度低、色偏严重、模糊失真等问题,妨碍了水下图像识别和处理等工作的开展。因此,探究如何提高水下图像的成像质量具有重要的研究意义,本文在分析了水下图像的降质原因后,以水下光学成像模型为基础,对透射率这一影响水下图像复原的主要因素
随着全球能源危机和环境污染等问题的加剧,锂离子电池作为清洁能源,以其重量较轻、高化学反应性、高能量密度和寿命长等优点迅速普及,在消费电子产品(手机和平板电脑等)、可再生能源(风能和太阳能)以及航天航空等领域中都发挥了重要作用。但是,随着充放电次数的增加,锂离子电池也不可避免地会退化或损坏,如果在电池失效前不采取有效措施,锂离子电池设备将无法健康运行,严重时可能造成人员伤亡。锂离子电池剩余使用寿命(
近年来,伴随着科技经济的高速发展,足式机器人展现出可预期的民用、商用和军事用途。足式机器人不同于轮式机器人和履带式机器人受限于运动环境,而是能够适应于如坡地、楼梯、丛林等多种不平整地形。而足式单腿作为足式机器人的运动单元,是足式机器人的基础,为了保证足式机器人在复杂路况的平衡性运动,其单腿机构必须具有高爆发性、稳定性和灵活性,而单腿运动特性测试能够模拟出足式机器人在不同地形运动时的真实工况,因此高
军事信息化建设一直是各国的研究热点,但我国的武器存在着种类繁多、信息散落等问题,这不利于国防工作提取有效信息,大大妨碍了我军信息化建设的步伐。同时,我军武器常以文字、二维图片和实体武器等传统方式进行展示,交互性差且无法满足更多军迷了解武器性能、近距离观赏或把玩武器的迫切需求。本文将改进后的Yolo v4算法应用到武器识别中,将武器图片中的武器快速识别出来,提取武器的相关信息,并将其放入三维的武器展
新冠疫情期间,各类智能移动机器人在药物物资配送、疫情区域消毒、公共区域安全巡逻和出入安检测温等无接触服务方面发挥了重要作用。智能移动机器人相关技术当中,同时定位与构建地图(Simultaneous Localization and Mapping,SLAM)是自主性的核心,也是机器人实现自主移动的基础。近些年,深度学习作为备受追捧的技术,能够增强计算机对数据的有效利用能力,那么将深度学习结合到SL
表面肌电信号(Surface electromyography signals,s EMG)是最有价值的生物电信号之一。通常用于测量肌肉的活动状态,能够为许多康复医学和智能假肢的研究提供有用的信息。但肌电信号是很微弱的一种电信号,使得手势识别效果差强人意。当它与其他类型的信号结合使用时,可以弥补这些缺点。加速度信号能够精确反映运动的方向、速度和位移,陀螺仪是一种可以检测出物体运动时角速度的传感器,