论文部分内容阅读
物体识别需要融合定位与分类双重任务,实现过程及优化问题相对复杂困难,同时果蔬图像具有种类多样、形态各异、检测环境复杂等特点,果蔬识别的效果仍存在多方面的提升空间。本文将深度密集卷积神经网络引入SSD网络结构,借助密集网络对有效特征优秀的挖掘能力及SSD网络的多尺度检测结构,较好地实现了对复杂背景图像内多果蔬的识别。本文所做的工作如下:(1)设计密集加权连接模块。对密集卷积神经网络中的密集模块进行改进,将传统的完全径直连接模式改为由临近向外层,以权重递减的模式逐层连接,由此既可以保证有效的层间联系,又能在一定程度上减轻冗余特征的堆积。(2)构建双型模块级联网络。在由多个加权密集模块构建的密集卷积神经网络中引入残差模块,通过密集模块的多次开发组合,尽可能多地挖掘到关键有效的特征,再由残差模块容纳消化、排除冗余特征的干扰,从而实现一个较为稳定的促提取与消冗余的平衡状态。(3)改进SSD网络结构。将传统SSD结构的特征提取网络改换成双型模块级联网络,并重新调整了多尺度检测的特征图谱输出节点及尺寸。该操作既使总体结构的层数增加,又能增强前后层间联系,进而在一定程度上提高了识别网络对目标的检测精确性。本文在深度学习Keras库上实现网络构建,并与其他经典网络在制作的数据集上进行训练及测试,通过效果对比可以发现本文设计的网络对识别准确率及检测速度的权衡效果更加突出,每秒可实现28帧图像的识别,平均精确度均值达78.45%,比SSD-300提高4.09%,系统的鲁棒性增强,对相似目标的出现更为敏感。与此同时,对提出的创新点采用控制变量的方式进行有效性验证,更加显著地证明本文对基础网络的改进具有较好的提升效果。