论文部分内容阅读
如今传统饮料售卖渠道趋于饱和,推广成本高昂,饮料自动售卖机作为新兴渠道,凭借着其低廉的渠道成本与饮料的品牌效应,已成为最受饮料厂商与经销商欢迎的新零售模式之一。饮料自动售货机的功能核心是饮料识别系统,通过实时检测售货机内的饮料种类与库存,从而为货品的发送和仓储物流管理提供必要的信息。随着深度学习和计算机视觉技术的发展,基于嵌入式终端的饮料识别系统也逐渐投入了应用,系统通过对摄像头采集的图像进行智能分析感知售货机内的饮料种类与库存,具有体积小、准确率高、速度快与成本低的特点,拥有非常大的市场潜力。受限于嵌入式终端的硬件性能,如何选用合适的检测识别模型,在满足系统精度和实时性要求的同时对模型进行压缩优化,是深度学习技术在嵌入式饮料识别系统上应用的难点。针对这些问题,论文主要做了以下工作:(1)在对典型目标检测模型的性能全面比较的基础上,选取了YOLO v2-Tiny神经网络作为饮料识别系统的核心网络。利用架设在售货机顶部的USB摄像头在不同光照强度和角度下采集了8000余张常见41种饮料图像,并将其制作成VOC格式的饮料识别数据集,在该数据集上对检测模型进行了训练。考虑到实际工程应用时的模型迭代效率问题,论文研究了利用迁移学习加速模型训练的方法。为了进一步提高识别精度,论文还探索了先检测大类然后再识别细分类的两步法方案。最后,在对训练得到的YOLO v2-Tiny检测模型使用Darkflow进行权重转化后,应用Tensorflow的量化工具对其进行压缩优化,可以将模型体积压缩75%,从而满足其在资源有限的嵌入式端运行的要求。(2)在RK3399嵌入式平台上设计并实现了嵌入式饮料识别系统,应用Tensorflow框架实现在嵌入式端的跨平台部署,实现了图片检测、阈值调整、日记记录等功能。考虑到实际应用的要求,对算法和模型进行了封装和加密,保证了系统的安全性,同时也可为快速投入市场提供方便。所开发的嵌入式饮料识别系统在RK3399嵌入式平台上,检测速度可达0.53s/帧,识别准确率可达97%,可以满足实际应用的需求。