论文部分内容阅读
如今社会上仍存在许多老式水表需要人工抄读,但仅依靠人工抄读与检测水表读数的方式需要消耗大量的时间和精力。为解决这一问题,利用计算机视觉技术对水表读数进行自动识别可以有效得解决这一问题。然而在现实中水表大多位于阴暗潮湿等各种复杂的环境下,所以所采集到的水表图像会存在多种问题:一为水表表盘自身问题,如表盘污损严重;二为人工采集问题,如人工采集时会有相机曝光、拍摄角度多样、表盘方向多样等问题。因此如果使用传统的图像识别方法会出现水表读数识别的识别准确率不够高,且速度较低的问题。但随着机器硬件的发展,利用深度学习的方法对水表读数进行检测与识别成为一种有效的解决方案。论文旨在研究基于深度学习的目标检测算法对水表读数进行检测与识别,主要工作包括:1.自制了实际情况拍摄下的包含各种复杂情况的水表读数图像数据集。并整理了真实情况下采集的水表读数,可能存在的问题如:表盘污损、图片模糊未对焦、存在光斑、表盘方向多样等,可以用于检测与识别模型的训练,提高其鲁棒性;为了有利于检测识别工作,针对水表读数图像设计了一套标注规则。2.针对各种复杂环境下的人工任意角度拍摄的水表读数图片,本文提出了一种鲁棒性强的自动识别方法,该方法基于深度残差神经网络,利用了自制的水表读数图像数据集,采用反向梯度随机下降法对R-FCN模型进行权重优化,经网络训练的反复迭代,最终获得水表读数字符目标检测的R-FCN模型,然后利用此模型对水表图片中的水表读数框中的字符进行检测识别。3.根据模型检测出来的水表读数字符通过中心排序算法,以及特定的排序规则对字符结果进行排序,最终可以得到一个完整的水表读数结果。4.针对如今的抄表运行模式,有效的提出了一种可以与如今抄表系统相结合的水表读数图像识别系统,来辅助审核人员对已抄读的水表读数进行审核。经对比实验表明本文所用的R-FCN算法对于水表读数此类小目标检测问题相对于其他检测算法有更好的效果,并且利用本文的方法在实际应用中可以达到81.79%的识别准确率,和0.5293张/秒的识别速率。因此该方法经过实验验证表明其识别速率快、准确率高,可满足实际使用需求。