论文部分内容阅读
通过对标签图像的特点分析,主要研究了手机拍摄的超市标签图像预处理以及其中字符识别的相关技术。在预处理部分,首先分析了实际采集到的超市标签图像的特点,提出了一套针对于标签图像的预处理流程,并对每一步骤中涉及的方法进行比较研究。在识别部分,在分析对比常用识别技术后,引入基于BP网络的字符分类识别技术用于识别标签文字,并对BP神经网络进行了详细的分析与设计。通过分析这两部分在研究过程中的重点和难点问题,将主要工作分为以下几部分:1.在标签图像的预处理部分,主要研究了三点内容:在去除不均匀光照影响方面,对比了空域增晰方法与频域增晰方法的处理效果,确定了用同态滤波处理受光照影响的图片的方法;在图像二值化方面,针对于带背景色的标签图像,在分析对比了整体阈值和局部阈值二值化中的常用方法后,提出了在大津法基础上进行灰度拉伸和灰度梯度优化;在图像去噪方面,在分析对比了典型的去噪方法后,针对于标签字符图像的特点,引入形态学滤波去噪处理标签图像并对结构元素的选取方法进行了优化设计。每一步骤都通过实验验证了以上优化后的方法的有效性,取得了一定的效果,为下面的字符特征提取打下了一定的基础。2.在标签图像字符识别部分,首先总结了常用的字符识别方法以及字符特征,引入了在归一化字符图像的基础上提取字符网格特征与投影特征相结合的组合特征向量作为神经网络输入端变量的方法。在BP神经网络设计方面,通过结合提取的特征向量,认真研究了用于字符识别的BP神经网络的结构设计、参数设计等重要问题。针对动量梯度下降算法易陷入局部极小值问题,引入了动量-自适应学习率的方法来尽量抑制此类问题的发生。最后通过实验验证了所设计的BP神经网络的有效性。