论文部分内容阅读
冠字号识别技术是清分机的必备技术,现在很多自动取款机也带有此功能,但是现在识别的技术都要求纸币比较新,不能污渍,否则误识或退币。产生此问题的主要原因是机器内置识别算法不能对这些污染进行处理。本文的研究内容即是尝试对这些问题提出一些解决办法。通过对上海某公司清分机的冠字号误识样本分析,影响其识别的问题有以下几种:大块的污渍斑块,冠字号区域的直线干扰,字符的低分辨率,识别算法方面,本文分章节对上述问题的产生及解决进行具体的论述。首先,对于斑块或散粒污染,通常使用的平滑图片的方式发现效果不佳,原因是有些大块的污染不能被平滑掉。对于这个问题,本文使用基于连通域面积比较删除法的方式,并通过与中值滤波的效果对比,显示其在此类问题上的良好特性。其次,样本含有特有的直线噪声,成为影响字符识别的重要原因。对直线的处理,相比传统的二值图算法,本文使用的基于灰度图域的直线算法,有着明显的优势,做到了去除直线的同时基本完全留了字符信息。字符分辨率较低是因为机器使用的图像传感器分辨率低的原因,在低分辨率下对字符的识别也是本文的一个难点。对于这个问题,本文从字符归一化和改进识别算法两个方面解决。由于分辨率较低,每个像素相对含有的信息量就较多,字符的细节就尤为重要。本文使用基于笔画的双边缘检测算法,统一了字符的最大笔画宽度,且二值化后能更多得保留字符细节信息。相应的,此算法的引入,使总体识别率有了7%的提升。识别算法使用基于BP神经网络的多层判别树架构,显著提高了字符的识别率。综合以上算法,本算法对1000张机器运行中实际采样图片的识别率达到98.3%,相比机器原93%的识别率,有较大提高。最后,为了验证算法的时效性,本文将算法移植到DSK6416平台,模拟清分机的运行过程,进行硬件仿真运行,验证算法的运行效率,实际结果,算法单张平均识别时间13.6ms,达到预期20ms/张的识别速度。