论文部分内容阅读
本文以英文名片图像分割和识别为课题,主要研究了英文名片图像的分割和识别处理中相关算法和实现意义。本文首先介绍名片图像分割和识别的总体框架,包括图像的预处理、图像版面的分析、图像的字符分割和字符的分类识别。然后再对组成框架的各个功能模块和过程进行介绍和说明,并且对涉及到的相关算法进行阐述和比较,其中重点介绍图像字符分割和字符识别。在分割阶段,本文针对名片识别信息字符的特点,首先利用连通元分析的方法进行分割,然后对名片粘连字符块进行分割。在粘连字符分割上,本文提出一种水容器(water reservoir)的方法,该方法是结合字符识别进行的。水容器拓扑结构和属性可以表示字符与字符间隔之间的重要信息,从而为字符的分割提供重要的依据。通过实验表明该方法能够提供比较精确的粘连字符的分割。在识别阶段,本文结合模式匹配算法和BP神经网络的方法,一方面,首先进行基于改进Hausdorff距离的模式匹配算法,该算法是在加权Hausdorff距离方法上的一种改进:然后进行BP神经网络的分类方法,其中对字符的特征进行了多维特征向量的提取,其中包括结构特征和统计特征。结构特征与统计特征在识别分类中各有优缺点,所以本文结合两者的优点进行特征向量的提取。实验表明,证明上述方法在一定程度上提高了字符识别率。