论文部分内容阅读
基于光学摄像头图像处理处理以及模式识别理论的光学字符识别(OCR)在社会生活的各个行业得到了广泛的应用。光学字符识别在文字的录入方面具有速度快、效率高、错误少、成本低等优势。在光学字符识别的基础上发展起来的证件识别作为一种新兴的技术也在社会生活的各个方面得到了应用。课题在仔细调研国内外研究现状的基础上分析了基于光学图像的身份证信息识别软件所涉及的主要研究内容;基于MATLAB平台设计了身份证信息识别软件。图像预处理是基于光学图像的身份证识别软件图像处理的第一步。针对身份证的光学图像,课题采用了平均颜色偏移率校正了图像的高光区域。依据T.Youg提出的理论,利用加权平均值法对身份证图像灰度化。将全局二值与局部二值化方法结合的Ostu-Berensen方法对灰度化后的身份证图像二值化。最后利用图像的行方向投影和列方法投影的方法对二值化后的身份证图像进行版面分析,得到用于字符识别的单个字符块的图像。针对经过图像预处理后的图像大小存在位置、大小差别的问题,分析了重心归一化和边框归一化的位置归一化方法以及利用字符图像的分布方差归一化方法。利用统计信息和结构信息相结合的全局弹性网格内的模糊笔画特征构成了用于汉字字符识别的7╳7╳4的特征向量。经过图像预处理得到的单个字符图像经过归一化处理、字符特征提取后的字符特征向量需要送入到汉字分类器中才能完成身份证信息的提取工作。图像分类器主要包括欧氏距离分类器、神经网络分类器、支持向量机分类器以及遗传算法分类器几类。详细分析了图像预处理、字符特征提取方法以及字符分类器设计的方法后,在MATLAB平台上设计了基于光学图像的身份识别软件。详细论述了身份证识别系统的关键函数原型以及函数的简单流程。函数包括图像预处理、图像二值化、图像字符块划分、字符特征提取以及字符识别的详细分析设计。最后展示了本课题设计的识别软件对身份证图像的识别结果,表明了该系统在身份证信息中的性别、民族、生日、身份证号码具有较高的识别概率,而在姓名和住址两个方面的识别能力还有待提高。通过本课题对基于光学图像的身份证信息识别软件关键技术研究,设计出了基于MATLAB平台的身份证信息识别系统软件。该软件实现了对身份证的性别、民族、生日、身份证号码的较高识别概率,而对姓名和住址的识别概率尚且比较低。基于光学图像的身份证信息识别软件要得到广泛的推广应用还有一个成本控制的要求和软件运行时间的要求。关于低分辨率下的身份证信息识别方法还需要进一步展开研究。身份证信息识别软件的算法还需要进一步优化,达到快速有效提取身份证信息的目的。