论文部分内容阅读
脱机手写体汉字识别因其重要的理论意义和实用价值已成为模式识别领域中的热门课题。汉字识别属于超大规模的分类识别问题,而脱机手写体汉字由于书写的随意性和不规范造成的汉字形变与连笔以及缺乏书写过程信息等问题,成为汉字识别领域的研究难题之一。本文将过程神经网络的理论和方法与人类认知汉字的过程结合起来,研究了基于过程神经网络的脱机手写体汉字特征提取与识别方法,对机器“认知”脱机手写体汉字进行了新的探索。论文的主要研究工作如下:1.分析并提出了一种具有容错性的汉字特征表征方法。通过模拟人类汉字的书写习惯,将脱机手写体汉字的特征容错性的表征为笔划类型数量、笔划类型位置、拓扑结构类型数量和笔划书写顺序特征,给出了脱机手写体汉字多特征的表征方法。2.构建了用于提取脱机手写体汉字特征的过程神经网络模型。将手写体汉字二维点阵的图像转化为空间聚合与时间聚合的序列,利用过程神经网络的时空聚合能力,建立用于提取脱机手写体汉字特征的过程神经网络模型,并运用粒子群优化算法对网络进行训练,采用训练好的过程神经网络提取手写体汉字的多特征,构建脱机手写体汉字多特征数据表。3.研究了具有容错机制的脱机手写体汉字识别匹配规则。通过模仿人类识字时的对比、判断、分析能力,给出了具有容错性的脱机手写体汉字识别匹配规则,将待识别脱机手写体汉字的多特征数据表与样本库中的手写体样本的多特征数据表进行容错性匹配识别。4.从SCUT-IRAC手写体汉字图像样本库中选取了各种类型的脱机手写体汉字样本,在MATLAB7.0软件平台上,对本文提出的基于过程神经网络的脱机手写体汉字特征提取与识别方法进行了仿真实验。结果表明,该方法较好地消除了汉字畸变对特征提取造成的影响,具有较高的识别率。