论文部分内容阅读
手写体数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition)的一个分支,是人们研究较为深入的一个经典课题,也是模式识别中最成功的应用之一。数字识别的识别类较少,从而有助于深入分析和验证一些新理论新方法;而且手写体数字的识别方法易于推广到一些相关问题,这些都促使我们有必要对其作深入的研究。本文建立了一个由BP神经网络和支持向量机组成的二级手写体数字脱机识别系统,主要由学习和识别两个部分构成。在整个系统的实现过程中,本文的工作主要有以下几个方面:1.为提高网络的收敛速度和避免网络假饱和现象,对传统的BP神经网络做了一些改进;而为了防止网络的过拟合,我们在训练过程加入了交叉验证的方法。2.在BP神经网络训练过程中,系统对训练结果的输出作了易误识模式的概率统计,并根据这个统计结果,设置了确信度参数,在识别阶段,系统根据这个确信度参数,来决策BP神经网络的输出结果是否需经过支持向量机分类器。3.对支持向量机的训练过程,引入了SMO算法和DirectSVM的改进算法。通过DirectSVM算法来加快选择支持向量的速度,并在学习训练时配合SMO算法,来保证整个支持向量机的性能不被降低,这样,就得到了一个速度提高的支持向量机分类器。4.本文建立的BP神经网络与支持向量机二级手写体数字识别系统,由BP神经网络构建粗分类器,由支持向量机构建细分类器。粗分类器的识别结果若符合一定的确信度则直接输出识别结果,否则,将选择最大的两个结果,交由支持向量机来进行二级分类,并将结果作为最终结果输出。实验结果表明系统在一定程度上提高了手写体数字识别的精度,值得深入研究下去。