论文部分内容阅读
在目前这个信息化的世界中,信息的传递显得尤为重要,其中文字信息在现实环境中随处可见,而识别其中的文本信息对获取周围环境的信息具有非常重要的作用,所以文字识别技术在近年来受到越来越多的重视。现有的较为通用的文字识别技术OCR的局限性在于:OCR只能处理背景单一的文字图片。在实际生活应用中,待识别的文字图片往往是直接来源于成像设备捕捉的自然场景图片,该类图片的特点是背景复杂且不可预测,如果直接将此种图片作为OCR的输入进行识别,效果往往是不尽人意的。自然地,自然场景文字识别作为计算机视觉技术中的一种较为年轻的学科在近年来发展得非常迅速。作为最常见的文字识别类型,英文识别的应用最为广泛。如何对输入图片进行预处理,并对处理后的图片来提取特征、训练分类器、抑制错误结果和对最终结果进行判别和修正,是英文文字识别中的一些值得深入研究的问题。基于对上述问题的考虑,及对结合近年的英文文字识别的方法的研究,本文对自然场景英文文字识别进行相关研究,主要内容有:1.提出了基于类间错分率的模糊类别划分方案,本文通过计算目前最为通用的是62类英文字符分类的两两样本间的错分概率,对类别进行了模糊处理,通过降低类别空间,本方法从根本上提高了初始分类精度。2.提出了基于图像分割的方法预处理方法,对输入待识别的自然场景图片使用图像分割方法进行预处理,结合预处理结果,提出分离置信度SC的计算公式,并结合字符的纵横比统计信息抑制大量滑动窗口,最终将分离置信度加入所有的识别结果候选序列的最终识别分数的计算中,得到一系列分数较高的识别结果。3.提出了基于大样本字典的定量修正识别单词的准则,对目前现有的根据字典信息对识别结果进行修正的方法进行了改进。确定了根据识别结果中不同字符数的不同修正方法,并通过大量实验证明了本文提出的识别方法具有较好的识别精度和运行速度。本文提出的自然场景英文字符识别方法准确度高,基于重新给定样本空间的方法,提高了分类器的分类精度,且基于纵横比的子窗口抑制方法更为合理地将子窗口数量降低了2个数量级,从而同时提高了分类精度和运行速度。