论文部分内容阅读
复杂背景下的文本定位与提取研究对于今天这样一个信息时代有着重要的意义,它丰富了图像处理理论,在实际应用中诸如Internet环境下对于图像和视频的检索、现代交通管理中对车牌的识别等有着巨大的商业价值。所以如何从复杂背景的图像和视频中快速而准确地定位和提取文本,成为国际上热门的研究课题。 本文从复杂背景下文本的定位与提取研究所面临的难题入手,对文本的划分、特征抽取及其识别进行了分析。介绍分析了复杂背景下文本定位与提取的多种方法。 本文对于三种主要的角点检测算法Harris、IPAN和SUSAN进行了实现,并比较了它们之间的优劣,在着重分析SUSAN角点检测方法的基础上,对该算法进行了改进,实验结果表明,改进的算法取得了更为满意的效果。在此基础上提出了基于SUSAN角点检测的文本定位与提取算法,并且将其扩展到支持向量机的框架下。 我们还重点研究了模糊理论在文本定位与提取上的应用。介绍了子图像变异灰度直方图的概念,将其成功的应用到文本的定位与提取中去,实现了基于子图像变异灰度直方图的文本定位与提取算法,该方法对于图像和视频中的文本/字幕取得了较好的效果。接着将模糊理论与该算法结合起来,使得算法在鲁棒性、正确率和处理速度方面都得到进一步提高。 最后对视频文本的多帧检测问题进行了讨论。