复杂背景下的文本定位与提取研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:lxs000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂背景下的文本定位与提取研究对于今天这样一个信息时代有着重要的意义,它丰富了图像处理理论,在实际应用中诸如Internet环境下对于图像和视频的检索、现代交通管理中对车牌的识别等有着巨大的商业价值。所以如何从复杂背景的图像和视频中快速而准确地定位和提取文本,成为国际上热门的研究课题。 本文从复杂背景下文本的定位与提取研究所面临的难题入手,对文本的划分、特征抽取及其识别进行了分析。介绍分析了复杂背景下文本定位与提取的多种方法。 本文对于三种主要的角点检测算法Harris、IPAN和SUSAN进行了实现,并比较了它们之间的优劣,在着重分析SUSAN角点检测方法的基础上,对该算法进行了改进,实验结果表明,改进的算法取得了更为满意的效果。在此基础上提出了基于SUSAN角点检测的文本定位与提取算法,并且将其扩展到支持向量机的框架下。 我们还重点研究了模糊理论在文本定位与提取上的应用。介绍了子图像变异灰度直方图的概念,将其成功的应用到文本的定位与提取中去,实现了基于子图像变异灰度直方图的文本定位与提取算法,该方法对于图像和视频中的文本/字幕取得了较好的效果。接着将模糊理论与该算法结合起来,使得算法在鲁棒性、正确率和处理速度方面都得到进一步提高。 最后对视频文本的多帧检测问题进行了讨论。
其他文献
VOD系统是大量多媒体应用系统中的一种关键技术。大规模VOD系统中的资源有效利用问题非常突出,海量数据传输使得网络I/O带宽和服务器磁盘I/O带宽成为系统的瓶颈。视频点播流调度
随着Internet的飞速发展,World Wide Web已经发展成为全球传播与共享科研、教育、商业和社会生活等方面最重要和最具潜力的信息资源。而以HTML标记语言发布的Web信息面向显示,
模式匹配问题在计算机科学中出现的最早且人们对它的研究也最广泛,随着需要处理的文本规模越来越大,在文本中进行的搜索越来越复杂,模式和文本之间可以有某些细小不同的近似模式
人体动作行为分析在智能监控,高级人机交互等众多领域都有着很多发展。在视觉监控技术的研究,尤其是在基于人体行为视觉这个方面,它已经成为视觉监控技术的一个新的方向,它的独
网格安全对于网格非常重要,它是网格被广泛应用的基础。与传统网络环境相比,网格环境提出了更高更广泛的安全需求。研究基于Globus平台的网格安全证书管理系统,对于实现网格
随着经济的飞速发展以及人们生活水平的不断提高,电话在经济生活和人们的日常生活之中的作用越来越重要,人们对电信服务的功能及质量的要求也越来越高。呼叫转移业务是在传统电
随着计算机技术的飞速发展,计算机应用范围越来越广,特别是在计算机三维应用领域,十几年来从无到有,有了长足的发展。目前,计算机广泛的应用于外观设计,影视三维制作等领域。
本文的研究目标是实现从传统IP网向MPLS/VPN网络的迁移。MPLS/VPN网络技术具有广泛的应用前景,本文从一个实际的项目应用出发,针对建设MPLS/VPN网络过程中引发的各种问题,进行了
随着三维模型数据采集工具的不断发展,我们所能采集的模型数据也日益精细,伴随而来的就是模型数据量和复杂程度的急剧增加.如何使用有效的算法来表示三维模型,从而降低三维数
本文以雷达、声纳、软件无线电等电子装备的发展需求为背景,介绍了一种以6片AD公司ADSP21160处理器的单板处理模块构成的并行处理计算机系统。本系统充分利用了ADSP21160支持