图像中自然场景字符区域定位

来源 :东北大学 | 被引量 : 2次 | 上传用户:oucuifang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,由于多媒体技术和互联网的蓬勃发展,全世界数字图像容量迅猛增长。我们生活的每一天都能产生数千兆字节容量的图像,这些图像中的字符承载着非常有用的信息,例如交通道路指示牌、街道名称、商店名字、广告牌、海报、书籍封面等。假如能自动定位图像中的字符区域,那么对于图像高层语义的理解、索引和检索有重大意义。本文结合应用数学相关知识,建立数学模型,围绕图像中自然场景字符区域定位,做了如下工作:首先,利用Canny边缘提取算子与NiBlack算子相结合提取出原图像的边缘图,结合两种算子各自的优点,既可以抑制背景和噪声,又可以将邻近的字符区域分开,为后续的字符特征提取做好准备工作;其次,将边缘图进行填充,进行连通区域分析,利用字符特征,如字符宽高比满足一定比例、笔画宽度相似性等多个特征去除部分背景或者非字符区域,得到字符候选区域粗提取。再次,将粗提取的字符候选区域对比着原图像上色,根据字符区域颜色一致性,采用K均值聚类算法聚成三类。因为字符区域较非字符区域具有更多的角点,因此再结合Harris角点检测算法通过判断连通区域角点的数目来区分哪一类为字符区域,哪一类为非字符区域,从而将一部分非字符区域去除,得到字符候选区域精提取;最后,针对精提取的字符候选区域仍会有非字符存在的情况,本文提出基于支持向量机结合HOG特征和LBP特征,对字符候选区域进行识别分类。HOG特征通过计算统计图像局部区域的梯度方向直方图获得,LBP能够很好地描述图像纹理特征,采用主成分分析进行特征选择。用训练好的分类器进行识别分类,最终达到图像中自然场景字符区域准确定位的效果。本文提出的图像中自然场景字符区域定位算法可检测图像中存在多类不同字符的情况,也可检测字符区域像素值较背景低的情况。经实验表明,字符区域定位效果好,且不易受光照、字符字体、复杂背景等因素的影响,具有较好的鲁棒性。
其他文献
复方法是研究偏微分方程的一种强有力工具.本文主要对复分析中高阶方程和高维区域上偏微分方程的几个边值问题进行研究,并推广了已有的结果.首先,在复平面上讨论k正则函数(即
半定规划是线性规划的一种推广.近年来其理论和算法取得了很大的进展,并且在组合优化、系统工程和电子工程等领域得到了广泛应用,已成为数学规划领域中一个新的活跃的研究方
本文研究了两类排序问题,一类是同型机上可中断半在线排序问题,一类是同类机上的在线排序问题.并且对这两类问题都给出了最优的(半)在线算法.全文共分为三章. 第一章是绪论
全文共分三章: 第一章,主要介绍了独立同分布随机场变量的Marcinkiewicz-Zygmund强收敛性.Smythe(1973)研究了独立同分布γ维随机变量矩阵的强大数律,证明了如下的定理: 定
本文主要讨论了三个内容:(i)引入了AF-环的概念,并给了AF-环的一些特征与性质,证明了在AF-环上,IF-环与自FP-内射环是等价的,还讨论了AF-在对偶理论中的重要性以及AF-环的同
称一个n阶半正定、元素非负的矩阵为双非负矩阵,并记所有n阶双非负矩阵构成的集合为DNN_n。对于A∈R~(n×n),若有非负矩阵B∈R~(n×m)满足A=BB~T(T表示转置),则称A为完全正的