复杂背景图像中维语文字区域定位技术研究

来源 :长沙理工大学 | 被引量 : 2次 | 上传用户：passat168

【摘要】

：

复杂背景图像中的文字往往包含重要信息,是图像内容识别与场景理解的关键。因此,复杂图像中的文字区域定位技术是图像检索、人机交互、模式识别等方向的重要研究课题,同时在

【作者】

：

陈建均

【出处】

：

长沙理工大学

【发表日期】

：

2017年01期

【关键词】

：

复杂背景图像文字区域定位维语文字图像 CPU-GPU异构并行

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

复杂背景图像中的文字往往包含重要信息,是图像内容识别与场景理解的关键。因此,复杂图像中的文字区域定位技术是图像检索、人机交互、模式识别等方向的重要研究课题,同时在智能购物、自动驾驶、文档分析等领域具有广阔的应用前景。图像中的文字区域定位是指在包含文字的图像中找到文字区域的位置坐标,以便后续对文字的处理(识别、匹配等)。传统图像OCR技术主要处理背景简单的文档图像,难以应对背景复杂图像。目前,复杂背景图像中的文字区域定位技术研究大多关注中英文,该类技术对像维语这样使用人口较多的少数民族(维族人口 1006.93万1)的文字定位精度不高。同时,由于图像本身的噪声、光照、模糊、遮挡等干扰因素,以及文字本身的字体大小、颜色和字体的多变性,使得图像中的文字区域定位任务充满挑战。尤其是复杂背景图像往往包含大量易与维语文字混淆的元素(比如,树枝、草地纹路、波浪等)。本文围绕维语自身的特点以及复杂背景图像中文字定位相关技术展开,重点研究了复杂背景图像中维语文字组件的提取方法和图像文字/非文字组件分类方法,取得了一定成果,总结如下:1、基于多颜色通道增强的候选组件提取方法近年来,基于最大极值区域(Maximally Stable Extremal Regions,MSER)的候选组件提取方法以其快速高效的特点而被广泛采用。但是MSER对图像的低分辨率和模糊敏感,容易遗漏文字组件候选。为了弥补MSER的这一缺陷,本文提出了一种基于多颜色通道增强MSER的候选组件提取方法,其包含两个阶段,提取阶段和去重阶段。提取阶段中,通过分别提取各颜色通道中的MSER能有效提高MSER对图像模糊和低分辨率的鲁棒性,获得较高的召回率。在去重阶段,由于在多个颜色通道中提取的候选组件包含大量重复,因此在本阶段使用一个高效去重算法进行去重以减少后续步骤的计算量。实验结果表明该方法有效改善了 MSER的鲁棒性,在组件提取任务中取得了高达91.4%的召回率。2、基于强分类恢复策略的文字组件分类方法本文提出的强分类恢复策略包含两个阶段:强分类阶段和恢复阶段。由于文字本身具有丰富的梯度特征,因此在强分类阶段使用两个自适应的梯度方向直方图特征(Histogram of Oriented Gradient,HOG)+ 支持向量机(Support Vector Machine,SVM)构成的分类器分别在不同特征空间对组件进行分类。由于强分类阶段难免将文字组件误判,因此在恢复阶段就是要找回被误判的文字组件。一般而言,相邻文字组件的颜色特征具有较大的相似性,根据这一特点,通过计算强分类阶段已经区分开的文字组件与非文字组件的颜色特征相似性实现误判文字组件的找回。实验结果表明该方法在文字与非文字分类任务中的准确率达到了 94..34%。3、基于CPU-GPU异构并行的加速方案随着多核CPU的普及和GPU编程接口的完善,在普通机器上进行小规模的并行计.算得以实现。在本文提出的复杂背景图像中维语文字区域定位方法中存在大量可并行计算,因此本文提出了针对该方法的异构并行加速方案。通过任务划分,充分利用CPU和GPU的计算资源来加速算法。实验结果表明,该并行加速方案将复杂背景图像中维语文字区域定位算法的运行速度提升了 12.5倍。本文针对复杂背景图像中维语文字区域定位技术中存在两个核心问题,分别提出了有效的解决方案。在复杂背景维语文字图像数据集(Uyghur in Complex Background Image,UICBI400)上使用面积标准的测试准确率和召回率分别达到了 81.4%和94.8%,领先当前传统定位方法。之后又对初始提出的方法进行了并行化改进,进一步提高了其运行效率。

其他文献

实验研究铷原子蒸汽中脉冲真空压缩态的建立过程

压缩光科学的出现对整个物理学界有着重大影响,利用多种非线性光学过程产生的压缩光场及其性能优化是量子光学领域的研究热点。而在量子信息和量子精密测量领域,脉冲压缩光又

学位

脉冲真空压缩光光偏振自旋转效应相位平均统计平均光子数噪声演化

交通视域下的唐代终南山诗研究

终南山在唐代毗邻都城,既是天然的地理屏障,又是重要的交通孔道,被唐人视为“国门”,在众多山岳中地位超然。这里的西南面,有子午道、骆谷道、褒斜道沟通着川陕交通,蓝田道沟通着荆陕交通,对帝国的政治、经济、文化影响深远。由于此山地当出入京师的要路,所以有很多文武官员或求名文士经过、造访或游历,并创作诗歌,纪实写景,抒情议论,从而对唐诗创作和传播也有维系和促进作用。可以说,有唐一代,终南山的交通与国运兴衰

学位

唐代终南山唐诗交通题材风格心态

陶厄氏菌属（Thauera）富集的SBR系统脱氮性能研究

城市污水处理厂主要采用生物脱氮的方法来处理污水中的氮污染物,因此微生物是生物脱氮的主体,经研究陶厄氏菌属(Thauera)具有卓越的反硝化能力,而N_2O作为一种温室气体备受关注,因此研究如何在生物脱氮系统中富集该菌属,以及富集后系统对N_2O的产生和降解有何影响具有重要意义。此外,对于同步硝化反硝化(SND)系统,因其可使硝化反应和反硝化反应在一个反应器、相同条件下同时发生而成为研究热点,因此,

学位

SBR反应器反硝化ThaueraN2O同步硝化反硝化生物脱氮有机碳源

微博网络中隐蔽关键用户发现技术研究

微博是一把双刃剑,不仅方便了人们的信息互动,也便利了恶意舆论的传播,而微博中很多恶意舆论传播过程中的关键用户具有较高的隐蔽性,增加了微博中舆论监管与引导工作的难度。

学位

微博影响力显式关键用户隐蔽关键用户转移熵隐蔽影响程度

基于服务设计的中小学生课外教学系统开发

随着我随着我国经济的发展,我国家庭对教育的重视程度越来越大,学生及家长对个性化教学的需求也与时俱增,而我国的教育模式仍处于原始的大班教学制,很难保证每个学生都能享受

学位

服务设计课外教学服务系统服务生态链物质-场

机场飞行区工程关键节点施工测量方法和不停航施工组织实施研究

鉴于航空运输相较于其他运输方式的优势,机场建设已经成为我国各个地区为发展区域经济的重要举措,在各地大力建设新机场的同时,现有机场的迁建及改扩建等项目频繁上马,机场建设任务日益繁重。测绘工作贯穿机场建设项目的全生命周期,具有极其重要的作用,本文对机场建设中涉及到的各种测量技术、方法、工序及施工组织等进行了深入研究,针对飞行区不停航状态下的施工测量与施工组织开展了深入研究,提出了完整的、可实践的解决方

学位

机场建设3D数字化系统施工测量不停航施工组织

盐生杜氏藻对盐度变化和渗透胁迫下的细胞反应及其中性脂肪的积累

杜氏盐藻是一种绿色微藻,能够在盐度极其广泛的环境下生长并积累含有类胡萝卜素的中性脂肪球,因此可以用来生产生物柴油和色素。杜氏盐藻是迄今为止研究发现的最为耐盐的真核

学位

杜氏盐藻渗透胁迫细胞体积盐度中性脂质

室内LED可见光通信系统中降低PAPR算法的研究

较之其他调制技术,OFDM调制技术由于具有良好的抗窄带脉冲噪声、抗多径干扰、频谱利用率较高、易于与其他技术相结合及实现复杂度较小等众多优点而被广泛的应用于室内LED可见

学位

LED 可见光通信OFDMPAPRMatlab/Simulink

福建师范大学图书馆民国文献特色研究与分析

本文通过对福建师范大学馆藏的民国文献进行整理与研究,各章节对馆藏的民国时期前身校的毕业论文、报纸、期刊和图书逐一进行整理与分析,研究其馆藏特色与价值。通过本馆自建

学位

特色馆藏民国自建数据库

止痉通络方治疗瘀血型偏头痛的临床疗效观察

目的:通过对瘀血型偏头痛患者的随机对照研究,观察止痉通络方治疗瘀血型偏头痛的临床疗效及安全性,为临床治疗偏头痛提供安全、有效的治疗方法。方法:选取符合纳入标准的瘀血型偏头痛患者60例,采用随机数字表法分为2组,治疗组30例,对照组30例。治疗组给予止痉通络方治疗,对照组给予盐酸氟桂利嗪胶囊治疗。两组以4周为1个疗程,观察1个疗程后两组在西医临床症状、中医证候积分、血流变学指标、血小板聚集率、C反应

学位

偏头痛瘀血型止痉通络方风瘀兼夹疗效

复杂背景图像中维语文字区域定位技术研究

其他学术论文