自然场景中的文本检测方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:tsgistsgis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景中的文本检测在图像检索、辅助驾驶、工业检测等领域具有广泛的应用。传统的自然场景文本检测技术主要根据文本的颜色、纹理、笔画宽度等设计一些低层次的特征对文本进行检测,这类方法泛化能力和检测性能较弱。近些年,基于深度学习的文本检测方法利用深度卷积神经网络提取图像更深层次的特征,为文本检测任务带来了更好的性能和泛化能力。本文针对现有的基于深度学习的文本检测方法的不足之处,提出并设计了三种面向自然场景的文本检测方法,具体工作如下:(1)置信度融合的自然场景文本检测方法。非极大抑制算法在对同一个真实文本框的重复检测进行合并和筛选时,将预测框的分类置信度作为排序依据,导致那些定位更精确而分类置信度略低的预测框被抑制,从而影响检测准确率。本文针对以上不足,首先,设计了交并比网络预测每个锚框与真实文本框之间的交并比,作为每个预测框的定位置信度;其次,在非极大抑制算法中,将定位置信度与文本分类置信度融合作为预测框排序的依据;最后,在ICDAR2011和ICDAR2013数据集上对本方法进行了实验,结果表明,本方法可以提高文本检测的准确率,并且检测的文本框更加紧致,包含的背景区域更少。(2)无锚框的水平方向自然场景文本检测方法。基于锚框的文本检测方法具有超参数众多、正负样本数量不平衡、对狭长细小的文本区域检测不鲁棒等不足。本文针对以上不足,首先,设计了一种无锚框的水平方向文本检测方法,直接预测特征图上每个坐标点处距离真实文本框的左、上、右、下边的距离;其次,对模型训练中的特征选择策略作了改进,只将梯度传递给每个实例损失函数最小的特征层;最后,在ICDAR2011和ICDAR2013数据集上进行了实验,结果表明,本方法可以有效提高文本检测的速度,对细小狭长的文本区域检测具有较好的鲁棒性。(3)无锚框的任意方向自然场景文本检测方法。基于锚框的任意方向文本检测方法在设计锚框时,除了需要考虑锚框的尺寸和长宽比,还需要考虑覆盖更多的角度;这使得任意方向的文本检测速度较慢。本文针对以上不足,首先,设计了一种无锚框的任意方向文本检测方法,用带有角度的旋转矩形框来标注文本区域;其次,直接预测特征图上每个坐标点距离旋转矩形框的左、上、右、下边的距离和该矩形较长边与水平右向的角度;最后,在ICDAR2013和ICDAR2015数据集上进行了实验,结果表明,本方法能够有效检测任意方向的文本区域,并且检测每张图片的时间缩短为主流方法检测时间的32%。
其他文献
非线性科学作为一门交叉学科,已经逐渐发展成为科学研究的一个重要领域。许多非线性系统伴随有混沌现象,且系统的非线性程度越高意味着其动力学行为越丰富,因此混沌理论与应
石膏是一种重要的工业原料,同时也在一些工业过程中以副产物的形式生成。我国的工业副产石膏产量日益增加,其堆存会造成一定的环境问题。大部分工业副产石膏主要为二水石膏(DH
本文主要研究了光诱导N-芳基丙炔酰胺环加成反应合成卤代氮杂螺[4,5]三烯酮的方法。第一部分研究了光诱导条件下高价碘试剂PhI(OCOCF3)2作用的N-芳基丙炔酰胺合成卤代氮杂螺[4,
光本身携带动量,当光照射在物体表面时,动量会传递给物体,并由此对物体产生力的作用,即光辐射压力。基于此原理,布兰津斯基(Braginsky)等人于1967年提出了由光腔和力学振子通
问答社区(Community Question Answering,CQA)是当下较为流行的一种知识获取以及分享的用户互动平台。CQA提供了很多服务来提升用户获取知识的效率,其中之一就是问题响应时间
随着我国交通运输的快速发展,隧道的建设也是最重要的部分之一,而对于隧道的保养十分重要。隧道衬砌裂缝的检测关系到交通运输的安全,我国目前检测隧道衬砌裂缝采用的是人工巡检的办法,其工作量大,并且无法满足快速有效的要求。随着人工智能机器视觉的发展,将神经网络和深度学习结合,在图像识别领域得到了广泛的应用。本文深入研究了深度学习的相关理论和目前流行的目标检测算法,在卷积神经网络的RCNN(Region-C
纸质档案的高密度存储基本上都采用回转库存取方式。盘点档案是否在库以及档案存放位置是否正确是日常管理的一项繁琐而又重要的工作。传统的手工盘库方式劳动强度大且易出错
解决全球变暖和能源短缺问题最具吸引力的战略之一是开发清洁、可持续能源。催化水还原制氢和CO2还原是非常具有潜力的方式,其为太阳能或电能的转化和储存提供了良好的前景,
硫化氢(H2S)是一种剧毒、恶臭、具有腐蚀性的气体,大量副产于大规模的石油炼制和天然气净化等过程。目前,工业上处理硫化氢的主要方法是克劳斯工艺(Claus process),即H2S不完全氧
玻纤增强塑料具有密度低、强度高、耐腐蚀、耐高温、电绝缘、可设计性强等优点,在工业生产中得到了广泛应用。但是,玻纤增强塑料熔体的流动性较差,成型时需要很高的注射速度