基于卷积神经网络的自然场景文本检测技术研究

来源 :南宁师范大学 | 被引量 : 0次 | 上传用户:ll19870627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景的文本检测是从自然场景中实现对文本检测和定位,进而服务与各项应用,在社会的方方面面中都有着越来越重要的作用。使用卷积神经网络检测文本已有一些研究,但是依旧存在很多问题没有解决。本文针对自然场景中的长文本和石碑文本的检测提出新的方法。本文主要研究内容如下:一、针对自然场景下的长文本检测因为文本行的极端长宽比使得大部分网络无法完整检测的问题。本文在网络模型中结合特征激励模块提取通道信息,来抑制背景特征,进而加强前景特征;并提出了新的椭圆形几何回归方式,可以在不添加额外步骤的情况下准确的完成长文本的链接和角度的旋转,提升长文本检测的准确性。二、针对自然场景下的石碑文字因为其文字的“大”超过大部分网络对文字设定的最大限度而不能准确检测的问题。利用深度卷积神经网络作为特征提取工具,将提取到的特征进行图像信息熵计算,取最大熵的值作为文本候选区域的一部分。另一方面,使用特征减弱算法,尽量消除与颜色特征无关的影响,输入最大稳定极值区域算法中或者文本候选区域的一部分。两者的最终结果相结合得到文本区域特征图。结合迁移学习训练一个分类网络,将候选区域输入网络中,得到最终的文本区域。并在此任务研究的过程中制作一个石碑数据集,设计两种不同的标签用以支撑研究任务,并且在这个数据集上与其他最先进的进行了比较试验,验证了这个数据集的挑战性。本文取得的研究成果:一、自然场景下的长文本模型所改进的网络模型有较强的迁移能力,可以用于其他领域的研究;所提出的模型与多个性能优秀的模型进行比较试验,在精准率、召回率、f值中均取得了最好的性能结果。二、自然场景下的石碑文字检测模型结合了深度学习和传统方法,在小数据集中与其他方法相比较,取得了最好的效果。所提出的数据集有足够的挑战性,有扩展的空间。
其他文献
2008年以来,人民币国际化进程不断推进,人民币国际使用在空间拓展、职能提升方面都取得了明显的进展。当前,资本项目开放程度不足、缺乏面向国际的有深度和广度的金融市场是
随着高校教育信息化的大力建设和学分制教育管理模式的不断推行,学生选课工作越来越重要,而保山学院9000余名学生的选课工作压力也越来越大;为提高选课工作的效率和质量,保证
按物流的要求 ,提出报纸自动分拣系统及其实现方案 ,介绍了系统的原理、工作过程及管理
胶体量子点(QDs)由于荧光量子产率高、单色性佳、稳定性高、荧光光谱随尺寸可调等独特的光学性质,使其在生物标记、光伏器件、激光、发光二极管等领域引起了广泛关注。特别是基
在科学和工程计算领域中,有许多问题最终归结为稀疏线性方程组的求解。在实际应用中,经常需要求解百阶、千阶甚至万阶及以上的稀疏线性方程组,完成大量的矩阵数值运算,这是数
土壤微生物总RNA的提取是研究土壤微生物分子生态学的基础,在研究土壤微生物群落多样性分布与功能的关系时,需要从土壤中提取出高质量的RNA样品。RNA是在转录水平上的研究,是
【深圳商报讯】(记者 陈燕青)登云股份IPO文件及年报造假案尘埃落定,证监会对登云股份等26名责任人、中介机构新时代证券及广东君信律师事务所(下称“君信所”)等,合计开出4144.92
报纸
将湖北五峰发现的珍惜树种红花玉兰(Magnolia wufengensis)引种北方后,其幼苗在自然越冬过程中常受到低温伤害,但其近缘物种白玉兰(Magnolia denudata)适应性良好。本研究试图通过探究红花玉兰和白玉兰在冷应激和冷驯化进程中的物质代谢特性和差异,发现红花玉兰低温下的代谢障碍,为红花玉兰在北方的引种驯化和分子改良提供代谢组学基础和理论依据。本研究采用气相色谱-质谱联用技术和
张承志作为中国文坛享有盛誉又颇受争议的作家,他与苏俄作家艾特玛托夫从接受借鉴到体现出各自独创性的关系,是中外文学关系中一个颇受关注的个案。早期两位作家创作出风格相