基于特征融合网络的自然场景文本检测

来源 :计算机系统应用 | 被引量 : 6次 | 上传用户:hawkwangyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,基于深度学习的自然场景文本检测在复杂的背景下取得很好的效果,但难以准确检测到小尺度文本.本文针对此问题提出了一种基于特征融合的深度神经网络,该网络将传统深度神经网络中的高层特征与低层特征相融合,构建一种高级语义的神经网络.特征融合网络利用网络高层的强语义信息来提高网络的整体性能,并通过多个输出层直接预测不同尺度的文本.在ICDAR2011和ICDAR2013数据集上的实验表明,本文的方法对于小尺度的文本,定位效果显著.同时,本文所提的方法在自然场景文本检测中具有较高的定位准确性和鲁棒性, F值
其他文献
Oracle数据库系统是目前企业应用最广泛的大型关系数据库管理系统.PL/SQL是Oracle对结构化查询语言SQL扩展的过程性语言,利用其设计和开发触发器、视图、存储过称、包以及函
互联网的快速发展带动了人们的购物行为,越来越多的人群习惯于进行网购,随之产生的是各种各样的网购交易数据,这些数据复杂、多维,并且具有时序性,消费者的购买行为是众多电
随着现代制造业对产品质量、生产效率和操作安全性要求的提高,视频监控在现代制造业中的应用越来越广泛,对视频处理的精度与速度要求也越来越高.运动目标检测是视频理解和分析的基础,因此面向工业场景的运动目标检测算法一直是一个研究热点.作为算法的重要组成部分,运动目标检测所用到的背景特征在以往并没有受到足够的重视.为此本文,从像素数据和已有算法中获取背景特征,给出相关特征和数据的可视形态表示,支持更直观的方