基于全卷积网络的多场景图像文本检测方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:wyj8332606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对多场景下的图像文本区域检测算法进行研究,从图像分割的角度解决文本区域检测问题,提出了一种改进的全卷积网络模型:U-FCN。可以有效的检测出不同场景图像的文本区域。针对网络合成图像和自然场景图像中字符特性的不同,分别设计两种基于全卷积结果的二阶段文本检测方法,实现了多应用场景下的图像文本检测任务。本文的研究内容如下:1)本文对传统的全卷积网络模型进行了相关改进,设计出一种新的U型全卷积网络模型,在原有的FCN网络基础上,通过空洞卷积重构,全卷积归一化等改进方法,对传统的全卷积网络模型进行了优化。2)为了精确检测网络合成图像中的细粒度文本区域,引入了图像文本检测粒度的概念并给出了数学定义。然后提出一种两阶段图像细粒度文本检测方法FMN,利用全卷积网络对图像中的类文本区域进行检测及标记,然后采用MSER+NMS算法对类文本区域进行细粒度特征提取,同时引入椭圆拟合思想,最终实现网络合成图像的文本检测。基准数据及真实数据集上的实验证明,与已有方法相比,本文的方法在检测粒度和精度上均有明显提升。3)为了精确检测自然场景图像中的细粒度文本区域,基于全卷积网络的输出结果,本文提出了一种多阶段集成的文本检测方法。考虑到自然场景下图像背景过于复杂,提出一种改MSER树结构以消除输出结果中字符粘连情况,并结合图像分层,区域融合,CNN字符判别等技术,最终实现自然场景下文本检测目标。
其他文献
电动直线负载模拟器(electric linear load simulator,ELLS)广泛应用于航空航天、武器装备及船舶等领域,是重要的地面半实物仿真设备。ELLS可模拟直线舵机在实际工况中所受到的恒定或交变的载荷,由此完成舵机的机械性能及控制性能的测试。针对ELLS中存在的加载精度低、频宽小和抗扰能力差等问题,对ELLS系统进行了进一步的研究。完成了ELLS与电动直线舵机机理模型的搭建;采
随着群体活动在网络上越来越常见,如何向一个群组推荐一个物品或者一个活动吸引了很多学者的注意。由于群组内部的复杂关系,个性化推荐算法往往无法得到令整个群组满意的商品,因此需要更具针对性的群组推荐算法来进行群组推荐。已有的大部分的群组推荐工作通过融合群组内成员的偏好来表示群组的偏好,这种做法忽略了群组与群组之间的行为相似性。近期,图神经网络在个性化推荐系统显示出了惊人的潜力,图神经网络通过图上的信息流
蠕动机器人是仿生机器人的一种,由于特殊的运动模式和结构,它们具有很强的环境适应性,应用领域广泛。本文通过结合传统蠕动机器人与软体机器人的特点,保留其刚性框架,在关节处加入柔性材料,研制出了一款刚柔结合的小型仿蚕机器人。本文对生物蚕的运动方式进行分析,根据蚕的生理结构和运动规律,在现有小型仿蚕机器人的基础上对其进行柔性化设计。选择硅橡胶作为柔性化材料,设计了柔性腹节驱动器。并通过ANSYS分析驱动器
本文课题依托于国家科技重大专项“功能部件测试试验共性技术研究与能力建设(2016ZX04004007)”,通过前期调研发现,滚珠丝杠副的摩擦力矩波动、刚度、定位精度等关键性能受滚珠精度及滚道加工精度影响较大,而现有文献关于滚珠丝杠副性能与滚动体与滚道误差之间的关系研究较少。以此为背景,本文对影响滚珠丝杠副关键性能的因素和滚珠丝杠副螺旋滚道误差测量两方面进行了深入的理论及试验研究,具体研究内容如下:
随着弹道修正装置向小型化的方向发展,表贴式永磁同步电机因其体积小的特点,而被广泛用作弹道修正装置的执行机构。随着对电机控制性能要求的提高,在矢量控制下,传统PI控制受不确定因素影响大,难以满足控制需求,而滑模控制因其对扰动和参数不敏感的特点,在电机控制中有广阔的应用前景。首先,本文根据舵机的数学模型和三闭环控制原理,设计了舵机矢量控制模型,并搭建了双旋舵机控制系统Simulink仿真模型,为控制算
数控机床关键功能部件核心性能指标直接决定了数控机床的加工性能优劣。本文以国家科技重大专项为研究背景,重点研究基于数控机床KPI体系的关键滚动功能部件载荷谱试验及应用。建立了数控机床KPI体系,确定了数控机床一级指标重要程度为:精度、可靠性及效率;选取了直接影响数控机床精度及可靠性关键指标的关键滚动功能部件(滚动直线导轨副和滚珠丝杠副)的载荷谱作为主要研究内容,建立了滚动功能部件受载模型与寿命预估模
针对航天精密铸锻件零件加工过程中存在的划线找正困难、对作业人员经验要求苛刻、加工耗时过长造成的严重制约产品生产周期和质量、影响产品定型生产等现实问题,本文提出了面向复杂多结构件的机器人自动划线技术。通过采集复杂零件数据及并进行数字化余量分配,驱动机器人运动实现自动精确划线作业,大幅度缩短人工测量和手工分析、调整的划线时间,提高加工效率,并有效保证划线精度。论文的主要研究工作及成果如下:1.研究点云
近些年来,机器学习成为一个热门的学科,涉及人类生活的各个方面。其研究目的是从已有的经验或数据中提取、总结出一定的规律,设计出计算机算法以便对更多的未知数据进行处理和分析。正类和无标签类学习(Positive and Unlabeled Learning,PU学习)隶属于弱监督机器学习范畴,旨在仅仅基于PU数据集学习出一个性能良好的分类器。PU学习问题在现实生活中普遍存在,尤其是在负样本收集困难或收
随着现代社会对智能移动机器人的依赖逐渐加深,机器人在周边环境完全未知或部分未知情况下的路径规划能力成为研究者们突破的重要方向;其中主要的研究内容有机器人对周边环境的实时地图构建和自身同步定位(Simultaneous Localization and Mapping,SLAM),以及基于已构建地图和定位信息完成路径规划任务的相关算法。由于小型智能化移动机器人成本和体积的限制,其配备的传感器制约了自
近几年来,智能交通系统以及无人车技术取得了长足的发展。其中,交通标志识别无疑是智能驾驶系统中极为关键的技术之一。本文根据交通标志的特点,采用多尺度特征结合区域目标检测器,进行网络多层特征的融合,并利用筛选过的区域建议进行训练来实现交通标志的定位和分类。本文的工作主要包括以下几点:(1)传统神经网络仅依赖深层特征进行检测识别极易丢失图像的空间信息以及目标边缘像素,针对这类问题,设计了基于区域建议和多