【摘 要】
:
近年来随着科技进步,人们物质水平提高,对于图像内容理解的需求增大,文本检测识别应用面对的通常并不局限于单一场景,而是多种场景的混合,这就导致要求多场景下文本检测识别
论文部分内容阅读
近年来随着科技进步,人们物质水平提高,对于图像内容理解的需求增大,文本检测识别应用面对的通常并不局限于单一场景,而是多种场景的混合,这就导致要求多场景下文本检测识别任务要应对复杂的光照条件、多变的文本字体和角度,因而非常挑战算法的能力。同时学术界和工业界也举办了很多不同场景的文本检测识别挑战赛,这也体现了多场景文本检测与识别的研究热度。本文主要在如下三个方面进行了工作:(1)本文以可变形卷积目标检测网络为基础,进行改进并应用到多场景水平文本检测任务中去,在自然场景以及票据场景进行了实验验证,结果符合预期,并取得了ICDAR2017 COCO-Text文本检测竞赛亚军。(2)本文从实例分割的角度,提出了一个多场景多方向文本检测框架FTSN,通过融合底层细节信息和高层语义信息得到融合特征图,并且改进了非极大值抑制后处理方法,使得其在多语言场景下多个多方向文本数据集ICDAR2015、MSRA-TD500中取得了领先的性能,并且可以自然地扩展到曲线文本检测任务中去。(3)本文基于流行的行识别模型CRNN进行改进,提出了识别模型DSAN,其引入了空间注意力模块和深度监督模块,使得在序列处理之前的特征图能够更集中激活语义信息部分、抑制冗余杂乱信息部分,该方法在多个不同场景文本识别数据集即ICDAR2013、SVT和IIIT5K中均达到了领先性能。本文在多场景文本检测与识别任务中提出的方法,在多个数据集或比赛中验证了有效性,其性能也超越了之前众多方法。
其他文献
为了核对计算结果,摩尔(R.E.Moore)于20世纪50年代提出了区间算法的概念(见[1]),其后区间算法便很快成为计算数学的一个活跃分支(见[1]-[25])。其主要思想是在运算过程中用包含某
改革开放以来,随着我国城镇化的快速发展,超大城市中大量现代无特色建筑和贪洋求怪式建筑盛行,原本和谐统一的城市风貌被建设性破坏,城市风貌亟待修复。目前我国超大城市基本都进行了城市风貌引导的尝试,风貌专项规划与风貌导则编制等工作已经较为成熟,城市风貌的引导效果较为不错,但是针对城市风貌引导体系的研究还稍显不足。本文将“城市风貌基因”这一概念引入城市风貌引导,以超大城市的城市风貌为研究对象,将城市风貌解
民粹主义具有多种样貌,存在多个阐释维度。本文通过剖析美国特朗普民粹主义,从制度基础、内在结构和政治风格三个维度考察民粹主义。其一,民粹主义是一种现代民主政治现象,是
一、新型农业经营主体发展现状(一)发展数量稳中有升近年来,林州市政府高度重视新型农业经营主体培育工作,按照“加快培育一批,努力规范一批,着力提升一批”的思路,采取“宣传引导、
摘要:案例教学,是一种新型的教学方式,它是动态的、开放的,重视教师与学生的互动,模拟和重现一些生活实例,使学生产生浓厚的兴趣,留下深刻的印象。财政学是经济类学科的基础,因此,在财政学教学中也应该充分利用案例教学的实效性来启发学生的思维,这有利于学生对理论基础的更透彻的理解,学生在案例中联系实际,可以在日后的学习生活中更娴熟地运用课堂知识,做到学以致用。本文从案例教学的含义入手,简要探讨了案例教学在
永磁同步电机具有能量效率高、结构简单、运行可靠、功率密度高等特点,是高性能工业传动的理想选择。多数永磁电机驱动系统中,是基于机械式传感器来测量电机速度或位置的。这
可靠的扩散系数测量方法对于稠油开发中气体注入方案设计、页岩气开发中流动机理研究和天然气成藏保存过程中气体运移方式的确定等都具有重要的意义。为此,提出了一种基于压
宿州市地处安徽省最北部,与苏、鲁、豫、皖4省11个县市接壤,是淮海经济区的核心城市之一,是安徽距离出海口最近的城市,辖砀山县、萧县、灵璧县、泗县、甬桥区和七个省级经济开发