【摘 要】
:
文字的检测与识别在实际生活中应用广泛,比如字符识别系统,名片识别系统,证件识别系统,交通管理中的汽车车牌识别系统等领域。随着网络和科技的发展,图像文字检测和识别的应
论文部分内容阅读
文字的检测与识别在实际生活中应用广泛,比如字符识别系统,名片识别系统,证件识别系统,交通管理中的汽车车牌识别系统等领域。随着网络和科技的发展,图像文字检测和识别的应用场景在不断改变,图像版面越发复杂,处理难度增加,传统的光学字符算法无法满足当下图像文字检测和识别的需求。随着深度学习的发展和其在计算机视觉领域的使用,为文字检测识别技术的发展提供一个新的思路。本文通过研究主流的多方向图像文字检测算法,得到现有算法的特征提取、池化和候选框精修模块存在待完善点。因此,本文引入特征金字塔,并对其连接方式进行改进,提出半紧密连接方法来充实各层的语义信息。从文字检测所需要的特征性质出发,使用低层的特征信息进行检测操作,提高算法的结果。针对池化部分,量化操作使用邻近插值法导致特征不对齐的情况,使用双线性插值法进行改善。同时针对文本行的宽高比特征,引入多尺度池化操作,使用三种池化尺寸进行池化,来增强水平文本包围框的特征和垂直文本包围框的特征,并对仿射变换后的感兴趣区域90度旋转后进行池化,增强算法的鲁棒性。在候选框精修部分,使用置信分数对候选框进行筛选,置信分数的计算考虑了候选框之间的夹角信息,降低候选框筛选的误判情况。针对已有的图像文字识别算法,分析主流算法的优缺点和所需要的资源后,决定本课题采用编码-解码模型,设计端到端的文字识别算法。本课题使用卷积神经网络对图像特征进行提取,在编解码部分使用双向简洁循环单元减少网络参数,在解码部分,引入自注意力机制解决识别长文本行时出现漏识别和误识别的情况,提高识别结果。本文中多方向图像文字检测阶段使用ICDAR2015数据集进行实验和分析。通过设置变量进行交叉实验,确定改进策略的最佳变量组合,使用训练数据集进行训练,与当前主流的图像文字检测算法进行比较,证明本文的改进方法可以提升多方向图像文字检测的结果。另外,本文中图像文字识别阶段在ICDAR2013数据集进行实验并对比主流算法,证明本文的改进方法可以提升图像文字识别的结果。
其他文献
目的评价曲戋他嗪联合丹参川芎嗪注射液治疗冠心病不稳定型心绞痛的治疗效果。方法将82例冠心痛不稳定型心绞痛患者随机分为观察组与对照组.每组各41例,对照组采用常规治疗;观察
随着对网络信息需求的增加,图书馆电子阅览室功能的不断扩大,以前的管理模式显示出弊端,我院图书馆引进网络计算机管理控制系统对电子阅览室进行管理,方便了管理及维护,并且增加了
等离子体隐身的机理非常的复杂,其中包含有十分复杂的大气化学过程。研究等离子体隐身的大气化学过程对等离子体隐身的理论研究及实际应用都具有比较重要的意义。这项研究同
目的 探讨心肌肌钙蛋白I在心肌梗死患者诊断中的应用价值。方法在2001年1月1日-2009年12月31日9年间选100例心肌梗死患者.观察心肌肌钙蛋白I阳性率,并对结果进行分析。结果100
随着医疗业和无偿献血事业的发展,采供血采集技术面临着更高的标准和要求.作为卫生专业人员应该提高职业素质和采血过程中的质量控制.通过多年采血工作实践,总结出以下几种常
目的通过对住院病人前十位疾病构成的统计分析,以便掌握当前主要危害人民健康的疾病,为加强疾病的防治工作提供依据。方法回顾性分析我院2003-2008年住院病人前十位疾病构成及
“普教看高考,职教看大赛”,这是新时期下我国教育部门对职业教育(尤其是中职教育)内涵建设提出的要求。作为职业教育的组成部分,职业技能竞赛不仅是检验当前中职学校教育教学改革的有效方式,也是衡量中职学校办学水平的标尺。因此,职业技能竞赛是中职学校深化教学改革、强化校企合作、创新人才培养的助推器,技能竞赛人才培养是中职学校人才培养体系中极为重要的组成部分。目前,我国中职学校职业技能竞赛人才培养过程中存在
目的:探讨核心结合因子相关急性髓系白血病(Core-Binding Factor Acute Myeloid Leukemia,CBF-AML)患者的基因突变规律及其对患者预后的影响。方法:收集104例CBF-AML患者,其中RUNX1-RUNX1T1融合基因阳性患者86例,CBFB-MYH11融合基因阳性患者18例。使用高通量基因测序方法对104例CBFAML患者进行58种血液肿瘤中常发生突变的
X射线被发现的一个世纪以来,热电子源以其易于制造和标准化的优势,被广泛运用于各类X射线应用中,处于X射线应用技术的核心地位。然而,随着计算机断层成像、机场安检、医学放
天津滨海新区于家堡金融区起步区同期开发的6个地块处于1个共同的基坑内。由于受到基坑内同期施工的B3地铁线的影响,导致支撑不能按期拆除,因此造成各地块地下主体结构不能顺