【摘 要】
:
近年来,自然场景文本图像识别已成为一项流行的技术,被广泛地应用到无人驾驶和刑事侦查等场景中。而受到硬件设备、采集编码方式、焦距光圈限制等因素影响的自然场景低质量文本图像在识别效果与精度上通常不够理想。针对上述问题,本文提出了一种基于两阶段学习的场景低质量文本识别方法,从语义特征重建层面入手,利用超分辨率模型学习并重建文本信息,增强序列特征的表达能力,再通过文本识别模型与对应的标签字符之间形成泛化能
论文部分内容阅读
近年来,自然场景文本图像识别已成为一项流行的技术,被广泛地应用到无人驾驶和刑事侦查等场景中。而受到硬件设备、采集编码方式、焦距光圈限制等因素影响的自然场景低质量文本图像在识别效果与精度上通常不够理想。针对上述问题,本文提出了一种基于两阶段学习的场景低质量文本识别方法,从语义特征重建层面入手,利用超分辨率模型学习并重建文本信息,增强序列特征的表达能力,再通过文本识别模型与对应的标签字符之间形成泛化能力更强的参数映射,最终实现自然场景低质量文本图像在识别精度上的提高。实验结果表明,本文方法的平均PSNR达到31.45d B,平均SSIM达到0.89,文本识别LEV值在不同识别难度上分别达到1.40、7.92、16.54,与现有的识别方法相比,本文提出的方法有更好的识别效果。本文主要内容如下:(1)针对自然场景低质量文本图像退化模型未知的特点,在SRGAN的基础上提出并构建了闭环对抗网络(CLCN)作为超分辨率的学习模型。将闭环结构引入对抗网络中,使得生成器由一元映射改为二元映射,进一步缩小超分重建中LR图像与HR图像之间的映射空间,获得更好的语义重建性能。实验结果表明,与最新的Kernel GAN、DRN等方法相比,本文提出的CLCN网络在PSNR上平均提高0.33~1.92d B,SSIM上平均提高0.02~0.07。(2)对超分重建模型进一步优化,将训练的着重点放在判别器上,引入小波变换增加判别维度,对生成器进行激励,使得重建图像的高频信息更为突出。同时,对残差结构进行适当的修改与替换,用于解决闭环结构造成的模型复杂、收敛速度慢的问题。实验结果表明,随着迭代次数增加本文方法收敛速度比其他方法提高了20%~40%。(3)针对自然场景低质量文本图像场景融合的特性,将目标检测融入到识别中,提出并构建了TDRN网络作为文本识别的学习模型。利用共享卷积特征的方式将序列信息进行复用,增强语义信息的利用率。同时,对其中偏移调整模块的插值函数进行替换,规避插值过程中造成的特征像素丢失的问题。将CLCN与TDRN结合即构成两阶段学习模型。实验结果表明,相较于最新的STN-OCR,本文方法的LEV识别指标在不同识别难度上分别低出1.05、1.96、1.40。
其他文献
在经济飞速发展的今天,各行各业的工程建设都离不开钢筋。在工地现场,对于钢筋的交易和使用,由于其每根的价格比较昂贵,所以对数量的要求极其严格。人工点数的计数方法速度比较慢,而且员工长时间处于疲劳状态下工作可能导致点数错误,造成不必要的损失和纠纷,所以智能、高效、正确的钢筋计数就成了建筑行业迫切的需求。目前,目标检测技术在各种应用场景中都表现出了不错的检测效果,但在钢筋场景的检测上效果并不理想。主要的
板翅式换热器是一种高效紧凑式换热装置,广泛运用于石油化工、低温空气分离、航空航天等诸多领域。翅片作为板翅式换热器的核心元件,加工质量检测与控制水平与国外仍有差距,为实现翅片冲压过程中翅片材料厚度、翅片几何尺寸参数高精度控制,研制翅片成套精密测量装置对提高翅片加工质量水平具有重要意义。针对翅片材料厚度和翅片几何尺寸检测,本文提出了基于激光检测技术和机器视觉检测技术的板翅式换热器翅片成型机检测系统,主
随着计算机科学、自动控制理论、网络通信等技术的逐渐成熟,三维虚拟仿真技术也得到迅速发展,目前已广泛应用于各行业的职业技术培训中。传统的井下作业仿真培训系统画面真实感不足,且普遍局限于单人的仿真训练,已不满足职业院校对多岗位协同的井下作业仿真训练的需求。针对上述问题,本文结合井下作业的特点,基于三维虚拟仿真技术和网络通信技术,开展对井下作业多人协同仿真训练问题的研究,开发了井下作业虚拟仿真培训系统,
<正>小学数学教师正确把握现阶段核心素养指导下小学数学课堂教学的方向,聚焦“双减”背景下小学数学单元整体课堂教学研究,响应“双减”政策,不断探究、不断创新,让小组合作成为打造优质、高效教学的有力抓手。教育不断变革,推动了新课改在教学中的发展。单元整体教学是史宁中先生在2021版新课标中提倡的大观念背景下的一种结构化的教学方式,这个方式的核心思想旨在培养学生的系统思维,在双减的政策下为了让学生能学有
全球约有三分之一人口表现出视觉高度的不耐受,这会造成在高处的运动与平衡障碍,影响了其中很多人的生活质量。研究视觉高度刺激下的运动学特征能够为恐高的诊断和治疗提供理论依据。目前,对恐高情绪下姿态控制的研究还存在一些问题:1)高空实验存在安全性问题,且实验高度远远低于日常生活中的常见高度。2)大多数研究主要集中在恐高的缓解上,缺少运动学方面全面的运动姿态量化分析。针对这些问题,本文利用虚拟现实技术(V
智能印厂是印刷产业数字化和智能化转型升级的重要发展方向,而可视化是推动印刷企业转型、升级、再造和变轨的关键方法,同时也是智能印厂建设和印刷智能化应用的关键技术。本研究以智能印厂可视化中场景可视化和工艺数据可视化实现为目标,在系统分析与建构智能印厂可视化需求的基础上,从场景可视化和工艺数据可视化的设备模型、印厂场景构建、实现路径和实际应用出发,构建了一套适用于智能印厂的可视化方法。在场景可视化方面,
细粒度情感分析,也称为基于方面的情感分析,其目的是根据评论文本,提取和识别出某一实体的某个方面或属性的情感信息。随着互联网中各种评论不断涌现,如何准确、自动地对一段文本进行特定方面的情感分析成为了自然语言处理领域中一个广泛研究的课题。目前针对细粒度情感分析的研究方法绝大多数采用了有监督的深度学习算法。为了训练这些算法,前期需要收集和整理大量相关领域的文本数据并为每条数据进行手动标注,这些工作往往是
大幅提高可再生能源发展是实现我国“30.60”双碳目标、能源转型、低碳可持续发展的重要途径。我国在“十三五”期间可再生能源得到了快速发展,截至2021年底,风电、光伏等可再生能源装机容量占比达26.89%。在2022~2030期间,预计每年将新增新能源装机1.2亿千瓦,到2030年,新能源装机容量将达16.4亿千瓦,占全国总装机容量的43%。随着其占比的不断提高,可再生能源固有的间歇性、波动性等特
量感对于学生预测分析能力、数学逻辑思维和推理分析能力的发展具有突出的作用,能够帮助学生更好地解决各种问题。可视化教学是经过实践检验的有效教学模式,将其应用于小学生的量感培养中,可以使学生对质量、长度、时间等形成直观的认知。文章基于新课标视角,剖析了量感的内涵及可视化教学的价值,进而提出了具体的小学数学量感可视化教学策略。
<正>“公顷和平方千米”是人教版小学数学四年级上册的教学内容,“公顷”和“平方千米”是两个测量土地面积的常用单位,由于这两个面积单位在生活中运用得较少,不容易建立表象,学生学习完后依旧对1公顷、1平方千米的概念把握不准。《义务教育数学课程标准(2022年版)》首次将“量感”加入小学阶段的核心素养中。量感主要是指对事物的可测量属性及大小关系的直观感知。建立量感有助于学生用定量的方法认识和解决问题,是