【摘 要】
:
随着智能手机等智能终端的普及,原来面向高性能配置服务器硬件上的图像处理和深度网络手写识别方法表现优秀,但是由于计算量太大,很难直接推广应用到存储和计算资源都有限的智能终端硬件上。为解决图像处理和深度网络计算量过大的问题,本文重点研究了面向智能终端的图像快速处理和轻量级深度网络手写识别方法。首先,为了加快智能终端上的图像处理速度,采用了图像快速压缩,图像灰度化增强,高斯滤波加权平均去噪,迭代最佳二值
论文部分内容阅读
随着智能手机等智能终端的普及,原来面向高性能配置服务器硬件上的图像处理和深度网络手写识别方法表现优秀,但是由于计算量太大,很难直接推广应用到存储和计算资源都有限的智能终端硬件上。为解决图像处理和深度网络计算量过大的问题,本文重点研究了面向智能终端的图像快速处理和轻量级深度网络手写识别方法。首先,为了加快智能终端上的图像处理速度,采用了图像快速压缩,图像灰度化增强,高斯滤波加权平均去噪,迭代最佳二值化,图像膨胀腐蚀改善和图像有效分割提取的改进处理方法。加速大尺寸彩色图像的处理,改善目标手写对象和背景图像的对比度,有效去除高频噪声,清晰分割目标手写对象和背景图像,明显修补目标图像中的断裂空洞并进一步消除部分孤立噪点,快速分割并有效提取真实手写字符串图像。改进后的方法显著缩短了图像处理耗时,图像秒级处理,提高了图像中目标对象的提取效率。其次,为了提高Le Net-5模型的识别准确率,通过调整网络规模,设计合适的卷积核大小和个数,添加dropout层,选取合适的激活函数和优化器,选择适宜的批处理和学习率的模型改进和优化方法。提高模型识别能力,提高图像的局部特征提取能力,减少模型过拟合,找出损失函数最优解,提高训练的效率。改进和优化后的模型有效的降低了损失函数值,提高了手写数字的识别准确率,测试精确度提高到99.36%。最后,面向智能终端的深度网络手写识别的现实应用,使用3x3小卷积核组合的连续卷积层和动态学习率,以及深度可分离卷积的优化和轻量化方法,提高图像局部特征变化的感知能力和图像分类能力,提取出更丰富的图像特征,加速模型的训练收敛。轻量化后的智能终端模型占用的存储空间减少到0.9%,参数总量减少到0.7%,浮点计算总量减少到0.66%,显著降低了模型的存储和计算资源需求,识别耗时降低至56%。改进后的模型的测试精确度提高到99.63%。设置手写字符图像边缘填充比例为20%,有效提升真实验证数据上识别准确率。采用模型训练测试和验证分离的方法,在服务器端将轻量化后的模型训练好并持久化,在智能手机终端上移植模型文件并应用,设计手机应用程序,对实际手写字符串图像进行快速预处理,然后输入模型进行目标数字字符串识别。所以在智能终端硬件存储和计算资源有限的条件下,本文研究方法仍然可以进行大尺寸手写字母数字字符串图像的快速处理和深度网络模型的轻量化移植,有效提高了目标数字字符串的识别准确率,从而有利于实现跨智能终端的应用及智能化推广。
其他文献
近年来现代医学成像设备随着科技的进步得到了迅猛的发展。不同的医学成像设备能够产生不同模态的医学图像,而不同模态的医学图像能够反映出人体不同组织结构的具体信息,通过对不同的多模态图像进行信息集成,医生可以在同一张图像上观察到更多的有用信息,从而能够更好地进行疾病的检测和诊断,因此,医学图像配准与融合技术应运而生。本文对医学图像配准和融合技术进行算法研究,主要研究内容如下:(1)针对现有医学图像配准算
自然界中有许多天气现象,包括但不限于雨、雪、露、霜、冰雹等。随着科技的发展,人类出于各种各样的需要,对这些自然天气现象的观测需求也在加大。天气现象观测的终极目标一般是全天候、全气象、自动化、精确化观测,其中对露水观测而言,自动化精确观测更是成为研究的重点。本文采用机器视觉,对凝露天气现象进行自动化识别。研究了露水的形状特征在露水识别中的可能性,设计了采集露水数据的观测系统,分析了观测图像不同的预处
节理面的黏结面积对危岩体的稳定性起决定作用,同时也影响岩石的动力响应。分析节理面黏结面积与节理面刚度之间的关系,可以建立危岩体和基岩的振动幅值之比与节理面黏结面积之间的关系;再结合极限平衡理论,可以建立基于振幅比指标的危岩体稳定性计算方法。提出了共振黏结长度的概念:当岩体节理面的黏结长度达到共振黏结长度时,危岩体对基岩振动响应最大;而在共振黏结长度两侧,岩体的振幅比会随着黏结长度的改变产生相反的变
海洋蕴含各种资源,但由于水体介质对光波的吸收和散射特性,使得水下能见度低,对水下资源的勘测工作难度极大。传统的可见光成像探测技术在水下成像领域中的应用较为广泛,但传统的光电探测技术获取到的水下图像退化严重、模糊不清,图像包含的信息较少,早已不能满足研究学者们的需求。获取到对比度高、分辨率高的水下图像已经成为该领域亟需解决的问题。与传统的可见光成像相比,偏振成像能减少杂散光、散射光的影响,可在一定程
物联网催生了大量具有严格延迟要求的应用,例如车联网,智能农业,医疗监测系统等。这些应用对信息的时效性提出了很高的要求。如何度量信息的时效性成为了目前的热门研究话题。信息年龄(AoI)地提出弥补了延时和吞吐量在度量信息时效性上的不足,并在排队模型,排队策略以及多源多径等角度进行了研究。对于在某些重要时刻,则需要通过决策时刻年龄(AuD)来表征决策时刻信息的时效性。本文通过模型构建、模型优化、数值分析
作物株高的测量是农作物自动观测中的重要环节,它能直接反映作物的生长情况。本文将图像处理和FPGA硬件架构结合起来实现自动的实时作物株高测量系统,并将其广泛应用于农作物或景观植物的自动观测中,通过测量的株高信息反馈植物生长态势,指导进行人工干预的时机。本系统通过摄像头采集标尺图像,通过识别未被遮挡的标尺实现作物株高测量。本文首先研究了标尺图像识别及株高测量的具体算法并对其进行仿真验证;然后设计实现了
乳腺癌具有极高的发病率和死亡率,是一种对女性健康具有重大威胁的恶性肿瘤。在患者确诊为乳腺癌后,如何快速准确的针对不同的患者制定合适的治疗方案至关重要。临床上新辅助化疗正逐渐成为乳腺癌的主要治疗方式,且治疗后达到病理完全缓解的病人五年生存率很高。由于不同患者在新辅助化疗后治疗效果各异,化疗无效的患者极可能错过最佳治疗时机。因此急需一种无创式的评估和预测方法,对患者的治疗效果进行预测,辅助医生选择合适
目标跟踪作为计算机视觉中的一个热点问题,广泛应用于导弹定位、视频监控和无人机侦察等众多领域。近些年来,尽管基于孪生网络的目标跟踪算法蓬勃发展,但是在速度和精度上仍然受到一些复杂场景的限制,以至于无法得到有效的实际应用。其主要问题在于孪生网络算法的特征提取框架太浅以及无法在线学习,导致模型的判别性较弱。为解决上述问题,本文主要研究基于孪生网络的目标跟踪算法,主要贡献如下两点。首先,为了解决全卷积孪生
近年来,随着现代无线通信技术的发展,无线通信系统必须适应不断增长的用户数量,才能满足对新业务的需求。在这种背景下,基于多输入多输出(Multiple Input Multiple Output,MIMO)的通信系统能够在发射机和接收机上提供高速传输,同时保证服务质量引起了很多学者的关注。本文主要围绕MIMO信道建模进行研究,针对公路场景建立了不同的信道模型,深入研究了MIMO信道模型的天线阵列,概
由于成像系统及环境设备的缺点,图像不可避免会在采集、传输和存储等过程中受到污染导致质量下降。因此,图像复原是数字图像处理研究领域中的一项最基础的任务之一,并且它在后续图像的处理与应用中扮演着十分重要的角色。传统全变分在复原图像时因具有很好保存图像边缘信息的优点,被广泛应用于图像复原问题中。然而,由于全变分模型假设图像是分段光滑的,所以在复原过程中容易产生阶梯效应。为了进一步提高图像复原的质量,本文