基于深度学习的社会保障卡光学识别模型的设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:q115106962
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动医疗产业的兴起,对低成本、高效率读取社会保障卡(社保卡)信息提出需求。在入校筛查体检等需要大规模部署但又受成本限制的场景,使用光学图像识别社保卡信息可以免除配置专用读卡设备,简化设备配置、降低成本。但是,社保卡卡面布局和自定义信息依各省、各发卡机构各式各样,记录的姓名等关键信息常包含罕见汉字,超出现有商用解决方案的识别范围,且难以搜集真实图像数据以供训练识别模型。为此,本文结合了光学模型分析、图像处理算法和深度学习技术,基于面向字符区域检测和字符识别深度学习模型,设计社保卡卡面字符光学识别模型并实现了原型系统。本文主要工作包括:(1)设计了社保卡卡面汉字与数字字符图像光学识别模型。识别模型由五个模块串联而成。其中,预处理模块进行降采样、卡片边界识别以及视角修正;卡片信息区域检测模块在卡片正视图像中识别关键文字信息区域;字符分割模块对关键信息每个子标题和内容段切割、再逐字符切割;字符图像识别模块将每个汉字和数字图像识别为机器编码;后处理模块对卡片信息整理,将子标题与预设关键词对比以分别输出姓名和卡号的机器编码。上述模块中,卡片信息区域识别和字符图像识别模块分别使用了卷积-循环神经网络和卷积神经网络模型。(2)设计了仿真字符图像合成模型。通过对软件渲染的字符图像添加干扰并施以弹性扭曲运算进行数据增强,实现了生成包含丰富罕见字样本的训练数据集,以提高识别模型对罕见字样本的识别准确性。(3)实现了社保卡卡面字符光学识别原型系统,完成了社保卡卡面字符光学识别模型实验与原型系统测试。原型系统客户端以Java语言在安卓智能手机上实现;服务端以Python语言在Windows服务器上实现,以OpenCV为框架实现了预处理模块和仿真训练数据生成,以基于图像计算卡加速的TensorFlow为框架实现了面向卡面信息区域识别和字符图像识别的神经网络子模型并完成训练,以Flask为框架实现了http服务。测试中,首先对预处理模块、合成仿真字符图像识别子模型和卡面信息区域识别子模型分别测试,然后对原型系统进行测试。测试结果表明,基于深度学习技术的社保卡光学识别模型实现了处理速度约0.5秒、准确率接近100%的卡面信息识别,因不需要专用设备、可自定义训练字库而提供了低成本、强可扩展性的社保卡读取方案,在只需要卡面基本信息的场景下有效替代专用读卡设备。客户在使用原型系统后,认可各项功能,对识别性能满意。
其他文献
抑郁症是一类普遍的精神障碍疾病,在全球范围内超过2.64亿的人深受其害。抑郁症发病的主要原因有神经递质分泌不足、谷氨酸系统的代偿失调、脑源性神经营养因子水平的降低等。抑郁症的治疗主要依赖于药物治疗,现有药物主要包括三环类抗抑郁药物、5-羟色胺再摄取抑制剂、单胺氧化酶抑制剂等,这些抗抑郁药物大多是通过直接或间接调控G蛋白偶联受体(GPCR)发挥作用,因此,以GPCR为作用靶点是开发抗抑郁药物的有效途
学位
三七[Panax notoginseng(Burk)F.H.chen],为五加科人参属植物,是我国名贵中药材。具有“生打熟补”传统功效,主要产地为云南文山地区。三七饮片被广泛应用于预防和治疗心脑血管系统疾病,是目前销售超过100亿元的饮片品种。随着科学技术的发展,新型饮片以其方便服用、生物利用度高等优点成为中药饮片发展的趋势。三七冻干饮片、破壁饮片、配方颗粒等新型饮片目前已经成为新型饮片的代表品种
学位
肝细胞癌是我国常见的恶性肿瘤之一,目前,在肝细胞癌(HCC)的治疗中,肿瘤区域的特异性靶向和可控性给药仍是一个难题。本论文介绍开发了一种由吲哚菁绿(ICG)和环糊精(CD)结合的超分子载体系统,并负载依托泊苷(EPS)作为模型化疗药物。在该体系中,ICG片段不仅可作为光敏剂用于光热治疗(PTT),并且由于其在HCC组织中的特异性保留特性,可将ICG作为靶向部分。通过体外评估,ICG-CD@EPS显
学位
【研究背景】登革病毒(dengue virus,DENV)属于黄病毒属,是一种蚊媒传播病毒,近年来引发了严重的公共卫生问题。然而目前尚无有效的抗DENV药物应用于临床治疗。因此,寻找有效的抗DENV药物具有重要的临床意义。登革病毒NS5蛋白主要由两个功能结构域组成,其中N端是甲基转移酶结构域(methyltransferase,MTase)主要负责催化病毒RNA帽子结构的N-7和2′-O甲基化;而
学位
龙陵县表面分布着大量的花岗岩,其表层风化强烈,抗蚀性较差,且地势起伏大,坡度陡,降雨充沛,土壤侵蚀极为严重,这对龙陵县的粮食生产安全和人民生命财产安全造成了巨大的威胁。本研究通过获取龙陵县降雨、土壤资料、数字高程、土地利用和遥感影像等基础数据,首先分析了土壤侵蚀因子的时空分布特征;其次运用CSLE模型估算龙陵县的土壤侵蚀模数,分析龙陵县土壤侵蚀时空分布特征及影响因素;最后通过室内人工模拟降雨试验,
学位
针对目前方法自适应控制卷烟共线系统时,由于未能依据Lyapunov函数确定系统的控制规律,导致在实施系统自适应控制时,存在控制效果差、控制误差高和控制性能低的问题,提出基于神经网络的卷烟共线分拣系统自适应控制方法。首先依据Lyapunov函数确定系统的控制规律,建立对象控制模型并使用前馈神经网络训练模型,优化控制器参数,完成控制器的设计;再利用控制器的参数建立线性和非线性2种自适应控制方法;最后通
期刊
<正>在全球经济快速发展的当今时代,加强对生态环境保护的呼声日益高涨,生态文化作为文化创意产业的一大门类随之兴起,出现了众多生态文学作品和生态艺术品,呈现“百花齐放,百家争鸣”的盛况。然而一系列问题也随之产生,层出不穷,其中出现较多的莫过于生态文化产业知识产权和版权的侵权问题,出现这一问题的原因一方面是人们的产权和版权保护意识不强,另一方面是缺乏针对生态文化知识产权和版权保护的法律,文化艺术知识产
期刊
电力属于国民经济建设的重要能源,在实际开展各项工作的过程中需要得到系统化安全化的支撑,其中电力设施作为电力系统安全运行及正常供电的基础,对人们的生活生产有着重要的意义。然而,我国对于全球范围内电力设施的精确点位信息尚未完全掌握,对于电力设施遥感目标检测能力尚未形成。互联网中存在的丰富电力设施开源数据库,虽然从中可以获取大量电力设施信息,但这些信息中不免存在错误、过时、重复等情况。近年来,数据融合手
学位
在湿法炼锌中,采用硫酸锌溶液作为电解液,阴极板为1070纯铝。但纯铝阴极板的机械强度较低,在含有氯离子的电解液中耐腐蚀性差,导致使用寿命短。铝阴极板的腐蚀还会导致表面沉积锌与铝阴极板之间黏结牢固,增加了剥离的难度同时降低了电效、提高了能耗,不利于湿法冶金的绿色节能发展。因此,研究和开发机械强度高、耐腐蚀性强且电化学性能良好的铝阴极是目前亟需解决的实际问题。与此同时,深入研究新型铝阴极板在高氯电解液
学位
电弧等离子体是一种提纯效果显著的冶金工艺,具有环境友好、提纯效率高等特点。同时,电弧等离子体也是一种制备纳米材料的方法,具有产物纯度高、效率高、操作简单、环境友好等优势。电弧等离子体提纯与纳米材料制备结合可提高生产效率、降低生产成本,符合国家高效、环保、创新的发展理念。本文以稀土金属钆(Gd)和难熔金属钨(W)为研究对象,探究了气氛、放电电流、熔炼时间和气体压力对提纯金属的影响规律,然后将纯化后的
学位