基于深度模型的脱机手写体汉字识别研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:lulu6661125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写体汉字识别在残疾人无障碍阅读、文献自动翻译、文献自动录入、金融单据的处理、快递包裹和信件的分拣等领域有着广阔的应用前景,帮助使用者自动录入文字,节省劳动力成本。它涉及机器学习、模式识别、数字图像处理、人工智能、自然语言处理、统计学、信息论等多门学科。由于每个人的书写习惯不同、汉字笔画粘连等因素,脱机手写体汉字识别是中文OCR领域最具挑战性的问题。因此,本文提出基于深度学习的脱机手写体汉字识别方法。针对无遮挡的手写体汉字图像,本文采取基于深度卷积神经网络的分类算法,直接使用预处理后的图像数据作为分类器的输入。针对深度卷积神经网络容易过拟合的特点,本文提出滑动窗口和弹性形变的方式等扩充训练数据集,提升模型的鲁棒性和泛化能力。本文使用多个不同结构的卷积神经网络对手写体汉字图像进行分类,然后将其融合,进一步提升模型效果。针对古籍扫描和手写稿件扫描中出现的文字破损、文字被污迹遮挡等情况,提出基于深度递归网络和深度信念网络的有遮挡的手写体汉字的识别方法。首先使用两个深度递归神经网络从有遮挡的汉字图像和无遮挡的汉字图像中提取高层抽象特征,然后训练深度信念网络将有遮挡手写体汉字的特征空间转换到无遮挡手写体汉字的特征空间,接着用深度玻尔兹曼机进行分类,最后添加深度卷积网络隐含层提取的特征改善识别准确率。实验结果表明,本文提出的无遮挡手写体汉字图像识别算法和有遮挡手写体汉字识别算法均具有较好的识别效果。
其他文献
随着互联网的迅速发展,获取信息资源变得更加方便和快捷,同时抄袭也变更得加容易。就计算机专业而言,因其工程实践性的特征几乎完全可采用计算机进行教学与考核,从而导致作业
集合选择是分布式信息检索系统的重要组成部分。利用文本语义信息来度量查询与集合的相关度是提高集合选择准确度的一个有效途径。本文从文本的语义表示入手,提出一种基于分
测试数据生成是软件测试过程中最重要的一环。如何在有限的时间及资源条件下生成尽可能有效的测试数据是一个具有重要理论意义和应用价值的课题。手工生成测试数据需要耗费大
下料问题就是将一系列形状各异的小零件在大的原材料上进行合理的几何组合,切割下料,确定下料方案,使得给定原材料的利用率最高,以达到节约材料,提高效益的目的。从数学计算复杂性理论看,优化下料问题是具有很高计算复杂性的NP完全问题,对于大规模的下料问题,不但人工排样无法做到真正的优化,即使采用计算机也必须开发高效的算法,才能达到较高的材料利用率。根据空间划分,下料问题分为一维、二维、三维,其中二维下料的
随着Web2.0时代的到来,视频网站得到了快速发展。视频已成为人们获取信息的重要途径,但是,大型视频网站上日益增多的视频在给用户带来很多选择的同时,也迫使用户不得不花费大
随着信息技术的发展与Internet应用的普及,越来越多的场合需要用到网络信息审计系统来对通信内容进行审计,特别是公众场合的信息安全问题亟待解决。与入侵检测系统与防火墙相比
随着网络规模的日益庞大和复杂化,如何提供有效的、高质量的信息传输服务,满足现代社会多元化的需求,是计算机网络服务质量保证的重点研究内容。文中运用随机网络演算理论中的随
数字图像恢复技术作为数字图像处理中的重要分支,被认为是适应数字化时代的一个有力支撑,并成为数字图像领域的一个研究热点。数字图像恢复技术是指在针对退化降质的图像,通过框
经过近五十年的发展,人脸识别技术已有了长足的进步,并成功应用到许多领域。但当一些如光照、表情、姿态等外界条件不理想时,算法性能下降较快。因此,如何降低这些干扰因素对
CRM (Customer Relationship Management,客户关系管理)可以泛指企业获得和维持可带来业务收益的用户群的各种技术平台,在国外已相当成熟,而在国内CRM行业还处于成长时期,随