脱机手写体汉字识别技术研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:jiesenbone23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  脱机手写体汉字识别技术有着重要的研究价值,从中我们不仅可以得到理论上的提升,它的实现还可以解决更多的实际应用问题。但是因为汉字的识别具有一些难点,如整个汉字集的规模很大,不同的人具有不同的书写风格,很多汉字之间的差别很小以及汉字具有较复杂的字型结构等,使得它在模式识别领域中一直是极具挑战性的课题。   特征提取与分类识别是汉字识别过程中的两个关键环节,本文主要是对这两个环节进行研究。本文的主要内容如下:   脱机手写体汉字识别的粗分类,通过不同的特点将汉字集分为9个子集,首先根据汉字的复杂程度将汉字分为简单字与复杂字,简单字的识别相对简单不再进行分类,接着根据直方图投影法将复杂字集分为一级可分的字集、二级可分的字集与杂合集,一级可分字集又可以分为左右字集与上下字集,二级可分字集又可分为上中下字集与左中右字集,而杂合字集可根据外边框的类型进一步进行分类。   特征的提取,首先介绍了几种简单的特征提取方法,有粗外围特征、粗网格特征、笔划密度的特征等。接着介绍了在手写体汉字识别中对小波变换的应用,通过对行列方向的小波变换的理解,提出了两种不同方向的小波变换—对角线方向的小波分析与径向加权的小波分析,三种方向的变换与弹 性网格结合,形成新的小波网格特征。最后介绍了双弹性的模糊网格特征,对用小波变换得到的4个笔画的子图像进行双弹性的模糊网格特征的提取。   用基于SVM的AdaBoost算法对简单集、混合集、左右字集、左中右字集、上下字集与边框字集这几个样本集进行训练与测试,分别采用了不同的特征提取方法,识别得到的结果与Libsvm得到的识别结果进行分析,其中,双弹性模糊网格的特征提取方法与其它特征相比具有较好的性能。实验结果的数据表明,基于 SVM的AdaBoost算法比SVM方法的正确率有所提升。
其他文献
随着科技的进步和人们生活水平的提高,身心健康成为当今社会的关注问题。通常,研究者可以通过社交感知特征客观分析和评估身心健康状态。语音信号处理是该领域重要的研究方向
煤矿瓦斯灾害是制约矿井安全生产的主要自然灾害之一,严重影响着工人的生命及财产安全,因此认识瓦斯灾害发生的规律和特征、实现瓦斯涌出量的准确预测是防治瓦斯灾害的有效手段
多示例学习(Multiple-Instance Learning)不同于传统的监督学习,在文本分类,图像处理(自然场景分类,基于内容的图像恢复等)等领域,MIL都得到了大量的应用。为了解决各种各样
本文从发动机转速测量方式的简便性和快捷性入手,提出了从汽车点烟器提取端电压信号测量发动机转速的方法,设计了硬件测试电路,通过多级带通滤波电路完成了对微弱信号的电压放大
博弈理论是人工智能领域极其重要和具有挑战性的课题,它的研究为人工智能带来了许多崭新的应用成果。当前,在对中国/国际象棋研究成果的吸收和利用的同时,研究和开发各象棋变种,
随着社会的发展,视频监控系统在人们生活中的作用越来越大,需要用到的地方也越来越多,但有的地方和场合不适合布线或者布线繁琐,传统的有线视频监控系统就不能适应,这样就需
本文通过在对光纤Bragg光栅传感技术的理论进行分析的基础上,结合模拟试验对其应用于煤矿顶板的应变检测进行研究。煤矿顶板围岩的应力是引起顶板事故的根源,光纤Bragg光栅通过
  智能交通系统(Intelligent Transportation Systems)是一个广泛的概念。基于计算机视觉、模式识别与图像处理的交通监控系统是其十分重要的组成部分。随着我国车辆工业的
对煤矿井下的复杂环境实时监测以及信息稳定传输是保证煤矿安全生产的重要因素。与传统有线监测网络系统存在成本高、铺设困难、移动性差等缺点相比,无线传感器网络(WSN)是由
未来城市人口的激增不管是在生活上还是在出行上都给人们带来了极大的不便。而悬挂式单轨交通(空轨交通)作为一种新的交通方式能够在一定程度上解决人们的出行问题。为了人们