基于多特征融合SVM的古汉字图像识别研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:Rosa1201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
古汉字图像识别是模式识别的一个重要研究领域,鉴于古汉字识别流程具有多过程、多约束等特点,并且流程中各过程之间相互关联而容易陷入局部最优,导致识别效率不高。而支持向量机(SVM)能够在一个高维特征空间中灵活的判别边界,具有很强全局收敛性。因此,本文以支持向量机为基础方法,采用粗分类以及细分类的两层分类识别思想,对古汉字图像进行分类识别。在充分分析古汉字字形以及输入图像特点的基础上,针对不同输入古汉字图像可能引起的预处理效果的差异性,提出了具有自适应功能的预处理算法,从而屏蔽了不同输入图像带来的预处理效果的不确定性,一定程度上保证了预处理效果的有效性,同时也更好的消除了预处理阶段带入的伪特征,为特征提取环节奠定基础。由于单一的结构特征以及统计特征难以满足高质量特征提取的要求,提出了基于结构特征和统计特征相融合的多特征提取方法,即基于部件结构特征与全局点密度特征相融合的串行特征提取方法以及基于网格特征和局部点密度特征相融合的并行特征提取方法,较好满足了高区分度、高稳定性以及典型性的特征提取要求。通过高质量的提取到的特征信息建立了基于SVM的两层分类模型,即多特征串行融合的粗分类识别模型以及多特征并行融合的细分类识别模型。测试结果表明本文提出的基于分层思想的分类识别模型具有较高的识别精度。本文开发了古汉字图像分类识别系统,应用结果表明本系统具有较高的分类识别能力。同时本文提出的古汉字图像识别的方法给目前研究的较少的古汉字识别领域提供了一种新的可行的方法。
其他文献
随着互联网的发展,网络上的信息迅速增长。由于网络本身的分布性,不同的组织必然定义自己的本体来描述数据。构建者和构建方法的不同必然导致同一领域存在许多有差别的本体,这就
利用虚拟现实仿真技术进行虚拟驾驶系统的开发,可以方便地进行车辆模型的选择和模拟环境的设定,再现性好;可以一定程度上代替危险性试验,提高安全性,降低成本。Quest3D是一款
学位
云计算是分布式计算、并行计算、网格计算、虚拟化、负载均衡、网络存储等传统计算机技术和网络技术融合的产物,是基于网络的新兴技术。云计算的资源池由大量性能不同的资源
随着电子商务与网络的发展,多媒体作品和软件产品以数字格式在网络传播将成为主流。在给大家带来便利的同时,也因此带来了许多负面影响,如版权侵犯,信息篡改等。传统的加密手段在
移动机器人技术自上世纪60年代以来,经历40多年的发展已经取得了长足的进步。而在污水处理厂,由于环境恶劣,某些工作不适合人工长期工作,这就对污水处理厂的自动化作业提出了
当前各种数据都呈现海量趋势,传统数据分析已无法应对人们从海量数据中发现知识的需求,于是各种新的数据挖掘技术应运而生。用于发现属性集之间有趣联系的关联规则挖掘是数据
随着移动互联网的蓬勃发展和快速普及,各种移动应用也呈爆炸式增长。目前主流的移动操作系统有iOS、Android、Blackberry、Windows Phone和Symbian等。由于移动终端的设备类
视频监控作为智能交通系统的一个重要组成部分,在保证公路交通安全、畅通等方面发挥着巨大的作用。高效可靠的交通事件视频监控系统可以提高交通管理和交通安全部门快速的处
学位
随着色谱技术的不断发展,色谱仪正朝着微型化、快速、高通量、多功能、和其他仪器或其他工业应用软件互联等方向发展。实际上,不同的色谱厂商各自均采用自定义的通信协议进行数据传输,没有统一的协议标准,从而造成不同仪器之间或仪器和应用系统之间色谱数据信息不能很好地共享,形成了所谓的“信息孤岛”问题。本文对国内色谱数据共享问题进行了详细的分析与研究,根据分析结果和现存的数据交换技术的研究现状,提出了一套工业在