基于二叉树多层分类SVM的手写体汉字识别方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:caiqigang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字识别的研究工作一直被认为是具有重要理论意义和实践价值的模式识别问题,并被视为字符识别研究的最终目的,脱机手写体汉字识别是当前模式识别领域的一个研究热点。支持向量机是一种专门研究有限样本预测的学习方法,SVM算法是建立在结构风险最小化原理基础之上发展成的一种新型结构化学习方法,能很好的解决有限数量样本的高维模型的构造问题。因此,将SVM理论运用于脱机手写体汉字的识别有较大的理论意义和实用价值。论文的主要工作如下:1)汉字繁杂度和结构度的划分。采用基于像素点密度法将汉字分为简单字和复杂字;采用基于水平和垂直投影直方图与连通域相结合的方法将汉字分为独体字和非独体字。2)二叉树支持向量机构造。针对脱机手写体汉字识别中复杂模式多分类问题,在应用二叉树和SVM理论的基础上,构造了手写体汉字分类的二叉树结构支持向量机模型,进行粗分类,以支持向量机工具箱为实现手段,成功实现了对多种类型(简单、复杂、独体字、非独体字等)的分类。3)手写体汉字识别算法。通过多种特征提取方法的组合提取手写体汉字图像特征的方法,根据每类字的不同特点,采用不同的特征提取方法进行特征提取,利用SVM“一对多”的方法对每个类细分类识别。实验结果表明,本文采用二叉树SVM粗分类与“一对多”SVM细分类结合的分类识别方法,可以充分发挥SVM在二类分类问题方面相对于单一SVM方法的优势,在解决脱机手写体汉字复杂多分类识别问题上,能有效的提高分类精度和速度。
其他文献
目的探讨结肠癌以急腹症为首发表现时诊断治疗和误诊误治、漏诊漏治的原因。方法回顾性分析154例结肠癌中呈急腹症表现40例的诊断及治疗经过。结果 40例结肠癌均经手术治疗,
医疗保障是当今世界社会保障体系中最重要的项目之一。随着社会的不断变迁,医疗保障问题也受到了人们的极大关注。西方国家较早进入了工业化和城市化,医疗保障制度建设相应也
糖尿病下肢血管病变是糖尿病较常见的大血管并发症,是糖尿病患者下肢难愈合溃疡及截肢的主要原因,并且国内外研究表明糖尿病合并下肢血管病变发生率较高,因此下肢血管病变的
目的冠心病(Coronary Heart Disease,CHD)即冠状动脉粥样硬化性心脏病;心绞痛和心肌梗死是其典型症状。半个世纪以来,冠心病已经成为威胁人类健康的最严重的疾病之一。其经典
本文以江西贵溪冶炼厂周边地区(苏门村)的土壤、植物为研究对象,选择人们较为关注的五种重金属污染物(Cu、Cd、Pb、Zn、As)及当地较为典型的农作物(茄子、辣椒、花生等)和野
目的研究姜黄素对心肌梗死大鼠心肌ROS、MDA与P-AKT/AKT的表达情况。方法选60只成年雄性SD大鼠,随机分为对照组(control,n=15)、手术组(MI,n=15),溶剂组(solvent,n=15)和药物
拓展训练是诞生于二战时期的一种培训手段,拓展源自教育,根植于教育,为教育服务,在现代高等教育中被越来越多地应用到社会科学的教学之中。从拓展训练历史的展开,讨论了拓展
最优化理论与方法是一门应用相当广泛的学科,它主要研究在众多方案中选择最佳方案,因而被广泛而深人地应用于经济管理、工程及最优控制等领域,例如:解决许多工程设计、资源分
<正> 蜂蜜的营养价值很高,是天然的甜味添加剂,具有吸收湿度并保持其湿度的能力,对面包等烘焙食品能在一定程度上有防止其干燥的作用。据统计,要酿成一磅蜂蜜,需要550只以上
职业教育是现代教育的重要组成部分,是国民经济与社会发展的重要基础。是工业化和生产社会化、现代化的重要支柱。改革开放以来我国职业教育取得了历史上前所未有的辉煌成就,