【摘 要】
:
脱机手写汉字识别技术在近二十几年内的不断发展说明了两个事实:对文字识别技术的需求及其在技术上的可行性。但是手写汉字的形变问题一直是制约其发展的主要因素。本文针对
论文部分内容阅读
脱机手写汉字识别技术在近二十几年内的不断发展说明了两个事实:对文字识别技术的需求及其在技术上的可行性。但是手写汉字的形变问题一直是制约其发展的主要因素。本文针对脱机手写汉字识别这一问题进行研究,根据手写汉字四角结构基本稳定的特点,提出了一种利用汉字四角结构特征以及笔画特征点进行脱机手写汉字识别的方法。识别过程采用了粗分类细识别的策略,首先通过适合的细化算法提取汉字骨架,并利用特征点信息对细化后的骨架做简单的优化处理;然后利用四角结构特征对手写汉字进行粗分类。传统四角号码检字法能够利用基元匹配将汉字与四位编码一一对应,本文在此基础之上,以手写汉字最稳定的3个特征:拐点、交叉点和倾斜度作为区分,重新设计易于提取的特征基元以提取四角结构特征,并将特征匹配的结果作为粗分类依据。粗分类后,同一类中的汉字不同于传统意义上的相似字,它们只在四角结构上有相似之处,而整体结构则往往相去甚远,这在很大程度上降低了细识别的复杂度。最后,提取几种较简单但区分性能较好的特征作为细识别特征,并使用最小距离分类器得出汉字的内码。本文通过对GB2312一级字库中的部分手写汉字进行实验,结果证明了将改进的四角结构特征用于脱机手写汉字识别的有效性。
其他文献
随着互联网服务爆发式增长,用户对海量数据的需求加大,如何在动态网络环境中设计具有高可用性和高可靠性的分布式存储系统,已经成为热点问题。P2P技术的成熟推动了网络存储技
作为一种新型的群集智能算法,蚁群算法从20世纪90年代提出至今,被广泛应用于求解复杂的组合优化问题,如调度问题、TSP问题等,取得了比较好的效果。然而蚁群算法自身也存在着不足
SQL注入已成为数据库严重的威胁之一,目前主流的防御SQL注入的方式是采取预编译SQL以及基于特征库的过滤,但是这两种方式在实际的应用中缺乏部署的灵活性和识别的准确性。本
基因表达谱数据的分析研究对于生物学和生物信息学而言具有极其重要的意义,尤其是对基因功能与条件的关联研究尤为重要。传统的聚类方法是用相似性度量函数确定基因的相似程
随着互联网的发展,社交属性成为互联网应用中最基本的元素之一,社交网络在移动终端上也有很广阔的应用前景。社交网络服务(Social Networking Service,简称SNS)是一种综合的
高校中对程序设计类科目传统的评测方法一般都需要教师参与,具有耗时、耗力以及评测结果受主观因素影响较大等诸多弊端。如何改进传统的评测方法使得它能更加准确和高效已经
智能视频监控是计算机视觉领域一个新兴的应用方向和备受关注的前沿课题。在智能视频监控系统中,运动目标的识别和跟踪是研究的热门话题。目前,许多关于多目标跟踪的算法在实际
植物是自然界最重要的组成部分之一,与人类的生存与生活密切相关。所谓虚拟植物(Virtual Plant),就是利用计算机来模拟植物在三维空间中的生长发育过程,以可视化的方式来反映
事件是一种描述特定人、物、事在特定时间和地点相互作用的客观事实。事件抽取旨在从非结构化的自由文本中抽取出事件信息,并以结构化的形式表示。结构化的事件信息包含触发
目前,人脸检测是科学计算机研究的一个热门话题,广泛应用于身份验证、视频监视、人机交互和图像数据库的检索等领域。其中,人脸检测与定位、人脸部轮廓特征提取和人脸识别等