基于内容及风格的离线手写汉字鉴定算法研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:TimRealler
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于未知人员手写文字进行计算机识别与分析,基于其内容与书写风格进行分类,进而鉴定书写人类别是一项困难的任务。本文从图像风格信息和文本语义信息两个角度进行离线手写汉字鉴定算法研究。图像风格信息通过笔迹鉴定算法提取,文本语义信息通过字符识别和文本分类的方法提取。首先,鉴于深度学习中卷积神经网络模型在图像识别与分类中的出色性能,本文的笔迹鉴定和字符识别算法采用卷积神经网络模型进行研究;而文本分类采用传统的向量空间模型和主题模型进行研究。接着,构建手写汉字鉴定算法文本图像数据库,验证鉴定算法有效性。最后,提出采用乘法规则,对图像风格特征和文本语义特征进行信息融合,提升算法鲁棒性。本文的主要内容有:1.针对卷积神经网络中不同大小的卷积核提取图像信息层次不同的特点,提出采用多级卷积特征提取结构代替卷积神经网络中的第一个卷积和下采样层。增强网络的特征提取能力,并分别在离线中文笔迹鉴定和字符识别卷积神经网络模型上进行改进验证,提升模型鉴定和识别正确率。2.将改进后的字符识别HCCR-GoogLeNet模型,应用于文本无关离线中文笔迹鉴定领域,获得端到端方法最佳性能。3.对比向量空间模型和主题模型在文本分类上的性能,提出将LatentDirichlet Allocation模型应用于匿名信分类场景。4.构建离线手写汉字鉴定算法文本图像数据库,验证基于风格和基于内容的鉴定算法有效性,并采用乘法规则对二者结果进行融合,提升鉴定算法鲁棒性。通过本文的工作,可以为匿名信文分类问题提供有效的处理算法,可以极大减少人工分类的工作量。同时,基于内容和风格的离线手写汉字鉴定算法中的相关改进模型及其融合策略,可以为其他类似问题,诸如画作风格学习、古文献鉴定等提供新思路。
其他文献
随着电力通信高速宽带化发展,电力系统光纤主干网已延伸至变电站,能提供足够的带宽满足信息化和自动化的需求。然而,从变电站到用电需求侧,缺乏经济、高效、统一的通信手段。窄带
射频识别(radio frequency identification,RFID)技术以其准确、高效、快速、便捷的性能成为当今备受青睐的高新技术之一,在物流、交通运输、食品安全、供应链管理等各行各业
通信信号的分类与识别是截获信号处理领域的重要研究课题,它需要在有噪声干扰的复杂环境中判断出信号的调制模式,为下一步的分析处理环节提供坚实根据。战术电台网络是美国军
近年来,移动通信技术迅猛发展,而对于移动台位置信息的需求也相应加大。无线网络定位,可以利用现有的通信网络,既可以减小资金投入,又可以获得位置信息。无线网络定位技术,包
随着朔黄铁路运输需求的逐年增加,提高重载列车空载车辆的运行速度是提高重载铁路运输效率的一种有效方法,但列车提速后由于垂向力的减小易发生脱轨事故。为通过实验研究各种
随着人们对GPS依赖程度的增加,GPS的安全性问题逐渐凸显出来,因而需要分析各类干扰和偏差对定位性能的影响。除了使用传统宽带或窄带干扰信号外,发送带有虚假导航电文信号的G
色散渐变光纤(DDF)是一种新型的特种光纤,其色散值随着光传播的方向不再是一个常数,而是逐步递减,从而抵消掉光纤的非线性效应,由于其独特的性能,色散渐变光纤在光纤通信中有
  火灾预警技术经历了一个多世纪的发展,正朝着分布化、无线化、智能化的方向不断发展。当前,广泛使用的总线制火灾报警系统已经暴露出许多问题,包括系统的灵活性和实时性差,虚
目前,强力输送带已广泛应用于矿山、港口码头、发电厂、钢厂、水泥厂等场所。随着煤矿工业的发展,综合机械化程度的不断提高,生产能力的不断增强,强力输送带已成为煤炭生产中的主