基于ANN/HMM的时序模式识别方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:qx552801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手写输入与语音输入是人机交互中最自然、最符合人类习惯的交互方式,而手写体识别与语音识别也是多模式人机交互领域中的重要研究对象。这两种对象具有一个共同的特点,那就是时序性。本文主要研究一种以人工神经网络(ANN)和隐马尔可夫模型(HMM)为基本模型的时序模式通用识别方法。ANN具有抗噪声、自适应、学习能力强、识别速度快等特点,HMM具有较强的处理时间序列的能力。因此在本文中,将HMM作为整个待识别对象的结构模型,模拟时序模式状态之间的转换。用ANN来估计信号帧在HMM状态上的概率,并模拟HMM的各个状态,对待识别对象的基本单元模型进行建模。另外,针对传统的识别模型结构简单,自适应性差的问题,本文提出了一种自动增减状态数目的模型状态优化方法。这种方法可以根据训练样本的具体情况,对建模精度不够的状态进行拆分,对冗余状态进行删除,最终达到一个合适的数量。我们以手写符号识别和语音识别为实验对象,将上述方法与传统方法做了比较。结果表明,这种方法在不降低识别率的情况下,不但可以提高建模精度,并且节省了25%的系统资源。为了将研究成果实用化,利用上述识别模型及状态优化方法,我们开发了一个简单的多模式人机交互系统,人们可以利用手写输入或语音输入向计算机发布命令,交互方式简单自然。另外,该系统具有结构简单,响应速度快,识别率高等特点。手写命令符号的识别率达到了98%,语音命令的识别率达到83.6%,已经能够初步满足一般的应用需求。
其他文献
  随着Internet规模快速增长,Internet网络结构日益复杂,因此,了解其拓扑结构和拓扑性质对于Internet的应用、扩展、性能优化、增强网络安全性等方面具有重要意义。研究人员已
随着多媒体和计算机网络技术的飞速发展,数字图像的数量正以惊人的速度增长,如何快速、准确地检索到所需要的图像成为急需解决的问题,图像检索技术的研究已成为当今多媒体技
本文在分析C/C++程序安全检查工具框架的基础上,根据安全检查的特殊需求,给出了一种基于分析器自动生成工具ANTLR构造C/C++安全检查工具前端的方法,并将此方法应用于实际开发过
中文输入法是手机的必备功能,但手机中文信息处理技术,包括嵌入有汉字处理技术在内的手机核心模块的控制权和修改权,主要掌握在国外厂商手中。在中国人使用的数亿部手机中,90
随着近年来高校信息化建设的开展,各高校的校园网络获得了巨大的发展,各高校纷纷获得“西部高校校园网络建设项目”,“日元贷款项目”,“中央与地方共建实验室项目”,等众多
生物学相关信息量的革命性的爆炸,产生了对海量生物信息进行处理的需求;而计算机技术的革命性发展,形成了处理海量生物信息的能力。于是,生物信息学便在综合计算生物学的研究
Rijndael在2000年被确定为美国高级加密标准(AES),现在已成为商业数据加密的国际标准。AES(Advanced Encryption Standard)的密码分析和应用研究已越来越受到人们的重视。由于
安全生产是煤矿安全的一个永恒话题,其中安全运输是安全生产中的一个重要组成部分。目前,国内煤矿井下都安装了视频设备,但如何充分利用这些设备提高井下机车撞人等轨道事故
现今的很多门户网站,为了满足各类用户的信息查询和浏览要求,往往都做得比较复杂;并且当不同用户访问同一页面时,看到的都是相同的内容,而忽略了用户的个性化需求。随着互联
在过去几十年无线传感器网络(Wireless Sensor Networks, WSNs)得到了快速、全面的发展,其应用领域也在逐渐扩大。求解可同时传输的链路数目问题是无线传感器网络研究的基本