论文部分内容阅读
近年来语音识别技术已经逐步从实验室走入了人们的日常生活中,尤其是孤立词语音识别更是应用到了各个领域。但在实际生活中,孤立词语音识别技术仍然面临着许多问题需要解决,譬如孤立词语音识别实时性问题。本文以非特定人孤立词语音识别为研究对象,通过分析和改进现有的常用孤立词语音识别算法,有效提高了孤立词语音识别的效率。具体工作如下:1、针对DTW算法中孤立词语音模板训练速率慢的问题,本文对传统的DTW模板聚类算法提出了一种改进方案。该方案直接为孤立词语音模板训练集选择了多个合适的初始模板矢量,避免了传统模板训练过程中模板训练集逐渐分裂并增加模板矢量的过程。实验结果表明,以上改进方案可以有效减少孤立词语音模板训练的时间。2、针对DTW算法中孤立词语音识别速率慢的问题,本文对传统的DTW识别算法提出了两种改进方案。第一种改进方案将DTW识别算法中全局匹配路径限制的范围由静态平行四边形转变为动态平行四边形。第二种改进方案将DTW识别算法中测试语音特征矢量与模板矢量的匹配方式由全长度连续匹配转变为部分长度连续匹配。实验结果证明,在保证语音识别精度不变的情况下,以上改进方案可以有效提高孤立词语音识别的效率。3、针对基于HMM-GMM模型孤立词语音识别算法识别速率慢的问题,本文对基于HMM-GMM模型的识别算法提出了一种改进方案。该方案首先截取测试语音特征矢量的起始部分长度,然后保留其中部分能够有效描述截取语音的HMM-GMM模型,如此循环直至模型数量唯一。仿真结果证明,在保证语音识别率不变的情况下,以上改进方案可以大幅度减少孤立词语音识别的时间。