论文部分内容阅读
随着计算机和语音识别技术的发展,使《汉语普通话水平测试系统》的实现成为可能。《汉语普通水平测试系统》旨在利用人机交互优势,解决现今普通话人工测试的一些缺点。实验证明,利用计算机进行普通话测试有利于统一测试的不足,推广普通话。主要是在对现有语音识别技术进行研究,尤其是在对汉语语音识别技术研究的基础上完成普通话水平测试系统中双音节词测试的设计与实现,系统涉及到语音信号的采集、预处理、特征提取、模型的训练和匹配以及普通话水平的评价方式等。主要研究工作和取得的成果如下:分析一般语音识别系统的结构及所用到的各种理论技术,讨论语音识别系统中涉及到的基本概念及原理,包括语音识别单元的选取、预处理、特征参数的提取、模式匹配及模型训练等技术。对语音识别中各种特征参数的提取方法进行了系统的研究,特别是对反映语音倒谱特征的LPCC和MFCC的提取方法进行了深入的探讨和分析,并对它们进行了仿真实验。深入地探讨了连续概率密度隐马尔可夫模型(CDHMM)的基本原理和识别算法的理论基础和处理方法,且根据实际需要分析得出本系统所用的数学模型的理论根据和可实现性,并给出了算法的具体实现步骤。分析已有类似系统的评分方式,结合目前普通话测试的评分模式改进得出适合本系统的评价方式。在Microsoft Visual Studio 2008和MATLAB 6.5平台上,利用VC++和Matlab实现了汉语普通话中双音节词水平测试系统,并对其进行了测试。本系统主要解决的是双音节词的测试。通过实验测试证明了此系统能够完成预期功能,并通过比较同一个人的两次测试结果,以及不同人的测试结果来判定系统的效果。