论文部分内容阅读
目前,普通话与汉语方言语音识别主要采用的是三音素的隐马尔可夫模型,其语音识别率并不是很高。以Kaldi为测试平台,通过训练得到一个含有6个隐层的深度神经网络模型,利用该模型对普通话与四川话方言分别进行语音识别。实验结果表明,深度神经网络在普通话语料库中的语音识别性能要优于三音素的隐马尔可夫模型,词错率降低11.2%。而在四川话方言语料库训练集上的识别率与三音素的隐马尔可夫模型相当。