论文部分内容阅读
目前语音信号的分析与预测都是采用线性理论和线性预测技术,而语音信号的产生系统是一个复杂的非线性时变系统,而且具有混沌性和分形特征,所以采用线性方法是不够的。因此,论文在深入研究了汉语语音信号非线性特性的基础上,结合径向基神经网络(简称RBF神经网络,Radical Basis Function Network)设计了一个非线性预测模型。论文首先对语音信号非线性预测的理论依据以及预测工具进行了分析,并研究相空间重构参数——延迟时间和嵌入维数的确定方法,针对C-C算法求解出汉语语音音素的延迟时间和嵌入维数的结果存在局限性,结合自相关算法、虚假近邻法分别求解出音素的延迟时间和嵌入维数。针对实验中采样率的选择问题,论文运用统计分析的方法进行了研究,所得结果表明不同的采样率对延迟时间和嵌入维数的影响很小。其次,在非线性理论的基础上,论文对汉语语音音素非线性特征参数的求解算法进行了研究,采用Wolf算法计算出音素的最大Lyapunov指数及GP算法求解出音素的关联维数,结果表明汉语语音信号具有混沌特性。最后论文基于汉语语音信号的非线性特征,结合RBF神经网络的分析方法设计了一个非线性预测模型。在该模型中神经网络输入层和输出层神经元个数由汉语语音音素的延迟时间的均值确定,隐含层神经元的个数由音素的嵌入维数的均值确定。仿真结果表明:论文基于RBF神经网络理论设计的非线性预测模型与线性预测模型相比,预测误差明显减小,预测性能及精度上有了提高。