论文部分内容阅读
在语音识别过程中,声学模型的建立是语音识别的核心部分.目前的声学模型中的声道部分,普遍采用的是无损声道模型(也有人称为行波模型).在无损声道模型中利用流体力学的原理粗略的求解出系统的传递函数,这个传递函数是一个只含递归结构的全极点模型.然后运用线性预测(LPC)的方法求出线性预测系数来表征语音信号.但是,LPC有一个明显的缺点<[2][3]>,它基于的声道模型只是一个含递归结构的全极点模型,而实际上的声道传递函数应该采用自回归滑动平均模型,而不是简单的全极点模型因为声道响应都含有零点的影响.对于这种缺点,本文提出了一种全新的声道模型:基于透射系数的声道模型.本方法利用了物理学中声波在介质中的传播的性质.而不是传统的利用流体力学声管模型的方法.声音是由振动源引起的.在求解透射系数与反射系数时必须要解决两件事.首先,应该滤除掉语音信号中的高频干扰,因为高频成分会掩盖许多有用特征信号.第二,必须要找到声门激励和实际测到的声音信号的对应点,以便正确的求出透射系数与反射系数.在本文中,利用了数字信号处理的最新技术-小波分析,将这两件事一并解决.小波分析作为一种新的时频域兼顾的分析手段出现在1984年,在此之后,小波变换作为信号处理的一种手段,逐渐被越来越多领域的理论工作者和工程技术人员所重视和应用,并在许多应用中取得了显著的效果.同传统的处理方法相比,小波分析产生了质的飞跃.作为一种调合分析方法(兼顾时域和频域),小波技术具有十分巨大的生命力和广阔的应用前景.由于小波分析的使用,使得求取基音周期变得非常简单,并能够非常容易得找到清音和浊音的结合点(特征点).而且通过小波变换可以有效地将语音信号中的高频成分滤除掉.将经过小波处理后的语音信号作为实际要参与计算的输出信号,利用Rosenberg函数构造的三角波脉冲,作为要参与计算的输入信号.从而可以计算透射系数和反射系数.但是由于计算透射系数和反射系数非常的复杂,所以又根据透射系数和反射系数构造了一个新的特征变量.它是透射系数和反射系数的函数,当然也能够描述声道的变化.将这一新的特征变量最终用于语音识别,并能够取得预想的效果.