论文部分内容阅读
嗓音是由声带和声道的共同作用产生,其质量取决于两者。研究表明声门上喉管的声道对嗓音病理有明确的影响。本文研究声道面积估计及其在病理嗓音识别中的应用。 从声道滤波器中估计声道面积,会受到声门波信号的干扰和非理想边界条件的影响。为了最小化这些因素产生的干扰,本文提出了一种声门闭相下衰减加权线性预测估计声道面积的方法。针对现有嗓音特征对病理嗓音识别细分工作存在的局限性,以声门闭相下获得的声道面积函数为基础,提取声道面积特征参数,进一步研究正常嗓音与病理嗓音的识别以及不同病理嗓音之间的细分。具体研究内容如下: (1)提出衰减加权线性预测估计声道面积的方法,在不减少分析数据量的基础上,削弱声门开启相的影响,同时强调声门闭相的作用。将声门闭相下数据点的预测误差权重设置为1,衰减开相下数据点的预测误差权重,将其设置为一个正的极小值,然后在所有数据点加权均方误差最小的条件下求解预测系数。根据声道滤波器模型和声管模型的等效,递推得到反射系数与声道面积的函数关系,最后迭代计算声道面积函数。计算同一段语音数据的声道面积,结果表明,与核磁共振获得的标准声道面积比较,VTA-HPV(vocal tract area-half peak value)的归一化均方误差为0.15,本方法VTA-WLP(vocal tract area-weighted linear prediction)估计的面积均方误差为0.03,表明本方法估计更为准确。 (2)提出了WLPAP(weighted linear prediction area parameters)特征向量组,从VTA-WLP获得的声道面积函数中提取出反映各类异常嗓音的声道面积特征参数,构造基于声道面积特征的识别系统,将量化的不规则声道面积用于研究正常嗓音与病理嗓音(声带小结与声带息肉)的识别与细分。对本文提取的WLPAP特征参数进行相关性和差异性分析,表明正常和病理嗓音声道参数间存在差异,辅助病理嗓音识别并进一步分类声带小结与声带息肉疾病。本文提取的声道面积特征能够实现最高 97%的细分准确率,在正常嗓音与病理嗓音的识别效果上,本文提出的系统获得了99.21%的准确性。 本文为声道面积的估计及病理嗓音的识别研究提供新的思路和方法。