论文部分内容阅读
说话人识别是一项根据说话人的声音信号提取出表征说话人个性的特征参数来自动识别说话人身份的生物认证技术。因其独特的方便性、经济性、准确性,被广泛应用在信息安全、通信、司法、军事等各种需要安全认证的领域。说话人识别的两个关键部分是特征提取和模式匹配,而大量的研究表明,说话人识别的问题主要是来自于说话人的特征提取上,因此,本文在对说话人识别系统的基本原理进行了分析和研究的基础上,重点研究说话人的特征提取,主要工作如下:(1)线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)是说话人识别中最常用的两种特征参数,将这两种参数组合,虽然在一定程度上提高了识别率,但却增加了特征参数的维数,使得计算量加大。针对此问题,本文提出将LPC系数融入到MFCC系数的计算里的特征提取方法,该方法首先计算语音信号的LPC系数,求出LPC功率谱;然后将LPC功率谱通过三角形滤波器组,并取对数;最后将对数后的输出做离散余弦变换,得到新的特征参数:线性预测梅尔频率倒谱系数(LPMFCC)。LPMFCC参数兼具LPC参数的声道特性和MFCC参数的听觉特性,虽增加了一步计算,但不增加参数的维数,运算量相对较少。将LPMFCC方法分别应用到基于VQ和基于GMM的说话人识别系统中进行实验仿真。实验结果表明,本文提出的LPMFCC方法在纯净语音环境下在基于VQ的说话人识别系统中,较LPC方法和MFCC方法识别率能提高18.57%和10.00%;在基于GMM的说话人识别系统中,与LPC方法和MFCC方法相比,识别率也分别提高了11.72%和2.00%,在不同噪声环境下LPMFCC方法的识别性能均明显改善。(2)Mel滤波器组在低频区域分布密集,在高频区域分布稀疏,使得MFCC系数忽略了高频信息。针对此不足,采用将Mel滤波器组进行翻转,得到翻转梅尔频率倒谱系数IMFCC的方法。利用MFCC系数和IMFCC系数的互补特点,讨论MFCC和IMFCC特征的融合在系统中的应用,首先将两者分别输入到同一种分类器中,得到各自的匹配得分,然后将两者得分加权融合得到融合匹配分数,最后做出判决。通过实验仿真,验证了此方法的有效性。(3)研究说话人识别技术实用化的问题。初步实现了基于DSP的说话人确认系统,该系统以开发板上的LED灯确定说话人的身份,如果LED灯亮,表明是本人的语音,而如果LED灯不亮,则说明并不是本人的语音。