论文部分内容阅读
随着信息技术的发展,人们的交互手段越来越多样化,对身份鉴别的要求随之越来越高。生物认证技术基于人们自身的生理和行为特征进行身份鉴别,以其独特的优势,日益显示出它的价值。声纹识别技术被认为是最自然的生物认证技术,它是一项根据语音中反映的说话人生理和行为特征的语音参数,自动识别说话人身份的技术。近年来,声纹识别技术己成为研究领域的一大热点。与此同时,这一技术也存在着许多问题,集中于怎样从语音信号中提取尽量多与身份相关且比较稳定的特征信息,以及怎样进行改进特征提取的方法,使其针对现有的特征能得到更好的识别结果。
本文所要介绍的工作是文本无关的声纹识别,声纹识别的第一步就是对语音信号进行特征参数的提取与分析,因此提取的特征参数的好坏,直接影响到识别结果。本文从语音中提取MFCC和△MFCC,并采用HMM模型的方法建立模板库进行声纹识别。
从人耳的掩蔽效应出发,人们提出了临界频带的概念和人耳的等效滤波器组。用等效滤波器组来改进倒谱系数的提取方法,就得到了MFCC。MFCC采用了一种非线性的频率单位,以模拟人的听觉系统。
MFCC是一种代表频谱的静态参数,而频谱的动态特征也被认为能够影响人的听觉感受。从MFCC对时间的一阶导数,我们得到了△MFCC。MFCC以及从MFCC推演得到的△MFCC是一种非常优越的特征参量。它们之间的权重关系我们也做了相应地讨论。本文提出了一种MFCC的改进方法,通过加权,以突出说话人特征。
隐马尔可夫模型在声纹识别中广泛使用的识别方法,关于它的研究还很多,本文采用了此模型,并通过实验表明,该模型具有较好的识别性能。