论文部分内容阅读
从语音信号中有效地提取个人特征信息进行说话人身份的识别,是语音识别研究领域的一个重要研究方向。在身份验证、信息检索等领域,自动说话人识别都具有广泛的应用前景,其研究具有越来越重要的社会意义和实用价值。
一个人的语音受时间、环境、身体状况以及说话内容等条件的影响变化比较大,如何提取表征说话人个性的特征是说话人识别中的一个难点。常规的特征参数构造基本都是基于短时傅立叶变换,它是在短时平稳假定的基础上获取时频局部化信息,具有固有的时频分辨率,对于语音信号这种非平稳信号,存在很大的缺陷。而小波分析是传统傅立叶变换的继承和发展,是一种信号的时间-尺度(时间-频率)分析方法,具有多分辨率分析的特点,在时频两域都具有表征信号局部特征的能力,是一种时间窗和频率窗都可以改变的时频局部化分析方法。本论文详细研究了小波分析的知识,将其应用到说话人识别的特征参数提取中,并通过实验分析其性能。论文主要工作如下:
首先,研究了说话人识别的相关知识,主要包括常用的语音特征参数及说话人识别模型。其中重点介绍了LPC、LPCC及MFCC参数和本文所采用的识别模型(GMM模型)。
其次,分析语音特征参数的提取过程,通过具体实验分析了常用特征参数LPC、LPCC和MFCC在不同信噪比环境下的性能。并对主流特征进行二次处理,包括特征差分和特征组合,进一步剥离出隐藏在语音背后的说话人特征,分析其性能。
再次,研究了小波分析的原理,主要介绍了小波变换和小波包变换的知识等,并分析了其在说话人识别中的应用前景和优势。
最后,在充分比较小波变换和小波包变换的基础上,本论文选择基于小波包变换和LPCC参数进行特征提取,以提取出更多的说话人的动态信息,并进行实验分析其性能。