论文部分内容阅读
本文对与文本无关的说话人识别进行研究,研究内容主要有以下几个方面:在预处理阶段,采用语音信号的短时能量与短时过零率想结合的方法对其进行端点检测,提高了端点检测的准确率.在特征提取阶段,首先用主成分分析的方法对梅尔倒谱系数(MFCC)进行改进,然后再与反映说话人声道特征的基音周期相结合构成新的语音特征参数.此外,对新的特征参数进行了性能分析,分析结果表明了新的特征参数表征说话人的能力比MFCC稍强.在识别阶段,通过个人建立语音库将改进的特征参数用于高斯混合模型,并基于最大后验概率的方法对说话人进行判决,最后进行仿真实验,实验结果表明新的特征参数用于说话人识别比MFCC的识别率稍高.本文所有算法都能够编程实现.仿真实验结果表明,算法效果良好.