基于特征组合的说话人识别研究

被引量 : 0次 | 上传用户:bbaiing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一项根据说话人的声音信号提取出表征说话人个性的特征参数来自动识别说话人身份的生物认证技术。因其独特的方便性、经济性、准确性,被广泛应用在信息安全、通信、司法、军事等各种需要安全认证的领域。说话人识别的两个关键部分是特征提取和模式匹配,而大量的研究表明,说话人识别的问题主要是来自于说话人的特征提取上,因此,本文在对说话人识别系统的基本原理进行了分析和研究的基础上,重点研究说话人的特征提取,主要工作如下:(1)线性预测系数(LPC)和梅尔频率倒谱系数(MFCC)是说话人识别中最常用的两种特征参数,将这两种参数组合,虽然在一定程度上提高了识别率,但却增加了特征参数的维数,使得计算量加大。针对此问题,本文提出将LPC系数融入到MFCC系数的计算里的特征提取方法,该方法首先计算语音信号的LPC系数,求出LPC功率谱;然后将LPC功率谱通过三角形滤波器组,并取对数;最后将对数后的输出做离散余弦变换,得到新的特征参数:线性预测梅尔频率倒谱系数(LPMFCC)。LPMFCC参数兼具LPC参数的声道特性和MFCC参数的听觉特性,虽增加了一步计算,但不增加参数的维数,运算量相对较少。将LPMFCC方法分别应用到基于VQ和基于GMM的说话人识别系统中进行实验仿真。实验结果表明,本文提出的LPMFCC方法在纯净语音环境下在基于VQ的说话人识别系统中,较LPC方法和MFCC方法识别率能提高18.57%和10.00%;在基于GMM的说话人识别系统中,与LPC方法和MFCC方法相比,识别率也分别提高了11.72%和2.00%,在不同噪声环境下LPMFCC方法的识别性能均明显改善。(2)Mel滤波器组在低频区域分布密集,在高频区域分布稀疏,使得MFCC系数忽略了高频信息。针对此不足,采用将Mel滤波器组进行翻转,得到翻转梅尔频率倒谱系数IMFCC的方法。利用MFCC系数和IMFCC系数的互补特点,讨论MFCC和IMFCC特征的融合在系统中的应用,首先将两者分别输入到同一种分类器中,得到各自的匹配得分,然后将两者得分加权融合得到融合匹配分数,最后做出判决。通过实验仿真,验证了此方法的有效性。(3)研究说话人识别技术实用化的问题。初步实现了基于DSP的说话人确认系统,该系统以开发板上的LED灯确定说话人的身份,如果LED灯亮,表明是本人的语音,而如果LED灯不亮,则说明并不是本人的语音。
其他文献
【正】 羊年伊始,上海‘四海茶具馆’内鲜花争艳,水仙溢香,荡漾着一派盎然的新春气息。红木陈列橱内,一把把古朴典雅、款式优美的紫砂名壶,弥散出一种独特的文化情韵。难怪远
宋蒙战争爆发以后,蒙(元)军队与南宋军队在四川展开了持续近半个世纪的战争。蒙哥时期,钓鱼城依托四川的宋军山城防御体系,有效发挥了其重庆北面屏障的功能,1258-1259年的钓
随着现代教育技术的发展,媒体技术的形式也不断被丰富。可以说,在教学观念上和教学手段上,都有了很大的改观。但是仍然存在着一定的不足,例如:不重视实验教学;轻视化学史实在化
我国电子商务从20世纪90年代发展至今短短十多年,已经渗透到各行各业中,先后出现许多成熟的商业模式。2010年Alex Rampell提出了O2O概念,O2O就是顺应电子商务发展趋势而产生
外汇储备作为一国货币当局可随时利用的对外资产,在一国国际交往中具有重要作用。我国经过改革开放后三十多年的努力,逐步发展成为世界第一储备大国。但是,金融危机后,美国经
硬度是硬质合金最为重要的性能参量之一,其与组织结构之间的关系密切。许多研究者研究了硬质合金硬度与组织结构的关系并建立纯经验的或者基于合金塑性形变的理论模型。对WC-C
锅炉屏式过热器爆管是热电厂锅炉出现的主要事故之一,了解屏式过热器爆管事故的原因,搞清受热面管道失效的机理,并提出预防措施,减少屏式过热器爆管的发生是当前的首要问题。
随着社会进步及人类文明程度的不断提高,汽车正以大众化消费品的姿态进入百姓生活,有车族将更加注重汽车文化的享受。我国城镇居民已经开始从汽车代步时代向享受汽车文化的时
交通运输的快速发展给人们生活带来便利的同时,也给生态环境带来了严峻的挑战。如何实现运输环境的净化,运输与物流的可持续发展,运输资源的充分利用,运输效率的有效提升等是
目的:研究住院患者、肠道门诊腹泻患者、健康体检者三个不同人群肠道中肺炎克雷伯菌的携带状况、毒力基因、耐药性及其分子流行病学特点。方法:采集三个目标人群新鲜粪便标本接