基于Mel倒谱技术的声纹识别

来源 :贵州大学 | 被引量 : 0次 | 上传用户:crystal_zirui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,人们的交互手段越来越多样化,对身份鉴别的要求随之越来越高。生物认证技术基于人们自身的生理和行为特征进行身份鉴别,以其独特的优势,日益显示出它的价值。声纹识别技术被认为是最自然的生物认证技术,它是一项根据语音中反映的说话人生理和行为特征的语音参数,自动识别说话人身份的技术。近年来,声纹识别技术己成为研究领域的一大热点。与此同时,这一技术也存在着许多问题,集中于怎样从语音信号中提取尽量多与身份相关且比较稳定的特征信息,以及怎样进行改进特征提取的方法,使其针对现有的特征能得到更好的识别结果。   本文所要介绍的工作是文本无关的声纹识别,声纹识别的第一步就是对语音信号进行特征参数的提取与分析,因此提取的特征参数的好坏,直接影响到识别结果。本文从语音中提取MFCC和△MFCC,并采用HMM模型的方法建立模板库进行声纹识别。   从人耳的掩蔽效应出发,人们提出了临界频带的概念和人耳的等效滤波器组。用等效滤波器组来改进倒谱系数的提取方法,就得到了MFCC。MFCC采用了一种非线性的频率单位,以模拟人的听觉系统。   MFCC是一种代表频谱的静态参数,而频谱的动态特征也被认为能够影响人的听觉感受。从MFCC对时间的一阶导数,我们得到了△MFCC。MFCC以及从MFCC推演得到的△MFCC是一种非常优越的特征参量。它们之间的权重关系我们也做了相应地讨论。本文提出了一种MFCC的改进方法,通过加权,以突出说话人特征。   隐马尔可夫模型在声纹识别中广泛使用的识别方法,关于它的研究还很多,本文采用了此模型,并通过实验表明,该模型具有较好的识别性能。   
其他文献
半导体技术的飞速发展使芯片的集成度按摩尔定律持续提高,如今可以在单个芯片上集成几亿个晶体管。这就使得集成电路的测试变的越来越复杂,也越来越棘手。常用的可测性设计技术
珙桐(Davidia involucrata)是我国特有的单型属植物,属国家一级濒危保护植物。植物功能性状(Plant functional trait)是近年来生态学研究的热点,它能够响应生存环境的变化并
后三代(Beyond3G或B3G)移动通信系统结合了MIMO和OFDM技术在提高无线链路可靠性和数据传输速率方面的优势,具有更高的传输速率、频谱利用效率和更大的系统容量,能够满足未来对
初中英语课堂多是通过听、说、读、写方面的途径来开展教学。因此写作教学是英语教学的重要组成部分之一,它意味着全面考察初中生英语运用能力的综合体现。学生写作水平越高,意
PCI(Peripheral Component Interconnect)总线是一个面向多媒体技术的流行总线,是当今个人计算机的主流总线结构,并在嵌入式计算机和工业控制计算机领域具有广泛的应用前景。PCI总线在数据带宽、功耗、抗干扰性、开放性等诸方面的优良性能使其得到了迅速的普及和广泛的应用。 随着PCI总线的广泛应用,PCI总线控制器的设计显得尤为重要。严格的总线特征和总线定义使得总线控
随着集成电路特征尺寸的不断缩小,深亚微米、超深亚微米时代已经到来。在芯片功能日趋强大的同时信号完整性问题也已成为当前深亚微米集成电路物理设计中的关键问题。 信号
皮卫星是现代航天技术中的重要研究领域。这种卫星重量轻、研制周期短、机动性强、造价与发射成本低,往往采用一箭多星和子母卫星的发射方式,在卫星轨道上形成卫星群以编队飞行
在当前快速发展的信息时代中,语音通信成为人们远距离交流最为常用和快捷的方式,但随之而来的通信安全问题已成为一个人们面临的巨大挑战。混沌系统具有初始值敏感和不可预测
学位
随着数字系统及网络对计算量和通讯速度要求的不断提高,高速串行互连技术得到了广泛应用。时钟数据恢复(Clock and Data Recovery,CDR)系统是该技术的核心模块,它一般通过锁相环