文本无关的多说话人确认研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:tommy0229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,在生物特征识别领域,说话人识别以其独特的安全性、经济性和准确性等优势受到越来越多的关注,并逐渐成为人们生活和工作中重要的身份验证方式,具有广阔的市场前景。说话人识别的一个重要研究分支是说话人确认,本文着重对说话人确认展开研究。本文从说话人确认的系统框架入手,对系统的各部分予以详细的介绍。随后针对复杂条件下的说话人确认问题,重点研究了特征提取、说话人分割、模型建立等技术。本文的主要研究工作及创新点如下:1.构建基于GMM-UBM的说话人确认系统并将其作为本文的基线系统,研究分析了影响系统性能的相关因素,包括高斯混合度、训练语音长度、得分规整技术,并通过实验进行验证。2.在特征提取方面,为了提升噪声环境下说话人确认系统的性能,本文提出了一种具有较强噪声鲁棒性的多窗谱减MFCC特征。多窗谱减MFCC是在已有多窗谱MFCC(Multitaper MFCC)基础上的改进,主要是将多窗谱估计技术与谱减法进行了结合。仿真结果表明,当测试语音中含有加性噪声时,与多窗谱MFCC提取算法相比,采用多窗谱减MFCC的说话人确认系统性能在等错误率EER和最小检测代价函数值minDCF两项评测指标上都取得了较好的结果。3.在说话人分割方面,针对传统基于BIC的说话人分割算法累积计算量大、冗余分割点过多,导致分割速度慢、分割准确度降低的问题,相关文献采用了分治算法对其进行改进,虽然改进法能够大幅提高分割速度,但准确度却有所降低。为了达到分割速度与分割准确度同时提高的目的,本文首先在具体实现BIC说话人分割算法时提出了三步分割的策略,在此基础上引入分治算法思想对其进行改进。实验结果表明,改进后的分割算法在分割速度上有较大提高,准确度上也有一定提升。4.在模型建立方面,探索研究了i-vector说话人建模技术,重点研究了i-vector的提取过程,构建基于i-vector的说话人确认系统,并将其与基于GMM-UBM的说话人确认系统进行了对比分析。
其他文献
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术因具有较高的频谱利用率和较强的抗多径衰落能力,被认为是下一代通信系统的主流技术。然而,在移动通信环境下
随着全球移动通信的用户数量的激增以及信息业务类型的迅猛发展,人们对移动通信的服务需求、要求也越来越高。智能天线作第三代移动通信系统关键技术之一,在解决这个难题上已
无线通信的发展一直强调为用户提供3A服务(Anytime, Anywhere, Any media),即在任何时间、任何地点用户通过任何介质都可以获得优质的通信服务。随着通信事业飞速发展以及移
随着人类物质生活生活水平的提高,安全问题越来越被人们所重视,用于社会和谐、生命财产安全的安防系统近年来也随之发展迅速。作为安防监控领域中的核心组成部分,异常行为检
脉冲超宽带技术作为一种新的短距离无线通信技术,具有低功耗、高带宽,低复杂度、抗多径能力强、保密性好等优点。随着计算机技术和数字信号处理技术的飞速发展,我们希望能够
随着社会的快速发展,由于互联网的出现,其带领人类社会进入了前所未有的信息时代,互联网技术以其独特的发展速度,俨然成为现代人们生活、学习和工作必不可少的一部分。现代社会中
随着城镇化建设步伐的加快与城市人口的不断增加,城市的社区住宅不断增加,建造集现代高新信息技术于一体的现代化、智能化小区已成为21世纪社区的发展趋势,社区单元门禁系统
移动通信技术在21世纪给人们的生活带来了便捷的服务,移动用户数目随之激增。然而,移动通信使用的无线频谱资源是不可再生且有限的。因此,为了缓解这一矛盾,研究移动通信系统的无
本论文针对我国自主产权的AVS标准算法视频格式,从视频采集、编码、网络传送,到视频流数据接收、解码、显示以及客户端软件的编写,特别加入了视频流媒体中间件的设计来管理客
在大数据飞速发展的今天,信息安全关系着国家的政治、经济、军事等重要战略资源。信息隐藏技术是一种解决信息安全问题的有效措施,然而,由于传统的信息隐藏技术自身的局限性,无载