基于因子分析的与文本无关的说话人辩认方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:nd963852
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与文本无关的说话人辨认旨在通过说话人的语音而非语义信息从而辨认出话者的身份,该研究在充分利用语音识别的非接触性的基础上逐渐发展成为生物认证领域的关键技术。近年来伴随着日益复杂的网络环境以及语音传输信道的多样化,传统的说话人辨认方法已经无法适应实际的应用环境,因此说话人辨认的鲁棒性研究[1]成为当今说话人识别领域的热点。  因子分析的方法实质上是对说话人的语音提取紧凑的能够代表说话人身份的特征矢量,被称为I向量或者总体变化因子。I向量是基于联合因子分析(JFA)[2]的方法在2010年由Dehak提出的,相比联合因子分析的方法,它只需训练出一个全局变化空间,从而每个说话人的语音特征就可以利用该空间的I向量来表示。实验表明因子分析的方法能够有效地解决训练与测试环境不匹配的问题。  获取I向量首先要对每个说话人建模,文中采用LBG算法和模糊理论相结合的方法来初始化模型。由于I向量既包含说话人的特征又包含信道信息,因此对I向量进行信道补偿是必不可少的,目的是实现信道信息与说话人特征的分离。信道补偿技术包括线性区分性分析(LDA),主成分分析(PCA),类内协方差规整(WCCN),干扰属性映射(NAP)。实验中比较了不同信道补偿技术的识别性能,并且在识别过程中采用多种不同的方法包括矢量量化,对数似然度,支持向量机和余弦距离测度进行对比。结果表明信道补偿技术将LDA与WCCN方法结合,模式匹配模块采用余弦距离测度配合得分规整的系统能够达到较佳的正确识别率。最后论文对识别系统的训练和测试过程的图形用户界面进行设计与仿真。
其他文献
滚动轴承是机车车辆的关键零部件之一,其工作状态直接影响到机车的性能和行车安全。本文针对机车轴承故障征兆提取的难题,将局域均值分解(Local Mean Decomposition, LMD)和1
机械臂轨迹跟踪控制是机器人控制技术中的重要研究内容。工业机械臂是高度非线性、强耦合、模型不确定的复杂系统,且运动过程中往往具有重复性特点,如何针对机械臂系统模型和
图像拼接是图像处理研究的一个重要方向,能够很好地解决某些特定的应用领域(如医学影像分析、遥感测量等)中由于受到图像采集设备硬件条件的限制,无法采集到大视野且高分辨率
空调系统是汽车中一个十分重要的组成部分,为乘客提供了舒适的驾乘环境,然而,汽车空调系统也显著增加了汽车的能耗,对汽车的高效运行产生不利的影响。为了减少汽车能耗,本文
自进入21世纪以来,随着计算机性能和网络技术的不断提升,我们正在步入一个高速发展的信息化社会。特别是在模式识别、数据挖掘这一领域,越来越多的创新性研究与方法不断涌出,造就
随着计算机技术和因特网的迅猛发展,人类积累的数据在迅速增加,在数据极大丰富的同时也带来了信息过载等问题。数据增长的另一个趋势是非结构化文档在数据中的比重日益增大,
随着计算机技术的快速发展及其在铁路信号系统应用,系统变得日益智能化,其自身不安全性也为恶意攻击者提供了入侵铁路信号系统的机会,有可能造成不良后果和不可估量的经济损失,因
动态优化问题广泛存在于石油化工、航空航天、生物工程等诸多领域,是解决工业瓶颈,实现系统节能、降耗、挖掘、增效的重要手段。由于其实际应用价值巨大,引起了国内外众多学
示波器校准仪是一种可产生精密的正弦(稳幅、双通道)信号、方波(直流、电压)信号、时标(三角波、子刻度方波/正弦波)和快沿信号等,可校准多种模拟和数字示波器,具有通用性、程控性、先进性和准确度的信号源仪器。随着电子测试计量技术的发展,示波器的规范性、高效性得到了飞速的发展,同时示波器自身误差会对被测信号产生影响,导致严重的产品质量问题,因此对能够提供标准信号的示波器校准仪的需求越来越高,同时对丰富测
随着汽车工业的迅速发展,汽车弹簧生产制造业迎来了良好的发展势头,生产规模不断扩大,生产者除了关注生产现场控制系统的运行性能,还对信息管理、远程控制、分布式广泛感知以