基于DTED-FTRLS和BP神经网络的说话人识别研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:trytry11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别,为生物识别的一种,它主要依据说话人语音中表征的个性特征,作为特征参数,从而利用各种模型方法,如动态时间规整(DTW)、矢量量化(VQ)、隐马尔可夫模型(HMM)、高斯混合模型(GMM)及人工神经网络(ANN)等等,进行识别的技术。本文是基于改进双门限端点检测、FTRLS滤波算法和BP神经网络进行的与文本无关的说话人辨认系统,其主要研究如下:(1)改进的双门限端点检测方法。文中首先介绍了两种传统双门限端点检测的算法步骤,并通过实验证实,第一种端点检测方案存在音节漏检,原因可能是由于静音或停顿时间过长,被误认为是检测结束;第二种端点检测方案受突发噪声的影响颇为严重。为了同时避免这两种传统端点检测方案存在的缺陷,本文提出了一种改进的双门限端检测方法,对比改进前后实验结果可以看出,改进后的端点检测方法将语音进行逐音节检测,并去除音节间隔静音部分,同时排除了一定突发噪声的干扰,大幅度地提高了说话人系统的识别效果。(2)提出了一种改进的FTRLS滤波算法,即找出计算误差大的量并累计,再将该误差进行反馈从而使算法更加稳定。仿真结果分析表明,改进算法提高了收敛速度和稳定性,并有效地减小了收敛后的噪声。(3)利用三层BP神经网络进行说话人识别。本文中BP网络输入层为24或36个神经元,隐含层为25个神经元,输出层神经元个数最大值为10个,并对四种激活函数Sigmoid函数、Tanh函数、ReLu函数及Leaky ReLu函数进行分析,最终与改进的端点检测和FTRLS算法结合起来进行说话人识别。实验证明,改进的算法将说话人识别率提高了约5%,而且降低了计算复杂度,增加了系统稳定性。
其他文献
本文测定了863名老年人的味觉敏感度,并调查分析了老年人的饮食习惯、烟酒嗜好、口腔内修复体与味觉改变的相关关系。结果表明:随着年龄的增长,老年人的味觉功能有所减退,所
自科技助力精准扶贫工程全面实施以来,湖北省科协高度重视,积极行动,按照中央部署和《科技助力精准扶贫工程实施方案》的要求,围绕湖北省科技助力精准扶贫工作的重点任务,精
<正>2011年,大同御东恒安街一座坐北朝南向的北魏时期的偏室土洞墓出土墓铭砖、石灯、陶壶、陶罐、铁镜、项饰、金耳饰、云母片和水滴形铜饰片等器物①。墓铭砖上阴刻"崔令珎
化工装置设备和管道的防冻设计是设备管道设计的重要内容,特别是在北方寒冷地区,经常发生因管道受冻而导致装置停车检修的现象,严重的时候还会导致设备和管件冻坏,给化工生产
在新媒体大量涌现的今天,网络文学以一种崭新的姿态走进大众的视野,作为一种新生事物,它在学生的思政教育方面具有双重作用,其一方面为思政教育工作的发展提供了新的发展契机
随着十八届六中全会的召开,通过对十八届六中全会精神的学习和深入探究,重点学习了加强党内监督以及严肃党内政治生活的内容。中国共产党带领了中国人民建立新中国,是中国社