基于IP网络的鲁棒性说话人识别技术研究

来源 :南京邮电学院 南京邮电大学 | 被引量 : 0次 | 上传用户:sunnus31
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音处理技术和IP网络技术的飞速发展,基于IP网络的说话人识别技术已成为将语音与IP网络融合的一种重要应用.该技术可靠性高,操作简便,易被用户接受,在网络认证等方面有着相当广泛的应用前景.基于IP网络的说话人识别系统的正确识别率会受到录音环境、背景噪声、传输信道及说话人说话方式等因素的影响.提高系统的鲁棒性,是该文的主要目标.该文对如何提高系统客户端、传输过程中及服务器端鲁棒性做了如下工作:分析了Mel倒谱各阶系数的抗噪性能,得到高阶系数抗噪性较差而低阶系数抗噪性较好的结论以便于对它们进行合理编码来突出抗噪性强的系数对识别系统的贡献;采取一种对Mel倒谱提取的幅度加权算法,使得系统的性能在SNR较低时得到较大的改善;提出只取每字前后N帧进行识别的既可提高鲁棒性又能节省计算量的方法;估测带噪语音的SNR,选择SNR大于某个门限值的语音段来提取参数,不仅可以提高系统性能还减少了流经网络的数据量;针对IP网络中数据丢失这一现象,采用交织及丢失数据替代技术对丢失的语音数据进行补偿以提高系统的鲁棒性;研究了干净和带噪语音测试时间长短对系统识别率的影响,得到系统识别率基本随测试时间增加而上升但在测试时间大于1.1秒时,带噪语音的识别率几乎不再随测试时间变化的结论;采用将注册用户分为男女两类,在识别时先判断测试音所属的类别再在该类中最终判断的基于说话人分类的识别方法,并用实验验证该方法确实改善了系统的性能.
其他文献
目的::探究产后出血治疗中子宫压迫缝合术的应用效果.方法:选取2015年3月至2016年6月期间本院收治的120例产后出血患者,采用随机分组方式,将其分为研究组与对照组,各60例.对照组,给
近几年来,移动通信在全球范围内发展迅猛,第三代移动通信系统逐渐进入商用,但仍不能满足移动用户日益增长的需要。下一代无线移动通信的目标是支持高质量高速率的移动多媒体
媒体服务器已在智能网和IP通信网中广泛应用,其类型已从基本的交互式语音应答(IVR)服务器扩展到音频媒体服务器、视频媒体服务器和会议服务器等,其技术已从基于TDM的音视频处