语音活动检测的算法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:mimidong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动电话和网络电话由于其普遍性和实用性,已成为现代通信中不可或缺的工具,人们对语音质量的要求也越来越高。由于背景噪声和传输距离使得语音质量降低的现象很严重,须采取相关措施对其进行改善。语音活动检测(Voice Activity Detection,简称VAD)方法主要用于检测出一段谈话中语音部分的端点,其结果可用于语音的压缩编码,语音增强,语音识别,语音合成等方面。 早期的语音活动检测方法是基于启发式或模糊规则实现的,但是这些方法使得优化相关参数和取得一致结果变得相当困难。近年来有一些基于Ephraim和Malah提出的统计模型的VAD方法,取得了不错的成果,算语音和噪声功率谱时采用Welch法或是周期图方法,但用周期图法算功率谱时得到的方差较大,信号的一致性差,而Welch方法只是比较适合用来算语音的能量谱密度。 本文在基于统计模型的基础上,提出用最小统计法算噪声能量谱密度的平均。最小统计法是基于这样两个事实实现的:1.语音和干扰噪声通常是统计独立的;2.一段含噪语音信号的能量会逐渐降低到干扰噪声的能量。因此可以算出一段含噪语音的最小能量谱密度,用来作为噪声能量谱密度的平均。这种方法更适合于用来算噪声谱密度的平均。另外,本文提出了用SNR自适应Hangover法减少VAD算法判决结果的误判率。以往的HMM Hangover方法过于复杂,基于VAD的Hangover法比较简单,但是由于它是基于最后判决结果的Hangover,其精确度受到影响,特别是在低信噪比条件下,效果很差。而基于SNR自适应的Hangover法从语音和噪声信噪比开始把关,减少VAD判决结果的误判率,其结果明显优于基于VAD的Hangover法。 本文的创新点是:用适合噪声谱估计的最小统计法算噪声能量谱密度的平均,精确门限值,另外提出了一种基于SNR自适应的Hangover算法,既易于实现,又在信噪比较低的情况下比现有的Hangover算法更加精确。
其他文献
随着航天航空技术的发展,越来越多的航天航空器在太空工作,宇宙中存在各种射线的辐射,将使航天航空器上电子器件的性能和参数发生改变,对航天航空器的正常工作产生影响,同时暴露在
2019年12月6日,纯碱期货在郑州商品交易所上市交易.中国石油和化学工业联合会副会长李彬在上市仪式上表示,纯碱期货上市后,一方面可以通过期贷的远期价格引导机制,帮助企业更
期刊
噪声是环境污染中影响最为广泛的一种,存在于人们的各种各样的生活中,给人们造成生理上和心理上的危害,不但会干扰正常的生活和工作,还会使听觉器官受损,听力下降,影响情绪,更严重的是引发神经系统等方面的疾病。当无法在声源和传输过程中对噪声进行控制时,就需要对个体加以防护,因此,各种噪声计或个体噪声剂量计应运而生。目前,市场上的噪声测量仪表大都是针对专业人员设计的,对现场作业人员而言,操作难于掌握,输出内
本文通过对荣华二采区10
期刊
本论文的研究对象是血液中的两个重要蛋白质:凝血因子Ⅴ(humancoagulation factorⅤ)和纤溶酶原激活剂抑制剂2(plasmigogen activator inhibitortype2,PAI2)。这两个蛋白质具
数据管理是无线传感器网络中的重要组成部分,而数据存储与查询技术则是数据管理的核心部分。这一技术负责将数据以高效、易获取的方式存储,并对用户提交的查询进行优化。合理的
学位
随着Internet的普及和信息技术的飞速发展,全球经济一体化趋势不可逆转,企业市场竞争日趋激烈。如何进一步提高客户服务水平,不断提高客户满意度和忠诚度,保持业务持续增长和市场
太赫兹波是指频率在0.1THz-10THz的电磁波,在电磁波谱上介于红外线与毫米波之间,是当前国际上倍受关注的前沿技术。太赫兹波具有瞬态性、相干性、穿透性、吸水性、低能性等特
学位