基于Mel倒谱和Bark谱失真距离的汉语音质客观评价研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:qinling88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音研究的各个领域,都涉及到语音质量评价的问题,它早已为语音传输系统研究、设计、生产以及使用者所关心和重视。各种语音通信系统或通信网络在规划、开发、研制以及投入运营之时,都必须进行音质的评价。有效的音质评价手段除了可以评价编码器的性能优良以外,还可以用来测试信道通信质量的好坏。由于语音质量的好坏最终是由人通过人耳来评判的,因此,近代的音质评价方法主要采用的是主观评价方法。然而,主观评价只能在条件允许的情况下才能进行,而且还会受到人对音质反应的不重复性的影响。这样,人们就对音质客观评价提出了要求。 本文首先介绍了音质客观评价的发展简史。由于音质评价的研究不仅涉及到信号处理领域,还涉及到心理声学知识,因此,本文在研究音质客观评价以前,对人类的发音系统和听觉系统作了详细介绍。关于语音信号谱失真测度的研究,本文主要深入研究了Mel倒谱系数失真测度和Bark谱失真测度,并将其用于汉语连续语句语音和数字串汉语语音的客观评价,得到了比以往的谱失真测度与主观MOS更高的统计相关度。同时,针对汉语连续语句语音,作者在深入研究改进的Bark谱失真测度的情况下,提出了广义的瞬时掩蔽矩阵的概念,并将其用于该测度方法中,使其与主观MOS的统计相关度提高了1到2个百分点。对于数字串汉语语音,考虑到数字汉语语音特征的特殊性,在做短时截取的时候,借鉴了语音识别中的方法,将矩形窗代替常用的汉明窗,使Mel倒谱系数失真测度与主观MOS的统计相关度提高了接近1个百分点。最后,作者对本文的工作做了总结。
其他文献
无刷直流电机在当今国民经济各个领域得到了广泛的应用。针对无刷直流电机的参数在系统输入信号发生变化时会相应地发生变化的特性,鉴于传统的PID控制无法很好地适应参数的变
学位
合成孔径雷达干涉技术能够为地形测量提供高精度的高程信息。随着科学技术的发展,人们对高程精度的要求越来越高。由于毫米波SAR采用比常规SAR系统更短的波长,可以获得更高的
该文对两种具有实用背景的语音输入方式——数字串语音和对话电话语音的与文本无关的说话人确认进行了研究,并针对两种方法实现中的关键问题,进行了深入的研究和探讨.数字串
随着信息技术与微电子技术的快速发展,人们对计算机功能的需求也出现了多元化的趋势,嵌入式系统越来越广泛地应用到各行各业中。在一些大规模使用网络的应用领域,如证券、保
VSAT是VERYSMALL APERTURE TERMINAL的缩写,即甚小天线地球站.是80年代中期利用现代技术开发的一种新的卫星通信系统,具有灵活性强,可靠性高,成本低,组网灵活、接续方便、互
随着我国GSM用户的迅猛增长,移动网络变得越来越庞大,有两个问题变得越来越突出。一是现行GSM无线网络利用率很低,无线网络资源被严重浪费。二是由于GSM无线基站不断扩容、系统