论文部分内容阅读
随着各类多媒体业务的不断发展和普及,如何衡量多媒体业务的质量已经逐渐成为一个热点的问题。话音业务是多媒体通信的核心业务,它直接决定了人与人之间的沟通效率。话音信号的质量评价方法可以分为主观评价和客观评价两种,主观评价方式费时、费力,但是可靠性高,客观评价方式简单、快捷,但是准确度低。P.563算法是国际电信联盟确立的第一个话音客观质量单端评价标准,但是其算法设计存在一定的缺陷,使它的应用范围受到限制。论文从话音信号的预处理、特征参数提取、评价结果的映射模型三个方面对P.563算法加以改进,并基于RealV210开发平台实现了一套便携式话音质量客观评价系统。首先,在话音信号的预处理阶段基于频谱分布特点检测单频噪声,以提高P.563算法对含单频噪声话音的评价准确度。其次,提取能反映入耳感知特性的美尔倒谱系数,并建立未失真话音信号美尔倒谱系数的GMM模型。然后,利用GMM建立6种话音失真类型的参考模型,根据话音信号特征矢量与参考模型的距离判定话音失真类型。通过MARS技术建立从多维话音特征参数到客观评价结果的映射模型。最后,基于‘RealV210开发平台设计并实现了一套便携式的话音质量客观评价系统,他具有系统自检和实时话音质量评价两种工作模式。针对本文所构建的测试话音库,改进后算法的客观质量评价结果与主观评价结果之间的相关系数从0.44提高到了0.82,显示出良好的算法性能。