【摘 要】
:
ITU-T G.723.1是国际电信联盟制定的5.3kbit/s和6.3 kbit/s双速率语音多媒体通信编码标准,分别采用代数码本激励预测(ACELP)算法和多脉冲最大似然量化(MP-MLQ)算法。虽然该标
【出 处】
:
中国科学院研究生院 中国科学院大学
论文部分内容阅读
ITU-T G.723.1是国际电信联盟制定的5.3kbit/s和6.3 kbit/s双速率语音多媒体通信编码标准,分别采用代数码本激励预测(ACELP)算法和多脉冲最大似然量化(MP-MLQ)算法。虽然该标准给出了G.723.1音频编解码器实现的参考代码,并且这些代码使用C语言进行编写,具有非常好的移植性,但是这些参考代码没有考虑到具体处理器的平台特性,并且算法本身仅仅考虑标准的清晰描述方面,并未考虑算法效率问题。从而导致算法时延大,执行效率低,根本无法应用于实际产品中。本文首先对G.723.1音频编解码器中几个重要的语音编码模块进行了介绍和深入分析,并且对G.723.1音频编解码器流程进行简要的介绍和分析。其次,由于G.723.1音频编解码器最终要在BF532处理器平台和uClinux软件平台上实现,这些平台的特性在算法优化时是必须要考虑的,所以本文也就BF532的硬件特点和uClinux软件特性进行了研究和讨论,并提出了G.723.1音频编解码器的实现与优化方案,该方案涉及了G.723.1音频编解码器的实现与移植工作,以及算法级别和程序级别的优化工作。最后,根据上述方案实现G.723.1音频编解码器并进行相关性能评测和正确性评测,使得优化后的G.723.1音频编解码器可以100%通过ITU-T的测试向量的测试。通过对优化后的G.723.1音频编解码器测试表明,本文提出的G.723.1音频编解码器实时实现的优化方案减少了编解码的时延和降低了算法的复杂度,使得编解码整体性能提升约10倍。编码一帧语音信号所需的运算量和算法时延分别为:6.3kbps下为24MIPS和12ms左右;5.3kbps下为15MIPS和8ms左右,满足技术指标和实时性要求。将优化好的G.723.1音频编解码器应用到嵌入式语音网关中,实验表明语音通话效果良好。
其他文献
血细胞显微图像处理是医学图像处理中的一个重要分支,也一直是生物医学工程研究中一个十分活跃的领域。医学上的许多发展都离不开显微图像处理。血细胞图像处理工作主要集中
随着软件规模的扩大,遗留系统问题越来越突出,软件演化问题逐渐成为今天软件工程研究的热点。软件演化过程,作为软件演化和软件过程的交叉学科,已成为了软件工程的一个关键领
随着高级编程语言和微处理器技术的不断发展,编译优化问题的复杂程度在迅速增加。现代优化编译器通常采用几十个甚至上百个优化遍来对程序进行优化以覆盖尽可能多的优化机会。
图像数据的数量正以惊人的速度增长,它在给人们带来方便的同时,也面临着如何有效地对这些海量数据进行分析、存储和检索的问题。这篇论文主要针对基于区域的图像检索系统中的相
密码技术中,在达到相同的安全强度的情况下,椭圆曲线密码可以使用较短的密钥实现。但随着计算能力的发展以及并行分布式技术的产生,暴力破解密码在时间上成为可能,我们必须使用更
在自然语言处理中,句子相似度的计算是一项重要而又十分基础的课题。它在自然语言处理中有着广泛的应用,例如,在基于实例的机器翻译中的元语言检索,信息过滤技术中的句子模糊匹配
IPTV业务融合了音频、视频和数据等多种媒体形式,是一项重要的电信增值业务。IMS是下一代网络(NGN)业务平面的核心控制子系统,基于IP多媒体子系统(IMS)的IPTV业务架构有利于
恶意代码的数量以每年超过1亿的速度在增加,给人们带来了巨大的经济财产损失,如何有效的对抗恶意代码是持续受到关注的安全问题。动态分析相比静态分析具有不受加壳、混淆等代
层序地层模拟和碳酸盐岩模拟是近年来发展起来的一项新的盆地模拟技术。本文综合考虑了盆地构造沉降、沉积物压实作用、均衡沉降、海/湖平面变化、物源供给量等因素的影响,利
随着互联网技术与多媒体技术的迅速发展,尤其是WEB2.0和3G技术的推广,每天有数以亿计的视频被上传到互联网上,视频数据呈现快速增长趋势,如何对这些海量的视频内容进行有效管