基于压缩感知的语音信号压缩重构研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:huamin1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是实现人们沟通交流的最高效和方便的手段。随着移动通信和人工智能设备的不断发展,所产生的海量语音数据对信号带宽的要求越来越高,并且海量数据的传输和存储给现有的通信系统带来了巨大的压力。传统的语音信号的采样遵循奈奎斯特定理,采集的信号中有很大的冗余,近年来发展的压缩感知理论利用信号的稀疏性,采用低于奈奎斯特采样的速率无失真地采样信号,采样的同时进行压缩,极大地降低了传输中所需的数据量,节约了存储和传输空间。随着压缩感知理论在信号处理领域的广泛应用,也必将会对语音信号处理领域带来巨大的变化。  本文详细介绍了压缩感知理论和语音信号处理的相关知识,研究了基于压缩感知的语音信号处理技术。本文的主要工作内容和创新如下:  1.详细描述了压缩感知的理论体系,对信号的稀疏表示、观测矩阵以及重构算法进行详细阐述,着重研究了常用的信号稀疏字典、构造观测矩阵的基本原则和不相干性准则。  2.介绍了DCT字典下的语音压缩感知框架,采用高斯随机矩阵作为观测矩阵,使用OMP算法对语音进行压缩重构,研究了不同压缩比下的语音信号重构效果。  3.根据语音信号自身的特点,运用线性预测分析的思想,构造了适用于语音信号的LPC稀疏表示字典。与传统的DCT字典相比较,LPC字典是根据语音信号的自身特征构造而成,其稀疏逼近效果优于传统的固定字典。除此之外,还分析了含噪语音在压缩感知框架下的性能表现。  4.研究了压缩感知系统中观测矩阵的优化设计,对Michael Elad提出的降低感知矩阵的互相关性的优化算法和Abolghasemi等人提出的基于等角紧框架的观测矩阵优化算法进行重点探讨,并对Abolghasemi的优化算法进行改进并应用于语音压缩感知系统。实验结果表明,改进的基于等角紧框架理论进行观测矩阵优化的语音重构质量优于其他同类算法。
其他文献
自从3G放号以来,中国移动已经在全国大部分城市推动发展TD-SCDMA业务,全国TD用户已达上千万。目前,TD网络已经升级到了HSPA,为了进一步地满足人们对于高速数据业务的需求,存在着两
随着现代科技的飞速发展,全方位视觉技术已经成为机器视觉领域的一个新的研究热点,在民用、军事、医学等方面都得到了广泛应用。鱼眼镜头凭借其超大的视场角、结构紧凑、不易损
随着大数据时代的来临,海量数据背后的重要信息吸引了越来越多人的关注。因此,为了满足科学研究和知识决策的需求,推进社会信息共享,拥有数据的一方常常会将数据向第三方发布。然
IEEE802.16m作为移动WiMAX的演进技术,不仅继承了WiMAX的宽带接入方便以及移动性好的特点,而且接入速度有很大的提高。2010年10月ITU在重庆召开的会上将IEEE802.16m作为4G的两
图像分割是图像处理过程中的关键步骤,就是把图像划分成若干个具有各自独特性质的区域并从中提取出我们感兴趣的区域。对于如何快速有效地提取出目标区域一直受到广大学者的关
水声通信网络作为水下信息系统的重要基础设施,在海洋环境感知、水下目标监测等领域正发挥着不可替代的作用。但由于水声信道频带有限,造成水声通信系统易受到其他水声系统以
无线传感网络和电子科学技术的进步,使得基于压电材料的压电振动能量采集器得到了迅速的发展,将其和低功耗元件相结合之后,广泛的应用于无线传感网络和微电子设备中。  和传统
随着无线通信技术的迅速发展,频谱资源的需求日益增加。本来就十分稀缺的频谱资源成为了制约通信领域发展的一个主要瓶颈。事实上,占据大量频谱资源的授权频段的频谱利用率非常
汉语连续数字语音识别在现实中具有非常广泛的应用前景,在电话与电信系统的自动语音拨号、身份证号码证实、智能家电中用于电视频道和空调温度的遥控等多方面都有着重要的应
多输入多输出(Multiple-Input Multiple-Output,MIMO)雷达是近年来新兴的一种雷达体制。利用MIMO雷达多通道观测的优势对飞机、导弹、舰船等运动目标成像,能够克服传统成像技术