卷积混合语音信号频域盲分离研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:nongfeng4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音信号的盲分离成为了盲信号处理领域的一个热点问题,它在语音识别、小型移动通信设备以及远程会议方面有着广泛的应用前景。针对语音信号盲分离的方法主要有独立分量分析(ICA)方法和基于时频分析的时频掩蔽(TF Masking)方法。目前,针对瞬时混合信号的盲分离已经获得了很好的效果,而对于在实际环境中由房间的回响和各种反射造成的卷积混合语音信号,要实现分离相当困难。目前越来越多的研究采用频域上的方法来进行卷积语音信号的盲分离,该方法可以将时域上的卷积问题变换为频域上的乘积问题,这样就可以采用相对成熟的解瞬时混合的ICA方法对混合信号进行分离。与TF Masking方法相比,频域独立分量分析(FDICA)方法优点在于使分离信号的音乐噪声与谱失真较小,但收敛速度不够理想,且存在固有的幅度和次序的不确定性问题。本文将传统的FDICA方法与TF Masking方法相结合,提出了一种新的基于FDICA的卷积语音信号盲分离方法,利用TF Masking的聚类结果对FDICA做初始化,并进一步进行ICA迭代频带挑选,该方法着眼于追求良好分离性能并极大提升运算效率,同时也解决了次序不确定性问题。在此基础上,又通过搭建的多通道数据采集平台,进行了分块在线的盲分离尝试,并针对性的加入了对ICA分离的后处理优化方法,在付出极小运算代价的情况下进一步提升了语音信号分离性能,这也为后续的盲分离系统的研究奠定了基础。具体研究工作包括以下几个方面:   第一,为了加深对盲分离的理解与认知,第二章首先介绍了盲信号分离的信号混合模型和麦克风阵列模型,接着采用MLS方法进行了房间声学脉冲响应测量。第三章对ICA的基本概念、数学知识和基本算法做了较为全面的介绍,并且给出了频域卷积混合语音盲分离的概念以及基于信息最大化的FDICA基本算法。   第二,在第四章中首先回顾了基于语音时频分析的盲分离算法,为了提升传统FDICA收敛和分离性能,结合TF Masking方法,提出了一种新的基于FDICA的盲分离方法,加快了ICA的收敛速度,并在追求良好分离性能的同时极大提升了运算效率。   第三,在第五章中首先利用ASIO驱动实现了多通道同步语音采集平台,该平台将有利于进一步的盲分离研究和盲分离系统的搭建;然后对分块在线盲分离可能存在的问题进行了分析,在第四章的算法基础上提出了针对FDICA的时频掩模后处理方法,从分块在线的实验结果来看,在消耗极小运算量的情况下,后处理方法对于语音信号的分离性能有较明显的提升;经过改进后的整套算法在分离性能和运算效率方面也表现出了很好的性能。这也为后续针对实际应用的盲分离系统的搭建奠定了坚实的基础。
其他文献
日志预处理是日志审计系统中的重要过程,审计系统采集的原始日志可能在被采集前遭到篡改,这将导致审计结果出现误差,所以有必要对日志进行安全保护,并验证其完整性;其次,现在
无线传感网络是由监测区域内的大量传感器节点,通过无线通信的方式组成一个多跳的、自组织的网络系统,其目的是协作地感知、采集和处理网络覆盖区域中被感知对象的信息,并发送给
航海对于认识、开发和利用海洋资源有重要意义,航海安全是航海首要关注的问题。船舶航行时,航海人员保持正规瞭望是确保航行安全的关键因素,采用雷达进行协助瞭望是保证航海
人脸面部图像的分析和识别是当前模式识别和计算机视觉研究的热点,具有广泛的应用前景。子空间方法是当前统计模式识别的重要研究方向,已成为人脸图像识别研究的主要方法。本
频谱检测作为认知无线电的核心技术之一,可以发现没有被主用户占用的空闲频谱,是认知无线电实现的前提和先决条件。目前,频谱检测已经有很多研究成果,主要集中在两个方面:单用户本
移动通信在通信质量和传输速率等方面日益增长的需求,给未来的移动通信系统带来了极大的挑战。为了满足ITU为IMT-Advanced系统的技术需求,3 GPP提出了LTE-Advanced,旨在成为I