论文部分内容阅读
基于麦克风阵列的声源定位技术在军用与民用系统中有着广阔的应用前景,是声音信号处理领域的热点研究问题。目前声源定位精度受多方面因素影响,本文针对传统的声源定位系统中采集电路采集到的声音信号易受噪音和混响的影响,提出采用运动传感输入设备Kinect中集成的小型线性麦克风阵列采集音频信号,实现高精度的声源定位。 首先研究了基于最大输出功率的可控波束形成的源定位、基于高分辨率谱估计的源定位和基于时延估计的源定位三种定位原理;研究了麦克风阵列声源定位的远场与近场模型的划分标准,详细比较了两种模型下定位的关联与区别;分析了基于时延估计的源定位中经典的麦克风阵列模型,给出了直线阵、圆阵、双直角三角形阵和四方阵模型的定位理论与推导公式;以广义互相关的时延估计法、互功率谱相位时延估计法、最大似然时延估计法、倒谱预滤波时延估计法和最小均方自适应时延估计法为例讨论了时延估计源定位中时延获取的方法;分析了泰勒级数法和Chan算法两种非线性定位方程的解法。 其次采用Kinect的麦克风直线阵,结合微软公司开放式的Microsoft KinectSDK库与Visual Studio开发平台构建了声源定位系统的采集系统。然后利用Kinect中的四个麦克风接收音频信号,并通过调用SDK库中消噪函数实现对采集到的音频信号去除环境噪音与混响,最后得到可直接应用于时延估计算法的较干净的四通道音频信号。 采用MATLAB软件,对互相关(CC)、相位变换法(PHAT)、最大似然估计(ML)和平均平方差函数(ASDF)进行了仿真,对比研究了在仅存在高斯白噪音与实际环境噪音两种情况下声源定位时延估计的性能,并讨论了在这两种情况下不同信噪比(SNR)对于定位性能的影响。 在实测实验部分,应用构建的实验系统在实测环境采集音频信号,并通过互相关、相位变换和最大似然估计获取时延,从而获取声源位置,并和实际结果比较。为了分析不同声源位置(不同距离、不同角度)的定位精度,对实测环境中十四个不同位置进行声源定位实验,实验结果表明由Kinect的麦克风阵列和Microsoft Kinect SDK库构建的采集系统具有良好的去噪性能,能有效地抑制了环境噪音与混响,使得定位系统具有较高的定位精度。