声源定位与语音增强的研究及SOPC实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户:jukai9751
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声源定位与语音增强系统广泛应用于音视频通信、军事安保、人工智能、工业生产等等领域,基于麦克风阵列的嵌入式系统向大计算量、高集成度、高分辨率、低复杂性方向发展。在此趋势下,设计了声源定位和语音增强的SOPC系统。在单FPGA芯片架构下,完成了声源定位与语音增强系统的设计与实现。研究并选择了声源定位算法。分析了相位加权法(PHAT)对广义互相关函数(GCC)性能的大幅度改进,验证了联合功率可控波束-相位加权法(SRP-PHAT)的优异时延估计性能。利用SRP-PHAT法不仅可以获得相当凸显的峰值,还可以高分辨率估计声源位置,并在多声源情况下表现也很突出。选用了CFRC算法,大大降低了声源定位的计算量。研究了语音增强算法。在平衡性能和复杂度的基础上,选用自适应波束形成法作为麦克风阵列语音增强的算法。分析了自适应波束形成的通用模型-广义旁瓣消除器(GSC)的性能,发现GSC在消除相干噪声方面性能很好,而在消除非相关噪声方面表现不佳。在非自适应支路添加维纳频域滤波后的GSC,对相干噪声和非相关噪声都有很好的抑制效果。为提高GSC自适应算法的收敛速度,进行两个方面的设计:1)采用NLMS自适应算法,2)采用子带滤波器组。仿真证明,子带GSC比全带GSC,信噪比提高了约3dB。为进一步验证算法的工程表现,进行浮点数仿真的同时,还进行了定点数仿真和工程实现过程中的折中处理仿真,结果表明,算法具有现实应用性能。在Xilinx XCV5LX110T FPGA内部,设计并实现了整个系统算法,包括数据缓存模块、端点检测模块、子带GSC语音增强模块、Codec控制器、嵌入式CPU,其中嵌入式CPU内部的软件实现了对整个系统的初始化、人机交互和声源定位算法。子带GSC模块中包括时延补偿、子带滤波器组、维纳滤波、NLMS滤波等。以上各模块都经设计、优化、硬件编程、多级仿真直至板级调试。设计了系统的硬件平台。实现了满足麦克阵列信号采集要求的高精度、多通道、同步数据采集器,与Xilinx V5-LXT FPGA ML505评估平台相连,构建了系统的实现平台。ML505上,使用LCD作为定位结果显示,语音输出由音频Codec外接耳机完成。参考三维声探系统,麦克风阵列采用空间五元阵。在实验室环境下,对系统进行了测试,结果证明了系统的有效性。
其他文献
随着微波射频通信的快速发展,传输系统对相位和信号失真度等性能的要求逐渐提高,负群时延滤波器因其特殊的性能受到越来越多的关注。但是目前为止尚未形成关于负群时延滤波器
随着互联网的发展和计算机技术的成熟,使得网上购票成为可能。通过网上客运票务系统,售票点、客运站之间的票务信息实现了共享,消费者足不出户就可以买到自己需要的车票,解决了以
我是1992年由组织调动到浦东的张江高科技园区开发公司工作的.分管财务、招商引资、综合计划等工作.不过说实在话,那时的我对高科技园区怎么做是没有概念的.于是,我们这批张
期刊
蝗灾是一种世界性的灾害。近几年来,由于全球性气候变化、水热季节性分配失调,人类活动加剧等原因,加重了蝗灾的发生频率和严重程度。在我国“九五”期间,全国飞蝗[Locusta m
随着噪声的增加,机器语音识别性能急剧恶化,而人类听觉系统的识别效果却是相对稳定的,这就启发了我们从仿生的角度来研究语音识别,而基于听觉特性的语音识别研究也是目前的研究热
在信息技术不断发展的今天,图像采集传输系统作为一种有效获取图像信息的技术手段,得到广泛应用。本文将基于硬件协议栈的以太网接口应用于CCD图像采集传输系统中,取代了“图像
这次新冠肺炎疫情,对于中国共产党人来说,是一次危机,也是一次大考.目前,疫情防控形势积极向好的态势正在拓展,同时,湖北省和武汉市疫情形势依然复杂严峻,防控正处在最吃紧、
期刊