声源定位与语音增强的研究及SOPC实现

来源 :湖南大学 | 被引量 : 0次 | 上传用户：jukai9751

【摘要】

：

声源定位与语音增强系统广泛应用于音视频通信、军事安保、人工智能、工业生产等等领域，基于麦克风阵列的嵌入式系统向大计算量、高集成度、高分辨率、低复杂性方向发展。在此

【作者】

：

郭永进

【机构】

：

湖南大学

【出处】

：

湖南大学

【发表日期】

：

2013年期

【关键词】

：

麦克风阵列声源定位语音增强 FPGA

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

声源定位与语音增强系统广泛应用于音视频通信、军事安保、人工智能、工业生产等等领域，基于麦克风阵列的嵌入式系统向大计算量、高集成度、高分辨率、低复杂性方向发展。在此趋势下，设计了声源定位和语音增强的SOPC系统。在单FPGA芯片架构下，完成了声源定位与语音增强系统的设计与实现。研究并选择了声源定位算法。分析了相位加权法（PHAT）对广义互相关函数（GCC）性能的大幅度改进，验证了联合功率可控波束-相位加权法（SRP-PHAT）的优异时延估计性能。利用SRP-PHAT法不仅可以获得相当凸显的峰值，还可以高分辨率估计声源位置，并在多声源情况下表现也很突出。选用了CFRC算法，大大降低了声源定位的计算量。研究了语音增强算法。在平衡性能和复杂度的基础上，选用自适应波束形成法作为麦克风阵列语音增强的算法。分析了自适应波束形成的通用模型-广义旁瓣消除器（GSC）的性能，发现GSC在消除相干噪声方面性能很好，而在消除非相关噪声方面表现不佳。在非自适应支路添加维纳频域滤波后的GSC，对相干噪声和非相关噪声都有很好的抑制效果。为提高GSC自适应算法的收敛速度，进行两个方面的设计：1）采用NLMS自适应算法，2）采用子带滤波器组。仿真证明，子带GSC比全带GSC，信噪比提高了约3dB。为进一步验证算法的工程表现，进行浮点数仿真的同时，还进行了定点数仿真和工程实现过程中的折中处理仿真，结果表明，算法具有现实应用性能。在Xilinx XCV5LX110T FPGA内部，设计并实现了整个系统算法，包括数据缓存模块、端点检测模块、子带GSC语音增强模块、Codec控制器、嵌入式CPU，其中嵌入式CPU内部的软件实现了对整个系统的初始化、人机交互和声源定位算法。子带GSC模块中包括时延补偿、子带滤波器组、维纳滤波、NLMS滤波等。以上各模块都经设计、优化、硬件编程、多级仿真直至板级调试。设计了系统的硬件平台。实现了满足麦克阵列信号采集要求的高精度、多通道、同步数据采集器，与Xilinx V5-LXT FPGA ML505评估平台相连，构建了系统的实现平台。ML505上，使用LCD作为定位结果显示，语音输出由音频Codec外接耳机完成。参考三维声探系统，麦克风阵列采用空间五元阵。在实验室环境下，对系统进行了测试，结果证明了系统的有效性。

其他文献

把人民群众生命安全和身体健康放在第一位

新冠肺炎疫情发生后,习近平总书记始终把人民群众生命安全和身体健康放在第一位,把疫情防控作为当前头等重要的大事,把疫情防控工作看作是一场人民战争、总体战、阻击战,并对

期刊

负群时延滤波器的设计与研究

随着微波射频通信的快速发展,传输系统对相位和信号失真度等性能的要求逐渐提高,负群时延滤波器因其特殊的性能受到越来越多的关注。但是目前为止尚未形成关于负群时延滤波器

学位

负群时延中心频率可调带阻滤波器短路耦合线信号衰减可调滤波器

基于J2EE的网上客运票务系统的研究与实现

随着互联网的发展和计算机技术的成熟，使得网上购票成为可能。通过网上客运票务系统，售票点、客运站之间的票务信息实现了共享，消费者足不出户就可以买到自己需要的车票，解决了以

学位

网上售票数据交换J2EE平台B/S结构数据传输单元

“旅游+互联网”融合发展的研究现状及前景分析

随着社会旅游行业的不断发展与进步,人们对与其领域相关的一些研究探讨逐渐提高了关注度。本文通过对旅游和互联网的简单描述,进一步讨论了二者融合发展的研究现状以及对未来

期刊

互联网社会旅游关注度领域相关计算机时代腾讯国家旅游局旅游计划百度旅游营销

张江高科的上市融资之路

我是1992年由组织调动到浦东的张江高科技园区开发公司工作的.分管财务、招商引资、综合计划等工作.不过说实在话,那时的我对高科技园区怎么做是没有概念的.于是,我们这批张

期刊

蝗虫病原菌的分离鉴定及其毒力病理研究

蝗灾是一种世界性的灾害。近几年来,由于全球性气候变化、水热季节性分配失调,人类活动加剧等原因,加重了蝗灾的发生频率和严重程度。在我国“九五”期间,全国飞蝗[Locusta m

学位

蝗虫病原菌鉴定粘质沙雷氏菌毒力组织病理

基于人耳听觉特性的语音识别及在人机交互上的应用

随着噪声的增加，机器语音识别性能急剧恶化，而人类听觉系统的识别效果却是相对稳定的，这就启发了我们从仿生的角度来研究语音识别，而基于听觉特性的语音识别研究也是目前的研究热

学位

多声源人耳听觉特性语音分离特征提取人机交互

基于以太网接口的IT CCD图像采集传输系统设计与实现

在信息技术不断发展的今天，图像采集传输系统作为一种有效获取图像信息的技术手段，得到广泛应用。本文将基于硬件协议栈的以太网接口应用于CCD图像采集传输系统中，取代了“图像

学位

图像信息采集传输系统以太网接口网络通信协议W3150A芯片电路设计

坚定信心,制胜阻击战和攻坚战

这次新冠肺炎疫情,对于中国共产党人来说,是一次危机,也是一次大考.目前,疫情防控形势积极向好的态势正在拓展,同时,湖北省和武汉市疫情形势依然复杂严峻,防控正处在最吃紧、

期刊

拉丁美洲与加勒比地区(LAC)实现清洁生产的一个主要障碍:资金限制

资金匮乏仍然是阻碍企业广泛实施清洁生产的主要原因之一.这一问题在中小企业中尤为严重,因为资金提供方往往认为投资它们比投资大企业的风险大,而收益却很小.这种状况非常不

期刊

拉丁美洲加勒比地区清洁生产障碍中小企业地方商业银行资金提供资金匮乏信贷计划比投资生产中心联合国大企业状况赞助收益绿色经验技术

声源定位与语音增强的研究及SOPC实现

其他学术论文