【摘 要】
:
在实际生活中,我们从外界获取的语音信号通常是各种声音信号的混合。对于听障患者来说,在区分环境中某一个说话人的声音时会出现困难,需要借助助听器来完成对目标说话人声音的分离与增强,这就要求在助听器中有一种能够准确分离混合语音信号的方法。盲源分离算法就是一种解决语音分离问题的常用方法。盲源分离指的是在信号源和传输通道参数未知的情况下,对观测信号进行检测,并根据其统计特性将输入信号源的所有分量分离出来。盲
论文部分内容阅读
在实际生活中,我们从外界获取的语音信号通常是各种声音信号的混合。对于听障患者来说,在区分环境中某一个说话人的声音时会出现困难,需要借助助听器来完成对目标说话人声音的分离与增强,这就要求在助听器中有一种能够准确分离混合语音信号的方法。盲源分离算法就是一种解决语音分离问题的常用方法。盲源分离指的是在信号源和传输通道参数未知的情况下,对观测信号进行检测,并根据其统计特性将输入信号源的所有分量分离出来。盲源分离最初是为了解决鸡尾酒会问题而被提出的,由于其重要的理论价值和广阔的应用前景,迅速成为各领域学者关注的研究热点。由于盲源分离算法需要迭代运算,其计算复杂度很高,不符合数字助听器低功耗与低延迟的要求。因此,将盲源分离算法应用于数字助听器中应最先解决的问题是如何降低算法的复杂度。针对盲源分离算法复杂度高的问题,本文提出了两种减少算法复杂度并提高分离性能的快速盲源分离算法,解决了当前盲源分离算法复杂度过高无法应用于实时性系统的问题。主要创新点如下:(1)提出了一种基于互信息频点筛选和非因果成分截短的快速分离算法。首先通过互信息标准选择信号统计独立性更强的频点,并通过离群值筛选将选择出的频点中相对混合参数偏离实际值的频点去除。对最终选择出的频点进行迭代运算,获得估计的相对衰减参数和相对时延参数的值来构建未选择频点的分离矩阵。然后将分离矩阵转换为时域FIR滤波器并截短非因果成分,进一步减少算法延迟。最后通过时域滤波器对混合信号进行滤波完成信号的分离。与固定点迭代算法和量化自然梯度算法结合的传统算法进行比较,实验结果表明,在无混响环境下,提出算法的运行时间仅为传统算法的10.1 5%,SIR、SDR和PESQ的平均性能分别提高了 7.69dB、9.94dB和0.11。在有混响环境下,提出算法的运行时间仅为传统算法的14.54%,SIR、SDR和PESQ的平均性能分别提高了 4.41dB、6.16dB 和 0.05。(2)提出一种基于单语音频点筛选的快速盲源分离算法。首先通过混合信号协方差矩阵的行列式标准筛选出只包含单个源信号的单语音频点,通过单语音频点中混合信号分量的比值计算出分类参数。其次使用多标准频点筛选选出分离性能最好的部分频点,用这些频点的相对参数估计值来计算分类参数。通过分离性能最好的频点的分类参数对单语音频点的分类参数进行比较和分类,单语音频点被分类为分别具有不同源信号分量的频点和未选择的频点。然后通过分类后单语音频点的分类参数计算出相对幅度衰减参数和相对时延参数,使用参数值计算出未选频点的分离矩阵并完成混合信号的分离。实验结果表明,在无混响环境下,提出算法的运行时间仅为传统算法的5.1%,SIR、SDR、SAR和PESQ分别提高了 10.1dB、12.16dB、17.07dB和0.09。在有混响环境下,提出算法的运行时间仅为传统算法的5.29%,SIR、SDR、SAR和PESQ分别提高了 3.65dB、5.14dB、15.71dB 和 0.2。
其他文献
在《中国制造2025》这一行动纲领的领导下,电力行业已成为我国走向制造业强国的冲锋号、排头兵,电力系统的安全与稳定也因此关乎着我国发展的大局。电网作为电力系统中极其重要的组成部分,承担着输送与分配电能的重要作用。由于电网的线路往往要穿越祖国大地各处的山川河流,面临着复杂多变的运行环境,在运行过程中会不可避免的因各类因素导致事故。对电网进行故障诊断是处理复杂多变的各类事故的重要前提。随着电网故障诊断
车联网是实现车与万物互联的泛在网络,为智能交通系统(ITS)中的诸多应用提供了重要支撑。随着信息技术的高速发展,新一代ITS中还将涌现大量感知、通信、计算、控制一体化的时间敏感类应用,这些应用高度依赖于情境信息的及时交互,因而对车联网中的信息时效性提出了新的要求。为此,以信息年龄为代表的时效性新度量应运而生,并正在成为车联网时严通信研究中的一项重要指标。在ITS的传统架构中,信息的交互往往通过地面
骨质疏松是一种以骨量降低、骨组织微结构恶化,导致脆性骨折风险增加为特征的骨骼疾病,常发生于绝经后的女性和老年男性。基于双能X线吸收检测法(Dual Energy X-ray Absorptiometry,DXA)的骨密度测量是骨质疏松诊断的“金标准”。但由于公众认识不足,以及基层医疗卫生机构的防治能力有限,导致DXA检测率仍处于较低水平,这严重影响了骨质疏松患者的诊断和治疗。此外,现有的研究大多基
近年来,深度神经网络在诸多计算机视觉任务中都取得了最先进的成果。然而,网络如此优异表现的背后,往往对应着复杂的结构、高达数百万甚至数十亿的模型参数。训练这些大型网络需要很高的算力和时间成本,并且过参数化模型所带来的巨额部署成本使其在移动设备端的应用受限,在实时性要求高的任务上也没有优势。知识蒸馏是一种有效的模型压缩和知识转移技术,它建立在教师-学生模型框架之上,通过让学生匹配教师模型的输出或有效特
随着信息技术的不断发展,虚拟现实、远程医疗、智能交通等兼需高信息传输速率与高计算处理能力的新型业务不断涌现。能量与计算能力受限的移动终端难以实现任务的实时处理,极大影响了用户服务质量体验。这一新挑战要求无线网络不仅可以提供高信息传输速率,还应能够提供可观的算力支持,以辅助用户高时效、低能耗的实现任务处理。为此,多址边缘计算技术孕育而生,边缘计算通过在网络边缘侧分布式的部署小型计算服务器,为用户提供
随着国家基础电力设施的日益完善,输电线路本体安全问题越来越受到重视,基于边缘计算的输电线路本体缺陷检测成为人工智能技术研究的热点。本论文重点对输电线路本体金具之间、金具与输电线路之间的连接部件上螺栓销钉缺失、绝缘子缺陷等问题的检测方法进行了研究,并开发了相应的系统,对提高电网巡检工作的高效化和可靠性有着重要意义。本论文主要研究内容如下:(1)面向输电线路本体缺陷检测算法设计。考虑到输电线路本体缺陷
课堂管理贯穿课堂教学的始终,是影响课堂教学效果的关键因素。有效的课堂管理不仅可以维持良好的课堂秩序,确保教学活动的顺利进行,还能够促进师生的交流,实现课堂互动。笔者在为期四个月的泰国汉语教学实习中,对泰国职校汉语课堂管理的困难与重要性深有体会。因此,本文选择对汉语课堂管理进行探讨,希望能够为泰国职校汉语教学实践提供有益参考。本文运用对外汉语教学、课堂管理的相关理论,结合文献,以课堂观察、案例收集的
党的十八大拉开了我国新时代的序幕,伟大梦想正在实现,伟大变革正在发生。各行各业立足新时代奋勇拼搏,取得令全世界瞩目的成就。从一穷二白到世界第二大经济体、第一大出口国,中国品牌走向世界、中国经济飞跃的背后是中国人民的拼搏奋斗,是无数企业家产业报国的不懈努力。中国经济腾飞的同时,民营企业家的社会地位有了明显的变化,从“民营企业消亡论”到“中国经济的半壁江山”,从“压榨剥削的资本家”到“有头有脸的自己人
自主导航是机器人可以应用到许多任务中的一项重要能力,是赋予机器人感知和行动能力的关键。随着计算机视觉的不断发展,基于视觉感知来完成自主决策成为机器人领域研究的热点。近年来,由于深度学习在目标检测、图像分类、语义分割等许多视觉任务上取得较大的成功,基于深度学习的导航方法也得到了广泛研究。但这类方法的局限性在于训练网络时对专家演示数据的需求量较大,或设计基于规则的控制策略时对先验知识的储备量要求较高。
随着工业制造能力和人工智能技术的不断发展,移动机器人逐渐应用在了国防、工业、农业、服务业等各行各业,这要求移动机器人能够根据周围环境进行感知,并按照路线到达最终的目标点,同时在行驶过程中能够应对各种静态、动态障碍物。因此,机器人的导航与避障问题引起了越来越多研究人员的注意。虽然在该领域已经有了许多经典的研究工作,但是其中大多数工作使用的是视觉传感器或单线激光雷达,视觉传感器对于光照等外界环境信息很