基于深度学习的声目标识别方法研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户：zrn851207

【摘要】

：

【作者】

：

李旻择

【出处】

：

西南科技大学

【发表日期】

：

2020年08期

【关键词】

：

声目标识别环境声音分类多频率分辨率卷积神经网络空间注意力

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

声目标识别是声音信号处理领域的热点研究课题,致力于通过分析声音信号中所包含的复杂特征,识别其中包含的语义信息,最终实现声目标的识别。声音作为信息的主要载体之一,声目标的识别可广泛用于安全监管、医疗监护、生态系统调查和反恐防暴等领域。针对复杂环境下多种声音难以得到有效表征和噪声环境下声目标的识别较易误判且易受噪声变化影响的问题,以ESC10、ESC50和UrbanSound8K三个常用的环境声音分类基准数据库和自建数据库AUDIO-5作为研究对象,进行了噪声环境下声信号的表征和识别研究。本文主要研究内容和创新性成果如下:(1)大量阅读并分析整理了声目标识别的国内外相关研究现状,发现基于深度学习的声目标识别方法往往具有更好的识别性能,对多类别的声音具有更好的泛化能力。此外,现有的声信号特征提取方法对声音的特征表达还具有较大的局限性。通过研究有效的声信号特征表达和深度学习方法,寻找更优的特征提取方法和结构化网络模型并在声目标识别上进行实践应用。(2)针对现实环境中不同场景下的背景噪声差距较大,采用固定阈值的端点检测常出现噪声和声目标有效特征混淆从而导致检测准确度较低的问题,提出了自适应的单参数双门限端点检测方法。该方法能有效截去背景音频片段,避免了较多的背景信息干扰。(3)通过分析获知不同声音的最优频率分辨率是不完全相同的,然而现有的音频特征提取方法均是提取出具有单一频率分辨率的特征图,比如对数梅尔特征、耳蜗图特征和恒定Q变换特征,这使得复杂环境下多种声音特征的表达具有较大的局限性。针对该问题提出了一种能够兼顾多个频率分辨率的新颖的特征提取方法,由此提取出多频率分辨率特征来对声信号进行更全面的特征表达,该特征不仅具有数据增强的效果,而且还能提取出更多的时频维度上的关联信息。实验结果表明,相对现有的单一频率分辨率特征提取方法,相比现有特征提出的多频率分辨率特征在ESC10、ESC50和UrbanSound8K三个基准数据库上的识别精度分别提高了1.9%、2.3%和1.7%。(4)声信号的特征图与自然图像最明显的差别就是声信号特征图中背景信息往往比前景信息更多,这造成图像中包含了太多的无用信息从而影响对有效信息的获取。针对该问题本文利用卷积神经网络设计了具有空间注意力的高效网络模型,使得网络提取背景信息的比例逐层降低,将更多的注意力集中在前景区域上,从而减少背景噪声的干扰。该模型还能将三种多频率分辨率特征进行特征通道融合,实现声信号的更全面特征表达。实验结果表明,所提方法在ESC10、ESC50和UrbanSound8K上均达到了更高的精度,分别为97.5%、93.1%和95.3%。对于ESC10,人工在该数据集上的精度为95.7%,该精度是以前的方法从未达到的,然而,我们提出的方法比人工精度高了1.8%,比目前最新的方法提高了3.3%。在ESC50和UrbanSound8K上,本文方法比目前最新的方法分别提高了0.5%和2.3%。(5)针对噪声环境下声目标的识别较易误判且易受噪声变化影响的问题,设计了一个环境自适应的声目标识别系统。采用对声目标信号主动标定的方式,获取声目标在现实环境噪声影响下的特征信息来对模型进行自适应优化。实现了系统的软硬件设计,并将所有功能以图形界面接口的方式呈现出来。自建了数据库AUDIO-5在真实环境下全真模拟来对声目标识别系统进行验证。实验结果表明该系统具有较高的稳定性和环境自适应性。

其他文献

怒江州烟草专卖局市场稽查管理系统的研究与分析

在怒江州烟草专卖局市场稽查管理工作中,怒江州烟草专卖局市场稽查管理是怒江州烟草专卖局日常工作管理的重要组成部分,是保证怒江州烟草专卖局管理工作正常进行的关键因素之

学位

烟草专卖市场稽查管理系统需求分析UML建模

心理评量技术对骨肉瘤手术患者护理效果的影响

目的研究心理评量技术对骨肉瘤手术患者的护理效果影响。方法选取2013年3月至2016年6月间南通大学附属海安医院收治的72例骨肉瘤手术患者,采用随机数表法分为研究组和对照组,

期刊

心理评量技术骨肉瘤护理效果

元素掺杂低维SnO2基纳米结构材料磁性及发光性能调控研究

二氧化锡(SnO2)是一种典型的宽带隙(Eg=3.6V)氧化物半导体材料,因其优良的光电性能、气敏特性以及热化学稳定性在陶瓷、透明导电玻璃、发光材料、平板显示器、太阳能电池、气敏传感器、催化剂等方面有广泛的应用。构筑SnO2低维纳米结构材料并进行异质离子掺杂对Sn02的晶体结构、电子能带结构和电磁传输特性都具有重要的影响,可以进一步提升材料的热化学稳定性、改善其光电性能指标,是目前材料科学领域的研

学位

SnO2CPACP碳模板法磁性敏化发光

液压挖掘机自适应模糊滑模控制的研究与仿真

为了解决滑模控制中的抖振问题，设计了自适应模糊滑模变结构控制器．为了使滑模控制的等效控制不依赖于挖掘机工作装置的精确数学模型，引入自适应模糊控制连续逼近等效控制器，增强

期刊

液压挖掘机运动学动力学滑模控制自适应模糊控制hydraulic excavator kinematics dynamics sliding contr

阳江A房地产项目市场营销策略的研究

随着社会的发展,房地产行业发生了很大的变化。作为国家的支柱性行业,房地产曾一度成为了投资产品。房子已经不单单只是居住,更具有了投资的属性。经过了近20年的发展,一二线城市可用于房地产开发的土地逐渐减少,各大地产商开始陆续进入三四线城市。三四线城市的房地产市场由原来的卖方市场转变成为买方市场,市场竞争进一步加剧。再加上,近些年来,国家不断综合运用各种手段和措施对房地产市场进行调节和控制,房地产企业想

学位

房地产营销营销策略房地产品牌

基于CNN的SAR目标识别算法研究

SAR图像目标识别即从SAR图像中提取特征,确定目标的类别属性,具有广泛的军事与民用价值,可应用于战场监控、引导攻击、打击效果评估、海洋资源探测、环境地貌监测及自然灾害

学位

SAR图像目标识别卷积神经网络生成对抗网络SSD算法

云南大学教师对学术休假的态度研究

自“双一流”大学建设以来,大连理工大学、北京大学等等多所高校先后建立了学术休假制度,这是继中华民国之后,学术休假制度再次走进我国的大学的象征。学术休假自建立以来,就以其众多优点受到各国各大高校的热烈追捧。具体而言,它能够改善教师职业倦怠情况、提高教师创造力、增加教师知识经验、促进文化交流与融合、促进教师个人以及高校本身的深远发展。但对于我国而言,它是建立高水平大学以及“双一流”大学的有力选择。本研

学位

学术休假云大教师高校

基于深度学习的声目标识别方法研究

其他学术论文