自然场景下鸟鸣声识别算法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:fang_pi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鸟类是生态系统的重要组成部分,对鸟类活动及其分布的监测,为了解一个地区的生物多样性和气候变化提供了重要的依据。鸟鸣声是区分鸟类的重要特征,鸟鸣声识别也是目前鸟类物种识别普遍采用的方式之一,通过鸟鸣声实现鸟类监测具有高效、稳定、范围广的优点,具有巨大的应用价值。在复杂的自然场景下采集到的鸟鸣声数据往往存在大量的环境背景噪声,设计一种鲁棒性高、抗噪声能力强的鸟鸣声识别方法对了解鸟类生物多样性具有重要意义。基于以上原因,本文对自然场景下鸟鸣声识别算法进行研究,研究内容主要分为三个部分:基于声学特征和机器学习的识别方法、基于深度学习网络的识别方法和鸟声识别原型系统开发。(1)针对鸟声识别算法中提取特征单一、分类准确率低等问题,提出一种联合混合特征选择与基于灰狼优化算法的核极限学习机鸟声识别方法。首先,从鸟声数据中提取声学特征集Com Par E;其次,计算每个特征的Fscore并进行排序;然后,以广义顺序向前浮动搜索为搜索策略,利用核极限学习机并采用十折交叉验证策略对特征进行优化选择,得到适用于鸟声识别的特征子集;最后,通过灰狼优化算法选择最优核极限学习机参数来识别鸟声。实验结果表明,该方法可以有效地提高Com Par E特征集在鸟声识别领域的识别精度。(2)为了增强网络对鸟鸣声信号的特征学习能力并提高识别精度,提出一种基于深度残差收缩网络和扩张卷积的鸟声识别方法。首先,提取鸟鸣声信号的对数梅尔特征及其差分系数组成Log Mel特征集,作为网络模型的输入;其次,通过深度残差收缩网络自动学习噪声阈值,减少噪声干扰;然后,引入扩张卷积增大感受野并利用注意力机制使网络更关注关键帧特征;最后,通过双向长短时记忆网络从局部特征中学习长期依赖关系。实验结果表明,该模型在噪声环境下的识别效果优于现有模型。(3)在深度残差收缩网络和扩张卷积鸟声识别方法的基础上,结合轻量级模型Mobile Net V3设计更高效的鸟声识别方法。首先,利用深度残差单元代替V3模型浅层网络中的SE模块,从而实现对噪声的抑制;然后,对Mobile Net V3网络进行裁剪,进一步减少模型参数量;最后,将利用北京百鸟数据库训练好的模型应用于搭建的鸟鸣声识别原型系统,从而实现对数据库中19种鸟类的监测。
其他文献
随着现代微波热疗、近场探测以及能量传输等领域的不断发展,工作于近场环境的阵列天线成为了当下的研究热门。在这些近场应用环境中,天线的近场分布需要根据不同的应用环境进行相应的调控。由于天线在近场区域的辐射特性比较复杂,因此针对近场区域的聚焦和赋形等问题的研究一直是近年来研究的热点。本文将研究最大化两阵列间功率传输效率的方法来解决近场区域的电磁场赋形问题,该方法是在近场的目标区域内放置多个测试接收天线,
学位
自动气象站在测量地面空气相对湿度时一般采用电容式湿度传感器,在低温或高湿等恶劣环境中,湿度传感器易产生较显著的测量误差,已成为制约湿度传感器性能提升的瓶颈问题。为提高湿度测量精度,提出一种综合利用气压控制和传感器加热技术进行误差修正的湿度测量系统。该系统包括四个湿度传感器,四个加热电阻及其测控电路系统,利用不同气压下的测量数据和有理二次高斯回归过程实现误差修正。对阵列式湿度传感器的分布设计和加热电
学位
帕金森病(PD)是一种常见的神经系统变性疾病,其经典症状为震颤和运动迟缓等。医学专家设计统一帕金森评估量表(UPDRS量表)用于评估帕金森病中运动症状,量表第23项表明可以用手指敲击来反映上肢运动症状的信息。但该量表评估病程需要依赖主治医师的主观性和经验,且早期帕金森病患者或帕金森高危人群的运动症状不是十分明显,故需要设计一种可以采集手指敲击运动相关信息的传感器来客观反应上肢精细运动,进而反应相关
学位
对科研进行准确、合理的评价是客观评估科研人员学术贡献的前提,也是促进学术界良性循环与发展的重要保障。通过对科研论文的有效评价一方面可以调动科研人员的科研积极性,另一方面,可以为科研人员提供一定的帮助并为未来的研究趋势提供进一步的指导。因此,设计合理的论文评价方法具有重要意义。其中,通过学术论文的被引用次数判断文章学术贡献是当前最为普遍的学术论文评估方式,不过,学术论文被引用次数这一指标体系忽视了被
学位
随着传感器技术的不断发展,高分辨遥感影像带来了更加丰富的空间细节信息,基于高分辨率遥感影像的建筑物检测在城市规划等领域中发挥着关键作用,同时基于震后遥感影像的倒塌建筑物检测有助于摆脱对震前数据的依赖,对及时开展应急响应具有重要的意义。目前基于高分遥感影像的建筑物检测主要分为城市场景中的建筑物检测与震后场景中的倒塌建筑物检测。前者基于形态学属性剖面的方法通过对建筑物多属性、多尺度的精细刻画,在缺乏海
学位
随着全球气候变化,极端天气事件的频率也随之增加,以足够精细的时空分辨率提供准确的气象预报变得越来越重要。其次,在一些特殊观测地区,基础设施并不完善,导致气象数据难以采集,从而缺少气象预报产品。因此,气象预报的研究有着举足轻重的意义。自神经网络发展以来,它被迅速的应用于各个领域,气象预报也不例外,众多科研家逐渐开始利用人工智能的方法解决气象预报领域中出现的问题。针对广东省降水因素复杂、偏远地区无法获
学位
近年来,随着图形处理器等硬件的更新换代,基于深度学习的图像语义分割方法发展迅速。这些语义分割方法大多基于完全监督标注,其标注的制作成本高昂。语义分割方法与弱监督学习相结合成为新的研究方向。在弱监督标注的选择方面,大多采用基于图像级别标注的类激活映射方法。本文设计相关的优化方法旨在挖掘弱监督标注和网络自身的监督信息,其主要工作可概括为以下两个阶段:第一阶段是基于等变约束的伪标注生成阶段,本文提出一种
学位
大气电场是研究雷暴云形成及发展过程的重要依据,是大气电学领域的基本参数。大气电场仪是监测户外大气电场变化的仪器设备,对雷电灾害预警和放电过程研究具有重要价值。针对传统大气电场仪存在信号调理电路复杂、芯片陈旧等问题,采用新型集成电路设计大气电场仪,并研究大气电场仪的标定和数据修正方法。主要研究内容和结论如下:(1)针对传统大气电场仪信号调理电路输出信号线性度较差、集成度不高等问题,选用新型集成电路改
学位
随着非线性动力学理论的发展,离散混沌动力学迎来了又一个研究热潮。为增强混沌映射在图像加密中的应用效果,常需要获取调控便捷、复杂度高的时间序列。忆阻器特殊非线性反馈容易引发混沌,从而已成为混沌系统构建的重要元素。本文研究具有较高复杂度的超混沌映射的建模,研究其偏置可控与多稳态属性,通过数值分析和硬件实验进一步证明超混沌映射的特殊演变规律,为超混沌映射在图像加密中的应用提供依据。本文的主要工作包括:一
学位
随着机器学习、深度学习的发展,使用带标签的数据集进行监督训练可以很好地实现各种不同的任务,在多种应用场景也有不错的效果,但面对海量的缺失有效标注信息的数据,进行数据标注需要耗费大量的人力、物力和时间成本。另一方面,用训练集数据进行训练得到的模型可能出现无法适应现实场景的问题。无监督域适应算法可以在源域与目标域样本特征分布不同但相似的前提下,将源域样本分类模型迁移到目标域,使模型适应目标域数据。本文
学位