【摘 要】
:
随着音乐数据的增长,基于内容的音乐信息检索已经迫在眉睫。在音乐信号中对多种乐器进行分类识别,是音乐信息检索领域的一个重要研究课题。传统的乐器识别工作大多针对单音音乐中的乐器识别和复音音乐中的主要乐器识别。受限于数据集和有效的分类特征,复音音乐中多乐器识别的工作并不多。卷积神经网络在图像识别中得到了突破性的应用,很多工作已经使用卷积神经网络对时频谱图的特征进行提取和学习。同时,最近帧级数据集的发布,
论文部分内容阅读
随着音乐数据的增长,基于内容的音乐信息检索已经迫在眉睫。在音乐信号中对多种乐器进行分类识别,是音乐信息检索领域的一个重要研究课题。传统的乐器识别工作大多针对单音音乐中的乐器识别和复音音乐中的主要乐器识别。受限于数据集和有效的分类特征,复音音乐中多乐器识别的工作并不多。卷积神经网络在图像识别中得到了突破性的应用,很多工作已经使用卷积神经网络对时频谱图的特征进行提取和学习。同时,最近帧级数据集的发布,也为多乐器识别问题提供了新的思路。本文通过合成数据集来扩展网络模型的可用数据量,从乐器的乐理知识出发提取关键特征,构建了符合认知逻辑的两级分类模型,提出了基于卷积神经网络的音乐信号多乐器识别方法。本文的主要工作如下:(1)调研了众多数据集,并引入了三个具有帧级标签的数据集。受其启发,我们也构建了自建数据集来增加数据规模。我们从专业平台获取了真实世界演奏的原始音频和相应的MIDI数字乐谱,选择基于动态规划的动态时间规整算法来把MIDI乐谱上的标签注释对齐到原始音频上。(2)从乐理知识和信号处理的角度出发,以音高特征和常数Q变换作为网络的输入特征。首先,提取音高特征时,我们使用了人工设置参数的滤波器组来提取音频的初级特征,减少了传统端到端网络的参数量,有效减少过拟合的风险。然后,我们结合十二平均律的乐理知识引入了常数Q变换。在提取音频的常数Q变换矩阵时,先按每个八度进行变换再汇总,减少计算时间。(3)进行特征处理后,提出了三个分类模型并进行分类实验。基准模型通过对比实验,证明音高特征对识别的正相关性,并探究了识别不同乐器时应该关注的谐波数量。基于注意力网络的分类模型,借鉴了人类听觉注意力的特性,提升了主要演奏乐器的识别分数和全部乐器的整体识别精度。两级分类模型分为第一级分类模型和第二级分类模型,第二级分类模型由三个残差网络组成,分别单独训练用来专门识别弦乐、管乐、打击乐,也就是第一级分类模型先进行乐器族的粗分类,在粗分类的基础上第二级分类模型再利用专门的乐器族分类网络进行某种乐器的细分类,最后把分类结果汇总,这种方法识别分数和整体精度最高。
其他文献
近些年,我国房地产市场价格普遍快速攀升,同时,房价在不同城市间的差距非常之大,政府出台了一系列措施来抑制房价上涨,但效果都有限。由于房地产开发火热,我国的土地开发面积
<正>南京市夫子庙小学是一所百年名校,是全国唯一一所以"夫子"命名的学校。学校在孔子教育智慧的启迪下,以教育部重点课题《传承孔子教育思想:深化小学素质教育的校本研究》
非物质文化遗产是民族文化的结晶,是从地方民族生活中提炼出来的,有属于自己的文化空间。我国的非物质文化遗产承载着社会文化发展历史,包含着特有的民族精神。从文化意识的
随着党的十八届三中全会提出发展普惠金融并将其作为一项国家战略,政府把关注小微企业成长提到了前所未有的高度。小微企业是我国实体经济的重要组成部分,商业银行与我国的实体经济之间存在共生关系,小微企业是这种关系中最重要的一部分,发展小微企业信贷是商业银行应该承担的社会责任。本文在总结前人研究成果、阐述相关理论的基础上,分析小微企业信贷产品创新的动因、产品创新的历程和当前国有商业银行与股份制商业银行小微信
在心理学领域,理解人的心理需求一直是研究者广泛关注的问题。对于需求的探讨一般从其静态的结构和动态的功能这两个角度开展。首先,不同的理论对个体需求的结构提出了各自的
本报喀什1月4日电:元旦期间,驻守在帕米尔高原上的新疆喀什边防支队排依克边防派出所教导员谭鹏飞,正带着边防官兵在瓦罕走廊巡逻……这是远在千里之外的支队指挥中心通过边防
人工地层冻结法已广泛应用于地铁隧道工程,相对于其它施工工法而言,人工地层冻结法具有较大的技术优势,能适用于各类复杂的地质条件。但地铁隧道冻结法施工期地层的冻胀现象一直以来都是工程中所关注的焦点。本文对人工地层冻结法在地铁隧道工程中的应用现状以及地铁隧道冻结期地层冻胀的研究现状进行了综述,并对冻土成分及形成过程、冻土热物理参数、力学特性、冻胀机理及分类进行了叙述。本文以地铁双线隧道水平冻结施工工程为
<正>农户信贷约束现状及其原因分析一、对400户农户信贷行为的调查和实证分析当前我国农村经济发展中存在着严重的信贷约束,农户"贷款难"是影响农户生产、扩大再生产的最主要
目的:探讨将Nlite激光联合微电针除皱应用于面部年轻化美容的临床效果。方法:对皮肤松弛或皱纹明显的面部老化者,联合应用Nlite激光和微电针进行除皱治疗。结果:63例面部皮肤老
目的探讨引导性路径护理在妇产科腹腔镜术后患者中的应用效果。方法选取2016年7月~2018年7月瑞金市人民医院收治的60例腹腔镜手术患者作为研究对象,按照随机数字表法将其分为