论文部分内容阅读
文化可计算的发展对数据挖掘领域产生了巨大的影响,音乐作为其具有代表性的表现形式之一,越来越成为研究的热点。在MusicXML出现之前,互联网上的音乐文件多以音频格式存在,而不同设备和不同网络之间的音乐文件交换却没有统一的标准,对音乐文件的研究成为了一个难题。而基于成熟XML技术的MusicXML,在为音乐文件提供了标准数据存储方案的同时,也为音乐可计算在数据挖掘领域的研究提供了解决方案。音乐可计算的研究离不开对于音乐特征提取的探讨。本文基于MusicXML数据进行音乐可计算的研究,改进了其部分结构,进而设计算法按照一定规则提取出音乐基因,并应用至音乐的分类与音乐的相似匹配中,主要讨论的内容包括音乐可计算的研究现状、音乐基因的提取规则及提取算法、基于音乐基因的分类及相似匹配。本文首先对国内外的音乐可计算在数据挖掘方向的研究现状进行了调研,探讨其方法和数据模型,进而针对不足之处提出了本文选题的意义。在第三章,本文改进了XML的部分结构,使其在提取音乐特征时,能够保留下更完整的旋律信息,从而得到音乐基因。文章进而将音乐基因应用至音乐的分类,在分类阶段,为了兼顾音乐基因的结构和内容,探讨了多种分类器并选择了支持向量机。实验部分探讨了不同情况下的分类准确率,结果表明,本文挖掘的音乐基因在一定程度上可以反映出乐曲的年代属性。文章的最后尝试在音乐基因下讨论音乐相似比较,综合考虑音乐基因与其XML结构,并进行相似度计算,实验比较了三类方法下的相似匹配数量,结果表明,在综合考虑音乐基因与音乐基因结构时,匹配数量虽然较少,但结果较为准确。