论文部分内容阅读
针对传统的基于人工标注的文本音乐分类存在人工标注成本高,易于出错,没有涉及到音乐本身的内容的问题,提出了一种基于音乐内容的分类方法,将深度学习中的长短时记忆网络(LSTM)应用到音乐流派分类中。从包含10种音乐流派的1000首歌曲中提取出梅尔倒谱系数,频谱质心和频谱对比度三个特征,将提取出来的特征数据输入到LSTM网络中进行训练,输出每种音乐类别的概率。对此,进行了三次实验。第一次是将梅尔倒谱系数,频谱质心作为特征数据输入到LSTM网络中,第二次是以频谱对比度和频谱质心作为特征数据,第三次是将梅尔倒谱系数