论文部分内容阅读
近年来伴随互联网以及多媒体技术的发展,数字音乐资源呈现爆发式增长。面对海量的互联网音乐资源和越来越丰富的应用场景,通过音乐标题、艺术家名字等传统数据组织方式已经无法满足所有的需求。音乐标签是一组用于描述音乐中高层次信息的关键词,可以有效地组织音乐资源,实现快速检索和高效管理,具有重要价值。可以将音乐标签作为音乐的属性信息补充到音乐知识图谱中,并进一步运用到基于知识图谱的对话式音乐搜索系统等上层应用中。本文主要研究基于文本的音乐标签标注,包含以下研究工作:在音乐主题标签标注中,本文设计了一种主题分类模型,针对传统静态词向量语义表达能力有限的缺点,模型通过预训练语言模型BERT(Bidirectional Encoder Representations from Transformers)得到歌名和歌词的向量表示,并使用注意力机制加权各层Transformer的[CLS]向量得到全局信息;针对传统的CNN结构感受范围小的缺点,模型使用能扩大感受野的IDCNN(Iterated Dialated Convolution)对BERT的词向量进一步编码得到局部信息,在特征融合层面将全局信息和局部信息进行拼接后使用全连接层进行分类。实验证明,该模型相比其他基于静态词向量的深度学习模型效果更佳,平均F1值达到69%。在音乐情感标签标注中,本文设计了一种情感分类模型,针对词语的情感极性能辅助指示文本情感倾向的特点,该模型先使用外部的情感词典构建歌名和歌词的情感向量,再使用字词联合方法将其与BERT得到的词向量结合得到融合情感信息的词向量;针对情感分类依赖语序信息,而BERT模型中的位置编码提取词序能力欠佳的缺点,模型使用能捕捉长距离顺序依赖的Bi GRU(Bidirectional Gated Recurrent Unit)提取双向上下文语义信息,还引入attention机制提升重点情感词对分类的影响。实验证明,加入情感信息和使用attention机制均能提升情感分类的性能,模型的平均F1值达到72%。基于以上研究,本文设计并实现了一个音乐标签标注系统,可以为曲库中的歌曲预测音乐标签,该系统生成的歌曲标签可以作为歌曲属性补充到音乐知识图谱中,从而作为数据支撑服务于某音乐公司的线上对话式音乐搜索系统。