基于MP3内容的歌手识别技术研究与实现

来源 :中山大学 | 被引量 : 0次 | 上传用户:n0131
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
歌手识别是音乐检索和分类中的一个重要分支。本文选取MP3格式的音乐作为研究对象,提取了MP3格式音乐的音素特征,对基于MP3内容的歌手识别技术进行了研究。 本文的歌手识别算法主要包括音素分割、特征抽取、相似度匹配三个阶段。首先根据MP3子带因子以及帧能量进行音素分割,然后以音素为单位根据MDCT因子进行特征抽取,将抽取后的特征与构建好的歌手特征库进行相似度匹配,并根据音素区分度计算得分,按降序排列,最后得出识别结果。 本文根据音素的帧能量特征改进了音素分割算法,并提出了反映音素不同区分度的方法,即根据各个音素特征向量与其邻近不同歌手的音素间的距离以及本歌手的音素数量等特性,进行区分度权重的分配,从而给不同的音素赋予了不同的权重,使相似度匹配阶段计算各个歌手的得分更加合理。 本文采用VC++和MATILAB编程实现了歌手识别算法,选用10名歌手的共10000个音素特征向量构建了特征库,通过音素分割准确率以及歌手识别命中率等指标进行测试和评价,实验显示,在音素分割准确率上平均提高了约32.5%,歌手识别命中率平均提高了约12%,证明了本文算法合理有效。
其他文献
在当今信息技术发展过程中,计算机已经成为人们工作、学习中必不可少的一项工具。计算机技术在其他领域的应用,不但提高了该领域的工作效率,也为计算机应用技术的发展开辟了
光纤通信技术的迅速发展,特别是密集波分复用(DWDM)技术的发展,使单波长上的数据传输率达到80Gbps,单根光纤接近Tbps,从而为利用计算机网络实现有线电视网络、电话交换网络和
惯性器件为飞行器提供位置、姿态等导航信息,是飞行器上的重要设备。惯性器件精度和特性的测试是应用中的重要问题,论文讨论了惯性组件测试评价系统的开发。论文介绍了惯性组
数据仓库的构建是一个复杂,庞大,循环往复的过程。要构建一个优秀的数据仓库平台涉及到很多技术,需要考虑很多方面。本文就数据仓库中的优化问题提出探讨。 本文首先介绍一些
给定一个有穷字符集∑,假设S是由∑中的n个字符组成的文本串,P则是由∑中的m个字符组成的模式串。模式匹配就是查找模式串P在文本串S中符合特定条件的所有出现。在巨大数据集的
基于步态的身份识别是近几年出现的一种新的生物识别技术。步态是指人们行走的姿势,步态特征是目前远距离情况下唯一可感知的生物行为特征。与传统的生物特征相比,步态特征具
转换系统作为经典的形式化模型,被广泛用于描述并发系统的行为。然而,在经典的转换系统中,标记自身所包含的结构性质并未被考虑,当考察附有特定要求的并发系统时,通常需要一
联合补充问题,是指从一个供货商那里订购多种物品,采用某几种物品联合订购的过程。在传统的库存补充模型中,研究者大都假设了主要订购费用、各物品次要订购费用、各物品单位库存保管费用等关键因素为已知常数,然后根据要求确定哪几种物品联合补充。但在实际情况中,有些影响联合补充的因素是不确定的,例如,需求量随市场波动而变化,订购提前期可能会受到运输条件的影响等,从而形成了联合补充的不确定环境。在复杂的联合补充系
通信技术是20世纪80年代以来发展最快的学科之一,也是人类进入信息社会的重要标志。纵观通信发展的语言文字通信、电通信、电子信息通信三个阶段,信息传输的安全性和保密性一直