基于MP3内容的歌手识别技术研究与实现

来源 :中山大学 | 被引量 : 0次 | 上传用户：n0131

【摘要】

：

歌手识别是音乐检索和分类中的一个重要分支。本文选取MP3格式的音乐作为研究对象，提取了MP3格式音乐的音素特征，对基于MP3内容的歌手识别技术进行了研究。本文的歌手识别

【作者】

：

王凯

【机构】

：

中山大学

【出处】

：

中山大学

【发表日期】

：

2008年期

【关键词】

：

歌手识别 MP3格式音素

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

歌手识别是音乐检索和分类中的一个重要分支。本文选取MP3格式的音乐作为研究对象，提取了MP3格式音乐的音素特征，对基于MP3内容的歌手识别技术进行了研究。本文的歌手识别算法主要包括音素分割、特征抽取、相似度匹配三个阶段。首先根据MP3子带因子以及帧能量进行音素分割，然后以音素为单位根据MDCT因子进行特征抽取，将抽取后的特征与构建好的歌手特征库进行相似度匹配，并根据音素区分度计算得分，按降序排列，最后得出识别结果。本文根据音素的帧能量特征改进了音素分割算法，并提出了反映音素不同区分度的方法，即根据各个音素特征向量与其邻近不同歌手的音素间的距离以及本歌手的音素数量等特性，进行区分度权重的分配，从而给不同的音素赋予了不同的权重，使相似度匹配阶段计算各个歌手的得分更加合理。本文采用VC++和MATILAB编程实现了歌手识别算法，选用10名歌手的共10000个音素特征向量构建了特征库，通过音素分割准确率以及歌手识别命中率等指标进行测试和评价，实验显示，在音素分割准确率上平均提高了约32.5％，歌手识别命中率平均提高了约12％，证明了本文算法合理有效。

其他文献

英语口语考试系统的设计与实现

在当今信息技术发展过程中,计算机已经成为人们工作、学习中必不可少的一项工具。计算机技术在其他领域的应用,不但提高了该领域的工作效率,也为计算机应用技术的发展开辟了

学位

口语考试语音采集文件上传题库管理

SUPANET中基于EPF的信令机制研究

光纤通信技术的迅速发展,特别是密集波分复用(DWDM)技术的发展,使单波长上的数据传输率达到80Gbps,单根光纤接近Tbps,从而为利用计算机网络实现有线电视网络、电话交换网络和

学位

SUPANETEPF信令UNI信令NNI信令SVL

惯性组件测试及其在地空拦截仿真中的应用

惯性器件为飞行器提供位置、姿态等导航信息,是飞行器上的重要设备。惯性器件精度和特性的测试是应用中的重要问题,论文讨论了惯性组件测试评价系统的开发。论文介绍了惯性组

学位

惯性组件测试地空拦截HLA分布式仿真

数据仓库性能优化之物化视图选择算法研究

数据仓库的构建是一个复杂，庞大，循环往复的过程。要构建一个优秀的数据仓库平台涉及到很多技术，需要考虑很多方面。本文就数据仓库中的优化问题提出探讨。本文首先介绍一些

学位

数据仓库性能优化物化视图选择遗传退火算法动态调整

压缩后缀数组构造算法的改进

给定一个有穷字符集∑，假设S是由∑中的n个字符组成的文本串，P则是由∑中的m个字符组成的模式串。模式匹配就是查找模式串P在文本串S中符合特定条件的所有出现。在巨大数据集的

学位

压缩后缀数组构造算法文本索引字符串查找模式匹配BWT变换

基于步态的人体身份识别

基于步态的身份识别是近几年出现的一种新的生物识别技术。步态是指人们行走的姿势,步态特征是目前远距离情况下唯一可感知的生物行为特征。与传统的生物特征相比,步态特征具

学位

生物识别步态识别Zernike矩小波矩主成分分析

基于Institution理论的结构化转换系统的研究

转换系统作为经典的形式化模型,被广泛用于描述并发系统的行为。然而,在经典的转换系统中,标记自身所包含的结构性质并未被考虑,当考察附有特定要求的并发系统时,通常需要一

学位

转换系统模态转换系统结构化标记集部分互模拟共变-逆变模拟Institution理论

不确定环境下联合补充问题研究

联合补充问题,是指从一个供货商那里订购多种物品,采用某几种物品联合订购的过程。在传统的库存补充模型中,研究者大都假设了主要订购费用、各物品次要订购费用、各物品单位库存保管费用等关键因素为已知常数,然后根据要求确定哪几种物品联合补充。但在实际情况中,有些影响联合补充的因素是不确定的,例如,需求量随市场波动而变化,订购提前期可能会受到运输条件的影响等,从而形成了联合补充的不确定环境。在复杂的联合补充系

学位

联合补充问题不确定环境随机模拟遗传算法迭代算法

基于BB84量子密钥分发协议的量子密码通信系统研究

通信技术是20世纪80年代以来发展最快的学科之一，也是人类进入信息社会的重要标志。纵观通信发展的语言文字通信、电通信、电子信息通信三个阶段，信息传输的安全性和保密性一直

学位

量子密码学量子密钥分配协议BB84协议通信效率身份认证

基于MP3内容的歌手识别技术研究与实现

其他学术论文