基于支持向量机的电话语音/铃声分割方法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:baoyw00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言是人类所特有的也是最重要的交际手段,随着科技的发展,在现代社会,电话逐渐成为人们日常交流和感情沟通的重要手段,电话语音的识别研究也就相应变得越发重要起来。   电话语音/铃声分割在电话语音识别中占有重要地位。本文所进行的研究首先判断电话语音中是否包含有具体的通话信息,如果仅仅是电话铃声,则直接将其略去,如果语音中同时还包含有对话部分,则再将电话语音中的铃声和对话部分分割开。这样在进行电话语音识别时,可以省去对大量无意义的电话铃声的处理,只对通话过程中的人声进行识别,从而降低了语音处理的难度,这对于电话语音的说话人识别和确认有着重要的意义,在安全、信息检索等领域都有广泛的应用。   本文使用基于不同核函数的支持向量机作为电话语音/铃声分割的基本方法,采用的语音材料是包含有语音/铃声的固定电话录音。实验提取语音样本的Mel倒谱系数作为特征参数,用以对支持向量机进行训练和识别。   本文提出了一种基于支持向量机的电话语音/铃声分割方法,并重点介绍了一种对特征参数进行归一化处理的技术,而且通过语音样本进行了实验。实验结果表明,对特征参数作归一化处理之后,识别率平均提高了25.77%,这说明本文提出的特征参数归一化方法能显著的提高识别率,是非常有效的,同时,对基于不同核函数的支持向量机的对比实验表明,基于径向基核函数的支持向量机对于电话语音/铃声分割问题具有最好的性能。   
其他文献
视频包含了最丰富的信息而与此同时也意味着它需要巨大的存储容量和存在着复杂的语义内容。用传统的手工索引和顺序查找方法在大量的视频数据中查找所需的视频片断是一项繁琐
论文以“863-704主题”项目“空间实验室高级在轨系统(AOS)关键技术研究及演示验证”为背景,对空间实验室数据管理系统的部分关键技术进行了详细地分析与研究,具体工作内容如
高可用性集群技术是一项使得系统能够无间断响应外界服务请求的技术,它在关键性事务处理领域应用非常广泛。在对计算机高可用性技术进行说明的基础上,详细阐述了高可用性集群
近年来随着计算机及其计算机通信技术的快速发展和全球信息化步伐的日益加快,现代计算机网络作为信息社会的基础设施已渗透到社会的各个方面。网络管理的重要性也与日俱增。首
随着《电子签名法》的正式实施,数字签名将在电子商务中得到广泛的应用。协议是数字签名在电子商务中实施的技术基础,因此,必须完善与数字签名相配套的协议。 本文根据Dol
本文的主要研究目的是实现基于网络及OpenInventor的虚拟多机器人协同的仿真控制系统。该系统包括基于虚拟现实的多机器人可视化协同搬运子系统和立体视频传输子模块,能够完成
异构数据库集成是近年来数据库界的研究热点。本文主要对异构数据库集成系统的设计和实现做了系统全面的研究。提出了一种基于三层体系结构的异构数据库集成系统(HEDIS)。该
对低质量指纹图像进行高效的增强处理,以保证指纹细节特征的准确提取与比对,是指纹识别技术中很重要的一个方面。近几年随着指纹技术的发展,大量的指纹档案以图像文件的形式
保持结构性(Structure-Preserving, SP)签名与Groth-Sahai非交互式证明系统(简称GS证明系统)的结合,在密码学协议的模块化设计中有十分重要的作用,尤其在保护隐私的匿名性协
无线网络技术和流媒体应用技术是现今最流行、发展最迅猛的两项因特网技术,它们的出现为信息的传播与交流带来革命性的变化,也对人们的生活产生了深远的影响。随着3G时代的即