【摘 要】
:
说话人识别属于生物认证技术的一种,是一种根据语音波形中反映说话人生理和行为特征的语音参数来识别说话人身份的技术。在生物认证技术领域中,说话人识别技术以其独特的方便
论文部分内容阅读
说话人识别属于生物认证技术的一种,是一种根据语音波形中反映说话人生理和行为特征的语音参数来识别说话人身份的技术。在生物认证技术领域中,说话人识别技术以其独特的方便性、经济性等优势受到世人的关注。在保安、公安司法、军事、财经和信息服务等领域,都有着广阔的应用前景。正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中。使得说话人识别方面出现巨大发展。但它还远远没有成熟。本文以MFCC特征参数作为识别的特征矢量集。运用矢量量化(VQ)和高斯混合模型(GMM)技术实现与文本无关的说话人识别。本文的主要工作有:1,在特征提取部分,详细阐述了语音产生的数学模型,线性预测分析原理和LPC、MFCC特征的提取过程。2,介绍了说话人识别的不同方法,主要介绍了矢量量化技术,其实质是在一个多维特征矢量空间中,用少数的几个特殊的点来代表空间中全部的有效点,以达到压缩、识别的目的。还介绍了高斯混合模型(GMM)的理论和应用。3,对各个系统的性能进行了研究,在VQ模型中,研究了码本尺度对系统性能的影响和阈值的选取问题。在GMM模型中,研究了高斯混合模型的阶数和帧长度对系统性能的影响。最后对本文工作进行了总结,同时对未来的研究工作进行了展望。
其他文献
图像是人们生活中交流最为重要的载体,也是蕴含信息量最大的媒体。数字图像的数据量非常庞大,必须经过有效的压缩才能满足数字图像的高速传输和存储。因此,图像压缩技术对信
随着互联网的快速发展,社会媒体越来越被广泛使用,成为人们生活方式的一部分。通过社会媒体积累的数据也因而正经历着爆发性的增长。通过挖掘社会媒体文本获得信息,相比于社
近年来,随着计算机处理能力的提高和对彩色图像应用的增加,彩色图像分割受到越来越多研究者的关注。彩色图像分割方法可以被看作是灰度图像分割方法在彩色图像上的延伸,但很
随着互联网技术的飞速发展,网络安全变得日益重要。在计算机网络犯罪手段与网络安全防御技术彼此较量不断升级的形势下,单靠网络安全技术打击计算机犯罪不可能非常有效,因此
本文以电信服务开通系统(Service Process System,SPS)的系统架构及其周边接口的分析设计作为SOA(Service-Oriented Architecture)思想在具体系统中的应用研究的一个重要切入
基于图像的公路路面病害自动识别与分类,一直是图像处理和模式识别领域的一项挑战性工作,其对公路养护工程具有很大的指导作用。本文的背景科研项目为南京理工大学江苏省自然基
惯性导航系统作为一种现代化导航系统已经广泛地应用到各类飞行器中,在现代军事航空领域发挥着举足轻重的作用。惯性测试评价平台主要是对惯性器件的特征参数进行测试和评价
人脸识别技术是计算机模式识别领域非常活跃的研究课题,而特征抽取是人脸识别中最基本的问题之一,因此能否抽取人脸图像有效的鉴别特征也成为人脸识别技术的关键问题。典型相
随着网络带宽的增加和高速局域网的普及,已有网络取证系统由于数据捕获和分析能力的不足造成大量信息丢失,削弱了证据的说服力和法律效力。深入研究网络取证相关技术,设计并
随着计算机的普及和数据库系统的巨大成功,各种数据库系统以前所未有的速度开发出来并在各行业得到广泛应用,使得事务处理变得更加准确、高效,积累的数据更是以指数级的速度