【摘 要】
:
说话人识别,是指通过从说话人的语音波形中提取表征说话人的特征参数,从而达到自动识别说话人的身份,其核心技术是特征提取和模式匹配。说话人识别具有广阔的应用前景,比如身
论文部分内容阅读
说话人识别,是指通过从说话人的语音波形中提取表征说话人的特征参数,从而达到自动识别说话人的身份,其核心技术是特征提取和模式匹配。说话人识别具有广阔的应用前景,比如身份认证,安全保密,门禁等系统。 从待识别的语音内容分类,说话人识别可分为文本相关、文本无关和指定文本三种;从说话人的发音方式可分为连续的和孤立词的。特定文本的孤立词说话人识别系统被作为分析和研究的对象。 首先从信号处理的角度,对说话人识别的基本理论部分进行了分析和研究,包括语音信号的产生模型,预处理,端点检测等。在语音信号端点检测处理中,改进了传统的双门限检测算法。在检测之前使用谱减法去噪音,并且通过试验确定了自适应的门限阈值,提高了端点检测的准确性和说话人识别效果。 在特征提取方面,美尔倒谱系数作为一种能够比较充分利用人耳对不同频率信号的灵敏度不同的感知特性参数得到了广泛的应用。提取最能体现说话人特征的美尔倒谱系数及其改进的一阶差分参数,并结合在一起形成新的特征参数,这种参数比单纯的美尔倒谱系数能更好的反映说话人的特征。在模式匹配方面,对动态时间规整、矢量量化和隐马尔科夫模型进行了比较和研究,采用混合高斯隐马尔科夫模型作为本系统的识别算法。 最后用Matlab和VC++6.0软件相结合实现了一个简单的有效的说话人识别系统。
其他文献
随着智能手机等移动设备的日渐普及,人们对于随时随地拍照并进行相关信息检索的需求也与日俱增。在这个背景下,移动视觉检索应运而生。作为一种新兴的移动应用形式,它得到了
搜索引擎的出现,为人们从互联网中查找信息提供了便利,而搜索引擎的关键技术之一,就是对海量网页数据的存储和管理。利用并行文件系统为搜索引擎提供支持则较好的解决了该问题。
不完全信息数据库与关系数据库SQL语言的查询处理是数据库理论的两个重要研究方向,不仅具有重要的理论价值,而且具有很高的应用价值。本文借助于中介逻辑谓词演算系统MFM,对
随着电子商务的迅速崛起,基于Web的应用模式迅速发展,Web应用从局部化发展到全球化,从B2C发展到B2B,从集中式发展到分布式。Web服务作为新一代的平台独立的分布式计算方式,具
随着世界各国汽车数量的急剧增加,城市交通状况日益受到人们的重视。如何有效地进行交通管理,越来越成为各国政府和有关部门所关注的焦点。车辆牌照的自动识别是计算机视觉与
随着计算机科学与其他学科之间的相互渗透和影响,科学家们根据不同原理提出了不同的计算模型。细胞膜计算是一种基于生物细胞膜结构和功能的新型计算模型,近年来得到广泛的研
科技发展带来数据维度的不断升高,对知识发现提出了更高的要求和挑战。从海量数据中发掘有意义的信息是数据挖掘研究的重点,也是各行各业关注的热点。特征选择是降低数据维度
随着网络技术和存储技术的不断向前发展,图像数据正以指数级的方式增长,越来越多的数据分布在网络上,这对于用户如何高效、快捷和轻松地查询到自己想要的图片信息是个难题。
持续数据保护技术(CDP)是提高系统可靠性的一个行之有效的方法。论文在对磁盘阵列系统进行系统分析的基础上,深入研究了磁盘阵列各个级别的特点和实现方法、磁盘阵列(Redunda
如今“网络就是计算机”,企业的信息化也从原来的单机应用发展为现在的网络应用。随着信息化的发展企业或单位往往具有一套或几套不同的应用系统。如何将这些系统集成起来,综合