基于共振峰分类的说话人识别系统研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:aajilin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是利用说话人语音识别其身份信息的技术。文本无关的说话人识别技术,由于不限制说话人语音内容,得到了更广泛的应用。基于概率统计的说话人模型在当今说话人识别领域内占统治地位,但这类模型并没有利用语音的语义信息。 本论文将语音信息两个主要方面,即语义内容信息和说话人身份信息结合起来,用于文本无关的说话人识别中。众所周知,文本限制的说话人识别技术,在训练说话人模型时,对语音有限制条件,即训练语音只能限定在所给的单词集合或者音素集合之内,并且在识别身份时的语音也有同样的要求,所以可以在相似或者相同语义内容下对比语音信息,这样就更专注于说话人身份信息的验证。基于以上原因,文本限制的说话人识别会比文本无关的说话人识别取得更好的识别效果。本论文就是利用以上基本思想,提出了基于共振峰分类的文本无关的说话人识别方法,即在为每个说话人建立语音模型之前,先按共振峰特性将其特征分成若干类,以此为依据划分说话人特征,并建立对应的说话人子模型,在识别阶段,按照同样的方法区分所属子类,利用子类模型得出识别结果。 通过引入共振峰分类思想,将文本限制的说话人识别的思想与概率统计模型有机的结合起来,实验结果表明,新的模型取得了较好的识别效果。
其他文献
自从20世纪80年代开始,大型喷墨打印机被广泛应用于各种平面彩色喷绘作业中。然而,现有喷墨打印设备仅能对平面材质进行打印。为此,在军事沙盘、风景区景点演示、城市规划等
随着对纺织机械的精度、速度、质量要求的不断提高,世界纺织机械控制系统朝着数字化、智能化、网络化的方向发展。本论文以高速剑杆织机为应用背景,通过对国内外高速织机控制
随着传统能源消费的增长、生态环境的日益恶化和人类可持续发展的要求,世界各国都在积极开发无污染可再生的新能源。太阳能资源丰富、分布广泛、可以再生、不污染环境,使得太阳
电子耳蜗是唯一能恢复全聋人听觉系统的有效装置,这种技术在安静环境下已取得比较好的效果,但在噪声环境下电子耳蜗使用者获得的语音信息量会明显下降。为保证语音的可懂度和
无刷直流电机具有调速性能好、体积小、效率高、控制简单等优点,在很多领域得到了广泛的应用。传统的无刷直流电机控制系统普遍采用三相开关霍尔元件来提供位置反馈信息,但低速时无法得到精确的控制效果。目前,为了实现低速的精确控制,普遍采用光电编码器,但其成本高。因此,采用低成本高精度的新型传感器对提高直流无刷电机系统的性能具有十分重要的意义。本文阐述了新型传感器MLX90316的工作原理以及输出特点,分析了
十几年来,我国铁路信息化进程取得了长足的进步,构建了以TMIS和客票系统等为代表的一大批业务信息系统,有力地推动了铁路现代化事业的发展。但由于各业务信息系统基本上都是
当前,纺织CAD软件在织物外观模拟方面的技术已经比较成熟,但是对于设计好的织物在如何在场景中模拟展示的研究成果却不多。本文针对这一现状,提出将虚拟现实技术引入纺织CAD
在油井开采过程中,需要对油井的温度、压力、动液面等参数进行测量,以监控采油过程。其中动液面是一个很重要的参数,它是及时掌握油井供液能力和调节机械采油的重要依据,也是实现
本课题所研究的横机是一种由嵌入式控制器系统控制的自动化程度很高的纬编针织机,主要用于针织服装的编织制造。我国是纺织大国,横机需求量大,自主研发全自动电脑横机有广泛
燃料电池以其高能量密度、工作温度低、无污染排放、结构紧凑等优点被公认为发展前景最好的汽车动力源之一,而对燃料电池发动机的研究也正成为当前的热点并已取得了重大的进