说话人分割与聚类技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：gao_zhenguo

【摘要】

：

本文所研究的说话人分割与聚类技术是语音识别领域中一个较为新兴的研究方向。该技术主要是针对含有多个说话人的对话型语音，例如含有两个人的电话录音、包含多个人的会议录音

【作者】

：

刘先

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2006年期

【关键词】

：

说话人分割聚类技术高斯混合模型层次聚类法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文所研究的说话人分割与聚类技术是语音识别领域中一个较为新兴的研究方向。该技术主要是针对含有多个说话人的对话型语音，例如含有两个人的电话录音、包含多个人的会议录音、电视新闻节目等。按照说话人的不同将对话型语音进行分割，而后将相同说话人的语音片段聚类在一起，实现说话人识别这样一个任务，即“whospokewhen”。它是语音技术走向实用化的一个重要环节，是说话人识别技术、说话人检索技术以及多门其他语音技术发展所共同要求的一个新兴研究重点。　　本文探讨了说话人分割和说话人聚类的理论和实现技术，实现了一个说话人分割与聚类系统，并在此基础上进行了一些相关实验。主要研究内容包括：　　通过对目前说话人分割技术中使用得最广泛的基于贝叶斯信息准则（Bayesian Information Criterion）的分割方法进行理论分析和实验，发现原始的基于BIC的说话人分割方法其计算量过大。针对这一情况本文提出了一种基于预分割的说话人分割方法，通过先预分割再对分割点验证的方法，以少量的性能损失为代价，将说话人分割过程中的判别次数（计算ΔBIC的次数）由(n2)O次减少到(n)O次。　　对于说话人聚类，由于事先无法确知说话人数目，本文使用了与分类数无关的层次聚类法。在样本间相似性度量方面，采用了高斯混合模型（GMM）间的距离来量化样本之间的相似性，并比较了两种不同的GMM模型间的距离在聚类效果上的差异，以及GMM混合数对聚类性能的影响。并再次利用BIC准则推导出一个聚类停止准则。　　此外，为了更好地从音频中得到纯语音信号，在特征提取阶段使用了一种利用动态能量阈值以及平滑处理来去除静音帧的方法。

其他文献

基于XML的WebGIS的应用研究

随着互联网的飞速发展,地理信息系统GIS的应用也快步进入了互联网时代。由于地理信息系统获取数据的手段复杂多样,形成了多种格式的原始数据,同时这些空间信息资源也大多存在

学位

WebGIS地理标记语言GML可升级矢量图形SVG纯XML数据库

P2P电子商务平台中的信任机制研究

P2P技术是近年来兴起的新技术，其在电子商务领域的应用越来越受到人们的关注。P2P环境下的电子商务使得参与交易的用户具有匿名性，而且他们在空间上是分散的，客户之间的交易不需

学位

P2P电子商务平台信任机制全局信任值数理统计

高校计算机实验教学管理系统开发

计算机学科实验课程作为计算机学科教学的重要环节，对培养学生的动手能力、分析问题和解决问题的能力，起着不可替代的作用。然而现阶段各高校传统的教学模式一直存在“重理论、

学位

高校课程体系计算机实验教学教学管理系统课程设置应用型人才VOD视频点播

基于硬件防火墙的日志信息审计系统的设计与实现

信息网络技术的飞速发展和全面应用将世界带入了一个全新的时代。人们在享受网络科技带来的方便和快捷的同时，也更加关注网络的安全。如今，它己经成为国家有关部门、企事业单位

学位

硬件防火墙日志信息审计系统组成模块网络安全

基于位置的物联网搜索技术

随着嵌入式技术和无线网络技术的发展,物联网已经不再是我们遥不可及的概念,它将是继计算机、互联网与移动通信网之后又一次信息产业革命。所谓物联网就是指在传统互联网的基

学位

物联网搜索车联网位置异步周期序列模式

深空探测中多光谱图像压缩的算法设计及FPGA实现

随着我国航天事业的进步和深空探测活动的开展,深空探测器中大量的数据传输需求与有限的信道容量之间的冲突亟待解决。为了在有限的信道容量下能够传输更多的信息,各个航天大

学位

多光谱数据冗余熵编码数据流水FPGA

单视觉通道唇读中的特征分析

基于单视觉通道的唇读技术研究，是独立的研究唇读这种常用于辅助语音、手语等识别的技术，研究其作为单独的语言感知通道的可行性，为今后将唇读研究转化为应用做好前期工作。本文

学位

唇读技术单视觉通道特征提取嘴唇检测唇区定位

基于局部图像特征的电路板图像拼接算法研究

随着我国空间技术的发展，对空间电子设备的长寿命和高可靠性提出了越来越高的要求。电子装联工艺质量检测技术是保证空间电子设备长寿命和高可靠性的重要基础之一，目前，国内的电

学位

局部图像特征电路板图像拼接算法工艺质量检测技术Hough变换聚类

基于区分性训练的手语识别算法研究

传统的隐马尔科夫模型（HMM）的训练方法基于统计概率的最大似然准则（MLE），在训练样本数目足够大的情况下，这种方法在理论上可以得到最优的结果。在手语识别研究中，采集足够大的训练样

学位

区分性训练手语识别算法MMIE准则参数估计

社会网络中的链接分析

链接分析是社会网络分析中非常重要的一类问题,关于社会网络的众多工作都是希望从网络中挖掘到更多的知识,包括节点的信息、链接的信息、网络社区的信息等等。链接分析则是对

学位

链接预测矩阵分解链接分类社会网络数据挖掘

说话人分割与聚类技术研究

其他学术论文