【摘 要】
:
尽管说话人识别系统在识别结果上已经取得了令人满意的结果,但是随着人口规模的不断增大,传统的GMM模型的识别时间也越来越长,识别速度慢将大大限制说话人识别系统的实用性。
论文部分内容阅读
尽管说话人识别系统在识别结果上已经取得了令人满意的结果,但是随着人口规模的不断增大,传统的GMM模型的识别时间也越来越长,识别速度慢将大大限制说话人识别系统的实用性。实验发现,识别阶段测试语音在对GMM模型进行匹配打分的时候,得分较高的说话人模型只有少数的几个,说明这部分说话人模型存在着相似性。如果我们能够通过聚类算法将这部分得分高的模型聚成一类,测试阶段只要找到这个类并搜索其中的类成员就可以找到目标说话人,这种方式缩减了识别的时间。于是,本文基于模型聚类算法对说话人进行识别,在不降低识别性能的同时,提高系统的识别速度。传统的基于K-means和近似KL距离的说话人模型聚类能很大程度提高系统的识别效率。然而通过这种聚类方式获得的识别结果对初始聚类中心比较敏感。基于这点本文提出了一种基于距离矩阵的初始聚类算法,它能根据数据的空间分布特点,合理地进行初始点的选择。在识别的时候,待测语音只需要先与每类的类中心进行似然概率计算然后再与候选类内的目标说话人进行似然概率计算就可以找到相应的目标说话人。将改进后的模型聚类算法应用于基准系统中,系统在保证识别准确率的同时,提高了识别的效率。
其他文献
爱国主义与爱社会主义相统一,是新时代爱国主义教育的基本要求和难点问题。在当前历史条件和社会关系下,爱国主义与爱社会主义相统一有其自身的历史逻辑、现实逻辑和理论逻辑
网络社区中数据规模大、数据种类繁多、数据结构复杂。通过分析网络社区中广大网民交互的帖子内容可以及时、精确的掌握到基层群众关心的热点话题,而如何高效地组织、存储及
如今我们的工作生活已经离不开移动通信网络,各种移动终端产品充斥着生活的每个角落。移动通信技术的发展速度比我们想象的要快得多。同时大家对移动通信的需求,不管是从需求
目前,我国已成为世界上电梯保有量最大的国家。电梯销售是一个周期长、专业度高且要求严格的工作,销售过程中存在着较高的复杂度和风险。因此,如何利用移动平台的优势和信息
在波分复用光网路(WDM)中,复用/解复用,上/下路,组播,交换,波长互换都能增加网络的灵活性与鲁棒性。波长互换能有效利用网络资源,提高网络性能,正向着更快的响应速度、调制格
转化型抢劫罪不是一种独立的罪名,而是法律拟制的条款,仅为法学理论上的称谓。同抢劫罪一样,不仅侵犯了他人的财产权利和人身权利,还对社会风气产生极其不良的影响和危害。其
在当今的通信网络中,信号的传输主要依靠光纤完成。但是信号的处理,还是主要依靠电来完成,这样就增大了传输成本,也降低了传输效率。全光信号处理技术可以在光域直接对光信号
随着近年来云存储的发展,越来越多的企业与个人开始认识并使用云存储。由于云存储服务提供商不完全可信,云存储的安全性一直是各界关注的焦点,也成为云存储能否大力发展的关
我国劳动教养制度的实施已近六十载,期间,适用劳动教养制度的收容对象数量一直趋于稳定。而今,在劳动教养制度面临废、改情势下更需要多方面的研究,尤其是实证分析。本文以甘
自从云计算平台提出以来,它的高存储性和高运算性能成功地解决了大数据时代带来的问题。然而,因为用户把数据远程的存储在云端,失去了对数据信息的控制能力,所以云端数据的完