一种改进的基于层次聚类的说话人自动聚类算法

来源 :声学学报(中文版) | 被引量 : 0次 | 上传用户:wangcx1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人聚类是语音识别以及音频检索等众多语音应用的重要组成部分。提出一种改进的基于层次聚类的说话人聚类算法,对层次聚类法做出了进一步改进:(1)改进误差平方和准则以提高聚类速度;(2)引入假设检验方法确定类别数目;(3)提出一种稳健的在线聚类方法以解决对新到来的语音段进行聚类的问题。在聚类实验中,算法的平均类纯度和说话人纯度分别为96.7%和96.6%。实验结果还表明,相比手工标注说话人信息,将该算法的聚类结果应用于说话人自适应可降低系统的误识率。 Speaker clustering is an important part of many speech applications such as speech recognition and audio retrieval. This paper proposes an improved clustering algorithm based on hierarchical clustering to further improve the hierarchical clustering method: (1) to improve the squared error square rules to improve the clustering speed; (2) to introduce the hypothesis testing method to determine the category (3) A robust on-line clustering method is proposed to solve the problem of clustering newly arrived segments of speech. In the clustering experiments, the average class purity and speaker purity of the algorithm are 96.7% and 96.6% respectively. The experimental results also show that compared with the manual annotation of the speaker information, applying the clustering result of the algorithm to the speaker adaptation can reduce the error rate of the system.
其他文献
销售的实现是企业盈利的第一环节,销售收入的大小不仅关系到当期增值税的多少,也关系到当期所得税的多少,是影响企业税收负担的一个主要因素,因此,对销售环节进行筹划就变得
以冲压车间能耗作为参考标准,优化车间调度方法,缩短设备工时。
我国企业债券契约设计至今仍由管理当局决定,与企业自身状况没有多大联系.随着市场化的深入,企业债券市场会有更多的发展,而其契约结构的设计,亦将逾来逾为企业所关注.
不同的语言,表达着不同的思想,流露出不同的情感;不同的建筑,承载着不同的文化,体现着不同的信念。无论是法国的凯旋门还是隆昌石牌坊,它们在世界建筑史上的影响都是非常大的
"名门闺秀"在日趋激烈的市场竞争中激流勇进,除了品牌的魅力与出色的产品品质之外,成功的市场运作功不可没,到底其推广策略有什么特色呢,一直引人好奇.
小流域的建设受自然、社会特征和生态功能的影响较大,文章选择辽宁东部山地丘陵区较典型的本溪市作为分析重点,在分析本溪市自然概况、社会经济情况和水土流失特点的基础上,
一、希望中国化学会继续为国民经济和国防建设服务,为社会主义精神文明建设和社会主义民主法制建设服务,为全面开创社会主义现代化建设的新局面贡献出我国化学界的力量。大
智能变电站是智能电网的关键环节,是今后变电站的发展趋势。介绍了智能变电站优越的技术性和良好的经济性,提出了智能变电站在变电运行、检修、故障分析、安全防护、源端维护等
随着社会转型,教育的改革已经成为世界各国应对日趋激烈的国际竞争的重要战略,且教育水平已然成为综合国力的主要体现。英语作为经济与文化全球化背景下的主要语言工具,是目
甜玉米作为新型果蔬型食品,已经在世界多国得到迅速发展。美国是世界上首要生产、消费和出口大国,人均每年消费甜玉米10kg以上,每年创造产值5~6亿美元。法国、泰国也是重要生