论文部分内容阅读
随着移动网络技术的迅速发展,基于嵌入式平台开发实时的说话人识别系统,实现移动终端设备上的身份验证,成为当前信息安全技术的研究热点之一。本文主要针对主流的GMM-UBM特征模型的特征分类情况进行了分析,提出了基于动词相似度的分类方法和基于网格密度的分类方法,在不增加计算复杂度的前提下降低说话人确认的等错误率,提高识别性能。进一步,基于ADI公司的ADSP-BFS48开发平台,进行了软件的优化,实现了高效率的说话人识别嵌入式系统,有利于应用在语音检索、司法鉴定和金融信息验证等安全认证应用方案中。
本文解决的关键问题有以下几个方面:
1.提出了一种基于计算动词相似度(Computational Verb Similarity)理论的特征分类方法。本文在梅尔倒谱域中引入基于距离和趋势联合相似度的评估模型,对原始的特征向量进行了距离-趋势联合相似度聚类。通过实验分析,其聚类效果要优于基本的LBG聚类方法。该相似度聚类方法应用于GMM-UBM构建的说话人识别系统,其获得的等错误率比基于LBG分类方法的说话人确认系统降低了12%。
2.提出了基于网格密度理论的特征分类方法。在Mel倒谱域中,不经过任何域的变换,只考虑语音特征参数在Mel倒谱空间的密度分布,将其按照每一维进行等距离划分,在Mel倒谱空间中形成不同的数据子空间,然后根据不同数据子空间的密度分布,选择最大密度所在的子空间,并对所获得的密度中心进行搜索合并,直到搜索条件达到所设定的阈值即为分类结束。该网格密度聚类方法应用于GMM-UBM的说话人识别系统,其获得的等错误率优于基于LBG分类方法的说话人识别系统,约降低了14%。
3.基于ADI公司的BLACKFIN系列ADSP-BF548评估板实现了一个基于计算动词相似度优化的说话人识别系统,外接LCD液晶板,通过AUDIO接口进行人性化的人机对话。同时,通过对FFT算法、DCT算法以及部分乘法运算进行优化,使其运算量减少为原来算法的4%至25%,提高了系统的运算速度。实验结果表明,在ADSP-BF548硬件平台上使用动词相似度分类算法的GMM-UBM说话人确认系统,其获得的等错误率优于基于K-MEANS分类方法的说话人识别系统,约降低了14%。