论文部分内容阅读
连续语音声韵母边界的确定是分离声母段和韵母段的直接措施,为解决手工标注边界的高耗时与主观误差引入问题,提出一种新的基于支持向量机(Support Vector Machine,SVM)的声韵母自动分界算法.该算法选取标准语音语料库,基于训练集样本特征及标签训练两级支持向量机模型,识别测试集样本,确定初始声韵母边界;基于余弦相似度和欧氏距离两种相似度判据,获取频谱突变点,并设计规则边界融合策略,实现安静环境下静音、声母及韵母边界的自动准确切分.以Matlab为仿真平台,手工标注边界为基准,本文算法在测试集上所得声韵母切分边界的F值平均值为94.01%,表明能够准确分离出连续语音中的声母段和韵母段.