论文部分内容阅读
语音识别后处理中的错误检测与错误纠正是语音理解过程中不可或缺的步骤之一。错误检测与错误纠正的信息依据通常来源于解码器相关输出信息以及独立于语音识别系统的高层语言语义信息。在语音识别后处理中,混淆矩阵也常用于错误检测与错误纠正。本文立足于朴素的混淆矩阵,尝试将混淆矩阵中的丰富统计信息应用于指导语音识别后处理模块的错误检测与错误纠正之中。本文的主要工作与创新点如下:第一,研究了基于混淆网络的加权混淆矩阵生成算法。本文研究工作主要依托于混淆矩阵进行展开,因此精确细致的混淆矩阵对后续工作起到了至关重要的作用。本文在之前研究者提出的基于混淆网络的加权混淆矩阵生成算法基础上,做了进一步的细致化改进,对同一声学单元的不同混淆集进行了区分性加权统计。实验表明这种改进对后续的错误检测与错误纠正结果起到了有益的作用。第二,研究了基于混淆矩阵的语音识别错误纠正算法。本文立足于混淆矩阵,提出了把错误纠正问题转化为寻找候选空间的分布中心问题来加以解决。混淆集中的不同候选之间存在着紧密的关系,它们来源于同一声学单元的不同可能识别结果。为了将这种关系可度量化表示,本文创造性的将混淆矩阵的混淆向量纳入混淆集中的候选表示之中,并将错误纠正问题转化为寻找候选空间的分布中心问题。从而将错误纠正问题赋予了高维空间可度量性,实验证明这种使用统计经验信息进行错误纠正的方法是有价值的。第三,提出了基于相似图的混淆项修正算法。本文在基于混淆矩阵的语音识别错误纠正算法上,进一步进行挖掘与研究,提出基于相似图的混淆项修正算法用于错误纠正。实际上混淆矩阵的统计经验信息与具体的错误纠正对象存在一定的沟壑,引入图算法将候选结果的后验概率分布进行循环迭代,使得候选结果在保持自身特征信息情况下逐步加入统计相似度信息,从而使得这种沟壑一定程度上得到了补偿,拉近了经验与实际的距离。实验证明,该算法进一步提高了系统的错误纠正性能。