论文部分内容阅读
随着当今社会的快速发展,语音合成技术已经渗透到了社会生活中的各个方面。为了使合成语音的自然度能够进一步提高,本文研究了在语音合成技术中占据重要地位的韵律结构预测问题。
在汉语韵律结构的研究中的一大难点是对汉语韵律短语的预测问题。本文在综合考察了目前应用在汉语韵律短语预测任务中的几种机器学习方法后,提出了一种基于条件随机场模型的汉语韵律短语边界预测方法;同时,为了减少标注训练语料库所需要的大量时间和人力,本文引入了一种应用于条件随机场模型的半监督学习方法,并实现了一个全自动的汉语韵律短语边界预测的原型系统。
当前,在汉语韵律短语边界的预测任务中,使用最广泛的是隐马尔科夫模型和最大熵马尔科夫模型。本文采用的条件随机场模型(Conditional RandomFields,CRFs)结合了隐马尔科夫模型和最大熵马尔科夫模型的优点,同时CRFs还可以克服隐马尔科夫模型中的严格独立假设以及最大熵马尔科夫模型中的标注偏置问题。目前,CRFs已被应用于一些自然语言处理任务中,如:词性标注、中文命名体识别等。本文对条件随机场模型和最大熵马尔科夫模型进行了实验比较,得出的结论是,在使用相同特征模板的情况下,条件随机场模型更适合于汉语韵律短语边界的预测。
传统的机器学习方法都是在大规模训练数据集的基础上进行训练的,而对训练集进行人工标注需要花费大量的时间以及人力,目前可直接使用于汉语语音合成中的资源又非常有限。因此,本文基于半监督学习的思想,引入了一种可以应用于条件随机场模型的半监督学习方法,将该方法应用于汉语韵律短语边界的预测任务中,并且最终实现了一个全自动的汉语韵律短语边界预测系统原型。本系统可使用少量的已标注数据和大量的未标注数据进行训练,首先对已标注数据进行训练,利用训练所得的模型对未标注数据进行预测,从预测结果中挑选出一部分有效数据加入训练集,然后进行下一轮训练,如此不断迭代下去,直到最终训练出用户满意的模型。多组实验表明应用该方法可以有效提高模型在同等规模训练集上训练得到的预测准确率,从而达到在大大降低人工工作量的基础上,利用少量已标注数据完成对汉语韵律短语边界的预测。