论文部分内容阅读
汉语文语转换(Chinese Text to Speech)技术是将计算机中存储的汉语文本转换成对应的语音,是计算机和人类交互的一种手段。本文以汉语文语转换技术为中心,在VCNET环境下设计并实现了一个由C++语言开发的汉语文语转换系统。
汉语文语转换技术包括两个主要部分,一是对文字信息的处理,二是对语音信号的处理。文字信息的处理中主要包括文本的规范化,中文分词处理,中文韵律的生成。语音信号的处理重点是中文语音的合成。论文重点提出了一种在文本处理过程中描述韵律的方法,以及语音合成部分采取波形编辑合成和参数合成相结合的方法。该语音合成方法将事物的表象和本质有机地结合起来,更有效地发挥各算法的优点,提高了合成中汉语字与字、词与词之间合成语音的自然度。论文在此基础上构建了一个计算机存储容量小,但合成语音的自然度较高的汉语文语转换系统。
在本文中主要对系统的三个主要部分进行介绍:①文本处理:主要介绍汉语文本的规范化、中文分词处理和汉字注音。②汉语文本韵律的生成:主要介绍汉语中字词句韵律的生成方法。③语音合成:主要介绍汉语音库的选择和建立、语音信号的基本知识、语音的产生的过程、语音波形编辑合成算法TD-PSOLA算法、使用同态处理构建声道倒谱参数的合成算法。然后对合成的语音进行实验和对实验结果进行分析。
最后对遇到的一些问题进行总结和分析,对需要改进和添加的功能进行补充,以便以后的研究者对系统不足的地方进一步地完善。