基于隐马尔可夫模型的跨语种语音合成方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:shanghui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言合成是用人工的方式产生人类语音从而赋予计算机如人一般自如说话的能力,目前的语音合成研究大多集中在文语转换(Text-To-Speech, TTS)这一阶段,即将一般语言的文字转换为语音。这些年来,随着语音技术的飞速发展,语音合成技术越加趋于成熟,合成的语音在音质和自然度上都有了明显的提高。然而,如何进一步提高语音合成系统的性能,使计算机合成出的声音更加的清晰与自然一直是语音合成研究领域的焦点问题。此外,随着国际交流的日益频繁,在国际交往中只用单一语种进行沟通往往已经不能满足人们的需求,有着对跨语种语音合成系统的迫切需要。在缺乏目标语种数据的情况下如何完成跨语种的说话人自适应,进而实现跨语种的语音合成系统以方便人们的国际交流与沟通,正是本文研究工作的重心所在。以下是论文的结构组织顺序:论文第一章简略地叙述了本文的研究背景。首先介绍了跨语种语音合成技术的技术需求与应用背景,接着介绍了现有的几种主流语音合成方法,最后对本文的主要研究方向——基于HMM模型的跨语种语音合成技术相关的概念与方法进行了大致的说明。论文第二章的前半部分主要是在介绍目前最为常用的基于HMM模型的可训练语音合成技术(Trainable TTS)的基本框架流程和关键技术点,后半部分则详细描述了这种语音合成系统基础上的同语种说话人模型自适应技术框架及相关算法。这两方面内容是本文研究工作的基础所在,也是后续章节研究内容的基本出发点。论文第三章介绍了对第二章中系统的改进工作。这里从参数语音合成系统中与语种最为相关的模块——基于决策树的模型聚类入手,着力研究如何改善现有基线系统的合成效果。研究中分别考查了决策树构建中挑选分裂问题的不同指导准则、判断分裂停止的不同条件准则及它们的不同组合对最终聚类效果和合成语音的影响。论文第四章主要从音素映射的思路出发来实现中英文跨语种的语音合成模型自适应。在跨语种的说话人模型自适应中,针对简单的音素映射效果不佳的问题,结合自适应数据的挑选,修正并改进了中英文音素映射表,同时通过中英文间的调型映射和韵律映射等方法以充分利用中英文语种间的相通韵律信息,取得了较好的自适应效果。论文第五章在前面研究工作的基础上,实现了一个中英文跨语种的语音合成系统,系统可以同时模拟任一中文说话人的中文发音和英文发音效果,即使在此中文说话人并不会说英文的前提下,也能很好地合成出具有其音色特征的英文发音语句。
其他文献
在信息安全系统中,身份认证是一个非常关键的环节,也是系统正常运行的前提保障。人们希望找到一种更加方便、可靠的方法来进行身份认证,而生物特征识别技术使得这种愿望成为
为了形成在调制解调领域的自主知识产权核,本文重点研究了如何设计一个高性能、低功耗、小型化的GFSK数字解调的硬件IP。在简要介绍GFSK调制解调的基础上,对当前的GFSK解调方案
人脸识别是生物特征识别的一个重要分支,在证件验证、门禁系统、视频监视、刑侦破案等领域中都有着广泛的应用前景。特征提取是人脸识别中的一个关键步骤。提取有效的鉴别特
织物起毛起球不仅会严重影响织物的外观,而且会降低织物的穿着舒适度,因此评价织物起毛起球性能成为纺织品检验领域内的一项重要内容。标准样照对比法是目前常用的起毛起球等
LTE-Advanced无线通信系统以其优越的性能获得了广泛的关注,该系统性能的发挥离不开充足的无线频谱资源的支持,随着无线通信系统的飞速发展,可用的无线资源愈发稀缺,在连续频段上
随着3G网络的普及,分组传送网络已经逐渐代替了传统的SDH网。然而现阶段的网络既要支持分组传送网络又要兼容传统的SDH网,这就需要开发出基于多网融合的网络管理系统,提供友好的
随着电磁环境的不断恶化,射频干扰已经成为提高微波辐射计探测精度的最大障碍,开展射频干扰检测研究具有重要意义。针对辐射计射频干扰检测需求,本文研究了基于时频域的射频干扰检测算法,设计并实现了辐射计射频干扰时频域检测系统,并对系统进行了实验验证。首先,本文对辐射计射频干扰时频域检测方法进行了研究。在介绍了峰度检测算法和能量检测算法的基础上,分析了峰度检测在恒虚警下对不同信噪比和占空比射频干扰的检测性能
移动互联网和物联网市场与业务应用的迅猛发展,推动了第五代移动通信(5G)的技术研究。5G要求具有媲美光纤的接入速率、享受本地操作的实时体验以及随时随地的宽带无线接入能
城市交通拥堵是世界各国面临的主要城市问题。随着我国国民经济的高速增长,城市化水平空前加快,机动车保有量逐年增多,导致许多城市都出现了不同程度的交通拥堵状况,虽然目前
移动通信网络从最初的第一代模拟蜂窝系统发展到第四代,小区半径一直在不断地缩小,小区密度在不断地增加。这种小区密集化机制已经为移动通信网络容量带来了一千倍的增益。在