【摘 要】
:
随着计算机技术的进步和其他相关学科的发展,在过去的几十年间,语音合成技术有了迅猛的发展,涌现出了大量的新理论和新技术。在现阶段,语音合成技术主要是以文语转换系统(Tex
论文部分内容阅读
随着计算机技术的进步和其他相关学科的发展,在过去的几十年间,语音合成技术有了迅猛的发展,涌现出了大量的新理论和新技术。在现阶段,语音合成技术主要是以文语转换系统(Text-To-Speech,TTS)为研究重点。这是一种将输入的文本转换为语音输出的技术。TTS系统一般由文本分析、韵律控制、语音合成和基元库四个模块组成。这四个模块并不是相互孤立的,每一个模块的性能都对最终输出语音的质量有很大的影响。对合成系统输出语音音质的评价是多方面的,但主要集中在输出语音的清晰度,可懂度和自然度这三个方面。当前,TTS系统的输出语音在清晰度和可懂度方面已经达到了比较高的水平,而在语音的整体自然度方面还有待提高。本文主要研究了韵律控制和语音合成这两个模块,希望通过对这两个模块的研究与改进来提高合成语音的自然度。韵律控制模块对合成语音的自然度有很大的影响,对这部分的研究包括多个方面,这里选择韵律建模作为研究重点。韵律模型可以将一些定性的高层韵律信息转换为定量的声学参数,以便提供给后面的语音合成模块使用。本文运用人工神经网络技术设计并实现了一个用于预测汉语音节基频曲线、时长和停顿的模型。实验表明,这个模型在一定程度上能够较好的反映汉语陈述句中音节的基频曲线、时长和停顿的变化情况。语音合成模块负责最终语音的输出,现在普遍采用波形拼接技术。在选择最优的合成基元序列的同时,此模块也需要对其中一些语音波形做适当的修正,以使合成语音听上去更加流畅自然。本文在研究了最优基元选择算法的同时,也研究了一种基于傅立叶变换的语音频谱平滑算法。此算法能够较好的进行语音频谱平滑并且在一定程度上避免了传统算法使合成语音质量有较大下降的问题。为综合验证算法的性能,本文构建了一个简易的TTS系统,在其中采用了上面介绍的算法。听音测试表明,此系统的合成语音自然度较高。
其他文献
计算机应用系统的交互性特点越来越突出,人们对系统用户界面(UI)也提出了越来越高的要求。这使得UI在计算机应用系统中日益成为一个决定系统成败的主要组成部分,据统计,在一
医疗资源是国家基础公共服务设施的重要组成部分,医院对外应充分满足为人民群众生命健康保驾护航的功能定位,对内应用激励约束机制,调动职工积极性,主动增强医疗服务的意识和
本文以运动技能迁移在啦啦操中的运用为研究对象,其目的是寻求啦啦操与其他舞蹈之间的积极因素,使得啦啦操的教学中能够合理运用技能的正迁移,取得更好的教学效果。比如竞技
目的:探讨肝硬化合并食管胃底静脉曲张破裂出血(esophageal-gastric variceal bleeding,EGVB)的预后因素,为肝硬化合并EGVB的预防、临床治疗及预后判断提供依据。方法:选取暨
在西方文化传统中,尼采是最常被引用的哲学家。他的名字镶嵌在小说和电影之中,从赫尔曼·黑塞(HermannHeSSe)的《荒原狼》、米兰·昆德拉(MilanKundera)的《不能承受的生命
一、数字化(DIS)实验1.概念数字化实验是以传感器和计算机为基础,结合传统的实验仪器,将实验数据采集之后用计算机进行分析处理,通过数据图表和图像展示现象、揭示规律。
怎样打造高效的数学课堂,是一个极具价值和现实意义的话题。在学校大力的倡导与推行下,我本人也一直在教学中实践与反思,下面谈一谈自己在进行高效数学教学的一点实践体会。
探究不同生物有机肥对西瓜生长发育和果实品质的影响,为西瓜合理施肥提供理论依据,以‘中农花冠’为试验材料,研究复合肥(CK)、鹌鹑粪肥(T1)、油渣肥(T2)、高蛋白肥(T3)和复
小胶质细胞是中枢神经系统的“感受器”,当脑内微环境发生变化时它首先被激活,活化后的小胶质细胞通过释放细胞因子和活性氧(Reactive OxygenSpecies,ROS)等对周围环境进行调
目的:分析治疗急性扁桃体炎应用耳尖放血的临床疗效。方法:选择74例我院2018年2月至2020年1月间收治的急性扁桃体炎患者作为分析对象,通过双盲法将其等分为试验组(n=37)及常