【摘 要】
:
本文致力于研究出特定人之间的语音转换系统。本文研究的算法是基于非并行数据实现将源说话人的语音在不改变音频文本内容的情况下对个性化特征进行转换达到转换后的语音听起
论文部分内容阅读
本文致力于研究出特定人之间的语音转换系统。本文研究的算法是基于非并行数据实现将源说话人的语音在不改变音频文本内容的情况下对个性化特征进行转换达到转换后的语音听起来像目标说话人的效果。个性化语音转换的研究在现有阶段是语音信号处理领域中比较热门的研究课题。语音转换系统在实际生活中应用十分广泛,有着非常广阔的发展空间。大多数语音转换现在是基于特定说话人之间的平行语料,但是平行语料库在多数情况下难以获取且需要进行特征序列对齐。本文算法将基于非平行数据的多领域图像转换方法G~2GAN创新性地运用语音转换中的频谱转换中。并且针对语音和图像的不同对整体网络结构、生成器、判别器、域分类器重新设计。在实验中,主要是对源说话人和目标说话人的语音信号做特征提取得到MCEP频谱特征值和基频特征,并分别针对这两个特征进行转换。本文使用高斯归一化的方法对基频进行转换,利用G~2GAN的方法对频谱进行转换,转换后再进行语音合成得到最后转换后的语音。实验结果与同样实现基于非并行数据的多对多语音转换的Star GAN算法以及基于平行语料的GMM方法进行比较。结果显示该方法优于Star GAN方法并且接近基于平行语料的GMM方法。
其他文献
随着互联网时代的发展,大数据概念的兴起,互联网数据中心(简称,数据中心或IDC)的市场正面临着巨大变革,从传统的独立化、分散化转向规模化、集中化。在这个信息化爆炸的时代,
分数阶微分方程近几年取得了非常迅速的发展;尤其是带分数阶边界条件的分数阶微分方程更是取得了很大的进步。本文是通过运用Schauder不动点定理和Banach压缩映像原理,研究了
带积分边值条件的分数阶微分方程是应用微分方程的重要分支,形式的多样化、应用范围的广阔使它难度更大,探究的学者更多。时代的变迁、经济的兴起促进了分数阶微分方程的应用
边值问题一直是微分方程研究方向的主要问题,它是各领域实际问题抽象出来的数学问题。对方程给予一定的边界条件,我们探讨方程是否具有解或者有几个解的问题。这对于实际问题
本文研究同态在几类半群结构中的应用,利用推广后的半群的半格分解,给出正则群并、正则(*,~)密码富足半群及正则密码富足半群的结构半格分解。以下为主要内容和相关结论:第三章
如今,分数阶微分方程应用范围非常广泛,包括有遗传力学,分子扩散论,岩石的流变性质描述,粘弹性分形理论,控制系统等等。分数阶微分方程的研究也己成为当前国际数学界研究的热
科学计算是计算机的一个重要应用方向之一,包括对来自不同领域中的模型的数值模拟,还有对复杂理论问题的数值求解等。它成为了研究者解决具体问题和了解自然现象特征的重要手
稳定性分析是复杂网络领域的研究热点之一,自提出以来便受到国内外研究学者的广泛关注。对复杂网络的性质分析离不开对动力系统性质的分析,由于动力系统的多样性和复杂性,虽
Kv表示一个v个顶点的完全图.完全图发Kr和完全图Kc的卡氏积图(Kr×Kc-格子区组)满足任意两个不同的顶点(a1,b1)和(a2,b2)相邻当且仅当a1=a2或者b1=b2.一个阶为v的(Kr×Kc,λ)
研究目的:分析胃脘痛的病因病机,探讨张庆祥教授诊治胃脘痛的辨证经验,总结归纳用药规律。研究方法:运用理论探讨与病案研究相结合的方法。(1)理论探讨:通过对中医经典及历代医家的论述,探讨胃的生理病理,胃与脏腑、气机的关系,胃脘痛病因病机、辨治规律。(2)病案研究:选取张庆祥教授在2016年01月-2018年10月期间于山东中医药大学中鲁医院的门诊病案中胃脘痛病案进行整理分析,筛选、整理出张庆祥教授治