IBM Voice Conversion Systems for 2007 TC-STAR Evaluation

来源 :清华大学学报 | 被引量 : 0次 | 上传用户:haicang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
This paper proposes a novel voice conversion method by frequency warping.The frequency warp-ing function is generated based on mapping formants of the source speaker and the target speaker.In addi-tion to frequency warping,fundamental frequency adjustment,spectral envelope equalization,breathiness addition,and duration modification are also used to improve the similarity to the target speaker.The pro-posed voice conversion method needs only a very small amount of training data for generating the warping function,thereby greatly facilitating its application.Systems based on the proposed method were used for the 2007 TC-STAR intra-lingual voice conversion evaluation for English and Spanish and a cross-lingual voice conversion evaluation for Spanish.The evaluation results show that the proposed method can achieve a much better quality of converted speech than other methods as well as a good balance between quality and similarity.The IBM1 system was ranked No.1 for English evaluation and No.2 for Spanish evaluation.Evaluation results also show that the proposed method is a convenient and competitive method for cross-lingual voice conversion tasks.
其他文献
地面等待是空中交通管理中普遍应用的一种方法.系统地分析了单机场和多机场地面等待策略GDP(Ground-Delay Policy)经典模型.在这些模型的基础上,研究了确定容量条件下的多元
在入侵检测系统中应用支持向量机算法,使得该系统在先验知识较少的条件下仍具有良好的推广能力.基于此,对支持向量机在网络入侵检测中的应用进行了分析,构造了以支持向量机分
阐述了γ相对WC-12Co喷涂粉末质量的影响,以及WC-12Co喷涂粉末生产过程中影响γ相的主要因素,并且从碳含量、烧结温度、冷却速度等方面提出了解决方案.
证明了在|n1-n2|≤1条件下,扩展双星树Tn1,n2有最大的Wiener指数和最小的子树个数,并且随着悬挂边的移动其Wiener指数越来越小,子树个数越来越大.
针对一类多输入多输出非线性不确定系统,提出了基于模糊干扰观测器(FDO)的轨迹线性化控制(TLC)方法并应用于空天飞行器(ASV)飞行控制系统设计。利用模糊系统具有以任意精度逼
铝合金压铸模裂纹成因有诸多因素,通过对问题样品的分析研究,认为:该压铸模产生裂纹导致提前失效的主要原因是由于结构设计不当和热处理欠妥,由此产生的较大结构应力和压铸交
介绍了相机定标的测试方法。通过对空间CCD相机成像时的地物辐射能量进行分析,提出了以成像方式进行相机定标测试的方法,并对数据处理方式进行了分析。
《凄凉犯》序所阐述的“犯调”理论对于判断该曲的宫调有重要指导意义。其宫调属性应该是“仙吕调犯双调”。《凄凉犯》下阙中“否”字之旁谱应译为“工”字(b1),“漫”字之
主要介绍了电参数分析管理装置的主要功能、软件设计、系统软件可靠性评估及硬件构成.系统软件包括两个部分:终端软件子系统和服务器管理控制软件子系统,其编程语言采用Keil
固液两相流运动特性是水动力学中的一个研究热点。本文建立的三维k--εAp两相湍流模型首先研究了模型中颗粒相的两个控制参数对数值结果的影响,然后讨论了不同的颗粒平均粒径