论文部分内容阅读
随着科技日新月异的发展,会议录音干扰领域对随机语音信号合成算法的研究提出了新需求。为此,本文展开了随机语音信号合成算法的研究。目前,语音信号的合成有着成熟的理论,但都属于确定性的方法,即,一旦语音合成参数确定后,多次重复合成输出,输出结果都不变。无法达到多次合成输出,结果随机变化的要求。对随机的语音合成算法,并没有多少文献可以直接借鉴,本文的研究对应着这种新的应用。本文首先针对利用语音库合成随机语音存储空间大的问题,在引入线性预测语音合成算法和人工神经网络模型的基础上提出了一种基于二次压缩的随机语音合成新方法。分别采用线性预测语音合成算法和人工神经网络模型进行一次和二次压缩,降低语音库的存储空间需求,同时对语音库的数据进行筛选,仅留下浊音,去掉清音。然后利用随机起点和随机长度产生需要的随机语音,实验验证了该方法的有效性。设计了随机语音的主观评价方法。其次,研究了基于二次压缩的随机语音合成算法的实现问题。算法先用matlab实现和测试,为了将该算法移植到嵌入式系统,研究了转C语言的代码移植方法,总结了一套行之有效的方法流程,创新性的解决了实践中一些代码转换优化问题,实验验证有效。最后,针对上文算法依赖语音库的不足,提出基于共振峰的随机语音合成方法,并提出了2种改进算法。先是通过对共振峰参数进行改造,达到能随机选取,从而构造了基于共振峰的随机语音信号合成改进算法,实验验证能产生随机语音,但是合格率不高,大部分情况产生的都是非语音。进一步提出基于共振峰参数比值的改进算法,实验验证输出随机语音合格率得到提高。最后又提出了一种基于语谱图判决和共振峰参数比值的随机语音合成改进算法,实验验证了该算法的有效性。