【摘 要】
:
具有语音生成和获取能力的DIVA(Directions Into Velocities of Articulators)模型是以英文的29个基本音素为研究对象的神经计算模型,但这样会使模型不能适应于其他的语言,具
论文部分内容阅读
具有语音生成和获取能力的DIVA(Directions Into Velocities of Articulators)模型是以英文的29个基本音素为研究对象的神经计算模型,但这样会使模型不能适应于其他的语言,具有一定的局限性。本文研究的目的是将该模型的理论扩展至其他语种,如相较英文更为复杂的中文发音。由于中英文的音素数目和发音脑机制均相差甚远,原有的模型只适用于英语者的脑机制,只能对英语元音进行发音,且原始的学习训练算法不能很好地识别中文发音,故本文在原始模型的基础上进行改进使之适用于中文发音。本文首先简述了DIVA模型的基本原理和两个学习阶段,探讨了汉语复合元音的声学特性,并展示其共振峰频率走势图。在已知英文辅音/r/与/l/的辨别结论以及英文元音听觉感知空间理论的基础上,深入研究中文元音的发音及感知空间。在模型发出汉语单元音的基础上,通过改进DIVA模型的训练学习算法,调整训练参数,结合隐马尔可夫和神经网络的混合模型以及共振峰提取方法(Linear Prediction and Mel Frequency Cepstrum Coefficient,LPMCC)研究DIVA模型中汉语复合元音的发音。最终证明了改进后的DIVA模型在英文元音发音的基础上不仅可以学习中文单元音,而且也适用于中文复合元音的发音。本文的研究为今后应用DIVA模型进行汉语语音生成与获取奠定了良好的基础,未来还可将其拓展至汉语所独有的发音(如辅音/zh/、/ch/、/sh/等)。
其他文献
微创手术与传统手术相比,能够有效地减少手术创伤,缩短治疗时间,降低手术风险,已经被国内外视为热门的研究领域。本文利用南开大学机器人与信息自动化研究所自主研发的多轴运动控
论文在基于视觉的移动机器人定位系统方面展开了深入研究。具体而言,利用顶视摄像机,设计了一个全局的、高精度视觉定位系统,为移动机器人自定位提供了位姿参考;利用车载摄像机,设
随着计算机技术和通信技术的迅速发展,嵌入式系统已经广泛地渗透到科学研究、工程设计、军事技术等各个方面。因此,研究嵌入式系统中最关键的技术--嵌入式操作系统有着相当重要
远程实验室建设在解决目前高校在校学生数量大幅增加而实验经费紧张的矛盾、新实验教学模式探索、贵重实验设备共享、以及不同大学或者研究单位之间跨城市或者跨国家合作等方
随着汽车工业的不断发展,人们在努力追求汽车动力性、经济性的同时,对汽车行驶的安全性、稳定性和驾乘舒适性也提出了更高的要求。传统的机械调节和控制方法很难实现汽车的最佳
电磁无损检测方法具有非破坏性、简便、快速等优点,广泛地被应用到金属工件的质量检测中。本文采用电磁无损检测方法,对钢材材质特性参数与磁导率相互关系问题进行探讨,研制
本文分析了配电网无功优化问题的研究现状,以配电网有功网损最小为目标函数,考虑到约束条件的限制及可靠性要求,针对其具有非线性和不连续性的特点,采用基于遗传算法和预测--校正
随着计算机技术与人工智能算法的飞速发展和在工业领域的深入应用,如何将现代智能算法用于控制器设计已经成为当前控制界研究的热点。本论文在C++Builder6.0集成环境下设计并
土工三轴实验仪是一种模拟土体在土层中承受荷载环境的仪器,使用此仪器进行的土工三轴压缩试验是测定土体抗剪强度的一种方法。土体抗剪强度直接反映了土体承受荷载的能力,因
运用一种新型的端口受控耗散哈密顿(PCHD)系统能量成形原理,研究了两种非线性控制系统Buck-Boost变换器和三相电压型AC-DC变换器的建模与反馈控制问题。同时,对所设计的控制系统在MATLAB/SIMULINK软件环境下进行了仿真研究,仿真结果验证了所设计控制系统的优良性能。首先,综述了功率变换器控制策略的国内外发展动态,并从以下三个方面进行了分析:常规控制方法、现代控制方法、新型控制方法