论文部分内容阅读
对于听力语言障碍者,生理上的缺陷在他们学习语言的过程中会造成不可逾越的障碍。因此,聋哑人的语言训练系统成为残疾人康复的一个重要研究课题,而这些康复系统的开发又都离不开一个共同的基础环节--语音信号的特征提取。
近年来,随着对语音信号各种特征参数研究的深入,分析和提取语音的动态特性成为研究的热点。因为它建立在语音信号非平稳特性的基础之上,所以更适合于语音信号非线性模型的处理与分析。因此,本论文采用了一种针对非平稳语音信号的新的时间序列分析技术--递归技术,来对语音信号动态特性进行分析,并最终实现了部分应用,为语音特征更准确的提取和各种康复系统性能的改进提供了一个研究的方向。
首先,论文讨论了利用非线性动力学方法对语音信号动态特性进行分析的可行性,并重构了语音信号的相空间。然后,系统地介绍了递归分析的理论基础。随后,在理论上对语音信号进行了递归定性和定量的分析。根据音素的发声机理,讨论了浊音的声门振荡模式、清音的湍流声源模式和交互作用模式这三种不同的动态非线性模式。找到了对应各种动态特性的递归图表现形式和递归量化参数的变化趋势,并在交互式递归图中初步实现了动态特性的可视化。最后,为了验证递归分析技术研究语音信号动态特性的有效性,该论文分别将其应用于三种语音信号处理领域,包括语音端点检测、语音清浊音分类、语音定位等,均取得了较为理想的结果。
以上是作者在这篇论文中的主要研究工作,本文不仅将先进的递归分析技术引入了语音信号动态特性的研究中,利用该技术避免了时间序列平稳性假设和数据长度要求对非线性分析方法的限制,分析了语音复杂多样的动态特性,而且在应用领域,提出了改进的递归算法,并在语音定位中进行了实现,在语音信号特征处理的新方法上作了有益的探索和深入的研究。