论文部分内容阅读
语言是人类交流最直接的方式,因此研究语音信号的表示方法具有重要意义。基于Matching pursuit(MP)的语音信号稀疏分解由于其表示方法的优越性得到了广泛应用。但是该算法的速度和存储量仍然是制约其应用的瓶颈。虽然语音信号MP稀疏分解算法经过多次改进,但分解质量或速度仍不能令人满意。有学者利用FFT改进信号MP稀疏分解,但是这种算法在实际应用中并没有考虑到语音信号是实函数的特点,而FFT是基于复数运算的,算法与信号模型之间不匹配。本文以语音信号为研究对象,根据语音信号具有类周期的结构特性采用余弦过完备原子库,在其上进行基于MP的语音信号稀疏分解。从而在保证重构语音信号质量的同时较大幅度的缩小了原子库,进而节省了存储空间和计算时间。论文中通过多次计算机仿真证明了余弦过完备原子库对于具有类周期特性的信号比Gabor原子库能取得更好的分解重构效果。本文还利用FHT改进基于MP的语音信号稀疏分解算法。算法首先根据“波形相同”这一等价关系对过完备原子库进行集合划分。在保证语音信号稀疏分解效果不变的前提下,减少原子库中原子的个数,缩小搜索范围。然后结合语音信号是实函数而FHT也同为实函数运算,将计算量巨大的内积运算转换成一次循环相关运算,并利用FHT实现循环相关运算。该算法充分利用了信号与原子的内积运算和循环相关运算以及循环相关运算和离散哈特莱变换之间的关系,大大地提高了语音信号MP稀疏分解的速度。该算法相比利用FFT改进MP稀疏分解复数运算节省了一半的存储空间,同时进一步提高了分解的运算速度。最后,本文还指出利用Gabor原子进行基于MP的语音信号稀疏分解,分解后所得的原子和投影中含有该信号的重要信息。而每个原子又是由参数决定的,所以分解后所得的原子参数及投影可以作为被分解的语音信号的特征。利用语音信号的这一特征可进行语音识别。针对以上三个方面,本文均通过计算机仿真证明了各种算法的有效性。