歌唱声的非线性重建

来源 :山东大学 | 被引量 : 0次 | 上传用户:fleur0512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前歌唱声信号的研究都是仿照语音信号分析,采用线性模型和线性分析方法,然而人体的发声系统是复杂的非线性时变系统,线性方法显然不是最理想的选择。本文从高阶统计量和混沌理论两个方面深入研究歌唱声信号的非线性特性,并在此基础上从重构和预测两个角度完成对歌唱声信号的非线性重建。首先,利用高阶统计量对歌唱声信号进行非线性重构。高阶统计量具有对高斯噪声免疫的特性,它与频谱之间具有非线性关系,因此相比于相关函数、功率谱等传统的二阶统计量,高阶统计量包含更多原信号中非线性、非高斯性的成分。根据重构算法理论基础不同进行归类,非参数型算法包括边缘信息法、BMU算法、Lii算法、最小二乘法、递归算法和DFT重构算法;参数型算法包括谐波重构算法和倒双谱重构算法。比较仿真实验结果发现,最小二乘法对歌唱声信号的重构效果最佳。由于歌唱声信号不完全满足参数型算法中假设的线性模型,参数型算法无法得到听觉质量理想的歌唱声信号。其次,利用混沌理论考察歌唱声信号的非线性特性。在相空间重构的基础上,计算相空间轨迹、Lyapunov指数、主分量谱、功率谱等特征,歌唱声信号与典型混沌序列在特征上表现出相似性,表明歌唱声信号具有混沌特性。在此基础上,结合神经网络构建非线性预测模型,实现对歌唱声信号的预测,并考察不同的相空间参数求解算法和采样率对预测效果的影响。实验结果表明,利用CC算法联合估计最佳延迟时间和嵌入维数能得到更好的预测效果。在滚动预测时,可在短期内得到较好效果,长期预测会受到累积误差的影响。最后,利用Volterra级数展开式对信号进行非线性拟合,在时域二阶Volterra模型和相空间二阶Volterra模型下预测信号,考察不同的核系数求解算法、预测步长和采样率对预测效果的影响。通过实验对比发现,奇异值分解法求解核系数、短预测步长、高采样率,这些因素对歌唱声信号的预测更有利。相空间二阶Volterra模型在低采样率信号的预测上比时域二阶Volterra模型表现更好。
其他文献
随着多媒体技术应用越来越广泛,人们对无线通信的传输带宽和速率提出的要求也越来越高。由于许多的国家与地区在60GHz频段都陆续地开放了7—9GHz的免费可用带宽,其可以足够地
隐写分析是信息安全中隐蔽通信领域的重要课题之一,在军事和国家安全方面有着广泛的应用。数字图像作为目前数字通信中最常见的信息载体,数字图像隐写技术的发展已经日趋成熟
GPU是计算机中的图形处理器,由于其出色的并行数据处理能力,近年来越来越多的应用于通用科学计算中。CUDA是英伟达公司推出的一种GPU编程平台,它开发流程和编程风格很简单,在
视频目标跟踪是计算机视觉中热门的研究领域。目前广泛应用于智能监控、智能交通、金融、生物医学,人机交互等领域。为了满足日益增长的视频跟踪应用的需求,经过多年的发展,
近年来,人们对所有类型的无线服务的需求急剧上升,未来无线通信市场还将会得到大幅度扩张。频带等资源的稀缺性制约着无线通信的发展,而UWB系统可以与其他系统分享频带并且能
通信链路经常受到非高斯噪声干扰的破坏,这类噪声具有显著的脉冲特性,其概率密度分布有较厚的拖尾。脉冲干扰对于通信接收机和信号检测性能具有严重影响。传统的基于高斯噪声
综合考虑光纤无线通信(Radio-over-Fiber,ROF)技术与认知无线电(Cognitive Radio,CR)技术对于接入网应用的优势,两种技术的综合应用越来越受到研究者的关注,并且被验证了是未
为了能够对脑部磁共振图像中基底节区若干神经核团进行准确分割,本文提出了一种局部预测主动轮廓方法和一种基于最短路径思想的交互式分割方法。局部主动轮廓方法通常使用轮
随着信息技术和多媒体技术的发展,教学方式也发生了巨大的变化,越来越多的多媒体教室被用于教学中。多媒体教学中尤以幻灯片教学为主,与传统的黑板粉笔教学相比,幻灯片教学有
由于噪声的存在,信息在传输过程中会发生错误。为提高通信系统的可靠性,可采用信道编码技术,在发送信息序列中有规律的加入冗余信息,接收端利用这些冗余信息检测或纠正错误。