论文部分内容阅读
单声道歌声分离是基于内容的音乐分析领域中的重点和难点。本文从伴奏和歌声两个角度出发,总结了当前主流的歌声分离算法并提出改进。本文的主要研究内容和创新点如下:1、本文从伴奏和歌声两个角度,全面总结了当前主流的单声道歌声分离方法,并将其划分为基于伴奏重复模式、基于歌声基频估计两类。在综述上述两类方法时,本文还分析指出各类方法中的主要思想和存在的约束限制。通过综述发现,伴奏重复模式和歌声谐波结构是当前歌声分离方法中最重要的两个线索,本文后续将从这两个方面选出参考方法加以研究改进。2、本文在详细分析基于伴奏重复模式的歌声分离方法后,选择约束条件少、计算量小的最近邻中值滤波(Nearest Neighbors Median Filtering,NNMF)歌声分离作为参考方法加以深入研究。本文分析了 NNMF方法存在的不足,即不适合处理歌声能量强的乐曲,并提出多子带划分结合NNMF的歌声分离方法。当混合音乐信号歌声能量较强时,通过多子带的划分能使一些子带中伴奏能量较强从而提升歌声分离性能。本文在当前主流的测试样本集MIR-1K上全面客观评测了参考方法和改进方法。结果显示,改进方法分离歌声和伴奏的整体评价指标都比参考方法好,三种信噪比的测试样本集下,分离歌声整体评价指标至少提高2.5dB,分离伴奏整体评价指标至少提高0.8dB。3、本文在详细分析基于歌声基频估计的歌声分离方法后,选择理论框架完善、无谐波重叠问题的瞬时混合模型(Instantaneous Mixture Model,IMM)歌声分离方法作为参考方法加以深入研究。本文分析了 IMM方法存在歌声基频估计过于简单粗略的问题,并引入歌声检测和基于旋律先验统计的Melodia歌声基频估计算法加以改进。本文在测试样本集MIR-1K上全面客观评测了参考方法和改进方法,结果显示,引入更加合理的歌声基频估计算法Melodia之后,分离性能得到较大提升,分离歌声整体评价指标至少提高1.67dB,分离伴奏整体评价指标至少提高近1dB。引入歌声检测之后,分离歌声中包含的伴奏分量更少,但由于歌声检测性能的限制,歌声分离性能只在-5dB测试样本集下有所提升。测试样本集的客观评测结果说明本文对参考方法的讨论分析和探索改进是合理有效的。