论文部分内容阅读
集成学习作为机器学习的研究热点,能够提高学习器的泛化性能,集成学习的基本理论、算法以及应用场合越来越成为众多机器学习学者的研究重点。本文对集成学习在回归应用中的数据扰动问题、个体学习器的生成和预测结果组合等方面做了深入的研究和分析。为了将研究成果更好的呈现,选择以图像质量评价为载体,全面分析、实现了集成学习算法在图像质量评价中的应用。概括起来,本文的主要内容安排如下:(1)结合集成Ada Boost思想与Bagging思想,提出了集成随机森林算法。集成随机森林在AdaBoost框架下将随机森林作为基学习器,将Ada Boost思想与Bagging思想在同一个算法中结合,既保证了学习器之间的差异性又保证了集成算法预测图像质量得分的准确性。将图像的感知特征作为实验数据,预测LIVEMD图像库和MDID2013图像库中的失真图像的质量分数。实验结果表明,该算法不仅能够提高个体学习器的差异度,同时还增强了图像质量评价模型的准确度和泛化能力,与其他的图像质量评价算法相比有一定优势,更加接近人类的感官感受。(2)在集成随机森林算法的基础上,结合旋转森林(Rotation Forest)扰动思想,提出了基于双重数据扰动的集成随机森林图像质量评价算法。考虑到实验数据增加的情况,如何进行有效地数据选取、充分发挥学习器的学习能力,成为了新的挑战。该算法利用旋转森林对特定的训练样本进行数据扰动,生成有差异度的基学习器,保证了集成学习器泛化性能的提升。最后将有一定差异度的学习器通过MultiBoost框架组合成完整的基于双重数据扰动的集成随机森林图像质量评价算法。为证明算法的有效性,实验数据选用LIVEMD图像数据库和MDID2013图像数据库中图像的多尺度感知特征。分析实验结果得到,基于双重数据扰动的集成随机森林算法在图像质量评价方面有一定的优越性。(3)为了证明本文所提出的集成学习算法在图像质量评价方面具有普遍适用性,本文提出了基于集成学习的四元数小波变换立体图像质量评价方法。在3D图像数据库上,首先对图像进行四元数小波变换后提取图像特征,将图像特征作为集成学习算法的输入,得到图像质量分数。分析实验数据可以发现,集成学习在立体图像质量评价方面同样具有优异的表现,集成学习可以在图像质量评价上有很强的泛化性,同时本文提出的集成学习算法可以解决一些其他单一学习器不能解决的问题,如数据规模不断增大的问题,这主要得益于集成学习很好地提高了学习器的泛化性能和扩展性。