论文部分内容阅读
随着信息技术的发展,机器学习已经成为人工智能领域的一大研究热点。机器学习包括统计机器学习和集成机器学习,自弱学习定理证明以来,通过弱分类器集成得到强分类器这种集成机器学习的研究成了机器学习领域的重点。
由于真实世界的复杂性,传统监督学习大都集中在二分类问题上,相关算法在处理多标签分类问题时效果也不甚理想,因此,直接用于多标签分类问题的监督学习算法成了当前的热点,在研究多标签分类问题的诸多算法之中,AdaBoost系列算法由于其强大的泛化能力和不易出现过学习的良好特性,吸引了国内外一大批学者投入其中进行研究。经过数十年的理论研究和应用,该系列算法已经取得了很大的成果。
本文在研究了前人的工作之后,提出了一种基于Ranking Loss最小化的集成学习方法。算法基于Real AdaBoost的核心思想,从Ranking Loss定义出发,以Ranking Loss在样本空间最小化为目标,采取迭代的方法训练多个弱分类器,并将这些弱分类器集成起来构成强分类器,强分类器的Ranking Loss可随着弱分类器个数的增加而逐渐减少。对该算法进行了详细的理论分析和公式推导,并给出了算法流程。理论分析和实验数据对比验证了提出的多标签分类算法的有效性和稳定性。