基于Ranking Loss的多标签集成学习算法的研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:mldn2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,机器学习已经成为人工智能领域的一大研究热点。机器学习包括统计机器学习和集成机器学习,自弱学习定理证明以来,通过弱分类器集成得到强分类器这种集成机器学习的研究成了机器学习领域的重点。   由于真实世界的复杂性,传统监督学习大都集中在二分类问题上,相关算法在处理多标签分类问题时效果也不甚理想,因此,直接用于多标签分类问题的监督学习算法成了当前的热点,在研究多标签分类问题的诸多算法之中,AdaBoost系列算法由于其强大的泛化能力和不易出现过学习的良好特性,吸引了国内外一大批学者投入其中进行研究。经过数十年的理论研究和应用,该系列算法已经取得了很大的成果。   本文在研究了前人的工作之后,提出了一种基于Ranking Loss最小化的集成学习方法。算法基于Real AdaBoost的核心思想,从Ranking Loss定义出发,以Ranking Loss在样本空间最小化为目标,采取迭代的方法训练多个弱分类器,并将这些弱分类器集成起来构成强分类器,强分类器的Ranking Loss可随着弱分类器个数的增加而逐渐减少。对该算法进行了详细的理论分析和公式推导,并给出了算法流程。理论分析和实验数据对比验证了提出的多标签分类算法的有效性和稳定性。
其他文献
分布式哈希表(Distributed Hash Table,简称DHT)是结构化对等网络组网方式的核心,广泛应用于各种大规模的分布式系统,例如目前主流文件共享应用eMule和BT等。DHT提供了一种去中心
随着移动互联网技术的不断发展,移动应用已经越来越广泛。目前移动终端已经拥有了强大的处理和存储能力,移动终端正在从简单的通话工具变为一个综合信息处理平台。这也给移动应
近年来,计算机技术和计算机图形技术正以十分迅猛的速度发展,在软硬件技术的带动下,三维虚拟服装设计与展示系统也呈现出繁荣的景象,并且对服装行业市场产生了深远的影响。服装设
运动目标检测是计算机视觉领域的一个重要研究课题,在智能视频监控、人机交互、视觉导航等许多领域有着广泛的应用。当场景中的光照有变化,特别是突然变化时,运动目标检测会变的
软件测试作为保证软件质量和可靠性的一种重要技术,开销在整个软件开发成本中占有很大比重。随着测试驱动开发的流行,开发者需要花大量时间在测试和调试工作上。对于开发者,编写
随着地理科学和计算机科学的不断发展,地理信息系统(GIS)的应用领域也在不断扩展。空间数据的存储是GIS系统的组织基础,空间数据的存取效率在很大程度上影响着GIS系统的性能
第三代合作伙伴计划(3rd Generation Partner Project,3GPP)考虑到未来用户对多媒体业务的迫切需求,因此引入了基于SIP协议的IMS (IP Multimedia Subsystem,IP多媒体子系统)
随着Internet技术的迅速发展,在线新闻己成为人们获取信息的主要途径。然而互联网上的新闻杂乱无序、增长迅速,人们很难从如此庞大的信息库掌握有用的信息,特别是最新的消息
高效视频编码HEVC(High Efficiency Video Coding),又称H.265,是由JCT-VC(Joint Collaborative Team on Video Coding)在2013年1月推出的新一代国际视频编码标准。在与现有标准
虚拟机池化管理是指以统一管理视角提供虚拟机生命周期管理和资源按需提供的虚拟化技术。近几年来,虚拟机池化管理已成为构建主流云计算平台的关键技术之一。根据IDC报告,预计