分类集成问题中的多样性研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:starfox_vip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量增长的数据在为机器学习和人工智能方向的发展提供坚实基础的同时,也带来了诸多挑战,如来源多样化、增长速度快、价值密度低、计算量大、分析复杂度大等。面对这些挑战,由传统机器学习方法所构建的单个学习器或许难以满足问题求解的精度需求,因此集成学习以其优越的性能而吸引了诸多研究者的注意。集成学习的成功依赖于两大要素,即其基学习器的准确度和多样性。然而学界在对多样性的研究上尚未达成共识。尽管多样性对于构建一个性能优越的集成器而言非常重要,但是如何度量多样性以及多样性究竟是如何在集成学习中起到作用等仍然是个开放性的问题。此外,随着基学习器准确度的提高,它们之间的多样性往往会有所下降,因此如何平衡这两者在构造一个性能良好的集成器的过程中也是一项重要的研究课题。
  为此,本文主要研究分类集成问题中的多样性及其应用,以期回答分类集成器中的多样性与泛化性能之间的关系这一问题,并利用多样性和准确度的合理平衡来完成集成剪枝任务,具体如下:
  (1)首先,受启发于回归集成器的误差分解,本文提出了分类集成器的误差分解并随之自然地定义了一种多样性度量方法;随后利用该多样性度量方法提出了分类集成器中的多样性与泛化性能之间的关系;最后利用该关系提出了基于多样性的集成剪枝方法,能够在不损害集成器性能的同时有效地缩减其规模。
  (2)其次,为了对准确度和多样性进行合理平衡,本文从信息熵角度提出了一种基于信息熵的目标最大化的剪枝算法,包括集中式和分布式两个版本;随后从中抽取出一个可普适于现有剪枝算法的通用并行框架,能够在不损害剪枝后子集成器(即由组成原始集成器的基分类器集合的一个子集所组成的集成器)性能的同时大幅加速算法执行的过程。
  (3)最后,本文将多样性应用到了神经架构搜索领域中的集成网络结构中,利用多样性对其进行剪枝,以期获得一个规模更小而性能持平甚至更优的子集成网络结构;三种剪枝策略均可被用作在该过程中的指导,能够生成多样的且规模更小的子集成网络结构。
  实验结果验证了本文所提出方法的合理性和有效性。
其他文献
随着坚强智能电网体系规划的不断推进,智能电网进行了快速发展,高级量测体系得到了不断完善,配用电数据类型逐渐增多,数据量不断加大而且增速不断加快。传统的异常用电检测存在成本高,准确率低,耗时长的问题。电力系统是大数据技术应用的领域之一,随着大数据技术的不断发展以及大数据生态圈的不断扩展,可以选择合适的算法模型提高异常用电检测的准确率,同时利用大数据技术具有存储数据量大及快速处理数据的能力,可以建设具
近年来,无线电能传输(Wireless Power Transfer, WPT)技术被广泛应用于各种场合中,比如电动汽车等。具体而言,在电动车辆(ElectricVehicle,简称EV)上运用无线充电技术进行充电,避免了充电线路暴露在室外发生漏电短路等风险,同时电动汽车在动态行驶过程中进行无线充电,能有效缩短充电时间,提升效率。目前,电动汽车所用车载电池绝大多数都是铅酸蓄电池,此类电池的等效电阻
学位
近年来,无线电能传输(WirelessPowerTransfer ,WPT)技术因其电能传输的便利性,在大功率电动汽车的充电过程中存在着广泛的使用,在WPT系统中加入平板磁芯可以较大地提升系统的电能传输效率,但同时磁芯的引入会导致系统中线圈电感的非线性变化。由于非线性器件的存在,WPT系统是一个典型的高阶非自治系统,非线性器件会引起系统非线性现象的产生,对系统的稳定性、安全性均会造成极大的影响。本
“智慧电网”、“坚强智能电网”等理念的提出,使得当前电网发展逐渐趋向自动化、智能化。智能电网利用传感、嵌入式处理、数字化通信和计算机技术,将电网信息集成到电力系统控制中心,使电网可以监测并控制电网内部元器件的状态,实现器件功能的适应和自我调节,从而提高电力系统的运行效率和可靠性。然而,在电网的智能化过程中,电力线由于其固有的结构及分布特征难以得到全面、有效的监控。电力线故障也是电网中发生频次最多、
信息传播广泛存在于人类生活实践和社会生产发展的过程中,发挥着不可或缺的作用。掌握信息传播规律,研究干预信息传播的有效控制策略,是近年来网络科学领域关注的重要内容。复杂网络理论为复杂传播的研究提供了有效的工具。二十世纪,信息网络技术飞速发展,使得信息传播动力和传播机制复杂多样。同时,信息本身具有依附性和可编辑性,传播主体具有主动性和社会性的特点,而网络的虚拟属性促使这些特点在网络信息传播中更加复杂,
学位
物联网与人工智能的兴起,形成电力系统供配电自动化、智能化向物联网化的发展趋势。现行的电力系统设备业已具备较完善的自动化体系,受国家电力体制的约束,在构架电力系统智能终端直接呼应电力物联网云端的新型体系还刚刚起步。本论文围绕电力供配电终端智能化、物联网化开展研究,基于物联网技术、大数据技术、通讯技术等高新科技,针对电力系统中变电站、配电站物联网建设的需求,探讨实现电力系统供配电物联网智能终端的理论依
学位
传播过程在自然界中是非常普遍的,广泛存在于任何有接触或通讯可能的场合,流行病传播、信息扩散以及电网级联故障都是典型的传播现象。复杂网络理论的发展为研究传播行为提供了可行而有效的依据,对于动态传播特征的探索也得到了各学科学者们的高度关注。在复杂网络的框架下,传播过程可以视为动力学系统,为了准确描述系统的演变规律,各种经典模型及其衍生拓展被相继提出和完善,进而为传播行为的预测和控制奠定了基础。针对网络
学位
随着电网智能化和信息化水平的不断提高,从电能生产到用户用电的每个环节都积累了大量的数据。通过聚类分析模型对用户的用电数据进行处理,可以获得区域内所有用户的负荷分布情况以及特定用户的典型负荷特性,对于负荷预测、电网建设规划、营销策略制定以及能源利用效率提升等都具有理论和实际意义。  用电数据在收集过程中常因为电力设备损坏、通信线路故障等原因产生离群点,对离群点进行分析可以快速对异常情况进行定位排查,
学位
塔式太阳能热电站以其发电稳定、发电高效等优点成为太阳能利用领域的重要发展方向。但是塔式太阳能热电站建设维护费用高,其中定日镜场的投资约占总投资的一半。我国在塔式太阳能应用技术方面起步较晚,对塔式太阳能技术的研究和应用还不够深入,塔式太阳能热电站也不够普及。本文主要以三轴定日镜的单机系统作为研究对象,先是分析三轴定日镜相较于常规双轴定日镜的优势,再分析三轴定日镜的运动模型,然后设计三轴定日镜整体硬件
近几年,目标检测技术一直是自动驾驶领域内的重点研究方向。在真实环境下,目标检测始终存在目标信息数据不完全、非线性运动目标难以跟踪、多目标之间数据关联性差等问题。因此,对多传感器数据融合技术与多目标跟踪技术进行研究显得十分重要。本文围绕单线激光雷达,从目标数据出发,对多传感器数据融合与目标跟踪展开研究。本文具体内容如下:  1、设计了一种基于STM32嵌入式平台的单线激光雷达目标检测系统。针对真实环
学位