基于留一交叉验证的类不平衡危害预评估策略

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:cmxhjjcz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,类不平衡问题已逐渐成为人工智能﹑机器学习和数据挖掘等领域的研究热点,目前已有大量实用有效的方法.然而,近期的研究结果却表明,并非所有的不平衡数据分类任务都是有害的,在无害的任务上采用类不平衡学习算法将很难提高,甚至会降低分类的性能,同时可能大幅度增加训练的时间开销.针对此问题,提出了一种危害预评估策略.该策略采用留一交叉验证法(LOOCV,Leave-one-out cross validation)测试训练集的分类性能,并据此计算一种称为危害测度(HM,Harmful-ness Measure)的新指标,用以量化危害的大小,从而为学习算法的选择提供指导.通过8个类不平衡数据集对所提策略进行了验证,表明该策略是有效和可行的. In recent years, the class imbalance has gradually become a research hotspot in the field of artificial intelligence, machine learning and data mining, and there are a lot of practical and effective methods.However, recent research shows that not all the unbalanced data classification tasks Are all harmful. It is difficult to improve the class imbalance learning algorithm on innocuous tasks, and even reduce the performance of classification, at the same time, the training time overhead may be greatly increased. In view of this problem, a pre-hazard assessment Strategy.This strategy uses a leave-one-out cross validation (LOOCV) to test the classification performance of the training set and calculate a new indicator called Harmfulness Measure (HM) Which can be used to quantify the size of the hazard and provide guidance for the selection of learning algorithms.The validation of the proposed strategy through eight classes of unbalanced data sets shows that the strategy is effective and feasible.
其他文献
在1980年前后,台湾养殖的美国牛蛙售价曾高达240元,十年后却只剩24元,牛蛙养殖可以说是大起大落的行业,曾经风光一时,如今大约仅存60余家养殖场。牛蛙是单位面积产量最大的物种,2分
建筑业是我国国民经济的支柱产业,改革开放30多年来,我国各项建设进程加快,建筑业发展进入一个黄金时期。建筑工程质量关系到工程项目各参与方的核心利益,更关系到建筑物的使用安
近年来,我国人民生活质量不断攀升,居民建筑暖通空调的需求在不断扩大,民用建筑暖通空调走进了千家万户,而这无疑是进一步加剧了我国的能源短缺危机,节能环保成为我国现阶段
TASCAM DM-24是按24路8编组设计,具有出色的音质,易操作,占用空间小,内置自动操作等功能,带有TASCAM MX-2424硬盘录音机的控制操作面板。使用24bit高质量模拟/数字和数字/模
为了筛选出合适的防治黄瓜霜霉病的药剂,进行了田间药效对比试验。结果表明,56%百菌.烯酰WP 2400 g/hm2效果较好,药后第10天防治效果达91.6%,增产率达83.8%。 In order to s
本文结合某滑坡勘查工程实例,介绍地震折射波法和瑞雷波法工作原理、工作方法及其在滑坡勘查工程的应用,结合进一步查明滑坡范围内覆盖层厚度和基岩起伏情况,确定滑坡范围和滑面
PCB焊接质量对于电子产品有着至关重要的影响,要重视对PCB焊接缺陷的分析,对焊接缺陷的控制方法进行研究,有针对性的改进焊接操作方法来提高PCB电路板焊接的质量,进而最大限
社会的发展和进步,虽然促进人们生活水平的提高,但是对自然生态环境产生一定程度的破坏,严重威胁着人类生存和发展,因而在社会发展中积极推广节能技术尤为重要。建筑是人类赖以生
从上一期开始,我们就进入了MediaMatrix的程序设计阶段。通过一些简单的设计和组合,不少朋友已经明白了MWare的主要作用和软件构成,但是对于Device例表中提及的大量设备,可
利用三相静止坐标到同步旋转坐标的变换技术(dq变换),建立了dq坐标系上TSMC系统的稳态数学模型(dq模型),推导了TSMC电压增益、有功功率、无功功率、网侧输入功率因数角等特性