不平衡分类相关论文
在数据分析的应用中,数据质量是一切分析研究的基础,针对电网运行过程中输变电设备基础数据质量不高的问题,首先介绍了电力系统不......
传统分类模型通常基于数据分布平衡的假设,然而由于数据的自然分布或数据收集等原因,许多现实生活中的数据分布是不平衡的。模糊支......
针对贫困生数据类别不平衡、特征复杂等特点,提出ADA-MDF贫困生认定模型。首先利用ADASYN自适应过采样方法,通过合成少数类别样本,改......
癌症的早期发现和诊断在病人的治疗和护理中起着至关重要的作用。组织病理学分析是目前诊断癌前病变的金标准。然而,由于外观、异......
在现实生活中,存在大量的样本类别不均衡数据,比如信用卡欺诈数据、罕见疾病数据等。基于不平衡数据的分类,称为不平衡分类,分类器......
不平衡分类是一个重要的研究领域。在不平衡数据集中,至少有一类(少数类)的样本数量是远远少于其它类别的样本数量。如果在不平衡数......
制造业是国民经济的基础,而数控机床作为基础制造能力构成的核心,其关键部件若出现故障将直接降低机床加工效率,因而对关键部件进......
目的:针对信用评分样本类别不平衡问题,提出一种新的分类方法——合成少数类过采样技术-自适应增强-决策树(SMOTE-AdaBoost-DT)模......
空腹血糖(Fasting Blood Glucose,FBG)是衡量人体健康的一个重要指标。对空腹血糖的分析预测对发现和治疗疾病有重要意义,尤其是对......
学位
随着信息技术的发展,数据挖掘技术作为目前计算机研究的热门领域,在社会各方面得到广泛使用,它旨在从大量数据中挖掘出有价值的信息。......
生物信息学研究生物数据的分析处理方法。生物信息学的发展过程是分子生物学与计算机技术、数学、信息学和工程领域不断交叉与融合......
随着海量数据的出现,数据挖掘成为目前最有应用价值的领域之一,数据挖掘技术从这些大量的无结构的数据中提取有效的隐含价值的信息......
互联网的飞速发展,能够为用户提供海量信息,满足用户在信息化时代对信息的需求。然而,互联网在为用户提供海量信息的同时,也带来了......
锚杆支护如今作为一种常用的加固手段广泛应用在各种岩土工程中。受施工因素的影响,工程中由灌浆质量不合格引发的安全问题不在少......
图像作为重要的信息载体,广泛存在于我们的生活中。从单个图像中恢复物体的深度次序关系,一直被认为是理解和感知的重要能力。在计......
链路预测是将复杂系统与信息科学联系起来的重要纽带之一,它处理的是信息科学中最基本的问题——缺失信息的还原和预测.链路预测算......
在现实生活中,存在大量的样本类别不均衡数据,比如信用卡欺诈数据、罕见疾病数据等。基于不平衡数据的分类,称为不平衡分类,分类器......
互联网技术催生了一大批新兴产业,促使互联网金融业蓬勃发展,不论是京东白条、蚂蚁花呗还是P2P网贷,越来越多的信用消费产品走入人......
图作为一种描述事物与事物之间关系的数据结构,常常被用来表征复杂的数据关系。基于图结构的节点分类任务在社交、政治和生物工程......
信用卡欺诈是指故意使用伪造他人信用卡,盗刷他人信用卡用于本人消费,或用信用卡进行套现的违法行为。信用卡业务是银行的主营业务......
一般而言,多标签学习与单标签学习最大的区别在于,多标签数据的标签被组织在一个标签向量中,而且标签之间往往具有很复杂的关联信......
关系分类在自然语言处理中是一个关键性热点问题,其对于问答系统、推荐系统和情感分类任务的构建都有非常重要的意义。如果能够有......
不平衡数据的分类问题普遍存在于实际应用中,例如,医疗诊断,网络入侵检测和生物数据分析。少数类样本往往隐藏着更重要的信息,错误......
随着人工智能技术的发展,学术界越来越重视和机器学习相关的各方面研究,各个行业也开始使用机器学习技术为业务赋能。传统的机器学......
分类问题是一个十分重要的课题,传统的分类算法大多基于类别平衡的情况。但是,在实际问题中,存在着大量类别不平衡的数据,这给分类......
基于范数定义的度量学习是机器学习、模式识别领域的基础性工作之一。最为常用的是基于L2范数的欧氏距离和马氏距离,因其易于求解(......
为了解决不平衡数据分类问题,人们提出了许多基于采样的预处理方法。这些方法的基本原理是通过具体的策略重新平衡数据集。针对不......
多聚腺苷酸化(Poly(A))是基因表达的一个重要步骤,它对转录本稳定性和蛋白质翻译起始必不可少,因此受到了复杂的调控。选择性多聚......
数据类别不平衡对轴承故障的诊断有很大影响,而生成对抗网络(Generate Adversarial Net)作为最热门的神经网络之一,在数据生成方面......
从海量恒星光谱中发现稀有光谱是天文学研究的重要课题之一。与一般光谱相比,稀有光谱数量较少,因此,传统分类方法无法正常工作。究其......
煤炭作为我国重要能源之一,其产量近年来节节攀升,然而,由此带来的矿井水害事故也在增多。因此,准确、快速地判别突水水源对煤矿水......
随着科学技术的飞速发展,各种媒体不断涌现,文本作为数据的一种载体,数量也日益增多,文本挖掘已成为研究领域的热点。目前,随着计......
针对现实生活中大规模不平衡数据的分类问题,设计了一种基于云计算平台的代价敏感集成学习分类算法。Hadoop云计算平台对海量数据......
类别不平衡数据是指不同类别的样本数目差异很大,AUC(area under the ROC curve)是衡量不平衡数据分类器性能的一个重要指标,由于A......
对于现实的复杂网络而言,有连边的节点对数目通常远小于无连边的节点对数目,在链路预测时,不同类别的样本数量不平衡会导致预测的......
针对采用单核学习支持向量机不能很好地处理样本分布不均衡、复杂多变的高光谱图像数据的分类问题,提出一种结合采样技术和多核学......
对不平衡数据分类问题进行了研究,提出了两种基于采样的不平衡数据分类方法:一种是采用FarthestFirst聚类降采样,另一种是对样本进行......
我国供水管网漏损问题严重,由于管线泄漏随机性大,难以有效捕捉泄漏信号。因此,检测数据中的正常样本远远多于泄漏样本,存在样本不......
针对拥挤数据分布不平衡问题,提出了一种新的重采样方法———交叉组合重采样法。该方法是将随机向下采样法与 smote法相结合,对原......
孤立点检测面临数据不平衡和代价敏感两个问题。利用改进的一类支持向量机对数据集进行重构,并结合代价敏感支持向量机提出了一种......
为了解决乳腺肿瘤诊断中误差代价敏感的不平衡分类问题,提出一种改进的随机森林算法的乳腺肿瘤诊断模型。首先,在随机森林算法的基......
针对克隆代码有害性预测中有害和无害数据分类不平衡的问题,提出一种基于随机下采样(RUS)的能够自动调整分类不平衡的K-Balance算......
针对垃圾网页检测过程中轻微的不平衡分类问题,提出三种随机欠采样集成分类器算法,分别为一次不放回随机欠采样(RUS-once)、多次不......