不平衡数据相关论文
提出基于粒子群优化特征选择(PSOFS)算法和TSK(Takagi-Sugeno-Kang)模糊系统的心电信号分类模型,即基于PSOFS和TSK的并行集成模糊神经网......
实际应用中数据不平衡问题经常出现,指数据集中各类别的样本数量极不均衡.研究了传统的数据过采样技术RANDOM、SMOTE、ADASYN以及目......
在不平衡数据分类问题中,为了更注重学习原始样本的概率密度分布,提出了基于梯度惩罚生成对抗网络的过采样算法。该算法首先引入生成......
通信欺诈行为是指用户利用网络,电话,短信等方式来为自己获取非法利益的一种行为,其对运营商和社会各界都产生了恶劣的影响。随着......
高效且科学的信用风险评估体制是解决银行与用户之间信息不对称所带来的信用违约风险的有效途径。针对当前银行用户数据存在类别不......
学位
煤炭港口是现代物流行业的重要组成部分,装备智能化是港口迈向集约化、绿色化、高效化发展的必由之路。取料机作为散货运输的重要......
滚动轴承是机械设备中重要的基础零部件,其质量的优劣直接影响着机械中运动零件的基本机械性能、运行精度、寿命以及安全性,因此在......
最近十年,随着大数据处理平台,云计算等技术等一些基础设施技术的蓬勃发展,人工智能和机器学习发展迅猛。伴随着谷歌旗下Deep Mind......
糖尿病是一种普遍的慢性疾病,不仅会导致血糖的不稳定,而且也会引发一系列的并发症。糖尿病患者大多数时间是在家中和门诊进行血糖......
随着互联网金融行业的不断发展,网络借贷作为一种新型融资方式已逐渐走进人们的视野。但是近年来随着网贷平台数量的增加,平台质量......
以LendingClub公开信贷数据集为实验数据,考虑数据集的数据样本不平衡情况,通过SMOTE+TOMEK算法处理类别不平衡;采用金融风控领域......
随着大数据时代的到来,我国信贷市场正在不断朝气蓬勃地发展,这不仅促进了我国经济发展,同时也给金融市场带来一定的风险和挑战。......
随着经济全球化以及我国金融改革进程的不断深入,我国商业银行的消费信贷业务发展迅速,信贷业务在我国商业银行业务和利润配比上所......
目的:建立不平衡数据处理方法对丹红注射液(DHI)临床应用安全性进行再评价,预测临床不良反应发生因素,并为临床合理用药提供参考。方法:......
随着金融机构信用卡业务的快速发展,信用卡欺诈行为成为金融机构面临的严峻问题。针对金融机构信用卡数据分布不均衡问题,本文采用过......
近年来不平衡数据分类问题持续成为关注的热点,广泛运用于医疗、金融、信息安全等诸多领域。与传统的数据分类不同,不平衡数据中某......
近年来,随着人工智能和机器学习在实际生活中的应用,不平衡数据分类问题成为了分类学习的主要方向之一。在实际应用中,比如医学诊......
传统的机器学习分类算法通常是在各类数据集样本数量基本平衡的基础上建立起来的。但实际应用场景中的数据集常存在不平衡问题,如......
多类别不平衡分布在图像分类的应用中普遍存在,是图像分类研究的主要问题之一。传统的分类算法基于平衡数据训练进行设计,当遇到不......
不平衡数据集在当今社会生活中大量存在,如肺癌病人诊断数据、信用评估数据、网络攻击识别数据等。针对不平衡数据集的分类叫做不......
不平衡数据广泛存在于现实生活中,如在金融领域内常见的信贷客户数据,即信贷之后发生违约的用户量远远低于履约用户量。对不平衡数......
本文搜集了云南大理州2000-2013年的林火数据和气象数据并进行了处理与整合。在此数据集的基础上,本文首先对云南大理州地区的气象......
随着我国市场经济的逐渐发展和完善,在竞争激烈的市场环境中,越来越多的上市公司由于经营管理不善而陷入财务困境。这不仅会使企业......
自2014年债券市场首次发生信用债违约后,债券违约事件频发,2018年以来违约规模更是呈现爆发式增长态势,达到了创纪录的1206亿元之......
近年来网络数据愈加复杂,特别是在可供分析的数据量有限的情况下,越来越高的特征维度直接导致入侵检测的时间效率和检测精度下降。......
随着金融借贷的快速发展,信用风险问题日益增大。因此,建立良好的信用评分模型在金融借贷领域起着十分重要的作用,以此来降低金融......
随着各种仿生智能技术的发展,适用于特定场景的说话人识别系统也层出不穷。说话人识别技术作为生物仿生特征识别的重要研究分支,以......
在信息技术飞速发展的当代社会,高度发达的金融交易环境使用户的金融交易成本降低、交易手段增加、交易频率增加,使金融交易具有实......
随着信息技术的迅速发展,人们越来越习惯于通过手机、计算机等线上平台查看各类信息,这催化了各类新闻网站的诞生。但由于新闻文本......
针对信用数据中的高维稀疏特征与样本不平衡问题易导致模型分类性能欠佳,提出一种新颖的框架来构建信用评分模型.首先,通过计算特......
宫颈癌是一种常见的妇科恶性肿瘤。宫颈癌筛查与诊断是预防与治疗该病症的有效手段之一,其中宫颈细胞病理图片分类是影响该病症辅......
变压器是电力系统中的重要设备,快速准确识别变压器的不同类型故障对提高电力系统的稳定性具有重要意义。然而,故障样本不足会严重影......
随着信息技术和互联网技术的高速发展,各种各样的数据信息急剧增加、不平衡数据问题广泛存在,使得不平衡数据分类问题成为数据挖掘......
在当今时代,分布式计算机控制技术的进步极大地推动了工业过程生产规模的扩大。对于复杂庞大的工业生产过程而言,高效的故障诊断技......
随着勘探目标逐渐由构造油气藏转向岩性油气藏,人们对储层预测的精度要求越来越高。自20世纪90年代开始,越来越多的机器学习算法被......
对不平衡数据集进行正确地分类并且提高少类样本分类性能的问题被称作不平衡数据集分类问题,该问题在近年来引起了研究者们的注意......
整合创新数据预处理技术与集成算法利用不平衡数据探讨了公司破产预测问题。首先,运用冗余信息处理方法、不同抽样方法等对不平衡......
在生命活动过程中,蛋白质和配体之间的互相作用是普遍存在并极为重要的。准确定位蛋白质和配体之间的相互作用位点,对于理解蛋白质......
社区矫正是我国一项重要制度,对优化刑罚资源配置、提升教育改造质量大有裨益。社区矫正工作能否取得良好成效很大程度上取决于社......
【目的】提出一种面向不平衡数据的电子病历自动分类方法,以进一步提高临床电子病历分类性能。【方法】利用MC-BERT增强电子病历的......
训练样本类别不均衡容易导致分类模型过度偏好,降低少数类样本识别精度。该问题的解决方法包括数据层面的过采样方法、欠采样方法......
人们的工作学习越来越离不开网络。网络给人们的生活带来便利的同时,网络漏洞攻击,如拒绝服务攻击、突发访问、蠕虫病毒等也威胁着......
随着互联网技术的快速发展,网络数据量也不断增长,随之产生了更多类型的网络攻击。面对规模庞大的网络流量特征信息,传统的基于机......
分类是数据挖掘领域中一个重要的分支,普通的分类模型通常假设数据集中各类别的样本数量差距很小且对于每个类别的误分代价相等,而......