不均衡数据相关论文
随着信息化发展,PDF文档以其良好的特性,成为日常流行的数据交换文件格式,也成为APT攻击事件中常被利用的文件载体。现有的恶意PDF文......
滚动轴承作为机械设备核心的零件,其性能影响着整个生产设备的稳定运行,研究滚动轴承智能故障检测技术意义非凡。传统的故障检测技......
随着越来越多用户习惯线上消费,电子商务平台积淀了海量的用户行为数据,提供了用户购买预测的数据条件。为更加精准高效地从海量商......
癫痫综合征是癫痫疾病的精准类型,包含了多种复杂的发作症状。癫痫综合征的精准分类和分析,使医生能够及时地采取积极的预防措施,......
随着信息技术的快速发展,各行各业所创造的数据总量以惊人的速度快速增长。为了能从海量的数据中获得有效的信息,数据挖掘技术应运......
纵火是一种特殊的犯罪形式,具有犯罪动机复杂,调查取证难的特点。纵火除了造成人员伤亡和财产损失外,还可能会产生巨大的社会影响,......
在实际的数据分类任务中,经常面临数据类别分布不均衡的问题,具体表现为属于某一类的样本数远超过另一类。若直接使用分类器对不均......
在各个领域中不均衡数据问题都广泛的存在,如医疗领域、故障诊断领域以及欺诈检测领域等。因此对不均衡数据进行研究且找到有效的分......
随着计算机网络技术的飞速发展,网络中各种电子形式的文本以指数级的速度增长,然而不同主题类别之间文档数量往往会出现指数级的差异......
在许多场景和应用领域中,不均衡数据学习是一个常见并且长期存在的问题。例如在实际生活中电信管理,信用卡欺诈检测,诊断数据中的......
随着我国互联网技术的飞速发展,导致碎片化信息增多,让舆情监测工作面临了新的挑战.越来越多的研究者开始通过情感分析的方式对碎......
在数据挖掘研究领域,分类任务广泛存在着数据分布不均衡问题,例如制造状态检测,医疗诊断,金融服务,等等.SMOTE是处理不均衡数据分......
针对基于不均衡网络评论的服务质量评价研究中存在的评论语料分布不均衡和特征词提取依赖主观经验的问题,在利用不平衡网络评论构......
针对高斯混合模型能有效表征任意空间分布信息的优势,提出一种基于变分贝叶斯高斯混合模型的不均衡数据集的自适应采样处理,以获得......
绝缘节是轨道电路的重要组成部分,当绝缘节出现破损时,就有可能发生行车事故,造成经济损失,甚至危及生命财产的安全。为了使现场人......
SMOTE算法被广泛应用在不均衡数据研究中,但原始数据集中的噪声数据可能会使数据边界模糊造成数据分布改变.本文基于采样平衡与特......
期刊
软件缺陷预测在提高软件质量、控制和平衡软件成本方面起着举足轻重的作用,是软件工程的活跃领域.研究者提出了许多预测技术,从不......
目的针对不均训练集导致印刷套准识别模型无法较好识别印刷套不准图像的问题,提出基于最大相关、最小冗余的印刷标志图像数据特征......
物质的太赫兹光谱具有唯一性。目前,结合先进的机器学习方法,研究基于规模光谱数据库的太赫兹光谱识别技术已成为太赫兹应用技术领......
基于分形自相似性理论改进SMOTE算法,实现数据集的均衡化。结合集成学习Adaboost技术更新样本权值,改善非均衡数据的分类性能,并对......
股票研报是由金融行业分析师对股票相关新闻作出的分析和评价,它从专业角度分析此类新闻是否会对某股票的未来走势产生影响,并提出......
为了解决传统分类器的过拟合现象,从而增强分类性能,提出了一种基于核空间中K-近邻算法的混合取样的不均衡数据集分类算法。该算法......
代价敏感学习是解决不均衡数据分类问题的一个重要策略,数据特征的非线性也给分类带来一定困难,针对此问题,结合代价敏感学习思想......
针对现有机器学习算法难以有效提高不均衡在线贯序数据中少类样本分类精度的问题,提出了一种基于主曲线的不均衡在线贯序极限学习......
为了提高传统支持向量域描述(C-SVDD)算法处理不均衡数据集的分类能力,提出一种基于密度敏感最大软间隔支持向量域描述(DSMSM-SVDD......
在对样本分布不均衡的数据进行预测分类时,样本均衡化往往是最重要的一步,而不同的均衡化方法产生的结果不同。对于“少数类”样本......
化探异常识别是成矿预测的重要依据。化探异常识别本质上是一不均衡数据的分类问题。异常识别过程中面临的主要问题是高维数据的处......
使用医疗信息系统的数据进行睡眠呼吸暂停低通气综合征(OSAHS)预测和分析过程中,存在不平衡数据问题。为此,在现有临床研究的基础上,......
针对传统的分类算法以及精度作为评价指标不能够满足现实分类问题的需要,将代价敏感方法引入支持向量机中,提出一种新的学习算法CS......
传统的支持向量机(SVM)算法在数据不均衡的情况下,分类效果很不理想。为了提高SVM算法在不均衡数据集下的分类性能,提出随机下采样......
针对现有学习算法难以有效提高不均衡在线贯序数据中少类样本分类精度的问题,提出一种基于不均衡样本重构的加权在线贯序极限学习......
在分布均匀的海量数据情况下,现有的入侵检测模型均具备良好的检测性能。但网络中产生的海量入侵数据的分布通常具有不均衡特点,而......
目的针对不均衡的印刷图像套准状态检测中存在的印刷套不准图像识别准确率低的问题,研究不均衡印刷图像训练集的预处理方法。方法......
近年来,人工智能(Artificial intelligence,AI)在诸多领域已经取得了巨大成功,如人脸识别、智慧医疗、自然语言处理和语音识别等。......
为减少不均衡数据对支持向量机分类性能的影响,提出一种基于二次支持向量机的欠取样分类算法,该算法依据样本的分类超平面贡献大小对......
新时期下,电信企业的战略目标已经由新客户开发转向老客户保留。在越发成熟的电信市场,新客户的开发难度越来越大,需要消耗大量的......
针对网络入侵检测中数据集的不均衡性和异构性,提出了一种基于密度均衡的网络入侵检测算法,利用异构距离计算类密度,依据类密度之间的......
随着网络环境日益复杂,网络规模与日俱增,各种网络攻击事件层出不穷,传统的网络安全系统已经逐渐无法满足人们对于网络安全的需求,......
近年来,高清视频设备的推出使得基于行为识别技术的人工智能在智慧安全城市、智能家居和军事安防等领域得以飞速发展。广泛的应用......
分布不均衡的数据在通过传统聚类分析的方式进行标注时,聚类效果容易偏向于样本数多的类,从而造成标注出现误差的问题。针对此问题......
针对异构数据集下的不均衡分类问题,从数据集重采样、集成学习算法和构建弱分类器3个角度出发,提出一种针对异构不均衡数据集的分......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
数字化经络仪、中医健康量表和四诊仪是中医临床常用辅助诊断工具,提供了很多中医临床数据。数据分布不均衡,同一个病例具有多个诊......
为了提高对变压器罕见故障的诊断准确率,有效应对变压器油中溶解气体(DGA)数据存在的样本不均衡现象,提出了一种基于加权极限学习机(wei......
当前,数据挖掘作为一种高时效性、高真实性的分析方法,正在社会中扮演着越发重要的角色,其在大型数据中快速挖掘模式,发现规律的能......
支持向量机(Support Vector Machine, SVM)算法是以统计学习理论为基础的一种机器学习方法,它以其扎实的理论基础以及完整的理论推......
针对中医临床在对有病个体分类时获得的数据很可能是不均衡的、缺失的,而且这种数据往往偏向于无病的个体这一问题,采用病例匹配最......