基于聚类和Ripper的稀有类分类方法

来源 :暨南大学学报(自然科学与医学版) | 被引量 : 0次 | 上传用户:yangqimeng2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀有类分类在许多领域有重要应用,针对稀有类在数据中所占比例少,容易被忽略的特点,提出一种基于聚类和Ripper的稀有类分类方法,该方法在一趟聚类的结果中,通过将在整个数据集中所占的比例低于15%的聚类标识为少数类,再应用Ripper分类算法分别对少数类和多数类分别进行分类建模,并按照一定的组合方式调整得出整个数据集的最终规则集。在UCI数据集上的测试结果表明,基于一趟聚类和Ripper的稀有类分类方法对稀有类可产生高质量的分类效果。可以将该方法应用于现实生活的领域中进行稀有数据的分类。
其他文献
给出了非线性薛定谔方程的5种差分格式,并且分析了这些格式的局部截断误差以及稳定性和收敛性.并且用数值实验比较了它们的截断误差和运算速度.
五色万代锦(Agave kerchovel var.pectinata)也称五色万代,五彩万代,为龙舌兰属多年生肉质植物,植株无茎,肉质叶呈莲座状排列,叶剑形于披针形,中间稍凹,叶质坚硬而韧性,不易折断,叶尖有
台湾水果进入大陆市场,其中有些品种人们感到陌生,比如莲雾,许多人连听都没有听说过,作者在此特作介绍。
期刊
目的:用蛋白组学鉴定小鼠外侧膝状体内的主要蛋白。方法:提取小鼠外侧膝状体的蛋白质,通过二维凝胶电泳分离蛋白,用PDQuest图像分析软件选择电泳图谱中的高含量蛋白,用MALDI TOF/TO