论文部分内容阅读
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简。给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性。以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法。为了验证该算法的有效性,在7份数据集上进行了3组实验。实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试。实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性