论文部分内容阅读
知识约简是粗糙集理论的核心内容之一。通过知识约简可以在保证信息系统决策和分类能力不变的前提下剔除数据集中冗余信息。现实生活中,数据以不可预期的速度在增加。每获得一个新对象数据,在冗余信息剔除计算中都对整个数据集重新进行知识约简计算,必然是浪费时间和低效的。因此,对于以原有决策表知识约简计算结果为基础,计算新增加部分从而获得新决策表知识约简的增量式知识约简算法具有重要的理论和现实意义。本文针对传统二进制区分矩阵存储空间大以及如何有效地将二进制矩阵在完备和不完备信息系统中用于增量式知识约简的问题,研究了基于二进制区分矩阵的增量式知识约简算法,并将约简算法用于光伏发电功率预测系统的数据预处理,主要研究内容包括:(1)探索了在完备信息系统下基于二进制区分矩阵的增量式属性约简算法。为了解决二进制区分矩阵存储空间大的问题,提出了一种压缩二进制区分矩阵的方法,将二进制区分矩阵的存储空间从|C|+1列简化成3列。当增加单个新实例时,根据建立的压缩二进制区分矩阵,通过动态更新二进制区分矩阵的方法实现增量式属性求核,并以属性核为出发点,提出了在增加单个实例时基于二进制区分矩阵的增量式属性约简算法。(2)探索了在完备信息系统下增加成组数据时基于二进制区分矩阵的增量式属性约简算法。根据新增数据是单一实例还是成组实例对象,选择不同的分支程序来更新二进制区分矩阵。根据更新后的二进制区分矩阵快速求核,并以属性核为出发点,提出了适用于成组对象增加的基于二进制区分矩阵的增量式属性约简算法。(3)探索了基于二进制区分矩阵的不完备信息系统增量式属性约简算法。不完备信息系统下的增量式属性约简求解首先需要求解容差类。当在已有系统中新增实例时,为了快速求解新的容差类,首先提出了一种快速、稳定性较好的容差类静态求解方法,然后在此基础上提出了容差类的增量式求解方法。根据增量式求得的新容差类,通过动态更新二进制区分矩阵,提出了不完备信息系统下基于二进制区分矩阵的增量式属性约简算法。(4)探索了增量式属性约简算法用于光伏发电功率预测数据的特征提取。对采集的光伏数据建立光伏发电功率预测数据模型决策表,并对采集到的光伏数据进行相应的离散化处理。当新增数据时采用增量式属性约简算法进行特征提取,并对提取特征数据采用神经网络算法进行训练和预测。