基于二进制区分矩阵的增量式知识约简算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:z85811936
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识约简是粗糙集理论的核心内容之一。通过知识约简可以在保证信息系统决策和分类能力不变的前提下剔除数据集中冗余信息。现实生活中,数据以不可预期的速度在增加。每获得一个新对象数据,在冗余信息剔除计算中都对整个数据集重新进行知识约简计算,必然是浪费时间和低效的。因此,对于以原有决策表知识约简计算结果为基础,计算新增加部分从而获得新决策表知识约简的增量式知识约简算法具有重要的理论和现实意义。本文针对传统二进制区分矩阵存储空间大以及如何有效地将二进制矩阵在完备和不完备信息系统中用于增量式知识约简的问题,研究了基于二进制区分矩阵的增量式知识约简算法,并将约简算法用于光伏发电功率预测系统的数据预处理,主要研究内容包括:(1)探索了在完备信息系统下基于二进制区分矩阵的增量式属性约简算法。为了解决二进制区分矩阵存储空间大的问题,提出了一种压缩二进制区分矩阵的方法,将二进制区分矩阵的存储空间从|C|+1列简化成3列。当增加单个新实例时,根据建立的压缩二进制区分矩阵,通过动态更新二进制区分矩阵的方法实现增量式属性求核,并以属性核为出发点,提出了在增加单个实例时基于二进制区分矩阵的增量式属性约简算法。(2)探索了在完备信息系统下增加成组数据时基于二进制区分矩阵的增量式属性约简算法。根据新增数据是单一实例还是成组实例对象,选择不同的分支程序来更新二进制区分矩阵。根据更新后的二进制区分矩阵快速求核,并以属性核为出发点,提出了适用于成组对象增加的基于二进制区分矩阵的增量式属性约简算法。(3)探索了基于二进制区分矩阵的不完备信息系统增量式属性约简算法。不完备信息系统下的增量式属性约简求解首先需要求解容差类。当在已有系统中新增实例时,为了快速求解新的容差类,首先提出了一种快速、稳定性较好的容差类静态求解方法,然后在此基础上提出了容差类的增量式求解方法。根据增量式求得的新容差类,通过动态更新二进制区分矩阵,提出了不完备信息系统下基于二进制区分矩阵的增量式属性约简算法。(4)探索了增量式属性约简算法用于光伏发电功率预测数据的特征提取。对采集的光伏数据建立光伏发电功率预测数据模型决策表,并对采集到的光伏数据进行相应的离散化处理。当新增数据时采用增量式属性约简算法进行特征提取,并对提取特征数据采用神经网络算法进行训练和预测。
其他文献
中气旋是一种规模不超过几十公里的涡旋型天气状况。气象工作者经过大量的数据统计发现,我国有92%以上、美国有90%以上的强对流风暴[1](如暴雨、强风、冰雹和龙卷等)都会伴随中
涡轮流量计在测量仪表中是一种非常重要的仪表,因其测量精度高、重复性好、体积小、重量轻而得到广泛应用。流体粘度变化是影响涡轮流量计特性的主要因素之一。随着其测量流
随着我国工业化发展水平越来越高以及进程的越来越快,国家对新能源的需求也越来越大。终端能源需求正在逐步从传统能源向优质高效洁净能源转化,作为新型环保能源的煤层气在我
大脑中约有101 1个神经元,神经元之间通过突触连接构成神经网络,实现大脑的各种生理功能。研究表明,大脑神经网络具有小世界拓扑结构特征,神经网络的过度同步放电会导致帕金
机群和弹群在执行任务时需要精确可靠的导航信息。对由多个节点组成的惯性网络系统采用主从式的传感器布局以及数据融合结构,不仅可以降低整个网络的成本,还能很好的实现子节点
电学层析成像(ET)是上世纪80年代发展起来的新型检测技术,它具有结构简单、成本低、无辐射等优点,广泛应用于石油化工等工业领域和医学领域中。ET重建图像质量评估是ET研究领域重
电导法测量是基于电学特性的两相流测量方法的一种,国内外对电导法测量气液两相流相含率主要以探针法、截面多电极法、纵向环形多电极法等为主,并已取得很大的进展。本课题在
步进扫描光刻机的研发工作是国内的重大科技专项之一,本文以光刻机工件台和掩模台控制系统研究为背景,为满足曝光扫描时各个子系统的任务调度、大量数据传输和工件台与掩模台的
蜂拥是一种相互影响具有一致目标的多个个体形成的群体现象。这一现象在自然界的生物群体中普遍存在,比如鱼群、鸟群、鹿群等。通过个体的局部感知作用和相应的反应行为形成
自上个世纪八十年代电学层析成像技术(Electrical Tomography,ET)提出,在短短的三十年里,该技术得到了快速的发展。电学层析成像技术具有非侵入、可视化、无辐射、响应速度快