基于差分演化算法的粗糙集离散化及属性约简的研究

来源 :长沙理工大学 | 被引量 : 6次 | 上传用户:moete
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,数据挖掘已广泛应用于金融、制造和医疗等领域。但随着知识库的信息量急剧增加,人类迫切需要一类工具能从数据量大、冗余多,且存在噪声数据干扰的知识库中提取潜在有价值的规则。由于粗糙集在这些方面具有优良性能,其已越来越多地应用于数据挖掘。实际应用的知识库存在大量连续数据,而以等价关系为核心的粗糙集只能处理离散数据。因此,在利用粗糙集方法(如属性约简)处理连续数据之前必须将其离散化。本文分析比较了各无监督离散化方法和有监督离散化方法的优缺点,针对最优离散化是一个NP-hard问题的性质,提出了一种启发式离散化方法——基于差分演化算法的离散化算法。该算法采用实数串表示个体,增强了对局部最优点的搜索能力,并在此基础上给出了二值个体和一种适应值函数的定义形式,其中二值个体的定义形式上因条件属性而异设置不同的阈值,适应值函数考虑到了粗糙集理论的特殊性。最后通过Iris数据集的测试实验,验证了该算法是有效的。知识库的各属性的重要性并不是等同的,在确保不改变知识库的分类能力的前提下,可以删除其中冗余的或者重要性较低的属性。本文探讨了属性约简的启发式算法,缘于最小属性约简的求解是一个NP-hard问题,并提出了一种基于差分演化算法的属性约简算法,分别讨论了其在相容决策表和不相容决策表中的约简情况,进而引出了一种新的适应值函数定义形式和一种新的差分操作使变异向最小属性约简相应的个体进化。最后通过两组实验证明该算法是有效的,它的计算复杂度与基于遗传算法的属性约简的计算复杂度相当,但它的收敛速度是基于遗传算法的4倍。
其他文献
粗糙集理论是由Z.Pawlak于1982年提出的,它是一种处理信息的工具,可以有效地对不精确、不一致、不完整信息进行分析。有关粗糙集理论的研究现已成为热点,该理论的应用也非常
随着信息技术的高速发展以及计算机网络的日益普及,计算机网络正在以其独特的魅力影响着人们的生活方式,这其中就包括人们的学习方式。传统的学习方式受到时间和空间的制约,
自网络编码理论提出后,网络编码以其可以增加网络带宽利用率、增强网络健壮性等优点被广泛研究和应用。然而,网络编码很容易受到污染攻击。在科技发展日益飞速的今天,安全性
随着集群规模的逐渐扩大和性能的日益提高,集群调度技术作为集群的关键技术也成为研究的难点和热点。粒子群优化算法(Particle Swarm Optimization, PSO)具有并行性、有效的全
随着现代工业的迅速发展,机械设备的规模越来越庞大,自动化程度越来越高,集成化管理方式也越来越普遍,一旦设备出现问题将会带来重大的事故和巨大的财产损失。传统的采用简单仪器和人工经验的方法己不能满足现代复杂设备的故障诊断。近年来,机械故障诊断技术在国内外受到高度的重视,在机械学、通信学、计算机学和人工智能等科学的基础上迅速发展成为一门新兴学科。利用智能系统对设备进行故障诊断,及时发现故障,以保障关键设
随着3D图形学以及计算机软硬件的发展,现在的游戏已经可以创造出非常优美的画面。在这种情况下,游戏中人工智能的好坏成为了决定一款游戏成功还是失败的重要因素。因此人工智能
随着计算机网络的发展,越来越多的人使用互联网办公、娱乐。在享受着互联网服务的同时,面临着的安全威胁也日益加剧。木马病毒、僵尸网络的崛起,降低了网民的网络使用体验。
近年来,增强现实中自然场景的重建已经成为计算机视觉领域中的一个研究热点。它的研究在虚拟现实、自然灾害预警、游戏动画、军事仿真等领域有着广泛的应用前景和重要的应用
无线传感器网络(Wireless Sensor Networks,WSNs)作为物联网技术的重要组成部分,已被广泛应用到各个领域中。然而由于传感器节点固有的特点,导致其通信、计算、存储、和电源
随着移动通信技术和计算机技术的飞速发展,地理信息系统(GIS)在通信行业的应用越来越广泛,目前在移动通信网络规划与优化方面,地理信息系统应用十分普及,不过在网络规划与优