【摘 要】
:
粗糙集理论是一种新的处理模糊和不确定知识的软计算工具。它能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。近年来在机器
论文部分内容阅读
粗糙集理论是一种新的处理模糊和不确定知识的软计算工具。它能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。近年来在机器学习、数据挖掘等多个领域得到广泛应用。
经典的粗糙集知识获取算法的时间复杂度都比较高,对于大数据集的处理效率不高,这大大限制了粗糙集的实际应用。因此,需要研究面向海量数据的粗糙集知识获取算法。
作为一种高性能计算技术,并行计算已经在数据挖掘中得到了很好的应用。把并行计算应用到基于粗糙集的知识获取算法中,提出面向海量数据的粗糙集并行知识获取算法,将是一个值得研究的问题。
本文结合并行计算,从粗糙集知识获取算法的处理效率出发进行了以下研究工作:
(1)分析了决策表中同一条件属性的候选断点集的断点重要性随断点值增大时的分布规律。基于此规律,提出了基于动态聚类的两步离散化算法。
(2)分析了基于动态聚类的两步离散化算法存在的并发性,提出了基于动态聚类的两步并行离散化算法,进一步提高了该算法的运行效率。
(3)结合并行计算的分治思想,提出了基于粗糙集理论的并行属性约简算法。
(4)对以上三种算法进行了仿真实验,得到了较好的结果。
其他文献
随着视频搜索技术的发展,基于内容的视频搜索近年来受到越来越多的学者关注。通用视频索引往往只使用视频图片的低层特征,对图片内容描述不够充分,搜索结果不太理想。为解决
主题搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合。其中的关键技术包括中文分词、主题爬虫、索引、分布式存
随着数据库和移动通信技术的飞速发展,用户需要在任何时候和任何地点都能通过网络获得信息。同时,用户对数据处理的需求不断提高,并且要求能够在限定时间内得到响应,与各种移
随着计算机和网络的发展,企业机房里的服务器数量也迅速地增长着,要方便、快捷地维护好这些服务器也变得越来越难。为了能方便机房管理员对服务器进行维护,研究和实现了一种
随着计算机技术和网络通讯技术的日益发展,大量数据涌到人们面前。如何有效地选择需要的信息成为了越来越突出的问题,数据挖掘技术就是顺应这种需要而发展起来。分类技术作为
近年来,随着人们生活质量水平的提高和计算机技术、通信技术及多媒体技术的发展,智能视频监控系统的应用日益广泛。但目前的智能视频监控系统大多是基于PC架构的,具有监控场景布
圆形Packing问题是一个典型的布局优化问题,也是一个有代表性的NP难度问题,NP难度问题是现代计算机科学中难于求解的一类问题,对于该类问题,目前尚不存在经典数学要求的既精
网格被认为是下一代网络,其目标在于实现网络环境内的资源共享和协同工作,而实现资源共享和协同工作的关键前提在于有效地发现资源。因此,网格资源发现机制长期以来都是网格研究
随着各种新型遥感卫星传感器的不断涌现,可用的多光谱、高空间分辨率的遥感图像数据日益剧增。但由于观测的限制和设计的原因,各种传感器有自己的特性,所以图像融合要充分的利用这些传感器的特性,不仅可以弥补单一图像信息的不足,而且有效增强图像的信息分析能力。遥感图像融合是一门综合多种学科的学科。本文在基于像素级融合的基础上,以遥感图像中多光谱图像和全色图像为例,研究如何充分利用两者的优势,在多光谱图像保持光
本文着重分析了Web服务研究最核心的问题——发现与组合技术,指出了当前所存在的困难;并在分析、总结现有Web服务发现和组合技术优点与不足的基础之上,提出了-个Web服务发现和组