属性约简技术及应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:andy630767963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大量来自客观世界的数据不仅结构复杂,而且具有众多的属性。这些属性在应用中其重要性并不是完全相同的,有的属性甚至是冗余的。根据应用的需要删除冗余属性和不影响应用的属性既有利于数据的有效保存,又有利于从数据中获取知识。属性约简是删除冗余属性和不重要属性的一种有效方法。 对数据集进行属性约简的研究是粗糙集理论的重要内容之一。Wong.S.K.M和Ziarko.W已经证明了基于粗糙集找出一个决策表(数据集)的最小约简是NP-hard问题。己知的多数基于粗糙集的数据约简算法一般是启发式算法,难于保证获得的约简是最小约简。常常数据集最小约简中包含的属性数目也难于确定。鉴于此,本文将分形理论与属性约简联系起来进行研究,用数据集的分形维数作为其本征维数,由此获得最小约简的一个有效判据。实验表明,这种判据是有效的和可行性的。 本文研究的内容和主要成果包括: ①详细介绍了属性约简相关技术与方法的研究现状。 ②研究了基于粗糙集的属性约简技术和分形维数计算方法,指出了基于粗集约简存在的缺陷,给出了一个有效的分形维数计算方法。 ③研究了目前常用的两种基于分形维数的约简算法,提出了改进算法。实验表明,该算法不仅能较好地解决了最小约简问题,也能将能处理的数据集的类型从单纯的决策表扩展到一般数据集。 ④研究了属性约简方法与关联规则挖掘方法的融合。实验表明,利用属性约简的结果到关联规则挖掘中,能够有效地减少挖掘过程中人工干预的过程,并且能够获得较好的挖掘参数。 本文的研究表明,将分形维数与数据约简技术结合起来有利于确定约简目标,为获得最小约简提供了有效的判据;将属性约简与关联规则挖掘技术结合起来能够为获得自适应的挖掘算法提供有益的指导。
其他文献
形式概念分析是德国的Wille教授在20世纪80年代提出的,随着对该理论研究的不断深入,利用形式概念分析理论进行数据库中的知识发现研究已经成为当前计算机科学领域的一个热门研
Overlay网络是由一系列分布在Internet各个自治系统内部的Overlay服务节点以及连接它们的逻辑链路所组成的虚拟网络,它能有效地利用Internet给终端用户提供更为可靠的服务。O
Peer-to-peer(P2P)作为以文件共享为初始目的的应用,允许任意终端用户对等点(Peer)间通过Internet完成文件交换。在P2P应用仅有的短短几年发展时间里,它已成为了占用Internet流
关联规则挖掘经过十几年的发展,取得了丰硕成果。其中的布尔关联规则挖掘是关联规则挖掘中研究比较多的一种。通过数据离散化和符号化,把时间序列数据转换为布尔型数据,从而使时
时代的进步,技术的发展,人们对于知识信息的交流和共享需求日益增多,这种共享和交流也为人们的生活带来了巨大的便利,也同时带来了非常可观的经济利益。而随之而来的各种对于这些
随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点
本文对航空货运装载问题算法进行了研究。文章提出了宽体客机集装器装载方法,它属于三维装载问题。采用逐层填充的方式,首先通过基于统计函数的启发式规则确定层高,根据机舱的要
电机制造是我省的传统产业,其相关测试仪器多依赖进口。由于价格昂贵,推广受到限制,从而制约了电机产业的发展。虚拟仪器的出现,在电子测量仪器的自动控制领域中引起了根本性
入侵容忍技术是一种新的信息安全方法,在过去十几年逐渐显现出来,最近赢得了国内外众多研究者的关注。传统的数据库信息安全研究主要集中在如何进行防御上,如认证、加密、访
随着测井技术的发展,各种井下仪器上传的数据量越来越大,导致利用RS-232串行接口来传输由井下仪器上传的数据时,经常会出现“瓶颈”问题。32臂井径仪是由我国自行开发的测井仪器,