数据挖掘中属性约简算法的研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:QQ2009sunboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是数据库系统和新的数据库应用的一个学科前沿.属性约简则是数据挖掘预处理中非常重要的一步,它大量压缩了信息系统的大小,有效提高了规则发现的准确性和效率.属性约简也就是机器学习中的属性子集选择问题.粗糙集理论为发现所有可能的属性子集提供了一种数学方法.目前有大量机器学习的算法用于属性约简.该文主要就这些算法进行研究和比较,并基于包装方法和GDT—RS系统的思想,提出了一种结合粗糙集理论和启发式搜索的属性约简(也叫特征提取)算法.为了验证这个算法的有效性,我们还开发了FSES原型系统,通过实验数据,证实了算法能够有效减少条件属性的数目.
其他文献
校园网络建设是一项高科技的综合性建设项目,涉及许多技术问题和管理问题。设计一个切实可行并具有很好的安全性的校园网络是一件富有挑战性的工作。随着计算机技术、网络通信
软件工程是为了经济地获得可靠的和能在实际机器上高效运行的软件而建立和使用的好的工程原则.将工程学的科学方法植于企业应用系统的开发过程,由此所产生的一系列的概念、过
椭圆曲线密码体制是一种基于代数曲线的公开密钥体制.使用椭圆曲线作为公钥密码体制的基础是由于定义在有限域上的椭圆曲线上的点的集合可构成阿贝尔群,由此可以定义其上的离
该文实现的小波图像压缩系统具有较好的压缩性能,能够应用于包括数学图书馆在内的很多领域,是一种通用的静态图像压缩系统.首先,该系统压缩的结果是嵌入式码流,允许从有损到
现今互联网正日益高速发展,当前的网络架构逐渐遇到发展瓶颈。尤其是随着网络虚拟化、云计算的大规模兴起,现存的网络设备及相关协议正成为阻碍其发展的因素。由于网络流量达
该文主要讨论工商行政管理中的信息技术应用,重点研究了计算机网络的全省架构、数据库系统的总体架构和业务应用软件系统的设计方案.在网络架构中主要讨论了建立覆盖省、市、
ARM是32位嵌入式RISC微处理器,目前占据低功耗、低成本和高性能的嵌入式系统应用领域的领先地位.虚拟机是用软件实现的机器.ARM虚拟机则是ARM微处理器的软件实现,其主要功能
该论文的主题是短信息点播管理服务器的设计与实现.该论文先介绍了短信息服务以及短信息点播服务的发展,提出了对短信息点播服务进行管理的必要性,进而引出短信息点播管理服
目前在Internet网络给人们带来极大方便的同时,人们已不再满足于从Internet上查询一般的信息,更需要从专业信息系统中获取全面、准确、及时的信息.这时就要考虑到Internet上
论文中的重点工作包括:①如何根据新图比例尺确定原图各地物要素的数量选取指标是实现无级比例尺数据处理的基础和关键.在开方根模型和等比数列模型的基础上,根据中国常见比