【摘 要】
:
特征选取是数据挖掘、机器学习和模式识别中的一项重要技术,在数据准备和预处理过程中发挥着重要作用。它能够删除原始数据中的冗余属性,起到提高学习的准确性和减少学习的时
论文部分内容阅读
特征选取是数据挖掘、机器学习和模式识别中的一项重要技术,在数据准备和预处理过程中发挥着重要作用。它能够删除原始数据中的冗余属性,起到提高学习的准确性和减少学习的时间的效果。粗糙集理论是一种处理不确定和模糊知识的重要数学工具,它能在无任何先验信息的条件下,通过知识约简得到问题的决策。近来,粗糙集理论在特征选取算法中得到了广泛的应用,算法的有效性和应用成为了研究的热点。针对判断两个正区域相等算法的低效性问题,实现了一种高效的正区域相等判定算法。在此基础上,实现了一种基于相关信息量的特征选取算法。针对正区域计算过程中存在不一致数据信息丢失的问题,实现了一种将非一致性数据进行归类处理的方法。然后针对现有的粗糙集特征选取算法仅仅单独考虑属性的重要性存在的问题,通过将属性的重要性和规则支持度相结合的方式进行特征评价。最后,在前面研究的基础上实现了一种基于支持度的特征选取算法,并用国际机器学习数据库中的数据验证了算法的有效性。为了检验算法的实用性,设计并实现了一个知识发现原型系统,将基于相关信息量的特征选取算法和基于支持度的特征选取算法集成到系统的特征选取模块中。通过客户关系管理中的一个应用实例说明了特征选取算法在客户数据中的处理方式和特征选取结果的实用性。
其他文献
资源智能聚融是知识网格研究的重要问题之一。软设备模型是知识网格环境下统一的资源模型。该模型以统一的方式管理分布式资源,支持资源的有效共享和智能、动态地聚合。软设
企业财务危机预测是非线性预测,各个影响因素之间又存在着复杂的组合决策关系,并且现实中的数据多为连续的,很难直接用于机器分类学习。企业财务危机预警问题本身的特点和复杂性
虚拟手术系统应该同时满足真实性和实时性的要求。弹簧质点模型可以满足实时性的要求,但它无法模拟人体软组织器官的粘弹性特征;传统的有限元模型虽然可以模拟人体的粘弹性特
多机器人足球比赛,作为分布式人工智能研究领域的典型问题,近年来受到大家的关注。机器人足球涉及多个研究领域,而仿真平台的机器人足球研究则使研究者的注意力集中在多机器人足
随着Internet网络、无线通信技术以及交互式多媒体的迅速发展,视频压缩自然成为当今视频通信的研究重点。目前,许多实用的图像编码算法都是基于空间域的运动估计和补偿、预测误
随着网络技术的普及,网络安全性问题日益得到人们的重视。为了保护网络的安全,防火墙、入侵检测系统、安全审计等技术已广泛应用于网络,并取得了一定的效果。但是因各种安全
半球谐振陀螺仪是一种新型振动陀螺仪,它具有可靠性高、寿命长、抗冲击和精度高等优点,因此被广泛应用到飞船、卫星的稳定控制、精度指向、航天器导航与行星探索等领域。由于半
本体(ntology)是语义Web中的一个核心概念。随着语义Web的发展,本体的开发和应用越来越多。由于本体本身是分布式开发的,这就导致了各个组织开发的本体可能覆盖相同的或者相交
随着航空工业的发展,空投空降系统的应用越来越广泛。例如空投救灾物资和空投救护人员,航天和航空飞行器的回收伞。但是由于其工作过程是一个高速变化的十分复杂的动态过程,受力
数字水印技术属于目前国际上新兴的研究领域。它按照一定方法在被保护的数字载体中嵌入一些秘密信息,来达到保护数字作品版权以及跟踪证明盗版侵权行为的目的。 本文通过研