连续属性离散化相关论文
财务失败预测是金融领域一个重要的研究课题.自上世纪60年代以来,随着企业破产问题的日益严重,各国学者纷纷尝试通过定量分析对企......
数据库知识发现(KDD)是涉及人工智能和数据库等学科的一门当前相当活跃的研究领域.在当今数字化社会中,各种商业、政府、科学数据......
数据挖掘是当今数据库和人工智能最活跃的研究领域之一,是知识发现(Knowledge Discovery in Databases,KDD)的核心,它的目的在于发......
粗糙集理论是一种处理不确定知识的有力工具,在各领域已得到了广泛应用。本文的研究工作主要集中在粗糙集应用过程中数据预处理和......
随着数据库和网络技术的不断发展进步,我们生产和搜集数据的能力有了大幅度的提高,数据量成指数级的增长,面对庞大的数据量,数据挖......
连续属性离散化是数据挖掘和机器学习研究及应用中的一个重要方面。在很多规则提取、特征分类算法中,连续(实值)属性必须进行离散......
我国的公安机关在多年的工作中,一方面不断推进信息化的建设,另一方面,其在公安工作的专门数据和社会信息方面都有了相当大规模的......
传统的粗糙集理论只能对数据库中的离散属性进行处理,所以对存在连续属性的数据库必须进行离散化处理。连续属性离散化是机器学习......
计算机技术的迅猛发展和数据库系统的普遍使用,给人们提供了强有力的平台,去更好地利用信息技术进行生产,而且搜集和检索数据的能......
为在应用粗糙集理论处理数据时,对连续属性进行离散化预处理,采用k均值算法对连续属性进行离散化的方法,将属性无监督聚类成两类.......
朴素贝叶斯分类方法是简单的贝叶斯分类方法,在众多分类方法和理论中,朴素贝叶斯由于计算高效、精确度高,并具有坚实的理论基础而得到......
提出了一种基于类-属性关系依赖度的数据离散化方法,其特点是:借助统计学的λ相关系数,有效地捕获类-属性间的相互依赖,以此来选取......
提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通......
介绍了在数据库知识发现(KDD)中将连续属性离散化的一些方法,并提出使用值差分度量离散化的算法,值差分度量算法原本是用于计算离散属......
连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法,在该算法中,首先将信......
为了剔除样本信息中存在的冗余成分和不相容性,同时提取关键信息等,根据样本信息的特点和信息具有粒度的思想,基于粗糙集的2个近似......
研究了基于联合熵和粗糙集理论的关联规则挖掘算法,改进了基于粗糙集的属性离散化方法—连续属性联合熵差离散化算法;以联合信息熵......
连续属性离散化在机器学习和数据挖掘领域中有着重要的作用。连续属性离散化方法是否合理决定着对信息的表达和提取的准确性。Chi2......
对基于信息论的离散化系列算法进行了分析,在此基础上提出了一种新的连续属性离散化方法。该算法使用信息偏差来对断点重要性进行......
提出一种基于改进粒子群优化的连续属性离散化算法。在算法优化方面,采用改进粒子群优化算法。为了克服传统粒子群优化的不足,对种......
为了解决数据挖掘和机器学习领域中连续属性离散化问题,提出一种改进的自适应离散粒子群优化算法。将连续属性的断点集合作为离散粒......
为了弥补粗糙集理论不能直接处理连续数据的不足,提出了一种基于粗糙集和布尔逻辑连续属性离散化的改进方法,针对相同个数的断点情......
目的:结合面向医学领域的数据挖掘技术,对乳腺肿瘤诊断方法进行优化。方法:提出连续特征离散化的New-Chi2算法,通过均匀选取类样本的......
研究了数量关联规则挖掘过程中的连续属性离散化问题,描述了连续属性离散化方法,包括连续属性区间划分算法和数据库样本大小的确定......
粗糙集理论是一种新的处理不精确、不完全与不相容知识的数学工具.粗糙集理论只能对离散属性进行处理,而不能处理连续属性.文中针......
学习分类系统(LCS)是一个动态感应环境的模拟认知系统,它利用环境反馈评估种群中的分类规则并通过遗传算法对种群进行进化. 当环境......
提出了一种基于聚类方法、结合粗集理论的连续属性离散化方法。在粗集理论中有一个重要概念:属性重要度(Attribute significance),它......
使用信息论的方法进行连续属性的离散化.引入Hellinger偏差HD(Hellinger Divergence)作为每个区间对决策的信息量度量,从而定义切......
针对海量数据环境下单机检索低效问题,建立了对海量化合物快速检索的分布式计算模型,提出了基于分治策略的分段哈希算法。对于如分......
连续属性的离散化是机器学习和数据挖掘的重要预处理步骤,如何高效处理海量数据连续属性离散化已成为急需要解决的问题。近年来兴起......
连续属性离散化是机器学习和数据挖掘领域中的一个重要问题,离散化是否合理决定着表达和提取相关信息的准确性。经过研究Chi2系列算......
在CAIM算法中,离散判别式仅考虑了区间中最多的类与属性间的依赖度,使离散化过度而导致结果不精确。基于此,提出对CAIM的改进算法,该算......
Chi2系列算法是基于概率统计理论的连续属性离散化重要方法.论文对Chi2相关算法进行了深入分析,指出其中的不足,提出一种新的连续属性......
针对机器学习领域的一些分类算法不能处理连续属性的问题,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法.该算法定......
运用贡献度随机森林方法(CRF)方法探讨公司债财务指标比率与其违约率的关系.运用连续属性离散化方法(OB)进行财务指标最优降维;运......
本论文研究课题源于国家973基础研究项目(No.2002CB312006)“Internet环境下基于Agent的软件中间件理论和方法研究”和国家自然基金......
面对国际不断加剧的竞争趋势,机械产品的创新、快速设计已经成为制造企业竞争的焦点。知识是设计的源泉。快速、创新的产品设计迫......
连续属性离散化是知识系统中的一个重要环节,一个好的离散化方法能够简化知识的描述和便于对知识系统的处理。而求取连续属性值的......
齿轮箱是机械系统的重要传动部件,故障发生率较高,其振动信号呈现非线性非平稳的特点,故障程度、部位和类型等对特征参量的影响很......
连续属性离散化是数据挖掘和机器学习研究及应用中的一个重要方面。在很多规则提取、特征分类算法中,连续(实值)属性必须进行离散......
随着计算机和Internet技术的迅猛发展和广泛应用,人们在受益于信息革命所带来的巨大利益的同时,也不得不面对信息安全的严峻挑战,系统......
提出了一种基于类-属性关系依赖度的数据离散化方法,其特点是:借助统计学的入相关系数,有效地捕获类-属性间的相互依赖,以此来选取最佳......