粒计算的高效知识约简算法与缺失数据处理

被引量 : 0次 | 上传用户:angelfang555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
原始数据通常存在噪声数据、缺失数据等问题,它们会影响数据挖掘、机器学习的效果,虽然已经存在很多基于统计学的方法,但这些方法实际上是对模型参数的估计,不利于缺失数据的填补,它们更适合于处理无监督的数据表,对于决策表的缺失数据,目前的处理方法不多,而且这些方法产生的规则支持度和置信度都较低,本文利用最小描述长度原则对缺失数据进行填补,实验结果证明这一方法使得数据表产生的决策规则的支持度和信任度都较高,达到了预期目的。本文研究的另一个方面是高效的知识约简算法,知识约简是有效知识发现和规则提取的重要手段,目前的知识约简算法主要是基于Rough集理论,在处理不确定知识等方面,粗糙集有着不可替代的优势,而知识约简也是粗糙集理论和应用的关键内容,面对庞大的数据量,高效快速的算法至关重要,但很多知识约简算法只适用于小规模数据,本文研究了粒计算在知识约简中的应用,并设计了一种基于粒度的知识约简算法,分析表明其时间复杂度较小,实验结果也证明算法时间大大降低,而且多数情况下都能得到最小约简。
其他文献
在小孔剩余油物理模型的基础上,采用受力分析和压强分析的方法对其流动状态进行了研究,并对小孔剩余油数学模型进行了修正.结果表明,对于盲孔中静止的油滴,既可以将油滴视为
珠江三角洲在全国改革开发大局中占有十分重要的战略地位,众多具有全球影响力的先进制造业基地和现代服务业基地云集于此.发达的珠江三角洲水系及充沛的水量,在为三角洲经济
在临床干预中,传统家庭评估技术已经逐渐显露出测试指标不统一、操作复杂、测试时间长和结果缺乏量化等缺点。从评估指标、评估方式和评估材料等三方面出发,分析了传统家庭评
随着WTO新一轮谈判的深入,关税等传统贸易壁垒将进一步降低或取消。纺织服装业作为长期受保护的敏感行业,在配额取消后,势必受到巨大冲击。随着科技的发展,全球环保意识也深
三农问题始终是关系到我国改革开放和现代化建设全局的重大问题,没有农村的稳定,就没有全国的稳定。而农村贫困人口的存在在一定程度上成为关乎社会稳定的潜在不安因素。本文
随着现代企业制度的建立,我国国有企业在产品、市场、技术等领域面临的竞争压力持续增大,这些竞争实质上是资源的竞争,其中稀缺的高科技人才资源显得尤为重要。如何打造一支
膨胀系数小是钨基合金的主要特性之一。本文研究W-Ni-Cu合金膨胀系数与粘结相的量之间的关系,从理论和实验上探讨了提高合金膨胀系数,同时保持合金良好综合性能的途径。
本文在大量调查研究的基础上,分燃气类型(天然气、液化石油气、煤气)对当今国内城市燃气行业的现状、发展趋势分别进行了分析、预测;对我国城市汽车用燃气市场现状进行了介绍,并
把握规律务实进取——对怎样当好“一把手”的思考文王偏小任何事物都有其内在的本质规律,如何当好“一把手”也是如此。由于“一把手”的责任重大,当好“一把手”的重要意义是