【摘 要】
:
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多,激增的数据背后隐藏着许多重要的信息,人们希望能够对数据进行分析,以便挖掘出其中存在的关系和
论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多,激增的数据背后隐藏着许多重要的信息,人们希望能够对数据进行分析,以便挖掘出其中存在的关系和规则,并希望能够对其进行更高层次的分析,更好地利用这些数据,根据现有的数据预测未来的发展趋势。数据挖掘技术应运而生,它是目前数据库和信息决策领域最前沿的研究方向之一。粗糙集理论是波兰数学家Pawlak Z于1982年提出的一种处理不确定和不完整数据的理论,其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。粗糙集理论对问题的不确定性的描述或处理比较客观,与其它处理不确定性问题的理论有很强的互补性。 首先介绍了数据挖掘和粗糙集理论的基本概念、发展及应用,分析了粗糙集理论与其它数据挖掘方法的特点及互补性,并对粗糙集理论在数据挖掘中的应用进行了综合的分析研究。通过对粗糙集理论与神经网络的互补性分析,提出将粗糙集的约简和属性重要性等概念引入到组合的神经网络分类器的构造中,得到了基于粗糙集理论构造的、可理解性更强的组合分类器,比较实验结果证明该分类器具有较高的分类精度和分类质量。约简是粗糙集理论在数据挖掘中的主要应用,在分析比较了目前常用的多种约简算法之后,针对这些算法对大数据集进行处理时的时间复杂性和空间性大的缺点,提出了基于元信息的并行约简算法设计方案,以及基于PC集群的算法实现模型。最后,对全文所做的工作进行了总结,并对下一步研究工作进行了展望。
其他文献
虽然双相障碍(BPD)位于全球疾病负担的前30名之列,但直到目前为止,有关精神疾病认知功能的研究仍然主要局限于分裂症和单项抑郁症(UPD)。许多医生仍受克雷丕林(Kpraepilin)观点
在当前的个性教育中,为数不少的大学生在发展个性的过程中存在着偏差。究其原因,有对个性理解不正确所引起的,有心理失衡调节不当所引起的,等等。本文对这些偏差进行了总结,
新课程改革的目标之一是以创新精神和实践能力的培养为重点,改革教学方法,促进学习方式的转变。问题情境教学是实现这一目标的重要途径之一。本课题主要通过行动研究的方法,对高
目的观察针刀松解定点旋转体位下阳性反应点治疗青年神经根型颈椎病的临床疗效。方法将60例青年神经根型颈椎病患者随机分为治疗组与对照组,每组30例。治疗组予定点旋转体位
道家在其自身的历史变化中,不论是在哪个阶段,也不论是以何种派别发生着变化,它的生命关怀始终是其中一个不可忽视的主题。它们涉及了生命存在所要面对的所有问题,比如生命与自然
桃流胶病是一种世界性病害,国内外分布十分广泛,几乎所有桃产区均有发生,以多雨地区发生更为严重。桃是重庆市主要果树之一,2000年栽培桃26万亩,年产桃果9.5万吨,占水果总产量的8.9
本文以当代商贾历史小说为研究对象,通过对文本的解读探究此类小说在创作方面的成就,在文化方面的价值及其现实意义。第一章综述了当代商贾历史小说的现状,分别从文学渊源、
本文较系统地研究了以丙烯酸(AA)和丙烯酰胺(AM)为单体,采用水溶液聚合方法合成的聚丙烯酸(盐)/丙烯酰胺高吸水树脂(PAAAM)的吸液吸附性能,结果表明:PAAAM树脂具有吸液倍数大
地质勘查行业科技创新具有鲜明的行业特征。当前的地质勘查科技创新体系远远不能满足地质勘查新体制与新机制的需要。建立以政府部门为主导,以各种生产要素高度集成为特征的地
蔡明亮超常冷静,关注着都市人的生存境况。通过旁观的视角,幽暗的影调,封闭的空间,频繁的长镜头与平行的蒙太奇,他洞察社会的畸怪现象,展露存在的寂寞空虚。与同为都市题材为