【摘 要】
:
从大型数据库中挖掘关联规则是数据挖掘中一个重要的课题。从挖掘要求的时间和空间上看,传统的顺序算法已很难适应于现实中不断增大的数据库规模。研究和发展高性能、可扩展
论文部分内容阅读
从大型数据库中挖掘关联规则是数据挖掘中一个重要的课题。从挖掘要求的时间和空间上看,传统的顺序算法已很难适应于现实中不断增大的数据库规模。研究和发展高性能、可扩展的并行算法对解决这一问题就显得十分必要。本文做了如下研究工作:1.基于分布式存储的并行关联规则挖掘研究本文在研究传统的挖掘频繁项集并行算法的基础上,提出了一种多次传送重新分配数据的并行算法(MRPD),并从理论上证明了算法的正确性。MRPD算法在第1步时对数据库重新划分成若干组,并根据各节点的需要多次传送分组,各节点获得完整分组后异步地计算频繁项集。所有节点计算完成后,得到全部频繁项集。通过实验,将MRPD算法与传统挖掘算法在不同数据分布情况下做了比较。2.基于共享存储的并行关联规则挖掘的研究本文在关联规则串行挖掘算法Apriori的基础上,针对SMP系统设计了两种不同并行粒度的挖掘算法,基于HASH表的HA-1算法和基于局部数据库的HA-2算法,初步解决了分布式存储系统算法中通信开销过大、并行度低等问题。通过实验对这两种算法与传统挖掘算法的性能进行了比较。
其他文献
为了探究孔型、填充材料、基体材料对节能环保多孔砖热工性能的影响,运用ANSYS软件建立6种多孔砖模型及2种保温墙模型,通过改变多孔砖的填充材料、基体材料并分别进行热工分
新生儿呼吸窘迫综合征(RDS)是新生儿期常见的肺部疾病,也是新生儿(主要见于早产儿)死亡的主要原因。新生儿RDS的早期诊断尤为重要,需及时给予肺表面活性物质和持续气道正压通
21世纪以来,世界经济全球化和区域经济一体化成为了不可阻挡的历史潮流,无论是发达国家还是发展中国家,都不可能孤立于世界而发展。因此,国内、国际经济双循环的发展模式成为
基于半导体技术的激光和宽带光源器件具有体积小、电流驱动和控制简便等独特优点,目前已在光纤通信和传感领域得到广泛的应用。但半导体光源的输出功率受电流和温度波动影响
在现代汉语词类研究中,动词研究尤其是动词的次范畴研究一直是汉语研究者所关心的问题。本文就是把动词中的一个小类——言说类动词作为自己的研究对象,希望可以通过系统的考
本文选用ANSYS作为工具,在选取适当的单元类型、本构关系和破坏准则的基础上对三个构件进行了有限元仿真分析,模拟了构件的破坏过程,并从理论上揭示了钢骨混凝土不等肢L形截
工后沉降是造成路基沉降变形的主要原因,研究路基工后沉降的规律并预测最终沉降量对工程设计具有重要意义。利用兰武二线黄土路基工后沉降的长期观测数据,提出一种新的分析预测
亲属称谓是对与自己有亲属关系的人的称呼方式,是建立在家庭及亲属关系基础上的亲属之间相互称呼的名称和叫法。亲属称谓词是亲属关系和亲属观念的外化符号,其间充盈着丰富的
对儿童而言,提高他们的综合素质,让他们拥有健康、快乐的人格(个性),是深层次家庭教育目的应承载的内容。亲子沟通作为家庭教育的核心内容,已受到广泛认可。因为家庭是儿童个
目的:研究家庭环境、养育方式、气质、骨密度及血清IGF-I对婴儿动作发展的影响,为早期教育和科学养育婴儿提供依据参考。方法:采取自愿的原则,选取健康体检的四月龄婴儿,选择