论文部分内容阅读
关联规则作为一种数据挖掘的工具,它能够发现数据项集之间有趣的关联,在关联规则的算法中,Apriori算法是其中的关键算法之一,面对大量复杂的数据集,怎样选择数据结构,怎样优化处理过程,对此此算法的性能将会十分重要,该文首先介绍了关联规则的原理和Apriori算法的实现,然后提出了对该算法的若干改进,例如:采用树型结构存取频繁项集,使用三种缓存优化的方法等,这些优化都能够在整体上提高算法的效率,对于大数据项,试验显示,这些改进能够正确,有效,快速地实现Apriori算法。