论文部分内容阅读
数据挖掘是集统计学、数据库、信息科学、机器学习、可视化等多种学科的一门交叉学科,主要任务是发现数据中隐含的模型或模式。在模型或模式发现过程中,由于数据规模过于庞大,为使算法得以运行或提高运算效率,人们往往针对抽样数据进行挖掘,因而也广泛应用了抽样技术。数据挖掘中的抽样技术继承并发展了统计学领域的抽样技术,经过十几年的发展,数据挖掘领域的抽样技术日臻成熟,但仍有许多难题需要解决。本文首先分析数据挖掘领域抽样技术运用中的一些难题,然后指出其未来的研究和发展方向。