论文部分内容阅读
随着用户对知识需求层次的提高,越来越多的人早已不满足于以往所得到的知识,为了应对这一趋势,本文研究的主要问题集中在提高知识发现的效率,尤其是随着数据库技术的飞速发展,各种存储着复杂数据类型的数据仓库给数据库知识发现提出更加严峻的考验。本文主要提出了基于数据仓库的数据库知识发现策略问题,即算法可伸缩策略和过程驱动策略两大策略,并提出了基于这二种策略的一种新知识发现模型。本文的主要难点在于本文着重解决一般数据挖掘过程在数据仓库的环境下进行知识发现的策略优化问题,提高数据挖掘效率,使数据、信息能迅速转化为可为用户利用和决策支持的知识;以及对不同数据选择不同数据挖掘算法策略的提出。使这种选择策略能成为连接基于数据仓库的知识发现与挖掘算法之间的有效桥梁,不论是对专家还是初学者都能有效地驾驭数据挖掘算法进行数据仓库的知识发现。在本文的研究过程中,作者通过大量的阅读和学习与数据仓库知识发现相关的书籍、文献资料和相关理论,使论文研究的理论基础比较厚重,并通过对现有有关数据库知识发现和数据仓库知识发现的研究成果的学习和研究,归纳和总结了一些数据挖掘策略的优缺点,从而分析了本文所提出的策略的可行性。力争为基于数据仓库的知识发现理论的研究提供若干参考,同时不论对企业还是个人用户的实际操作都能有一定的指导意义。