论文部分内容阅读
数据挖掘在企业决策支持系统中处于重要地位,能提供非常重要的决策信息。如何提高企业决策支持系统的效率一直是数据仓库和数据挖掘技术致力解决的问题。对数据挖掘得出的结果进行存储利用是解决这个问题的主要途径之一。
对数据挖掘结果进行存储的主要意义在于:对挖掘结果进行集中存储可以减少存储空间,在一定程度上解决数据仓库体积膨胀的问题;通过对存储的挖掘结果进行管理可以把最新的结果返回给用户,不必再次进行挖掘,以此提高数据挖掘效率;可以有效地利用挖掘结果;能为挖掘结果在不同挖掘系统间的共享提供途径。基于此思想,本文采用一种带有模式存储系统的数据挖掘体系结构,这种体系结构能加快数据挖掘的速度,从而有效提高系统决策的效率。
本文在分析现有数据挖掘结果存储方法缺点的基础上,提出一种基于XML的挖掘结果存储方法:先以XML描述各种数据挖掘结果,再利用关系数据库存储描述挖掘结果的XML文档。深入研究了以XML描述五种常见数据挖掘结果(关联规则、序列模式、分类规则、描述规则和聚类结果)的方法,并给出对这五种挖掘结果的一种统一XML描述方法,为数据挖掘结果的集中存储、操作以及共享奠定了基础。XML的内容独立性和平台无关性使它可以作为不同数据挖掘系统中描述挖掘结果的统一形式。XML在数据表示上的强大能力和极强的可扩展性使本文提出的这种XML描述思想可为大部分挖掘结果的XML描述提供基础。
同时,本文研究了利用关系数据库对描述数据挖掘结果的XML进行存储和操作的方法,并进行了相关实验。
基于论文提出的数据挖掘结果存储方法,作者开发出一个仿真的挖掘结果存储系统,实现了对五种挖掘结果进行存储和查询的全过程,验证了此挖掘结果存储方法的可行性和正确性。
本文提出的存储思想可为不同挖掘系统共享挖掘结果提供统一平台,并能够有效提高数据挖掘效率,为企业决策提供有力的支持;同时,本文方法可以为大部分挖掘结果的存储和应用提供基础,其思想具有普遍性和很强的扩充性。