基于XML的数据挖掘结果模式存储方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lienkai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘在企业决策支持系统中处于重要地位,能提供非常重要的决策信息。如何提高企业决策支持系统的效率一直是数据仓库和数据挖掘技术致力解决的问题。对数据挖掘得出的结果进行存储利用是解决这个问题的主要途径之一。 对数据挖掘结果进行存储的主要意义在于:对挖掘结果进行集中存储可以减少存储空间,在一定程度上解决数据仓库体积膨胀的问题;通过对存储的挖掘结果进行管理可以把最新的结果返回给用户,不必再次进行挖掘,以此提高数据挖掘效率;可以有效地利用挖掘结果;能为挖掘结果在不同挖掘系统间的共享提供途径。基于此思想,本文采用一种带有模式存储系统的数据挖掘体系结构,这种体系结构能加快数据挖掘的速度,从而有效提高系统决策的效率。 本文在分析现有数据挖掘结果存储方法缺点的基础上,提出一种基于XML的挖掘结果存储方法:先以XML描述各种数据挖掘结果,再利用关系数据库存储描述挖掘结果的XML文档。深入研究了以XML描述五种常见数据挖掘结果(关联规则、序列模式、分类规则、描述规则和聚类结果)的方法,并给出对这五种挖掘结果的一种统一XML描述方法,为数据挖掘结果的集中存储、操作以及共享奠定了基础。XML的内容独立性和平台无关性使它可以作为不同数据挖掘系统中描述挖掘结果的统一形式。XML在数据表示上的强大能力和极强的可扩展性使本文提出的这种XML描述思想可为大部分挖掘结果的XML描述提供基础。 同时,本文研究了利用关系数据库对描述数据挖掘结果的XML进行存储和操作的方法,并进行了相关实验。 基于论文提出的数据挖掘结果存储方法,作者开发出一个仿真的挖掘结果存储系统,实现了对五种挖掘结果进行存储和查询的全过程,验证了此挖掘结果存储方法的可行性和正确性。 本文提出的存储思想可为不同挖掘系统共享挖掘结果提供统一平台,并能够有效提高数据挖掘效率,为企业决策提供有力的支持;同时,本文方法可以为大部分挖掘结果的存储和应用提供基础,其思想具有普遍性和很强的扩充性。
其他文献
双线性映射和可证安全技术正在当前的密码学界、代数学界甚至业界全面展开,这正是需要密码学作出回答的前沿课题,具有相当深刻的实践意义.在此背景下,本文专注于这两个方面的
近年来,电信行业正经历着业务变化带来的巨大变革,使得改造电信企业原有运营支撑系统迫在眉睫。针对新一代OSS建设面临的众多问题和挑战,电信管理论坛TMF提出了NGOSS标准对电
J2EE体系结构中EJB,JavaBean等技术都位于三层架构的中间层,它是连接后台数据库和前台JSP网页的桥梁。 对于EJB的部署问题,传统的作法是停止应用服务器运行后再部署新的单
随着Internet的快速发展,面向服务的体系结构(Service-Oriented Architecture,SOA)作为一种新的分布式计算技术应运而生,主要应用于企业应用集成和电子商务处理领域。Web服务
网格的服务质量是网格三大要素之一,对用户来说网格能否同时提供多种所需的异构资源、满足跨越多个组件的端到端的服务质量是至关重要的,而资源预约为用户在预定的时间能得到所
图像数据在获取、存储、传输和处理的过程中不可避免地会遇到质量退化的问题,这将影响人们对图像信息的理解和应用。因此,图像的质量评价显得必不可少。由于人是图像信息的最终
在分布式系统中,成员之间通过信息交换共同完成某个特定的功能,这些成员的集合称为组。组通信是指组中某个成员将消息发送到组中所有成员的操作,为一对多的数据传输提供了一种有
自20世纪80年代以来,非线性负荷的增多使得电网的波形畸变日趋严重。传统的功率计量理论只适用于正弦电路,对非正弦电路的功率,未进行定义;而目前的计量方法对非正弦情况也缺乏有
随着Web服务的出现和推广,基于Web服务的动态服务组合技术也成为近年的研究热点。Web服务的业务流程执行语言(BPEL4WS)作为一种基于业务流程的服务组合方法,建模理论基础比较
现代科学研究和工程实践对高性能计算的需求越来越强烈。Internet的出现和普及为全国各地的科研和工程技术人员远程使用各计算中心提供的高性能计算能力和网络上的其它资源提