论文部分内容阅读
随着信息技术的快速发展,数据采集和存储技术开始广泛应用于人们的生产生活,很多领域都积累了大量的数据。所获取的数据正在以指数级的速度增长。然而这浩如烟海的数据只有部分得到了利用,升华为知识,造成了“数据丰富”而“知识贫乏”的尴尬局面。为此,人们引入了数据挖掘(Data Mining)的概念。数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息或知识的过程,目的是帮助分析人员寻找数据间潜在的关联,发现易被忽略的要素,而这些信息对预测趋势和决策行为是十分有用的。目前,对数据挖掘系统的建模和设计过于依赖于具体业务的表结构和数据仓库的形式。现行的数据挖掘建模和设计很难借用以往的数据挖掘的建模和设计成果,需要对业务和数据仓库进行重新的分析和设计。本文系统研究了模型驱动架构MDA(Model Driven Architecture)的体系结构,元建模框架,并对其中的元建模层次作了深入的阐述。在此基础上,鉴于关联规则在数据挖掘研究领域中的重要性,设计了基于MDA的关联规则挖掘框架。利用UML(Unified Modeling Language)扩展机制profile设计了关联规则挖掘平台无关元模型PIM(Platform Independent Model),利用CWM(Common Warehouse Metamodel)这一公共仓库元模型设计了关联规则平台相关模型PSM(Platform Specific Model)。针对东北某特钢厂的销售业务特点,建立了PIM元模型的实例source,开发了基于QVT(Query/View/Transformation)规范的转换规则rule,从而实现了ARDM(Association Rules Data Mining)的PIM元模型实例source到PSM元模型实例target的自动转换。最后,在EMF(Eclipse Modeling Framework)框架下,实现了对PSM元模型实例target的读取,并进一步转换成了SQL代码。由于模型的建立都是基于国际通用的相关标准建立的,从而使模型具有良好的规范性,提高了模型的利用率和系统开发的效率。