基于MDA的数据挖掘模型研究

来源 :大连交通大学 | 被引量 : 0次 | 上传用户:chongyou2026
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,数据采集和存储技术开始广泛应用于人们的生产生活,很多领域都积累了大量的数据。所获取的数据正在以指数级的速度增长。然而这浩如烟海的数据只有部分得到了利用,升华为知识,造成了“数据丰富”而“知识贫乏”的尴尬局面。为此,人们引入了数据挖掘(Data Mining)的概念。数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息或知识的过程,目的是帮助分析人员寻找数据间潜在的关联,发现易被忽略的要素,而这些信息对预测趋势和决策行为是十分有用的。目前,对数据挖掘系统的建模和设计过于依赖于具体业务的表结构和数据仓库的形式。现行的数据挖掘建模和设计很难借用以往的数据挖掘的建模和设计成果,需要对业务和数据仓库进行重新的分析和设计。本文系统研究了模型驱动架构MDA(Model Driven Architecture)的体系结构,元建模框架,并对其中的元建模层次作了深入的阐述。在此基础上,鉴于关联规则在数据挖掘研究领域中的重要性,设计了基于MDA的关联规则挖掘框架。利用UML(Unified Modeling Language)扩展机制profile设计了关联规则挖掘平台无关元模型PIM(Platform Independent Model),利用CWM(Common Warehouse Metamodel)这一公共仓库元模型设计了关联规则平台相关模型PSM(Platform Specific Model)。针对东北某特钢厂的销售业务特点,建立了PIM元模型的实例source,开发了基于QVT(Query/View/Transformation)规范的转换规则rule,从而实现了ARDM(Association Rules Data Mining)的PIM元模型实例source到PSM元模型实例target的自动转换。最后,在EMF(Eclipse Modeling Framework)框架下,实现了对PSM元模型实例target的读取,并进一步转换成了SQL代码。由于模型的建立都是基于国际通用的相关标准建立的,从而使模型具有良好的规范性,提高了模型的利用率和系统开发的效率。
其他文献
随着我国水电事业的迅猛发展,大批的规模较大的梯级水电站群已经投产使用。水电站群的特点包括电站级数多、装机容量大、输送范围广等,其优化问题具有非常明显的高维性,非线
随着在线社交网络平台的爆炸式增长,比如国内的微博、微信,国外的Twitter、 Facebook等社交网络平台,人们越来越倾向于在社交网络平台上发表自己的观点,表达情感态度。与此同
无线传感器网络(Wireless Senor Network,WSN)是由大量的具有独立处理能力的传感器节点,通过无线通信的方式所构成的一种拓扑结构。无线传感器网络中的一项关键技术是时间同
随着通信技术的迅速发展,用户对带宽的需求越来越高。以成熟的以太网技术为基础的以太无源光网络(Ethernet Passive Optical Network,EPON)采用点到多点结构、无源光纤传输,
随着计算机网络的应用推广以及数字多媒体技术的迅速发展,视频在传输过程中遭到攻击或侵权的问题越来越严重。目前,视频信息隐藏作为信息安全的重要手段之一,已经成为信息隐
学位
如今市场对产品的设计要求越来越高,而产品结构也变得更复杂、功能也变的更强大,如果继续使用基于文本的系统工程(Text-Based System Engineering)这种传统的方法,将不能顺利地开发出复杂产品,因此,基于模型的系统工程(Model-Based System Engineering)被研究者提出,它的出现将开发复杂产品的系统工程中出现的许多问题很好地解决了。运用基于模型的系统工程方
软硬件资源的不断成熟和完善,使得嵌入式系统应用得到了十分迅猛的发展。另一方面,互联网技术的发展,使得Internet逐渐深入到人们的日常生活中。嵌入式控制网络与信息网络的
渤海海域在地理位置的作用下,每年冬季都会有海冰生成。同时由于渤海处于亚热带季风气候区内,受季风气候的影响每年的冰情都不相同。冬季的海冰会对海上的生产运输产生影响,
关联规则挖掘作为数据挖掘中的一个重要问题,已经广泛地应用于各大商业领域,成为数据挖掘中最主要的研究内容之一。多维关联规则作为关联规则的一种重要形式,在近年来也得到
随着计算机和网络技术的飞速发展,多媒体信息的复制、存储和加工变得越来越容易实现,如何判定数字多媒体信息的真实性和完整性也成为了一个亟需解决的问题,基于数字水印的认