基于模型转换的ETL代码生成方法研究及应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lsq87810
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模型驱动架构的核心内容是模型和模型之间的转换,为实现代码自动生成提供了理论基础。公共仓库元模型包含关系元模型和多维数据元模型,数据抽取-转换-加载是数据仓库的重要组成部分,为数据仓库提供了必要的集成数据。为了解决关系数据源到多维数据仓库生成的ETL代码满足不同数据库管理平台的需求,本文提出了基于模型转换的ETL代码生成方法,该方法为实现设计重用、提高ETL开发效率具有重要意义。首先,本文研究了MDA开发流程中的模型、模型的表示方法、模型转换原理和转换规则。采用MDA表示模型的方法,用关系元模型表示关系模式,关系模式描述结构化的数据源;用多维数据元模型表示多维数据模式,多维数据模式描述目标数据仓库。其次,本文给出了数据模型形式化的方法,用描述逻辑语言SHIQ的蕴涵断言(Terminological Box,TBox)将关系元模型和多维元模型的元元素及元元素之间的关系表示为概念和角色,使用实例断言(Assertion Box,ABox)表示关系模式和多维数据模式形成知识库。再次,本文用关系代数表示ETL转换函数的语义,并对关系代数的关系进行形式化表示,使得ETL转换函数具有明确的语义。采用业务流程建模与标注(Business Process Modeling Notation,BPMN)来构建包含业务控制图和数据转换图ETL过程模型,将数据转换图生成关系表达式。通过MDA模型到代码的转换方法,定义ETL转换函数生成代码规则。通过BPMN提供的控制流调用关系表达式,实现关系表达式到ETL代码的生成。最后,本文将提出的ETL代码生成的方法应用到产品的销售场景中,并对结构化查询语言(Structured Query Language,SQL)代码用模板生成语言(Generate Template Language,GTL)进行描述,制定的GTL模板放入PowerDesigner实验平台,实现ETL过程的SQL代码自动生成,最后将生成的代码放到Oracle数据库中执行,验证了方法的有效性。
其他文献
目的建立一种早期快速检测西尼罗病毒的方法。方法以人工合成西尼罗病毒基因(1021~1240,NY99)作为模板,利用环介导等温扩增技术(LAMP)原理,设计合成3套6对引物,特异性识别人工
文章对湖南省株洲市芦淞区百井剪纸的技艺传承、艺术特色、装饰纹样与文化传承等多个方面,进行了枝分缕解、鞭辟入里的介绍。并强调依托学校为推广载体,着重陈述了百井村数年
本文对广东省珠江三角洲高速公路养护工程费用情况进行分析,研究影响养护工程费用的因素,同时探讨控制养护工程费用的措施。
<正>@喻国明:传统媒体过去的思路中,没有入口式的终端概念,每个媒体都是一个终端,都是一个入口。过去一报在手,走天下。今天社交媒体构建起来的移动互联背景下,这样的概念成
基于参照点契约理论,结合我国国有企业薪酬管制的制度背景,文章以中国A股2009—2014年上市公司为检验样本,选取高管薪酬的行业均值为参照点,实证检验了我国国有企业高管薪酬
幽默话语是由语言的各种要素的变异使用而产生的一种具有审美情趣的言语行为。人类物质文明和精神文明发展到今天,幽默在人们的现实生活、艺术世界以至整个精神领域的地位越
日本脑炎是一种严重危害养猪业以及人类健康的虫媒病,每年造成大量的经济损失。为了更好地控制与预防该病,及时的诊断尤为重要。用于日本脑炎诊断的技术主要有病毒分离与鉴定
中国近代外语教育自1862年清政府创办京师同文馆开端,此后不断发展完善,至民国时期形成完善的教育体系,培养了大量的教育、外交人才,对中国近代化做出了重要贡献。在特定的历
中心站设置的合理性直接影响高速公路运营集中管理模式的实施效果。构建以中心站设置成本最低为目标的混合非线性规划模型,研究满足基本运营条件下路网中心站的设置个数和最
本试验历时3年(2015-2017)定位跟踪监测了已建植10多年成熟草坪的蒸散量及其地上生物量、地表枯落物和地下不同层位土壤含水量等11个影响因子,通过主成分回归分析以期探讨影