一个大数据治理系统的设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:wxxsdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着分布式存储、分布式计算等相关技术的成熟,大数据产业也获得了快速的发展,无论是政府和企业都看到了大数据中所孕育的巨大的价值,开始对过去众多业务系统所累积的庞大的数据进行价值挖掘。但是传统的数据管理模式与处理方式已经无法满足政府和企业对于海量异构数据进行多元化管理、标准化治理、高质量融合,并通过高质量数据实现精准治理、快速决策的业务需求,而要让这些海量数据释放出其蕴含的强大力量,必须要保证这些数据的准确性、可靠性以及及时性,而要达成这一目标,如果没有合适、高效的工具仅靠人力是难以完成的,因此我们有必要为用户提供一套行之有效的工具来协助用户进行数据治理。本文的目的就是为了建设一套这样的数据治理系统,通过该系统一方面让用户能够对多源异构数据进行多维组织、统一管理、快速检索;同时能够建立一套统一的数据标准与数据治理流程,能够持续地对数据进行检测处理,保证数据精确,为后续的业务决策提供高价值的土壤。本文首先对国内大数据治理系统的市场规模和系统建设现状等信息进行阐述,提出目前大数据治理系统所面临的挑战,以及建设大数据治理系统的必要性和意义。其次,本文将分析大数据治理系统的用户需求,包括功能需求和非功能性需求,以及相关功能的应用场景,并通过流程图对其进行详细说明。基于需求分析,本文将进行大数据治理系统的系统架构设计。整个系统将分为数据资产管理、数据标准、数据质量、数据修复以及资源调度五大子系统,在设计时,这些子系统将按照一致的设计原则和标准分别进行系统技术架构和功能架构的设计。技术架构包括系统的技术选型、项目结构、交互协议以及可扩展性、可维护性、稳定性等方面的内容。功能架构包括系统针对用户需求所实现的模块结构、各模块功能组成以及功能流程图等内容。接下来,本文将讨论大数据治理系统的详细设计。该部分将对数据资产管理、数据标准、数据质量、数据修复以及资源调度五个子系统的各个模块进行详细的描述,主要包括各个子系统针对用户需求所做的用户交互设计,交互使用说明,以及系统关键点的技术架构、类图、时序图、数据模型图等内容,同时对于主要的系统交互接口,该部分也将进行必要的说明。本文的第五部分将介绍数据资产管理、数据标准、数据质量、数据修复以及资源调度五个子系统是如何相互协调配合实现大数据治理系统的系统目标的。最后,本文对大数据治理系统的测试情况作了简单介绍,并对系统进一步改进提出了建议。综上所述,我们针对大数据治理系统目前所存在的问题并基于政府企业在大数据管理、治理方面的需求,提出并设计了一个新型的大数据治理系统,借助于微服务技术架构,实现了一套架构先进、可扩展性强、功能完善的大数据治理工具系统。
其他文献
本文基于微信小程序,对气象服务进行优化设计,通过小程序及时、便捷和高效的特点,为用户提供了优质的气象服务。文章首先研究了微信小程序开发设计的技术框架,其次分析目前微
早些年,冯小刚的电影《手机》给人留下了深刻的印象。电影中“严守一”少年时期住的古朴的山村,在现实中就位于北京的门头沟区斋堂镇,村名叫做爨底下,建村于明朝,至今已有400余年
柿树的病虫种类不太复杂,只需将几种主要病虫害综合防治技术(表1)掌握好,即可丰产丰收.一、柿炭疽病
<正>蘑菇套种不但能充分利用空间,节约占地面积,而且其效益能够成倍增加。这在河南省郾城县问十乡蘑菇生产基地已经得到证实。一、棚内菇莱套种。利用蘑菇棚内适宜的温度,套
宁波银行作为地区性银行,其在资本实力以及运营方面,相对于四大国有商业银行以及一些能力突出的中小商业银行,有着较大的差距。此外,宁波银行在发展过程中,外资银行的涌入也
目前,畜禽养殖业已成为中国农村经济中最活跃的增长点和主要支柱产业,但是随着其产业化逐步扩大及小养殖场纷纷仿效,所造成的环境污染问题日益突出,大有超过工业污染的趋势,成为新
1、揭膜炼苗。当日平均气温稳定在10℃左右时开始揭膜。到3月中下旬,越冬御寒覆盖物应全部除去。如果是采用薄膜覆盖防寒的,要搞揭膜前的炼苗工作,防止突然改变环境温度,使温
<正>玉米是河南省主要的夏播饲料作物,常年种植面积逾200万公顷。由于播种面积大,重茬现象非常突出,导致玉米根腐病、立枯病等苗期病害的严重发生,很多市县玉米死苗率达20%-30%,甚至
去毛里求斯过年的5个理由1、被誉为Tiffany Blue的半粉半翠的海水;2、神奇的“地上彩虹”七色土;