论文部分内容阅读
随着分布式存储、分布式计算等相关技术的成熟,大数据产业也获得了快速的发展,无论是政府和企业都看到了大数据中所孕育的巨大的价值,开始对过去众多业务系统所累积的庞大的数据进行价值挖掘。但是传统的数据管理模式与处理方式已经无法满足政府和企业对于海量异构数据进行多元化管理、标准化治理、高质量融合,并通过高质量数据实现精准治理、快速决策的业务需求,而要让这些海量数据释放出其蕴含的强大力量,必须要保证这些数据的准确性、可靠性以及及时性,而要达成这一目标,如果没有合适、高效的工具仅靠人力是难以完成的,因此我们有必要为用户提供一套行之有效的工具来协助用户进行数据治理。本文的目的就是为了建设一套这样的数据治理系统,通过该系统一方面让用户能够对多源异构数据进行多维组织、统一管理、快速检索;同时能够建立一套统一的数据标准与数据治理流程,能够持续地对数据进行检测处理,保证数据精确,为后续的业务决策提供高价值的土壤。本文首先对国内大数据治理系统的市场规模和系统建设现状等信息进行阐述,提出目前大数据治理系统所面临的挑战,以及建设大数据治理系统的必要性和意义。其次,本文将分析大数据治理系统的用户需求,包括功能需求和非功能性需求,以及相关功能的应用场景,并通过流程图对其进行详细说明。基于需求分析,本文将进行大数据治理系统的系统架构设计。整个系统将分为数据资产管理、数据标准、数据质量、数据修复以及资源调度五大子系统,在设计时,这些子系统将按照一致的设计原则和标准分别进行系统技术架构和功能架构的设计。技术架构包括系统的技术选型、项目结构、交互协议以及可扩展性、可维护性、稳定性等方面的内容。功能架构包括系统针对用户需求所实现的模块结构、各模块功能组成以及功能流程图等内容。接下来,本文将讨论大数据治理系统的详细设计。该部分将对数据资产管理、数据标准、数据质量、数据修复以及资源调度五个子系统的各个模块进行详细的描述,主要包括各个子系统针对用户需求所做的用户交互设计,交互使用说明,以及系统关键点的技术架构、类图、时序图、数据模型图等内容,同时对于主要的系统交互接口,该部分也将进行必要的说明。本文的第五部分将介绍数据资产管理、数据标准、数据质量、数据修复以及资源调度五个子系统是如何相互协调配合实现大数据治理系统的系统目标的。最后,本文对大数据治理系统的测试情况作了简单介绍,并对系统进一步改进提出了建议。综上所述,我们针对大数据治理系统目前所存在的问题并基于政府企业在大数据管理、治理方面的需求,提出并设计了一个新型的大数据治理系统,借助于微服务技术架构,实现了一套架构先进、可扩展性强、功能完善的大数据治理工具系统。