论文部分内容阅读
针对当前石油钻井物料清单信息分布广、数据量大、类型繁多而难以管理的问题,通过分析大数据和钻井物料清单的国内外研究现状,设计提出基于Hadoop的钻井物料清单系统软件体系架构,并研究给出基于MapReduce的钻井物料清单数据信息的分析算法。本文的研究工作具体包括以下几个方面:第一,对钻井物料清单的结构及其管理特点进行了分析和概述,指出当前钻井物料清单管理中所存在的一些问题,在对钻井物料清单的研究现状概述的基础上,论述了在大数据时代下,对钻井物料清单进行管理分析的重要性和必要性。第二,将Hadoop的软件体系架构应用到石油钻井物料信息管理中,构建了基于Hadoop的钻井物料清单信息的分布式管理系统软件体系架构,实现了大数据环境下对石油钻井物料清单的分布式管理,为网络环境下石油钻井物料信息的分布式存储和有效管理提供了新的思路和方法。第三,采用MapReduce的编程模式与方法,研究基于MapReduce的钻井物料清单数据信息的分析算法,实现大数据环境下对钻井物料清单的实时并行分析,提高数据信息的利用率。第四,开发实现了基于Hadoop的钻井物料清单原型系统,为石油钻井行业钻井物料清单管理提供辅助支持,并简要介绍了系统的实现结果。采用大数据技术分析处理钻井物料清单数据,能够充分降低石油钻井企业成本,提高企业数据管理效率,为大数据时代的钻井物料清单数据的快速分析处理带来新的曙光。