论文部分内容阅读
在当今大型制造业中,由于多年的积累、产品型号的不断增加、“构型”机制的逐步实施,使存储在PDM(Product Data Management,产品数据管理)中的产品相关数据越来越多,逐步呈现出“大数据”特征;又随着MBD/MBE(Model Based Definition,基于模型的定义;Model Based Enterprise,基于模型的企业)技术的实施及全生命周期管理,不仅使工程数据的结构特征越来越弱,而且使企业中的用户几乎“全员参与”。以上特征使得基于关系型数据库RDB(Relation Model Data Base)的传统PDM系统在高并发读写、海量数据高效存储和访问、高扩展性和高可用性等方面存在的问题日显突出——服务器和用户终端机越来越“高档”、存储设备数量和容量越来越大、用户访问速度越来越慢、数据备份时间越来越长。因此对PDM中数据的新型存储组织结构及查询的研究具有重要的意义。首先,本文详细介绍PDM系统及非关系型数据库NoSQL(NoSQL=Not Only SQL,不仅仅是SQL)的国内外研究现状以及相关理论,分析PDM中产品结构树的创建理念,结合产品结构树中的结构关系与NoSQL的特点,探讨在NoSQL—MongoDB中PDM数据的存储结构,打破关系数据库表结构的传统模式,建立一种基于NoSQL的PDM数据存储的新模式。其次,详细分析于海量产品结构数据中提取单棵产品结构树耗时的缺点及MapReduce模型的优缺点,提出基于MapReduce并行分布式计算模型对海量产品数据查询其所包含产品结构树集的策略。最后,对本文提出的方法策略进行实验检验。结果表明,基于NoSQL的PDM产品结构数据组织可以更加清晰地表现产品结构关系和维护产品结构树,并且基于MapReduce模型在查询海量产品数据中所有产品结构树方面比传统方法效率更高。