论文部分内容阅读
随着现代社会中信息的高速增长,现有的数据管理体系已经无法有效管理广域环境中多达几十个 terabytes 甚至 petabytes 的数据,存储虚拟化技术的发展为解决这个问题提供了一条有效的技术途径。 在存储虚拟化系统中,元数据处于相当重要的地位。它是描述数据的数据,为系统提供单一全局用户空间、数据的定位和属性查找、数据的注册、数据访问控制信息和用户管理。为了方便有效的访问各种异构数据组成的数据集合,需要建立灵活的、可扩展的元数据管理机制。 在许多系统中比如 SRB(Storage Resource Broker),都采用层次目录结构管理元数据,由于元数据固有的层次性和结构单一性,这种管理方式有其方便简明的一面。但是,随着数据的激增,元数据变得越来越庞大,以前的组织结构和管理方式在扩展性、可用性和效率方面都不能很好的满足需求。 针对上述问题,在广域网虚拟化存储系统 GDSS(Global Distributed StorageSystem )中提出一种元数据层次管理模型 MDC(MetaData Controller)。MDC 提出一种基于匹配表的分级元数据管理方式,通过一次匹配就可以找到元数据所在的目录服务器,避免从根目录服务器的层层查询。同时,MDC 提供的 cache 模块保存热点元数据和正在被执行写操作的元数据,极大提高元数据读写效率。 基于 GDSS 系统已经实现了 MDC 元数据管理模型,通过测试证明,它可以提供并行元数据访问(快速搜索),对元数据稳定快速的定位,同时还可以提供一定的元数据容错能力,达到了很好的可用性和可扩展性,并更加易于管理。