论文部分内容阅读
随着信息社会的发展,越来越多的信息以电子数据形式存储,尤其是伴随着Internet发展,电子数据呈爆炸式增长。在未来几年内,存储将成为令人瞩目的一个市场。在今后的几年内,存储服务市场将进入飞速发展期。基于Internet的应用例如电子商务、电子邮件和客户关系管理(CRM)等将成为存储服务的主要市场。此外,如何利用异构的存储资源高效协调的工作也是一个非常迫切待解决的问题。G2NFS是在全局分布式存储(GDSS)平台上的开发针对这些问题而提出的一个较好解决方案。G2NFS结合单一名字空间和多名字空间的特点,建立一个全局统一的文件命名空间,对所有的用户提供相同的文件命名、定位、和访问机制,实现文件定位的高效率、位置透明性和访问透明性。同时针对不同的用户的兴趣,为他们提供不同的数据视图。利用域和组的概念,采用分布式元数据服务器,实现控制命令传输和真实数据传输分离的第三方数据传输,从而大大减轻服务器端的负载,提高了系统的吞吐能力。采用域和组的概念,建立方便高效的用户数据共享机制。G2NFS采用一种自适应策略,即当文件比较大的时候采用普通的传输方式或者分片传输,当文件比较小的时候放入一个数据通道,多个小文件共享一个socket。采用socket复用技术使得大批量小文件的传输高效而快捷;采用大文件分片技术,使得大文件传输的效率得到极大的提高。文件快照技术是一种保留某一时刻文件系统映像的技术,它用最短的时间和最低的消耗实现文件系统的只读备份,其目的是在应用层有效地保护数据不被破坏。元数据给出了数据在存储装置的存储结构,通过记录整个文件系统的元数据在某一时刻的状态,建立文件系统在这一时刻的快照。G2NFS实现了一般文件系统功能,具有统一的用户视图,实现了第三方传输,测试结果表明,该文件系统对大批量小文件和超大型文件传输具有极为明显的优势。