论文部分内容阅读
随着虚拟化技术的广泛应用,虚拟机开始广泛应用于各种数据中心和高性能计算平台,因此对虚拟机的物理载体--虚拟磁盘文件的备份需求也越来越强烈。传统的文件同步技术如rsync、RDC等在低带宽、文件尺寸较小的情况下具有较好的性能,但是在高带宽、文件尺寸大的情况下同步的速度有可能比直接通过网络传输整个文件还低。同时,在没有专用硬件存储设施的条件下如何解决备份的可靠性问题也需要考虑。
本文针对Vega Lingcloud课题组对大尺寸的虚拟磁盘文件同步的需求,提出了一种新的同步算法fsync,经实验测试,在同步GB级的虚拟磁盘文件时其同步时间开销比同类算法下降了30%~50%。基于fsync,本文结合Hadoop分布式文件系统设计并实现了一个分布式备份系统HD-fsync。该系统支持全量备份和差量备份,测试结果表明系统备份速度快,具有良好的备份一致性和可靠性。