分布式WEB信息存储关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kar123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet应用的普及以及信息的飞速增长,越来越多的企业或政府组织开始采用企业竞争情报系统来收集、分析和管理他们所需的Web情报信息。这就对企业竞争情报系统中的关键技术——分布式Web信息存储提出了巨大挑战。如何构建大规模、高效率、易于扩展、高可靠性的应用于企业竞争情报的存储系统,是分布式Web信息存储技术迫切需要解决的问题。本文从如何提供高可用、高可靠、高效率的分布式Web信息存储服务的角度出发,在对分布式存储领域的最新研究成果进行了系统学习和总结的基础上,结合企业竞争情报应用的背景,围绕着分布式存储机制、节点内Web信息存储组织结构以及Web信息版本管理这三个方面进行了深入细致的研究,取得了若干创新和成果。1.本文提出了一种分布式Web信息存储的加权轮询负载平衡算法,并应用该算法建立起分布式Web信息存储模型。该模型通过负载平衡算法将各个Web信息存储节点的磁盘空间组织成一个统一存储池,利用目录管理服务器来对存储池进行分配和管理。该模型以星形拓扑结构来组织节点,并采用Web信息自适应通道传输策略,为用户提供高效、透明的存储服务。2.本文针对Web信息文件小数量多的特点,提出了一种Web信息存储文件结构——PAK文件结构。该结构将多个Web文档经过高效压缩、分类处理、统计信息等操作,统一打包,节省了磁盘空间,又避免了频繁的磁盘I/O操作,提高了存储的效率。同时,采用PAK文件结构,也为用户各种不同的存取模式提供了良好的接口。3.本文提出了一种Web信息版本管理模型——基于时间序列的自适应Web多版本管理模型。该模型综合考虑用户对可用性、访问效率的需求以及数据的维护开销,对版本的数量进行动态管理,既提高数据可用性、降低访问延迟,又能减少维护数据的开销,为用户提供了较好的存储服务。
其他文献
随着MDA技术的流行和不断完善,越来越多的公司推出基于MDA的快速开发平台,通过用户设计的模型和平台已有的框架,可以直接生成可执行的程序代码。本文围绕此类开发平台的数据
在信息量呈指数级增长的今天,我们需要数据库管理系统(DBMS)能够处理上G、上T、甚至上P的海量数据。这就对数据库管理系统提出了挑战,即如何有效地存储和管理海量数据并高效
工程设计过程中数据整理、数据查询、图形处理、文档编辑等工作己逐渐趋于应用专业软件来实现。根据目前具体设计行业的特点,设计过程中往往通过多专业人员的多人协同工作,来实
数据挖掘是数据库系统和数据库应用的一个有希望的、欣欣向荣的学科前沿。它是一个多学科领域,从多个学科吸取营养。进行数据挖掘的方法有许多,而RS方法便是其中的主要方法之一
随着CMP的出现,如何提升其运行效率和最大化并行性倍受国内外专家和学者的关注。系统性能的提升不仅与硬件平台有关,同时也离不开硬件平台上的优化软件设计,只有两者充分结合
本文针对应急决策支持系统中数据交换的需求,提出利用XML(可扩展标记语言)技术建立数据交换平台,用统一的方式,实现各个系统之间不同结构和格式的数据的相互转换,解决了数据
近年来频频爆发的恐怖活动、地震、洪水、火灾、流行性传染病、煤炭安全生产以及稳定输送电能中的重大事故等突发事件对人民群众生命财产和社会安全造成极大危害。突发事件妥
定位与路径规划是月球车导航的两个重要问题。月球车要实现在月面环境下自主导航首先必须时时刻刻清楚自己的位置,之后能根据当前环境规划出一条合理的路径。因此本文围绕着
随着大规模数据收集技术、存储技术、网络技术以及信息技术的发展,越来越多的企业、组织和个人正逐步陷入数据泛滥但知识匮乏的困境中,聚类分析已经成为从大量冗余数据中提取有
近年来,随着互联网的快速发展,互联网已经成为人们之间进行交互的重要平台,从而产生一种基于信息的社会网络,与传统社会网络相比,在基于信息的社会网络中人们的交互方式和信