溯源数据压缩存储研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:juk3donda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,人们对信息的关注点不仅仅在数据本身,还需要知道数据的来源和演变等信息。这些数据的历史信息,也称为数据的溯源信息。在科学研究领域,数据溯源有广泛的应用,因为数据质量对科学家来说极其重要。其中有很多产生和收集溯源信息的系统,包括物理天文,化学,生物和海洋气象等研究领域。除此之外,溯源在数据重建,调试跟踪,安全和搜索等方面的应用也开始出现。但是在现有的诸多溯源系统中,溯源数据空间占用远远超过数据本身,在数据的内容与历史当中,处于次位的历史消耗了过多的资源,这就大大的降低了溯源系统的可用性和高效性。为了减少溯源数据的空间占用,而又不影响溯源完整性,Chapman等人提出了因式分解与继承(FAI)算法。FAI只是将溯源信息中的共同信息分析出来,进行优化。论文使用多维压缩算法,除了对溯源信息中共同的信息进行优化处理之外,还对数据本身的身份信息进行优化,同时挖掘溯源信息内在的相似性,将编码之后的溯源祖先信息使用web算法进行优化,进一步降低溯源祖先信息的存储开销,而且保证溯源信息查找性能不受影响,这是从微观层面对溯源数据进行优化存储。另外,从宏观层面来看,溯源数据随着时间无限增长,导致溯源空间和查询时间开销无限增长,针对这个问题,论文以PASS系统为研究实例,采用溯源信息分割,建立索引,压缩分割溯源文件等方式,利用溯源数据的局部性原理,改进了PASS系统的溯源存储和查找机制。实验表明,多维压缩算法无论在存储空间占用,还是身份或祖先信息查询方面都要好于FAI算法;在PASS系统的溯源存储优化中,使用数据库分割,建立索引,压缩分割的主数据库文件等方式,与原有的溯源存储方法比较,在空间占用和查询时间的开销方面都要好于原有的方法。
其他文献
习近平总书记在人民日报社就全媒体时代和媒体融合发展举行第十二次集体学习时指出,推动媒体融合发展,要坚持一体化发展方向,通过流程优化、平台再造,实现各种媒介资源、生产
高分子电阻型湿度传感器是一种有着广泛应用前景的新型湿度传感器 ,研究表明 ,对非纯电阻型湿敏元件 ,可将其等效为一电阻与电容的串联模型。文中提出了测量湿度传感器等效电
在国家快速发展的今天,环境工程得到了较高的关注,产生的影响较大。文章针对环境工程污水处理展开讨论,并提出合理化建议。
在CDMA通信系统中,由于在多径衰落信道下使用了时变扩频码,使得信道估计非常困难,而对接收机的设计往往需要信道的先验知识。本文建立了长码条件下的CDMA通信系统模型和多径
从桥梁结构钢筋锈蚀的成因,对结构产生的影响及其预防、维修几个方面进行了较为深入的研究和探讨,以期使桥梁混凝土结构由于钢筋的锈蚀而引起的桥梁结构强度下降,耐久性降低,
<正>犬尿石症又称尿路结石,是肾结石、输尿管结石、膀胱结石和尿道结石的统称,临床上以排尿不畅、排尿困难、尿闭、血尿为特征,其发病率占临床病例的0.5%,近年来远远高于1%。
高校学生自我管理能力培养对实现人的自由全面发展,起到积极的推动作用;人的自由全面发展又为高校学生自我管理能力培养和发展提供智力支持。基于当今社会对高校学生自我管理
慕课作为信息技术和教育高度融合的新事物,在很大程度上将冲击我国的高等教育教学模式、教学理念、教学方式等。事物作为矛盾的统一体,都包含着相互矛盾对立的两个方面,同样
设计并实现了一种智能型电机综合保护器,介绍了基于DSP的硬件系统以及用C语言编写的软件系统。设计中采用数字方法建立电动机的发热模型,对电动机提供准确的过热保护,并具有
结合冶金工程总承包项目,具体分析安全管理工作中遇到的实际问题,详细介绍具体工作方法。