基于回归检测的滑动块重复数据删除算法

来源 :新疆大学学报(自然科学版) | 被引量 : 0次 | 上传用户:bb1206
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临,重复数据在存储系统中占有很高比例,如何在保障数据可用性的前提下提高存储系统利用率问题一直是研究人员关注的热点.重复数据删除技术是一种存储系统优化技术,通过比较数据指纹确定冗余并删除,达到保障数据唯一性的目的.在重复数据分块检测过程中,无匹配指纹的块即认定为新数据存储,然而通过研究发现,未匹配块中仍然包含大量的重复数据,若能检测到未匹配块内的重复数据,则能够在一定程度上进一步提高重复数据检测率.本文提出一种基于回归检测的滑动块重复数据删除算法,对传统滑动块技术产生的未匹配数据块进行回归
其他文献
汉字系统状态下键盘变速的实现宋立波辽宁省铁岭市委办公室(112000)我们在使用诸如PE2、WS、WPS等编辑软件进行文本文件编辑时,随着操作人员的熟练程度不断的提高,常常会出现操作人员等待计算机的现象,光标等键的响应速度显得有些迟钝,即使是现在高档...
对77头患子宫内膜炎的奶牛进行治疗试验,其中46头患牛采用盐酸土霉素治疗,31头患牛采用清宫液治疗,治疗结果:土霉素治疗组治愈率80.43%,好转率10.86%,无效8.6%;清宫液治疗组治愈率87.09%,好转率6.45%无效6.45%。试验结果表明
针对可见光与红外图像融合问题,提出一种基于离散余弦变换(discrete cosine transform, DCT)与粒子群优化(Particle swarm optimization, PSO)的图像融合方法.先对源图像进行DCT变换再采用PSO算法获得优化权值因子,并用于完成源图像DCT系数的融合;其次,进行DCT逆变换得到初始融合图像;最后,利用直方图均衡化模型对初始融合图像进行优化得到最
确定湖泊污染物降解系数动态变化规律对提高水环境容量测算精度和水环境管理具有重要意义.本文以新疆克拉玛依市的艾里克湖为例,根据实测资料计算,得出艾里克湖在融冻期的KCO
运用重量法对三角城种羊场14只青海细毛羊公羊和8只新疆细毛羊公羊共88个毛样的含硫量进行测定。结果表明:含硫量水平在2.40%-3.24%,在羊毛含量正常值2.7%-4.2%内,偏低;两品种间、各品种不同年龄间及个体不
在1991年尕海农场盐酸碱弃耕地上进行苜蓿引种试验,在引种的8个苜蓿品种中,润布勒苜蓿抗寒性强,越冬率达69.9%,草原1号苜蓿抗寒性亦较强,第三年表现高产特性,产量达73.37t.hm^2;三年总产最高的是加拿大紫花
以塔河常压渣油为原料,正己烷为溶剂,分离制得C6沥青质试样.以石油醚为溶剂,在100℃~300℃范围内,对其进行多级升温热溶实验,并对热溶物和热溶残渣进行FTIR、GC-MS和TG-DTG等
本文讨论了地下管网计算机辅助设计的实现方法,分析了地下管网的结构和特点,给出了一种层次化设计方法,实现了系统的模块化设计和模块间的有机统一。
本文主要探讨在面向对象的文本窗口中进行输入操作时,输入键的接受和输入串的编辑问题。并以C++语言为例,给出了其实现与编程的方法。
由于图像的作用越来越大 ,很多数据库 ,特别是大型数据库都实现了对图像信息的直接存储。文中以大型数据库为例 ,实现了对图像字段的两种存取方法 ,并给出了主要源代码。