【摘 要】
:
大数据等技术的发展对数据存储的性能和容量提出了更高要求。统一内外存架构(Unified Memory-Storage Hierarchy,UMH)利用PCIe互连技术实现了可字节访问固态盘,被广泛应用于解决传统分层存储架构中内存容量不足以及大量内外存数据拷贝问题。然而内存数据库中常用的哈希索引在UMH下面临两方面问题:一是哈希索引利用哈希函数将键值对均匀随机分布于已分配空间,引起大量随机I/O,增
【基金项目】
:
国家自然科学基金“语义感知的闪存管理关键技术研究”(课题编号:No.61902137); 广东省重大研发计划“智能数据存储处理芯片关键技术与应用研究”(课题编号:No.2019B010107001)
论文部分内容阅读
大数据等技术的发展对数据存储的性能和容量提出了更高要求。统一内外存架构(Unified Memory-Storage Hierarchy,UMH)利用PCIe互连技术实现了可字节访问固态盘,被广泛应用于解决传统分层存储架构中内存容量不足以及大量内外存数据拷贝问题。然而内存数据库中常用的哈希索引在UMH下面临两方面问题:一是哈希索引利用哈希函数将键值对均匀随机分布于已分配空间,引起大量随机I/O,增加垃圾回收开销;二是哈希扩容需要做异地数据迁移,致使读写I/O受阻,增加插入和查找等操作的长尾时延,导致固态盘写放大开销增大固态盘性能下降。因此,如何设计哈希索引以提升固态盘性能和寿命成为研究热点。针对哈希索引随机写盘引起的写放大问题,提出一种面向固态盘的分层哈希索引(Tiered Hashing),优先写入上层哈希表,并在更新或插入下层哈希表的同时,利用层间数据迁移算法(RIA),将上层数据迁移至下层,从而增加上层哈希表的空余空间,实现层间写入频率差异化。最后,利用多流技术降低固态盘垃圾回收开销。实验结果表明,与现有哈希算法相比,RIA算法可将固态盘写性能提高1.78倍。针对哈希扩容导致的I/O阻塞和长尾延迟问题,提出一种底层增量式扩容算法(IRLL),为新增扩容层分配虚拟内存空间,通过仅对冲突路径进行细粒度扩容,利用盘内闪存页写时分配机制,减少数据迁移量、提高物理闪存页的空间利用率。实验结果表明,与现有哈希相比,IRLL扩容算法的空间开销及时间开销均与哈希表已有数据量无关。当哈希初始容量为3072时,扩容平均执行时间降低3个数量级。针对Tiered Hashing采用多层表结构导致读性能较差的问题,提出影子读(SR)和跳跃表读(TJR)算法。SR算法采用在上层保留键值影子以提高读命中率,TJR算法利用上层桶存储查找层实现加速查找。实验结果表明,SR算法降低平均时延29.5%,TJR算法降低平均时延61.5%,SR算法和TJR算法同时启用可使平均时延降低74.8%。
其他文献
Salen配体是有机化学领域中最重要的配体之一,能与不同氧化态的金属离子配位。传统固载M-Salen配合物的方法主要有浸渍法、离子交换法、瓶中造船法、化学嫁接法、溶胶-凝胶法、有机高分子聚合法等。固载化M-Salen在多相催化、CO2捕获、化学传感器以及电化学领域均有应用。固载化M-Salen催化剂在多相催化领域的应用虽有较多报道,但由于固载化催化剂的制备过程较为繁琐,其在化学合成反应中的实际应用
金属卡宾,尤其是供体受体卡宾,是许多化学反应的重要中间体,在有机合成中具有广泛的应用。目前,受重氮化合物潜在安全问题的限制,N-磺酰基-1,2,3-三氮唑作为一种稳定且具有多样反应活性的卡宾前体替代品,成为了化学合成研究中的热点;其与不饱和化合物通常发生环丙烷化和[3+2]环加成反应;其中值得注意的是,N-磺酰基-1,2,3-三氮唑与烯烃的反应类型较为单一且底物受限。因此,基于前人工作,本文发展了
近年来,随着新型持久性内存(PM)和远端直接内存访问(RDMA)技术的蓬勃发展,低持久存储开销的PM和低传输延迟的RDMA在数据中心环境中得到了广泛的应用。然而,由于RDMA网络接口卡(RNIC)中存在易失性缓存,如何在PM和RDMA结合的系统中高效地保证远端数据持久性成为了重大挑战。持久RDMA操作和RDMA数据更新的可见性在分布式持久内存系统中还没有得到充分的研究。尽管少数基于远端过程调用(R
互联网时代产生的海量数据亟待高效的数据管理方案,数据的索引技术是高效管理数据的关键技术之一。现有基于内存的索引技术(如B+树类)已经无法高效地满足数据总量不断快速增长的场景。新型非易失内存(Non-Volatile Memory,NVM)具有接近内存的性能、存储密度大于内存,是构建下一代存储系统的重要存储设备。但是,目前应用广泛的B+树索引并不能很好地适应大容量的NVM设备,其性能随着所索引的数据
为了保证分布式SSD(Solid-state Drive,固态驱动器)存储系统的高扩展性和数据的高可靠与强一致性,云存储厂商普遍使用的是多副本链路复制同步写的非中心化数据分布。它摒弃了传统中心化数据分布算法的查表寻址方式,直接通过计算得到数据副本放置节点,使得存储系统性能不再存在中心瓶颈。然而随着SSD产品的更新迭代和存储系统实际运行,底层存储池会充斥着不同接口不同厂家不同容量的新老SSD存储设备
饥饿治疗、气体治疗及化学动力学治疗都依赖于对肿瘤的靶向来发挥最大的治疗效果。合适的纳米载体可以将介导饥饿治疗、气体治疗及化学动力学治疗的效应分子或药物精准递送至肿瘤部位,在减少由脱靶带来的副作用的同时,提高治疗效果。金属有机框架(Metal-organic frameworks,MOF)是一种备受瞩目的纳米尺寸载体,具有巨大的表面积、内部多孔且尺寸大小方便调节,适合作为药物载体应用于肿瘤治疗。不同
新疆准东地区的高碱煤储量丰富,煤质优良,是一种具有较高开发价值的动力用煤,但因其碱/碱土金属的含量很高,而极易导致燃煤锅炉的结渣沾污,影响电厂的安全稳定运行。本文基于烟气强化水洗方法,探究了关键工艺参数对脱碱效果的影响规律,并建立了相关性模型,考察了强化水洗对高碱煤成灰特性以及热转化特性的影响,确认了此方法对抑制高碱煤燃烧结渣沾污的可行性和优势。此外,对烟气强化水洗工艺工业应用可行性和环境影响进行
中华文明历史悠久,底蕴深厚,拥有卷帙浩繁的古籍文献,古籍平台作为古籍数字化内容的主要载体,承担着传承古籍内容、展示古籍成果、普及推广古籍精神的历史重任。古籍知识平台服务设计的研究,能够帮助古籍平台更好的从信息平台向知识平台转型,实现古籍用户对于智慧服务的诉求。论文引入服务设计的理念和方法,以古籍用户为服务设计的出发点和核心研究对象,在互联网背景下,顺应移动时代的趋势进行服务设计创新,与过去研究对象
联烯醚与其他烯烃相比具有更高的反应活性,可用于合成多种天然产物。因此,关于联烯醚的合成和转化的研究一直备受化学家们的关注。联烯醚存在累积二烯结构单元,若在双键一端连有给电子基团,则表现出独特的三重反应模式:(i)γ-碳易受亲核试剂进攻;(ii)β-碳的反应性则和烯醇醚的反应性类似;(iii)α-氢很容易被碱攫取得到重要的有机合成中间体。探究高区域、高立体选择性的合成方法对于实现联烯醚的精准转化具有
金属纳米团簇(MNCs)超小的尺寸(2-3 nm)使其具有许多类分子的特征,如分立的能级结构、增强的荧光、磁性、催化性能等。近年来,小分子介导自组装金属纳米团簇成为研究热点:一方面自组装诱导荧光增强,另一方面丰富了金属纳米团簇的荧光机理。然而,金属纳米团簇稳定性不高、组装驱动力容易受环境影响等问题,限制了自组装金属纳米团簇的进一步发展。如何在自组装的同时提高金属纳米团簇的稳定性是关键问题。两亲性嵌