基于深度强化学习的云存储QoS优化

来源 :桂林电子科技大学 | 被引量 : 1次 | 上传用户:Leechen17008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球数据总量的快速增长,大数据的时代已经悄然来临,面对如此海量的数据,其要解决的关键问题就是如何存储数据。在这之前,数据存储方式一直以传统的集中式数据存储方式为主,但其在存储海量数据的场景下,由于可扩展性较差、成本昂贵等诸多弊端,显然这种集中式的数据存储方式已然不能满足存储需求。为了解决集中式的数据存储方式面临的问题,各种分布式存储系统应运而生,其中,如何提高云存储系统的QoS性能已经成为一个研究热点。设计一个分布式存储系统的关键就是要设计一个好的数据分布策略,其决定着如何将海量数据尽可能均匀的分布到各个存储设备节点,数据分布的均衡性又对存储系统的读写性能造成极大影响,从而制约云存储系统的QoS性能。Ceph云存储的数据分布算法CRUSH是一种具有高效率、高扩展性特点的伪随机数据分布算法。然而,CRUSH算法存在数据在各存储节点上分布不均衡而影响读写QoS性能的问题,具体表现为两个方面:一方面数据量较多的存储节点必然将承受过重的读写负载,很容易成为制约系统性能的瓶颈;而另一方面数据量较少的存储节点利用率相对较低,又是一种资源的浪费,降低系统的QoS性能。针对上面存在的问题,本文的工作以当前广泛研究与使用的分布式存储系统Ceph展开,其主要的工作和创新点如下:(1)在小规模场景下,针对Ceph数据分布算法CRUSH存在的数据在各设备空间上分布不均衡,最终影响云存储系统读写QoS性能的问题。本文设计并实现了一种基于强化学习的数据分布算法RL-CRUSH,首先从Ceph数据分布过程和算法本身进行理论分析及实验验证,得出PG在OSD节点分布不够均衡是造成用户数据在各存储设备上分布不均衡的原因。然后通过对问题进行建模、设计基于强化学习的训练模型、以及设计并实现基于模型的新算法这三个步骤来改进现有的数据分布算法,使得PG可以近似均匀的分配到各个OSD节点上,消除数据分布不均衡而导致的系统瓶颈,从而可以提高OSD磁盘使用率和改善云存储系统的QoS性能。(2)针对中、大规模的场景下,由于规模增大而导致环境变得更加复杂,我们设计并实现了新的基于深度强化学习的数据分布算法DRL-CRUSH,其借助深度学习从复杂环境中快速提取、转换信息的能力,同时结合强化学习自动决策、控制的能力来改进原有的数据分布算法,实验结果表明在中、大规模场景下,该算法依然对PG在OSD节点间分布均衡性有较为明显的改善,并且具有较好的时间性能。(3)同时,目前基于强化学习的智能算法多用于视频游戏、机器人控制及无人驾驶等领域,我们尝试性的将其引入到云存储领域中,利用强化学习技术来优化云存储系统的QoS性能,也希望能为相关领域的研究者带来一些启发和思考。
其他文献
心电图(electrocardiogram,ECG)是能反映心脏跳动的波形图,它应用在医院的心电图检查,并用来检查心脏的健康状况。在现在的网络时代,因生物特征识别技术逐步走向成熟,国内外众多研究学者对身份识别技术的研究也逐步深入,目前其技术已在人脸识别、眼膜识别、语音识别等多个领域有所使用,并趋于商业化。而且,相当多的技术研究者也投身到了 ECG信号身份辨认研究当中。但目前针对于ECG信号身份识别
多足爬壁机器人作为移动机器人的一个分支,以其独特的运动方式和不同环境的适应性,一直以来都受到国内外研究学者的关注。近些年多足爬壁机器人依靠其优秀的壁面适应性和运动灵活性从军事运用领域逐渐转向工业运用领域。但是其复杂的腿部结构和腿部运动所导致的控制难度成为广泛应用的一大障碍。为了满足一些特殊工业领域对多足爬壁机器人运行的水平姿态要求,本文设计了一种拥有三关节回转伸缩机械腿的新型爬壁机器人,可以保持运
随着互联网和信息技术的飞速发展,人类社会正步入大数据时代。海量的信息通过互联网发布和传播,其中非结构化的文本数据是互联网信息的重要载体和呈现形式。因此,高效、精准地管理和挖掘文本信息,并快速提取有价值、感兴趣的高质量信息具有重要意义。文本分类是管理海量文本信息的一种有效方法,能够使分类后的信息结构更清晰、内容更聚合。因此,文本分类技术已成为机器学习和自然语言处理领域的研究热点和难点之一。且主题模型
企业建立虚拟社区的目的在于通过用户间互动交流和问题解答来节约企业的产品服务成本,获取消费者的产品创意和共创知识资源,从而提高企业的创新能力,为企业带来价值。企业虚
随着社会的发展,企业间的并购、投资或者采购等商业往来越来越频繁。对于买方来说,这些商业往来存在着各种各样的风险。比如:签署合作合同以后,主要的员工、供应商以及客户是否会留下;目标企业过去的财务报表是否准确。所以,买方必须通过一定的方法来弥补买卖双方在信息上的不对称,从而进行风险管理。尽职调查,指的是买方对目标企业的资产负债情况、经营和财务状况、法律关系以及目标企业所面临的机会和潜在的风险进行的一系
近年来,海量数据产生,算法发展和计算速度提升推动了人工智能领域的发展,使许多任务试图用人工智能的方法解决。本论文尝试使用深度学习的方法解决心电数据去噪音任务,该任务的目的是将噪音心电数据转换为无噪音心电数据。深度学习擅长处理监督学习任务,监督学习需要配对的数据学习源域和目标域的映射关系,但是心电数据去噪音任务的难点在于我们无法获取到配对的噪音心电数据和无噪音心电数据,只能收集到无噪音心电数据集。因
QXJG集团是东北部地区的一家老牌建筑企业,经过多年来的发展,企业不断转型升级,其管理逐步走向规范化、精细化,但是随着建筑行业竞争加剧,高学历的人员招聘难,高层次人员流失严重的问题已经凸显。结合建筑行业的发展现状来看,知识型员工在企业发展过程中所起到作用愈发明显。随着集团大量的引进知识型员工,企业在绩效管理上还显得相对滞后,不能很好的配合组织的人才引进和发展的需要。为此,QXJG集团希望通过绩效改
电离层Es(Sporadic E)是在电离层的E层偶发的电子密度相对于背景环境增强的一块区域。由于Es临界频率有时可以和F层临界频率相比拟,甚至比F层临界频率大的多,因此电离层Es的出现对于电离层电波传播具有重要的影响。同时电离层Es产生的物理机制还有待进一步的研究和完善,因此对于电离层Es的研究也具有重要的科学意义。而Es在频高图中的出现,特别是二跳回波,对F层相关参数的度量和反演具有很大的影响
党的十九大以来,为适应国内经济形势的发展和国际经济环境的挑战,我国税收征管体制改革不断加快,国地税机构合并、减税降费等一些重要措施陆续出台。在税收征管体制的深刻变革中,税务系统的组织结构、征管方式、工作内容等都发生了较大变化。基层税务干部作为税收征管第一线的税务人员,正面临着来自工作、家庭、社会等各方面的压力。积极研究、认识、缓解、解决这些基层税务干部的工作、生活、身体及心理压力,对维护社会稳定、
随着智能产品及互联网的迅速发展,网络中充斥着大量良莠不齐的数据,而在这些数据中,视频占据了主要部分,若能够利用智能算法对视频数据进行自动识别,尤其是识别视频中的人类行为,就可以针对视频内容进行有效的监控,进而对视频中涉及的危险行为进行识别并预警或过滤。另一方面,在对视频内容进行监控时,只能基于已经发生的行为进行识别与分类,无法推断视频中人类的意图,而分析人类意图对于行为的识别与预测都具有至关重要的