【摘 要】
:
随着现代计算机的使用和大规模数据的应用,传统的单核芯片已无法满足社会日益增长的高性能计算需求。同时,由于登纳德缩放比例定律的终结以及多核CPU下暗硅效应的影响,多核处理器芯片的发展也受到种种限制。然而,异构系统可以在同一台设备上提供具有不同效率和能耗的硬件计算单元,从而实现系统整体计算能力的提升。这些有利条件促进了硬件加速设备的不断发展,使得具有异构架构的计算平台开始通用化,并逐渐成为计算服务发展的主流。本文通过对异构系统中数据加解密优化方面的工作总结,提出了针对异构平台的高性能计算策略。
文中
论文部分内容阅读
随着现代计算机的使用和大规模数据的应用,传统的单核芯片已无法满足社会日益增长的高性能计算需求。同时,由于登纳德缩放比例定律的终结以及多核CPU下暗硅效应的影响,多核处理器芯片的发展也受到种种限制。然而,异构系统可以在同一台设备上提供具有不同效率和能耗的硬件计算单元,从而实现系统整体计算能力的提升。这些有利条件促进了硬件加速设备的不断发展,使得具有异构架构的计算平台开始通用化,并逐渐成为计算服务发展的主流。本文通过对异构系统中数据加解密优化方面的工作总结,提出了针对异构平台的高性能计算策略。
文中首先根据对硬件加速器和NVM存储设备的分析,给出了硬件加速器的调度延时模型以及NVM作为缓存的异步刷新机制。其次,基于以上两个模型提出了异构系统的三个高性能调度策略,分别为数据聚合策略、软硬结合分配策略和负载均衡分配策略。其中针对硬件加速计算对小数据块没有提升效果的问题,提出了数据聚合策略,通过预设的阈值来识别数据大小以及按照一定的规则进行聚合,以最大化硬件加速设备的计算能力。针对在不同数据特征下软硬件计算性能存在差异的问题,提出了软硬结合的任务分配机制,通过在不同数据、并发条件下选择合适的软硬件计算方式,并充分利用主机的空闲资源,实现了软件和硬件之间的最佳调度。针对在数据不同负载情况下影响异构系统任务执行时间的问题,提出了负载均衡策略,通过构建数据分析模型获得了硬件加速设备的数据负载比值和分配大小,实现了数据的最优化分配与管理。此外,基于对系统资源使用、处理单元故障、能耗约束等方面影响的考虑,本文提出了动态反馈的阈值调整机制,使得方案具有更好的容错率和自适应性。实验部分,本文首先通过测试获得了相关硬件平台和应用的参数,并根据实际测试和模拟测试的方法,验证了设计方案的合理性。最后,本文所提出的数据调度管理策略对基于硬件加速的异构系统具有一定的通用性,这也为以后相关的研究工作提供了参考与借鉴。
其他文献
近年来,随着世界经济增长与科技水平飞速发展,越来越多国家与地区将发展的眼光聚焦于广阔无垠、资源丰富的海洋。为了在资源开发与海洋国防等领域占据先机,世界各国纷纷大力开展海洋装备的研发工作,水面无人艇USV(Unmanned Surface Vehicles)便是先进海洋装备的组成部分。实际上,无论是军用领域还是民用领域,水面无人艇都有着极其重要的价值。加快无人艇相关技术的研究对我国提升海洋装备水平有着极其重大的战略意义。
本文依托华中科技大学研发的“huster-68”无人艇以及其配套科研平台,重
三维人手姿态估计是人机交互领域的一个热门研究方向,主要研究如何从图像中估计人手三维姿态,在增强现实和虚拟现实技术中具有重大意义。根据图像形式的不同,该方向包含基于单目、多目和深度图像的估计任务。本文主要研究基于单目RGB图像的三维人手姿态估计方法,估计结果使用人手关键点的三维坐标表示。
首先,本文研究基于两阶段深度网络的估计方法。该方法分为两个阶段,第一阶段从图像中估计二维人手关键点的热度图,本文设计了一个新颖的编码解码网络实现逐像素估计。第二阶段从关键点热度图估计三维坐标,借鉴现有方法,本文将
目标检测技术越来越广泛应用于精确制导,医学图像诊断,自动驾驶,图像搜索引擎等领域。在目标检测的研究中,小目标检测一直是重点和难点问题;在实际应用中,需要在嵌入式环境计算资源有限的情况下,同时满足精度和速度要求,因此,在检测任务中降低计算复杂性和提高计算效率具有重要意义。本文重点研究了快速有效的小目标检测算法和单阶段检测网络的训练方法优化,研究内容如下:
针对小目标在深度卷积网络中的特征信息容易被干扰和丢失问题,同时为了保证检测算法的检测速度,本文在Darknet框架下,提出了基于YOLO的小目标
具有无线能量传输(Wireless Power Transfer,WPT)功能的微型植入式电子装置是现代医疗设备研发的热点和难点。应用WPT技术不仅可以简化医学装置的外科植入过程,而且可以避免体内电池由于电量耗尽产生的二次手术替换。同时体内植入装置与外部设备之间还需要通过数据交换实现健康监测和控制,因此经皮无线通信技术也备受关注。
为解决自由活动生物体内植入装置的经皮无线稳定供能问题,本文对产生均匀磁场的能量发射端进行优化设计。通过对平面螺旋结构发射线圈轴向磁场分布的分析,以线圈轴向磁场分布的变
【摘 要】一个班集体的集体力量要得到最大限度的发挥,离不开一个好的班级管理者。中职学校的班主任管理工作更是繁琐,需要倾注更多的心血和耐心。在具体对待班级管理工作时,班主任要立足班级学生实际,抓住群体特点,尽量创造民主、和谐的班级氛围,为社会培养出一批合格的中等专业技术人才。 【关键词】中职班主任 关爱 管理 自信心 【中图分类号】G717 【文献标识码】A 【文章编号】2095-3089(20
图像局部特征广泛应用于图像匹配、三维重建、图像拼接、图像检索等多个领域中。在这些计算机视觉任务中,图像局部特征的优劣会直接决定模型最终的性能。在实际场景中,图像成像条件复杂多变,比如光照、视角、模糊、噪声等,造成对应同一场景或目标的图像千变万化。因此在多变的图像中寻找不变的图像局部特征表达是一个研究难点。此外,自然场景中还存在很多视觉内容相似的场景或目标,在这些相似中寻找不同的局部特征表达也是一个研究难点。综上所述,在各种场景和成像条件干扰下,研究有效的图像局部特征表达具有重要意义。本文重点研究了面向匹配
人群计数是计算机视觉领域的一个重要研究方向,它在视频监控、公共安全、交通监测等领域有着广泛应用。主流方法通常采用一个全卷积神经网络学习原图到密度图的映射,对密度图进行积分即为人数。本文对基于全卷积网络回归密度图的人群计数算法展开了研究,针对现有方法存在的问题提出了以下改进。
多尺度问题是人群计数中的难点问题。大多数先进的方法是通过采用多列结构来解决多尺度问题,这种结构需要消耗巨大的资源成本,因而难以部署多个较深的列,而采用更深的网络已经被证明可以获得更好的效果。因此本文提出以单列网络作为共享主干
遥感图像中典型目标的高精度检测,在军事和民用领域具有重要的研究意义和实用价值。目前人工智能和计算机视觉取得了飞速发展,基于深度学习的遥感图像目标检测受到了越来越多的重视。然而,遥感目标密集度高、尺度范围广、旋转姿态变化大的特点,对高精度遥感目标检测提出了挑战。本文研究基于深度学习的遥感目标检测算法,对存在的高虚警、定位误差大、密集目标漏检等问题进行分析,并提出改进算法,主要的研究工作如下:针对Re
目前,信息存储主要存在两种方式即磁存储和光存储。而光存储具有功耗低、稳定性高的特点,但受光衍射限制约其存储密度仍较低。研究显示,利用表面等离激元效应可以有效突破光衍射限,将光场局域在纳米尺度空间中。激励表面等离激元需同时满足能量和动量守恒关系,在发展光致磁变光存储技术方面,磁效应的动量特征已成为一项关键性研究要素。涡旋光作为一种充分显示特殊动量特征的光波形态,在研究用于光致磁变超高密度光存储技术中的表面等离激元激励方面将发挥特殊作用。本文设计了凸面弧形螺旋相位结构用于产生汇聚形涡旋光束,以及用于激励表面等
物联网技术的蓬勃发展促使诸如无线多媒体传感器网络、云存储、边缘计算等新兴应用领域的涌现。全世界亿万个体的数据不再局限于标量信息,更多的则是偏向于多媒体内容,例如图像和视频。分布式压缩视频感知作为一种新型视频编解码技术,利用压缩感知进行独立编码与联合解码,突破了传统视频编解码的束缚。此外,日益激增的视频数据在编码和传输时的隐私也亟需强有力地保护。
因此,本文关于分布式压缩视频感知隐私保护研究与应用的工作主要包括:
①设计了一种在无线多媒体传感器网络环境下提供低成本和高效率视频数据隐私保护