基于FPGA的分子动力学计算系统研究与设计

来源 :江南大学 | 被引量 : 0次 | 上传用户:lixuantea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分子动力学(Molecular Dynamics,MD)模拟是过去几十年里科研人员从微观入手研究物质宏观性质的重要手段之一,该方法可以从微观尺度对新材料、新药物等的物理化学性质进行研究。然而由于其算法的计算复杂度,在传统处理器上的一个简单生物实体模拟通常就需要数月的时间。FPGA由于其低功耗和高能效等特点在众多加速平台中脱颖而出。然而,FPGA传统RTL级别的开发有着较大的编程难度和工程设计成本,这限制了FPGA在MD模拟加速中的应用。针对上述问题,本文提出了一种基于FPGA的分子动力学加速方法,选取HLS+HDL的设计思路有效解决了MD模拟时间过长和HLS在实现动态数据流时的低效问题,最后基于该设计思路实现了两种势能算法的加速设计。本文的主要工作和创新点如下:第一,分析MD中存在的动态数据路径,得到HLS无法高效描述的原因,并提出了一种HLS+HDL的设计方法,将HLS开发的高效性和HDL开发的精细性相结合,在极大缩减设计时间的同时保证了加速器的性能。第二,针对两体势能LJ,选择液氩作为MD模拟对象,并基于MD开源模拟软件LAMMPS,设计了一种基于FPGA的加速器,使用HLS+HDL的方式实现MD中的动态数据流并采用高效的数据缓存设计、计算流水线设计等优化策略,不仅大大缩减了整个系统的设计时间和工程成本,而且也取得了很好的性能。实验表明,对于20K液氩模拟对象,基于Xilinx U50的可重构加速器可以获得200.73ns/day的模拟性能,与Intel Xeon E5-2620相比,单个节点能效是其159.28倍,模拟性能是其25.8倍;与超级计算机神威太湖之光所搭载的具有4个主核和256个从核的SW26010单核组相比,单个节点能效是其17.07倍,模拟性能是其1.61倍。第三,针对三体势能tersoff,选择C作为MD模拟对象,并基于LAMMPS设计了一种基于FPGA的加速器。为其精心设计了几种缓存策略并对其进行分析;最后根据Tersoff的计算特点对其进行了全流水线设计,从而实现性能的最大化。实验表明,对于512K碳原子,基于Xilinx U50的可重构加速器可以获得1.87ns/day的模拟性能,与Intel Xeon E5-2620相比,单个节点能效是其91.8倍,模拟性能是其26.2倍;与SW26010单核组相比,单个节点能效是其9.9倍,模拟性能是其1.19倍。
其他文献
混杂系统是涉及了连续动态特性和离散动态特性的混合系统,而混杂脉冲系统是依赖时间切换的特殊的混杂系统,在生物医学、经济学、生态学、控制学科都有应用.混杂脉冲系统具有复杂的动态特性,加之控制输入约束、模型不确定性、外部干扰等因素影响,给混杂脉冲系统的研究带来了困难与挑战.本文以混杂脉冲系统为研究对象,在现有研究成果与方法之上,对其稳定性、切换控制以及鲁棒H∞控制等问题进行了研究.主要内容包括以下几个方
近年来,空间互联系统被广泛运用于电力系统、计算机通信网络、自动高速公路系统等实际生产生活中,其轨迹跟踪性能已经成为了学者们研究的热点。然而,由于空间互联系统内部各要素之间彼此耦合,其结构往往比较复杂,存在结构模型或参数的不确定性。此外,实际工程中普遍存在时滞现象,可能会导致系统不稳定;并且常常伴随着各种各样的扰动,影响系统的性能。因此,如何在复杂环境下实现空间互联系统的精确跟踪和性能改善是需要解决
近年来,多自主体系统的一致性问题引起了广大学者的研究兴趣,并在多个领域得到应用,如:无人机编队飞行、机器人协调控制、卫星姿态协调同步等。作为一致性问题的特例,平均一致性跟踪问题指的是各自主体通过和相邻自主体进行通信交流,最终自主体的状态达到所有参考输入的平均值。在实际情况中,自主体间由于通信负载和带宽限制,传输的数据需要进行量化;同时,传输的数据受到距离的影响,不可避免的存在通信时延;此外,自主体
能够诊断和治疗人体器官的医疗机器人作为传统手术技术的替代品吸引了越来越多的科研工作者的关注。磁场驱动形式的微纳机器人由于其入侵性小、无线化、驱动力强等特点,许多团体开始研究无线化的磁驱式微型机器人在各种人体器官的中应用,如靶向药物输送、微创手术、主动式胶囊内窥镜等。微纳机器人的尺寸也决定着其具体应用领域,如纳米和微米级可以用于细胞和组织操作、毫米和厘米级可用于器官操作。近十年的研究中,磁驱式微纳机
室内环境中障碍物所导致的信号折射、反射以及多径效应,严重影响着定位过程中信号接入点的筛选、离线指纹库的构建更新以及在线阶段的匹配运算。论文利用测量数据的时空特性,构建基于信号空间分布的离线指纹库,并通过观测数据的时序性约束目标运动过程,以降低指纹库的维护成本,提升在线定位精度。具体研究内容如下:(1)针对非自主部署环境下相似信号接入点的信号冗余以及覆盖区域的交替重叠,提出一种基于相关系数与改进信息
随着人们对海洋资源的勘探与利用和人们对高容量、高速率和高保密度的信息传递要求的提高,信息的传输媒介由传统的光纤延伸到自由空间(大气、海汽、水下),信息的载体由光振幅、相位、偏振(自旋角动量)以及频率等经典自由度拓展到光学轨道角动量(Orbital angular momentum,OAM)。但是,涡旋载波所携带的涡旋(或OAM)模必将受到海水湍流的干扰,因此研究海水湍流对涡旋模的干扰机制是优化水下
随着5G通信商业化应用的普及,作为保障道路安全的重要技术之一的无人驾驶技术得到了广泛关注与迅速发展。车队策略能够帮助无人驾驶车辆节省能耗,拓宽道路容量,是无人驾驶技术的关键技术之一。为了在极小的反应时间内做出正确行驶决策,配有智能交通系统(Intelligent Traffic System,ITS)的车辆通常采用IEEE 802.11p通信协议传输数据以保证信息传递的及时性与可靠性。然而车辆的高
随着第五代移动通信技术的发展,蓝光视频的直播[1]、高清移动视频通话[2]、超清交互式网络电视[3]等相关宽带业务在不断地更新和普及现代社会的生活方式。同时新技术对移动网络所要求的带宽需求也在日益爆炸增长,这一现象对目前光通信技术中的数据传输速度和传输容量发起了巨大的挑战。对应的,相关行业的研究开发人员也在对周边配套设施和架构等新型关键应用技术进行不断的创新和应用。其中,拓宽光网络传输系统容量和最
作为物质的第四态,人工产生的低温等离子体含有大量的电子和活性粒子,因此广泛应用于微电子、材料、汽车以及医疗等行业。低温等离子体按其工作气压可分为低压和常压等离子体。目前市场化的人工低温低压等离子体技术(无论是电容耦合还是电感耦合等离子体)由于等离子体密度较高,而且等离子体电场不可控,因此在处理材料的过程中其正离子都不可避免地会轰击材料表面从而对材料造成一定的损伤。二维半导体材料非常薄,如石墨烯和二
硅基光子集成回路是把各类光子器件集成在成熟的硅工艺平台上,形成一个能完成特定功能的高集成度的回路结构。这种以光为主要通信载体的回路具有电子集成电路所没有的优势,如:大带宽、低功耗和大容量等等,在通讯系统中表现出巨大的潜力。硅材料具有高折射率和良好传输特性,是制作光传输器件的极佳载体,目前已有大量不同类型的基于硅的光器件模型,如光探测器、调制器、分束器和模式转换器等等。光具有多个可复用的维度,基于光