【摘 要】
:
人类大脑智能水平高、功耗低,其计算模式非常值得借鉴。类脑计算通过模仿生物大脑的运行机制来实现信息处理,它主要以脉冲神经网络(SNN,Spiking Neural Networks)为基础,实现方式主要分为硬件实现和软件实现两种。硬件实现方法普遍采用专用类脑计算芯片与系统来实现脉冲神经网络。该种方法可以提供更佳的能效指标,但代价高、适应性差,当其与应用负载不匹配时,计算能效表现往往会大打折扣。软件实
论文部分内容阅读
人类大脑智能水平高、功耗低,其计算模式非常值得借鉴。类脑计算通过模仿生物大脑的运行机制来实现信息处理,它主要以脉冲神经网络(SNN,Spiking Neural Networks)为基础,实现方式主要分为硬件实现和软件实现两种。硬件实现方法普遍采用专用类脑计算芯片与系统来实现脉冲神经网络。该种方法可以提供更佳的能效指标,但代价高、适应性差,当其与应用负载不匹配时,计算能效表现往往会大打折扣。软件实现方式是通过设计类脑仿真器进行功能仿真,目前比较成熟的仿真器功能完善,且拥有完整的应用生态,具有计算灵活性强,精度高等优点,但是由于计算复杂度高,存在仿真速度慢、运行功耗高等问题。如果将两种实现方式相结合,通过软硬件协同设计,对仿真器性能瓶颈或计算密集点进行硬件电路设计,则可以在保证良好应用生态的同时获得更高的计算能效。本文提出了一种基于FPGA异构平台PYNQ集群的NEST类脑仿真器的高能效实现,主要研究内容如下:第一,选择适合的类脑仿真器并对其进行性能分析。首先对几款成熟的类脑仿真器进行性能对比,通过仿真范围,计算时间等性能评价指标选出NEST仿真器作为类脑体系结构研究的研究对象。后面对NEST仿真器进行代码分析,梳理其工作流程,并通过内存消耗,计算时间,通信时间等性能指标对NEST仿真器进行负载特性建模,推测该仿真器的性能瓶颈和计算密集点,为后续针对NEST仿真器设计FPGA硬件电路加速器提供理论依据。第二,实现基于FPGA异构计算平台的NEST仿真器。通过FPGA并行与流水化设计方法实现IAF神经元“更新”硬件电路。设计软硬件数据交互接口,优化内存分配,减少数据传输总量等方法实现并优化ARM与FPGA之间的数据传输,通过数据定点量化方法增加计算并行度。通过实际测试,FPGA异构计算平台实现的NEST仿真器相比不进行加速的ARM Cortex-A9计算平台计算速度至少提升6.3倍,能效比至少提升7倍。第三,实现规模可伸缩,计算力可调整的大规模NEST类脑计算集群。通过以太网和MPI通信机制搭建NEST计算集群。通过网络文件系统优化集群文件管理,设计自动负载映射机制,实现对计算模型的初步分析,获得集群最佳性能节点数和最低运行节点数等初始数据,提升集群使用效率。实验结果表明:针对不同的计算模型,当集群以最佳节点数运行时,集群在神经元更新部分的计算性能相比AMD 3600X提升超过4.6倍,相比Intel Xeon E5-2620v2至少提升7.5倍;集群在更新能效比方面相比AMD 3600X提升超过5.3倍,相比Intel Xeon E5-2620v2超过7.9倍。
其他文献
视频行为识别就是在不需要人为干预的情况下,综合利用计算机视觉、模式识别、图像处理、人工智能等诸多方面的知识和技术对摄像机拍录的图像序列进行自动分析,实现动态场景中的人体定位、跟踪和识别,并在此基础上分析和判断人的行为,其最终目标是通过对行为特征数据的分析来获取行为的语义描述与理解。视频行为识别技术可用于自动驾驶、人机交互、智能安防监控、智能家居监护等领域。因此,对视频行为识别的研究有着重要而广泛的
迭代学习控制是一种广泛应用于执行重复任务的高性能控制方法,其直接根据之前批次的系统输入输出信息不断修正更新当前批次的控制输入信号,最终在有限时间内实现对参考轨迹的完全跟踪。将优化理论与迭代学习控制技术相结合,能够得到最优型学习控制器以实现快速跟踪。然而在实际的工业过程中,系统输出往往不需要跟踪完整的参考轨迹,只需要在某些特定时间点处跟踪上给定的参考值。例如机器人的“取”和“放”操作,只需要专注于拾
间歇过程具有生产灵活的特点,广泛应用于化妆品、食品、药品等领域。迭代学习模型预测控制(ILMPC)兼具迭代学习控制(ILC)和模型预测控制(MPC)的优点,具有良好的抗干扰能力和约束处理能力,在间歇过程关键过程变量的轨迹跟踪中得到了广泛的应用。然而,ILMPC的预测模型是建立在原始变量空间的,变量间的共线性和高维性使得预测模型的开发变得困难和耗时。其次,ILMPC也存在在线计算量过大的问题。并且,
切换正系统由有限个正的子系统以及一组切换信号组成。切换正系统既有切换系统复杂的动力学行为特性又具有正系统独特的状态非负特性,因此针对此类系统相关控制问题的研究也相对棘手。切换正系统在控制领域应用广泛,并与经济、生物、通信等众多实际生活领域密切相关,因而引起了学者们的极大关注。实际工程应用中,系统短时间内的动态行为变化至关重要,很多系统满足无限时间区间的稳定性能却不能满足短时间区间内的性能指标。典型
随着社会的快速发展,人们的生活水平逐渐提高。但是与此同时,人们不规律的生活方式也使得更多疾病的发生,肿瘤甚至也变成了一种常见的疾病。脑肿瘤是常见的恶性肿瘤之一,其致死率较高,目前只有通过手术或放疗来治疗。因此,脑肿瘤的早期诊断对于改善患者的病情至关重要。核磁共振成像(Magnetic Resonance Imaging,MRI)可以帮助医生观察到病人大脑内部的情况,迅速地确定病灶区域。但是脑肿瘤具
受传输介质、周围环境以及人为因素的影响,控制信号在传输过程中难免会出现时延.时延的出现严重影响系统的控制品质,甚至稳定性.要对时延系统实行有效控制,就必须获得系统的参数.因此研究时延系统的参数辨识方法具有重要理论意义和应用前景.本文以线性连续时间时延系统为研究对象,基于系统正弦响应的观测数据,研究其参数辨识方法,主要内容如下:1.对于线性系统,其正弦响应是一个与输入同频率的含迟延相位的正弦信号,即
多智能体系统的分布式协同控制近年来逐渐受到众多研究者的关注,在这个研究领域中,多智能体系统的安全性问题也逐渐成为了热门的新兴研究方向之一。在实际应用中,智能体之间的局部信息交换往往受到恶意攻击的影响。重放攻击是计算机黑客常用的攻击方式之一,其隐匿性往往对系统造成巨大的危害。由于无法预料攻击会发生在何时何地,因此必须提供有复原力的解决办法以削弱攻击带来的危害,确保多智能体系统在受到恶意攻击的情况下完
工业无线传感器网络(Industrial Wireless Sensor Networks,IWSN)在工业监控中起着重要作用,但IWSN通常位于人工干预少的环境中,且无线电传播的广播性质导致IWSN比有线传感器网络更容易受到窃听攻击。物理层安全性正在成为一种有希望的安全通信范式,利用无线信道内在的时变性、互易性和差异性等特性,其实质为减少窃听者获得的合法信息同时最大化合法节点之间的安全通信速率,
模型预测控制(Model predictive control,MPC)在处理复杂约束、多变量系统的控制问题时表现出了巨大的潜力,已经在众多工业领域中获得了成功的应用,并逐渐成为现代工业环境中最常见的优化控制策略之一。传统的模型预测控制方法采用周期滚动优化的模式,并且优化控制问题通常较为复杂,使得在线计算量较大,限制了其在实际控制系统里的应用范围。尤其是当需要控制的系统通信和计算资源受限时,更加难
目前,在日益提升的计算力与海量的标注数据的推动下,以深度学习为代表的人工智能实现快速的发展,但在其高准确率的背后也存在着通用智能水平弱,计算力依赖度高等局限性。以第三代人工神经网络-脉冲神经网络(Spike neuron network,SNN)为代表的类脑计算借鉴了大脑的高效率和低能耗的计算特点,被认为是有望解决人工智能问题的重要途径。由于SNN的快速乃至实时的仿真需求以及明显的分布式计算特征,