论文部分内容阅读
自深度神经网络被提出以来,就因其在处理实际问题中所表现的优秀性能而成为人工神经网络的主流研究方向。但是,随着深度神经网络研究的不断深入以及处理问题的复杂度不断增加,深度神经网络的网络规模和网络计算复杂度也随之成倍提升。总体来说,在深度神经网络的计算中存在着存储复杂度高,计算复杂度高,数据传输带宽大的挑战。论文的研究目的是设计一种面向嵌入式系统的深度神经网络计算协处理器,用以实现低功耗,高效的大规模深度神经网络实时计算。论文通过对包括对深度置信网络和卷积神经网络两种网络模型的主流神经网络模型中存在的计算和存储复杂的问题进行研究,提出了一种面向硬件友好的脉冲深度神经网络模型及其训练算法,并且据此设计了一种基于片上系统的,具有可扩展性和一致性的高速脉冲深度神经网络计算协处理器。论文的主要研究成果如下:(1)提出了一种脉冲驱动的深度神经网络模型及其训练算法。论文通过综合分析具有较强实际问题处理能力的深度神经网络模型以及在硬件实现中具有易于实现和低功耗特点的脉冲神经网络模型,提出了包含脉冲深度置信网络和脉冲卷积神经网络在内的脉冲深度神经网络模型及其训练算法。(2)设计了一种通用的脉冲深度神经网络存储和计算硬件架构。为了实现兼容脉冲深度置信网络和脉冲卷积神经网络两种网络模型的存储和计算,论文提出了将两种网络模型转换得到一致的稀疏前馈网络结构,然后设计了一种基于索引查找表的一致性硬件架构来实现对转换后的脉冲深度神经网络进行计算,并且在硬件架构设计中引入了层次化流水和低功耗的硬件优化设计来提高硬件的计算效率,降低硬件的计算功耗。(3)设计实现了一种基于Xilinx片上系统的,针对脉冲深度神经网络的,具有一致性、低功耗特性的脉冲深度神经网络计算协处理器,并对其进行综合验证分析,最终实现了原型系统的设计与验证。