【摘 要】
:
循环神经网络语言模型(RNNLM)能保存训练样本的历史信息,已经成为自然语言处理领域研究和应用的热点。但现有的RNNLM在训练时涉及大量的参数,需要完成大量矩阵运算,使得训练R
论文部分内容阅读
循环神经网络语言模型(RNNLM)能保存训练样本的历史信息,已经成为自然语言处理领域研究和应用的热点。但现有的RNNLM在训练时涉及大量的参数,需要完成大量矩阵运算,使得训练RNNLM时间开销巨大,极大的限制了RNNLM中隐藏层神经元的数量,影响了其准确性。我们前期通过改变RNNLM的结构,在分布式内存计算平台Spark上实现了基于Spark的大规模RNNLM系统,利用Spark中计算节点的并行计算能力有效提高RNNLM的训练效率,但相比生物神经系统仍然存在训练机制缺少并行性等诸多影响RNNLM训练效率的问题。我们首先分析了RNNLM中影响训练效率的因素,在基于Spark大规模RNNLM系统的基础上,设计了基于神经元分布式增殖异步RNNLM系统的结构,并介绍了其中主要的功能模块,以及相关参数的定义。接着给出了基于增殖的神经元训练算法,通过神经元的动态增加,不断激活新的神经元,实现了网络的动态扩展,减少了RNNLM整个训练周期内的总时间开销,实现训练时间开销和准确性的动态平衡。实现了算法的原型系统,构建了同源和不同源的多个数据集进行了测试与分析,相比相同条件下的现有RNNLM训练算法,基于增殖的神经元训练算法能在减少RNNLM训练开销的同时,还具有准确性方面的优势。其次设计了神经元分区异步训练算法,通过神经元的分区降低神经元训练的复杂性,并通过异步训练策略减少了神经元节点之间的同步。在Spark平台实现了算法的原型系统,使用多个数据集进行了测试与分析,验证了相比相同条件下的现有RNNLM训练算法,神经元分区异步训练算法具有良好的训练效率优势,同时仍然保持了很好的准确性。最后在Spark上,实现了基于神经元分布式增殖异步RNNLM系统的原型,使用多个数据集进行了测试与分析,实验结果表明基于神经元分布式增殖异步RNNLM系统能大幅减少训练的时间开销。从而验证了基于神经元分布式增殖异步RNNLM系统相比现有RNNLM系统具有良好的实用性,能在使用相近计算资源开销时,构建具有更多神经元的大规模RNNLM系统,并使用更多训练语料,提高RNNLM系统整体的准确性。
其他文献
大跨径PC连续刚构桥因其具有建造工艺简单、行车平稳顺畅、抗震性能良好等优点在近年来桥梁建设领域倍受青睐,随着国家基础设施的建设,该种桥型会随之得到较快发展。近年来,一些PC连续刚构桥在运营期间都出现了跨中下挠过大问题,因此将控制长期时效变形为目的的成桥状态作为合理成桥状态,具有工程意义。针对连续刚构桥的合理成桥状态,需要对预应力配束设计做进一步的研究。本文基于PC连续刚构桥的合理成桥状态,对PC连
随着三网融合与宽带中国战略的推进,有线电视网络传输技术研究的需求日益增加。与此同时,消费者的需求也在发生变化,用户不再满足于传统的电视广播业务,而是追求更高质量、更
随着国内市场经济的快速发展,企业的市场竞争已经升级为全方位的竞争。对于制造业企业而言,原料采购成本是企业成本开支中的重要组成部分,对于企业的市场竞争力有着重要的影响。在电力设备制造行业中上述现象更为突出,电力设备制造所需的物料、技术、服务等资源的采购量及金额巨大。由于近年来国内电力市场结构的不断波动,电力设备制造企业的经营压力越来越大,缩减企业运营成本成为国内电力设备制造企业的首要任务。在这其中,
自由空间光(Free Space Optical,FSO)通信因其大容量、保密性强、高带宽等优点,成为通信领域的研究热点之一。随着用户网络化需求的增加,点对点的FSO通信已不能支持无间断的
第四代移动通信技术已经成为现代通信系统中的主要通信技术。OFDM(Orthogonal Frequency Division Multiplexing)技术由于其信号传输稳定、对抗频率选择性衰落或窄带干扰以及信
余华是中国当代文坛的重要作家之一。二十世纪八十年代,他以先锋式求新求变的创作姿态屹立于文坛;二十世纪九十年代后,他又以贴近民间的淳朴叙事方式向人们展现着生命的厚度与韧性。在他三十多年的创作生涯中,余华始终坚持对父亲形象的书写。他笔下的父亲形象不是一成不变的,而是随着余华创作风格的转变而发生变化。本文以余华小说中的父亲形象为研究对象,运用文艺心理学、叙事学等理论,采取文本细读法、归纳法和比较分析法,
节点定位技术是无线传感器网络的重要支撑技术之一,按是否需要锚节点可分为基于锚节点的定位和无锚节点定位。无锚节点定位可以在没有锚节点的情况下实现网络中节点的定位,具
作为政治知识相对薄弱而人数基数又占有绝大多数的理工类大学生,其政治社会化现状亟待我们关注和思考。本论文旨在采取实证调查研究的方式,结合理工类大学生的基本情况和自身
针对轮胎模具分块切割加工的效率低、内应力分布不均等问题,课题组发明并研制成功了一种多槽同步电火花线切割机床。为了解决新机床的电源体积与成本、工位间电流串扰、控制困难等问题,本文根据多槽同步电火花线切割机床工作原理,设计了多路分时输出脉冲电源与专用伺服控制系统;通过相关工艺实验,证明了所设计脉冲电源与控制系统的可行性与优越性,总结了多槽切割加工规律,实现了四工位同步高效加工。论文首先对机床机械结构进
信息时代下,计算机科学技术的蓬勃发展带来了软件产业的飞速进步,软件产业现已遍及当代社会发展和经济生活的各个角落。作为提高和保证软件质量的重要手段,软件测试技术能够