循环神经网络的自动高速结构优化

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:airbter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
循环神经网络(Recurrent Neural Networks,RNN)是一个简洁高效的非线性通用模型,加上时间元素之后,能有效地处理动态系统(包括时间序列)问题。在实践中,RNN的网络结构(包括反馈位置,隐藏层神经元个数,激活函数等)通常需要人为预先确定,这要求丰富的经验或者繁琐的反复实验;另外,RNN的权值参数优化一直是基于梯度方法的,梯度消失和梯度爆炸问题表现得尤为突出,这些都导致了RNN结构设计困难或者网络性能不佳。为了提高RNN的结构设计效率和网络性能,本文首先提出了一种RNN的自动化结构设计方法,由此形成了层内时间延迟神经网络(Intra-layer Time Delay Neural Network,ILTDNN)模型。ILTDNN模型引入延迟时间,延迟权值,激活函数种类三种结构参数增强网络性能,从两个方面体现了自动化结构设计:1).不用预先确定网络大小,而是通过网络生长确定;2).不用预先确定网络结构参数,而是通过优化算法得到。另外,该模型还将时间序列特征预处理过程并入网络结构设计过程中,实现了特征处理自动化,这也避免了当RNN网络性能表现不佳时,难以确定是特征处理不当还是网络结构设计不当的困境。传统的基于梯度的算法无法对结构优化,收敛缓慢,也很容易陷入局部最优,而进化算法可以通过编码和种群来高效地搜索结构参数空间。因此,本文还为ILTDNN模型设计了基于网络生长的增量优化策略和优化网络结构参数的混合进化算法。增量优化策略解决了网络从小到大生长时哪些参数会被优化的问题,一方面可以避免先前的优化努力不会浪费,另一方面可以减少要优化的结构参数数量。混合进化算法是基于改进收敛性的自然进化策略算法和具有超线性收敛的二阶局部搜索算法设计,其使用局部搜索增强种群搜索的梯度方向。实验表明,混合进化算法能够很好的处理复杂多模态问题。在实践中,将混合进化算法与并行计算技术结合,在多核处理器上能够实现RNN结构参数的高速准确求解。此外,本文比较了ILTDNN模型的几种结构参数对网络性能的影响,并将该网络模型应用于几个经典的混沌时间序列预测问题和轴承系统故障预测问题,证明了其有效性。与现有的大多数其它神经网络相比,通过自动化结构设计方法和混合进化算法生成的网络结构更加小型化,预测更准确。因此,网络模型更简洁,具有更好的泛化能力和应用前景。
其他文献
无监督域适应(Unsupervised domain adaptation,UDA)是一种通过从有标注的源域里获得知识,并把知识迁移到缺乏标注的目标域上的机器学习方法。现主流域适应研究关注于对齐两个域的特征分布,借此希望在源域训练的分类器能适用于目标域数据。但这些方法通常存在两个缺陷:(1)分类器偏向源域数据:大部分UDA方法只考虑最小化两个域的差异和源域的分类损失,而不对分类器施加其他约束。所以
目前,人们对于情感的表达尤为重视,中老年人喜好看新闻短评,时不时会发表自己的态度和观点;年轻人喜好在微博、知乎等平台分享所见所闻。以及一些短视频社交软件的不断涌现,比如抖音、Vlog等,人们表达情感的欲望更加强烈,情绪在生活中的作用也越来越不容忽视。良好的情绪,能帮助自己更好地完成工作;消极的情绪,对身体机能有一定伤害的同时,甚至还会影响健康人格的形成。随着疫情防控常态化,人们对心理健康的关注度上
社交网络信息传播速度快、范围广、即时性强,吸引海量用户通过社交网络分享社会消息、讨论现实事件。社交网络事件通常是现实事件在网络空间的映射,因此研究社交网络热点事件预测具有重要意义与价值。例如,预测热点事件能够辅助相关部门管控谣言传播,避免社会恐慌,维护公共安全。用户在社交网络发布的信息以文本内容为主,文本与事件热度相关性高,并且相较其它事件相关数据更易获取,是事件预测的重要数据基础。然而文本数据价
机器学习是人工智能研究中的关键技术,在医学健康方面有着广泛的应用前景。心血管疾病(Cardiovascular Diseases,CVD)是目前世界上对人类社会造成严重健康威胁的疾病。采用机器学习方法对CVD风险进行精确地预测,可以有效识别高风险患者及危险因素,及时采取相应的干预措施并帮助医疗机构优化资源分配,具有重要的现实意义。针对CVD风险预测,本文进行了以下几个方面的研究工作:(1)研究了基
随着我国社会智能化进程的不断推进,人工智能被应用到越来越多的领域和应用场景,同时由于自动化识别需求的提升,手写汉字图像的自动化识别成为了当下计算机视觉领域的研究聚焦点。本论文针对手写汉字由于字符疏密不同和连笔交叠导致的检测定位困难问题,完成了基于深度学习的离线手写汉字检测算法的构建;同时由于汉字数量过于庞大,且手写字形复杂多变导致的识别分类困难问题,完成了基于深度学习的离线手写汉字识别算法的构建;
随着互联网信息技术的不断向前发展,人们所要面对和处理的数据信息也日益增多,大量且繁杂的信息阻挠了有效信息的传递,在互联网中找到自己感兴趣的内容宛如大海捞针。对于用户和商家而言,推荐系统可以有效地将物品和用户的信息关联在一起,从而实现高效的推送,创造价值。传统的协同过滤算法中所采用的矩阵分解方式在构建用户物品交互矩阵上存在一定的局限性,导致算法限制了矩阵分解的表现力。本文通过采用度量分解与深度学习相
食道癌作为生活中常见的一种癌症,其发病率和致死率都已经排在靠前的位置。当前诊断食道癌的影像主要有电子胃镜、超声内镜、计算机断层扫描、核磁共振等。医生在分析医疗影像时依赖于经验和专业技术,在诊断工作中容易出现耗时费力、精确度不高等问题。为了提升食道癌的确诊率,保障患者的生命健康,急需一种高效快捷的方式来辅助医生进行诊断。深度学习在图像处理领域已经取得了良好的成绩,它能够有效地对图像进行识别、分类以及
交通驾驶环境是一个复杂多变的动态场景,信息错综复杂。经验丰富的驾驶员受人的视觉选择性注意机制影响,能从大量的交通场景信息中迅速搜索到对驾驶任务重要的关键信息,分析并做出预判,保证行车安全。近年来,交通场景的视觉显著性检测技术越来越受到人们的重视。通过分析驾驶员的注意分布,并对其进行建模,从而预测驾驶场景中显著性区域和目标。目前,大多数研究都是针对白天交通场景的预测,然而,由于光线不足、光源干扰,夜
对于介观系统的输运性质,无序在量子自旋霍尔系统、三维强拓扑绝缘体和超导体、分数量子霍尔系统和弱AIII拓扑绝缘体中起着重要的作用,它可以导致金属-绝缘体相变并驱动拓扑相变。杂质的浓度对量子输运有很大的影响。在某些情况下,它们的微小变化会显著改变电导值。因此,有必要进行大量的数值计算来研究杂质能量和杂质浓度对输运性质的影响。本文希望通过流行的机器学习技术来降低这方面的计算成本。并研究利用机器学习方法
得益于科学技术的突破发展和迅速普及,无人车的应用面越来越广,给山地侦查和勘探提供了更加智能的手段,但是山地环境复杂,海拔变化大,气候条件恶劣,如何保证无人车能够快速准确地行进,完成任务是基本的要求。本文从路径规划以及强化学习方法研究现状入手,对环境建模、基于深度强化学习方法的全局路径规划、基于人工势场法的局部路径规划所涉及的相关技术原理进行了介绍,完成基于环境的无人车避障路径规划系统设计与功能实现