【摘 要】
:
以牛顿法为代表的二阶优化算法已经被应用于解决稀疏学习问题并取得了良好的效果。这种算法与一阶优化算法相比主要的缺点是需要计算海森矩阵而会消耗大量资源,解决上述问题
论文部分内容阅读
以牛顿法为代表的二阶优化算法已经被应用于解决稀疏学习问题并取得了良好的效果。这种算法与一阶优化算法相比主要的缺点是需要计算海森矩阵而会消耗大量资源,解决上述问题的一个方法是寻求海森矩阵的近似项。本文提出了一种新的近似海森矩阵方法,本算法基于线性模型的光滑性条件构造了一个与数据特性相关的近似项,并基于此近似项构造了一个二阶子问题逼近原问题,接着利用迭代硬阈值法求解子问题间接地实现对原问题的求解。本算法可以应用于一些海森矩阵难以计算或者没有海森矩阵的线性模型。本文从理论上证明了该算法的可行性,并将此算法运用到几个经典的线性模型中。实验结果表明本算法与其它算法相比在收敛速度和准确率方面都具有很大的优越性。网络压缩特别是网络结构化剪枝是近几年来深度学习十分热门的研究方向。现有的网络结构化剪枝算法运用神经网络模型的零阶信息或者一阶信息作为衡量网络通道重要性的标准。本文提出一种将模型的二阶信息用于衡量网络通道重要性依据的算法,利用幂迭代算法得到网络参数对应的海森矩阵最大特征向量,然后将得到的特征向量作为衡量通道重要性的依据,并对神经网络进行结构化剪枝。本文将所提出的算法运用到经典的深度神经网络上,实验结果表明本算法具有很强的可行性。综上所述,本文的工作可以概括成以下两个方面:1.提出了一种用于稀疏约束下线性模型最优值求解的二阶优化算法,本算法可以应用于一些海森矩阵较为复杂或者没有海森矩阵的线性模型中,本文进行了理论分析并结合实验证明了本算法的有效性。2.提出了一种利用神经网络二阶信息衡量网络通道重要性的结构化剪枝算法,该算法利用幂迭代法获取模型的二阶信息,并依据该信息对神经网络通道进行剪枝。实验结果表明本算法可以在不影响网络精度的前提下减少模型参数量,并实现模型加速。
其他文献
随着互联网技术的高速发展,各个领域均会产生待处理的大规模数据。如何对这些数据进行处理和分析,成为了当代的研究热点。粗糙集理论为数据挖掘提供了一种有效地处理冗余数据的手段。但对数值属性进行处理时必须先将其离散化。模糊粗糙集能够直接对数值属性进行处理,减少了因数据离散而带来的数据信息损失和避免数据结构被破坏的优势,能够有效地对数据进行处理,已成功应用于数据挖掘、医疗诊断等领域。为了降低样本分布和类噪声
社会资本概念在1985年由布迪厄明确进行了界定,在此之后,科尔曼对社会资本理论进行了系统研究,随后普特南将这一概念全面引入经济和政治研究领城并得到广泛关注,并由此引发了大量学者进行研究,与之相关的社会科学文献数量呈现指数式的增长。学者们从不同的视角出发,探索了社会资本对个人、公司、社会,甚至对国家经济发展的影响。研究普遍认为,社会资本作为一种影响人们行为方式的制度、关系、态度与价值观念的综合体,对
《人民日报》是党的机关报,社论作为机关报园地,始终与党中央保持高度一致,积极宣传党的最新理论政策,对马克思主义大众化不断进行诠释。1989-2002年,马克思主义中国化面临新
中文分词是中文自然语言处理中最重要的一步,分词结果的好坏会严重影响后续任务的性能。目前的研究工作中多是使用深度学习方法来进行中文分词。这些研究工作大多数只用到句子中局部的上下文信息。近年来,将中文分词当作机器翻译问题来解决的新思路受到较多关注。基于这种思路的中文分词方法利用机器翻译模型直接对整个语句进行处理,能有效的利用全局的上下文信息。然而,机器翻译模型在翻译的过程中产生的错误翻译会导致分词的准
共振电子复合过程,是指一个自由电子被靶态离子共振俘获形成复合离子的共振激发态,随后通过辐射衰变放出光子的过程。共振电子复合是高温等离子体中的重要动力学过程,影响着
单图像超分辨率重建由于其在恢复图像细节和纹理方面具有很高的现实价值,所以一直是计算机视觉和图像处理领域的研究热点。深度神经网络能够学习低分辨率图像到高分辨率图像
离群点检测能够挖掘出大量数据中包含有价值信息的少量数据,在实际生活中有着广泛的应用,因此离群点检测成为了数据挖掘中的热点问题。离群点检测的主要任务是检测出异常的数据,从而在这些异常数据中获得有价值的信息。基于密度的离群点检测和基于聚类的离群点检测是目前研究的热点问题。本文深入分析了离群点检测的相关方法,针对基于密度和基于聚类的离群点检测中存在的一些挖掘性能不佳的问题提出了改进策略,旨在提高离群点的
伴随着《纺织工业“十三五”发展规划》的发布,中国的纺织行业正逐步迈向工业4.0时代。与互联网、大数据等技术的深度融合,各式各样的数字化智能纺织产品层出不穷,与此同时,
近年来,公共安全问题越发引起人们的关注。为了更好的解决城市安全问题,在人口密集的地方如商场、学校、电影院、游乐场、各大热门景点等地安装了大量的监控摄像头,这些摄像头汇聚在一起,形成一个巨大的监控网络,每天都会产生海量视频数据。但是处理这些海量视频信息大都采用传统的人工方式,通过人眼“盯屏幕”的方式从海量视频中寻找特定的几个监控信息,这样不仅费时费力、效率低下,而且容易遗漏重要信息,若有紧急情况发生
数字图像在人们生活中扮演着重要的角色。边缘则是数字图像中前景与背景的分界处,是图像的一个重要特征。边缘检测一直是计算机视觉、图像处理等诸多领域中的基础且重要的研究课题。在诸多边缘检测算法中,Canny边缘检测方法是目前理论上相对最完善的一种边缘检测方法。不过Canny算法在滤波去噪、梯度计算、边缘连接时的双阈值选择这几个步骤上都存在着缺陷,算法的自适应性较低。对于Canny算法中高斯滤波的缺陷,可