云环境下基于机器学习的入侵检测技术的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:shenjin62
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今是一个“互联网+”的时代,人们在学习、办公、娱乐等诸多方面无不受到互联网的影响。而当人们越是离不开互联网,网络安全问题就越是无孔不入。尤其是在具有虚拟化、无边界等特征的云计算环境下,黑客攻击、数据恶意泄露、信息篡改等行为日益猖獗,给企业与个人造成难以估量的经济损失。网络安全已经成为现今网络技术中最突出的问题。而传统的安全防御技术多为被动防御机制,不能进行实时监控,无法满足现今复杂多变的网络环境,因此主动的入侵检测技术得到了业界广泛关注。随着近年来机器学习技术的迅猛发展,传统入侵检测技术面对云环境下海量数据时,检测性能差、检测率低的缺陷得到有效解决,因此机器学习方法为云环境下的入侵检测系统提供了极佳的解决方案。本文围绕云环境下入侵检测的需求,结合基于机器学习的入侵检测框架,提出一种将随机森林与聚类算法相结合的异常检测分类方案,并对其在PyCharm平台上进行了入侵检测实验仿真,解决了常用数据降维与传统聚类算法K-means在云主机Windows审计日志上检测性能差的问题。主要研究内容如下:(1)研究了入侵检测的基本概念与分类、通用框架与检测流程、云计算环境下入侵检测的模型。研究了基于机器学习的入侵检测框架,数据挖掘、决策树、主成成分分析等主流机器学习方法在入侵检测的应用,以及聚类算法的原理与入侵检测中的算法需求。(2)重点研究分析了划分聚类K-means与层次聚类BRICH的算法原理与缺陷,同时选择基于最大最小距离的K-means算法来克服传统K-means由于随机选择初始聚类中心而造成的缺陷。随后对真实的Windows审计日志数据进行特征建模工作,根据不同数据处理方式,提出三种入侵分类检测解决方案:常用数据降维手段与聚类算法相结合的基于主成成分的最大最小K-means分类方案,BIRCH算法分类方案,以及本文设计的基于随机森林的最大最小K-means分类方案。(3)基于PyCharm平台,对三种入侵检测分类方案进行实验仿真,从分类器和聚类模型两个角度进行评估。实验结果显示随机森林的最大最小K-means分类方案,入侵检测准确率达93%,异常行为查全率高达96%,检测速度快,满足了云环境下入侵检测的良好可伸缩性、输入数据不敏感、高维数据可处理的要求。
其他文献
股利分配作为公司三大财务决策的内容之一,是上市公司进行利益分配的重要手段,也被视为降低股东和经理人代理成本的途径之一,因此一直是国内外研究学者进行财务研究的重要话
近场地震相对于远场地震具有特殊的作用效应且地震中财产损失和伤亡人数大多集中在近场区域,分析近场地震作用下的地面运动具有重要的现实意义。土层的存在是加剧近场地面运动的因素,在近断层地震地面运动研究中,考虑客观土层存在并研究土层对地面运动放大作用的研究较少,考虑土层放大作用的近断层地震地面运动研究具有重要理论意义。研究内容及结果如下:研究了有限断层震源模型在理想模型地面运动数值模拟中的运用,应用ABA
多铁性材料是一类含有两种或两种以上铁性的多功能材料,具有丰富的物理现象和广泛的应用前景。本论文从实验上制备得到掺杂钙钛矿锰氧化物及其多铁复合薄膜,研究材料的磁特性
胚胎的早期图式发生是个体发育中极为重要的一个环节,背腹轴形成是胚胎对称性被打破的最早事件,决定了器官沿着背腹方向的排列顺序,确立了脊椎动物两侧对称的身体蓝图。在斑
近年来,由于煤炭无尽的开采和大规模的利用,大量开采煤炭使煤炭资源急剧减少,导致多数煤矿无煤可采而停止采煤并关闭煤坑。由于矿井、坑道等长久缺少支撑和维护,在长时间的重力作用下会发生坑道沉陷、崩塌等情况,造成地面塌陷、沉降,严重情况下会引起地质灾害,给位于采空区附近的居民造成严重的生命财产威胁。所以,明确空区的详细情况,为采空区的治理提供必要的基础资料,就成了切实需要处理的问题。勘查煤矿采空区时,物探
受氯离子侵蚀和混凝土碳化等环境作用的影响,混凝土中的钢筋时常发生腐蚀。钢筋腐蚀不仅会产生锈胀压力,导致混凝土保护层发生开裂甚至剥落,影响混凝土结构的美观和正常使用,
制备高催化性能和高稳定性的电化学析氢催化材料一直是科研人员们的重点研究方向。二硫化钨(WS_2)作为一种重要的过渡金属硫化物,因具有独特的层状结构而受到了人们的重点关注。但纯相的WS_2由于其催化性能较低且导电性能较差,而无法被广泛应用。本论文通过化学气相沉积法,分别合成出了片状WS_2/WP/C复合材料和多孔WS_2/C复合材料,具体的研究内容如下:(1)以H_2W_2O_7/DDA为前驱体,硫
伴随着神经网络模型在各行业的广泛使用,其正确性和健壮性正在受到学术界和工业界越来越多的关注,特别是在安全攸关的领域中,如自动驾驶、恶意软件检测等,神经网络的每一次错误判断都将可能带来无法挽回的后果。神经网络是一种基于数理统计的优化模型,其目的在于使用近似函数高效地处理物理世界中难以描述的输入输出关系,这意味着神经网络对未知输入天然的不确定性;而形式化方法是一种建立在严谨数学逻辑上的适用于描述软硬件
随着数字计算机在工程和科学上应用的增加,人们开始越来越多的使用计算机进行控制器设计,此时被控对象通常是连续的,这种对连续对象设计离散控制器的系统称为采样控制系统。时滞广泛存在于采样控制系统中,因此对时滞不确定采样系统进行稳定性研究与控制器设计十分必要,本文主要在时域上对采样系统进行稳定性分析和控制器设计。本文首先对于一类采样控制系统,利用输入时滞法,将其转换为具有输入时滞的连续系统,通过构造出Ly
伴随着信息时代到来的是海量的数据信息,在被称为“大数据”时代的21世纪,大数据的处理成为了这个时代的难题。目前,分布式计算机技术是处理大数据的主流方式,通过建立分布式