论文部分内容阅读
信息技术的飞速发展超乎了我们的想象,并且已经广泛应用到生活中的各个领域,现在我们的日常生活已经离不开计算机,甚至是出现了很多新生的科技产品,他们与计算机的工作方式极其相似,比如智能手机,平板电脑。我们用这些高科技产品进行沟通、交流、学习,加之网络的存在,它甚至深入到了购物、吃饭、出行等一系列的生活细节。随之而来的就是对信息安全问题的严峻考验。而且网络入侵手段长速度非常快。在日常生活中越来越多的人被盗号,越来越多的黑客利用不法手段,获取他人财物,对人们的正常生活造成了很大的损失,但是由于能力所限还有每个人的工作学习方向不尽相同,我们无法要求每个使用网络的人都会保护自己的电脑安全,只能通过电脑系统本身在网络安全性能上的提高,来预防入侵事件的发生。人们不得不去寻求好的方法,对入侵进行防御,但是黑客的技术也在不断升级,所以传统的被动的防火墙等静态防御方式面临了巨大的挑战。而入侵检测的主动防御,恰恰很好的弥补了传统技术的缺陷。本文基于入侵检测技术,以数据挖掘聚类分析为切入点,寻求应对大数据环境下数据挖掘入侵检测的新技术。聚类分析是随着计算机技术的发展研究新兴的一种数据挖掘技术的研究方向,它将大量的数据,按照一定的规则进行分类,使相似的数据聚集成一类,以达到区分的目的。而聚类的特点恰好符合入侵检测对算法的要求,入侵的行为首先来说相对于日常的网络行为是较少的,并且可以根据不同的入侵事件特征,将相类似点提取出来,进行聚类整合。所以本文重点研究改进的k中心点聚类算法与入侵检测相结合的方法,文章包含以下几个方面:第一,对入侵检测系统和聚类分析方法进行系统阐述,分析了现有的聚类方法在大数据环境下应用于入侵检测时的优缺点。第二,介绍网络入侵检测、聚类分析的相关技术以及k中心点聚类算法应用在大数据环境下入侵检测遇到的问题,并在原有的k-medoids算法基础上进行改进,将改进的k-medoids算法应用到入侵检测中。第三,利用当今入侵检测中公认的KDD CUP99数据集进行实验,最终实验结果显示,改进的算法能更好地适应大数据环境下得入侵检测,并且大大提高入侵检测效率,还能有效地降低时间空间复杂度。