基于决策树分类的网络异常流检测与过滤

来源 :电子科技大学 | 被引量 : 11次 | 上传用户:vitaminchina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
快速发展的计算机网络在给人们带来便利的同时,也因为各种各样异常流的出现,给人们带来安全上的困扰。而当前针对网络异常流的各种检测系统都或多或少存在瑕疵,如最常见的入侵检测系统(IDS)。市场化的IDS由于缺乏自学习的能力,开发和维护人员不得不实时的更新系统的病毒库,才能使系统正常的工作。随着近几年机器学习和数据挖掘的出现,网络异常流的检测出现了新的思路和方法。网络异常流的攻击特性,使得其在流量特征上必然与正常网络流存在或多或少的差异,而这些差异可以使用机器学习挖掘出来的模式和规则来表示。当前各种使用机器学习进行的异常流检测研究和实验不断出现,而且大都取得了良好的效果。但由于网络异常流的复杂性和多样性,这些研究和实验仍然存在诸多问题;比如一些实验需要大量的训练样本才能有效;而另一些实验仍然存在很高的漏报率或误报率;因此对基于机器学习的异常流检测方法的研究仍然有很长的路要走。本论文通过对决策树分类算法、随机森林和AdaBoost分类算法进行深入的研究;在AdaBoost算法的基础上通过引入随机森林的多决策树投票机制,提出了以C4.5决策树为核心的基于AdaBoost强分类器群(简称AdaBoosts)的网络异常流检测算法。该算法通过训练得到一个AdaBoosts;使用该AdaBoosts对网络流进行分类检测,然后使用多数投票机制从检测结果中判断出网络流的异常情况。论文使用C4.5算法构造弱决策树,由弱决策树加权组合得到单个/AdaBoost。为了减少AdaBoost之间的关联度,本论文通过引入四个随机性原则对原始样本集合和属性集合进行处理,得到每一个AdaBoost对应的样本子集和属性子集。为了验证算法的有效性,论文设计并实现了异常流检测的原型系统,系统首先通过OPNET平台实现了网络流属性数据的提取,然后使用AdaBoosts算法实现了异常流的检测。本论文使用wireshark抓取网络流作为部分实验数据,其他实验数据还包括KDD数据集和DARPA数据包,论文最后通过这些实验数据对系统进行了测试,通过测试结果对比分析本文提出的算法与AdaBoost算法相比,可以通过更少的训练数据得到更高的检测率,并且在时间效率上并不比单个AdaBoost差很多。
其他文献
本文对汉语术语的抽取进行了一定的研究,设计了一个统计方法和规则方法相结合的汉语专业领域术语抽取算法,并具体实现。在本文的实验系统DSTES中,共有四个核心模块:预处理模块,对
作为支持向量机和神经网络应用研究的重要补充和发展,针对目前用于生产生活的监视、监控系统的广泛重视,本文提出了基于视频图像的MPEG4 压缩方式和支持向量回归与径向基函数
计算机技术的迅猛发展使得人们创作、使用数字多媒体作品变得越来越容易,并由于互联网技术的发展又极大的推动了数字多媒体作品的广泛传播,一幅好的数字多媒体作品可以在一夜之
本文介绍了目前在国内电信业发展迅速的PHS无线市话网络和它的GIS体系结构和特点,介绍了PHS GIS系统的建立过程和GIS系统在PHS网络中全方位的应用,说明了GIS相比传统DBMS系统在
序列模式挖掘是指挖掘相对于时间或其他模式出现频率高的模式,是数据挖掘的一个重要分支。在交易数据分析,病症分析,Web日志分析,天气预报等领域具有广泛的应用前景。 本文选
近年来,随着全国煤矿企业加大煤矿开采力度,煤矿事故也逐年增加。作为我国西南地区的煤矿重镇,重庆南川煤矿辖区内各大中型煤矿也发生了多次矿难,不仅扰乱了南川矿区的正常生
随着车载自组织网络的快速发展,出现了一系列引人注目的车载应用。但由于车辆节点的高速移动,车辆之间很难维持稳定的网络连接,传统的MANET中的路由协议已经不能够充分满足VANET
OLAP技术是决策支持系统中的一种重要技术,用于管理人员决策分析。为了提高响应速度,需要对数据立方进行预计算。数据立方的计算在数据仓库中是非常必要但代价很大的操作。有
基因微阵列技术使得人们可以同时监测成千上万个基因的表达水平。目前对基因表达数据进行分析的各种方法中,聚类分析方法应用得最多。常用于基因表达数据分析的聚类方法有很
有效的安全机制是当前开放式网络中数据传输的必要保障,在信息安全领域里,密钥是合法访问的唯一凭证,因此如何为群组通信成员产生平等、有效的组通信密钥,尤其为最为复杂的动