基于PCA和半监督聚类的入侵防御技术研究

来源 :江苏科技大学 | 被引量 : 6次 | 上传用户:dong_0622
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的日新月异、物联网技术的飞速发展和云计算技术的迅猛兴起,网络安全问题越来越受到人们广泛关注。传统的网络安全防护技术如防火墙、入侵检测等,已难以有力地保障网络安全。入侵防御技术是近年来网络与信息安全领域研究的新热点之一,逐渐受到人们高度重视。传统的基于无监督学习的入侵检测算法,检测率较高但误报率也较高;而基于监督学习的入侵检测算法检测率较高且误报率较低,但其难以正确检测出新的未知入侵攻击。本文将半监督学习引入到入侵检测中,并研究了主成分分析(principal componentanalysis, PCA)和聚类分析理论,给出了基于PCA和半监督聚类的入侵检测算法。首先利用PCA对入侵检测数据集进行特征提取,消除了样本间的冗余属性;然后利用少量具有先验知识的已标记样本,对成对约束信息进行量化并引入改进的竞争凝聚来监督指导大量未标记样本实现正确聚类。入侵检测实验结果表明,算法能够克服传统FCM依赖于初始化聚类个数、对样本几何形状及噪声和离群点敏感等问题,优于其他几种入侵检测算法。在现实的高速网络环境下会产生海量高维数据,使用传统的入侵检测算法审计和分析这些数据,必将面临“维数灾难”的难题。本文分别改进了基于PCA的半监督降维算法(SSDRpca)以及半监督聚类算法(PCCA),给出了基于改进的半监督维数约减和成对约束竞争聚类的入侵检测算法。一方面,算法对SSDRpca中的正则项进行了改进,充分利用了大量未标记样本来保持局部结构信息,从而得到更好的降维性能;另一方面,针对PCCA中的约束惩罚项与经典FCM项的数量级不一致的问题,算法将约束违反代价调整为两样本对应的隶属度与距离的联合表达式,并将竞争项改进为Shannon熵项,有效控制了大量未标记样本的正确聚类过程。在UCI数据集和KDD CUP1999数据集上的实验结果表明,算法能够改善聚类效果并提高了入侵检测系统的性能。本文研究并提出了基于PCA和半监督聚类的入侵防御系统模型,模型主要由中央控制模块、通信模块、入侵防御模块和日志记录模块组成。论述了系统模型中各模块的基本工作原理,重点研究了入侵防御模块并设计了入侵检测系统和入侵响应系统。
其他文献
随着移动互联网的快速发展,我们逐渐步入大数据时代,越来越多的人可以将自己的观点、心情等信息发布到网络平台中。评论中蕴含有很大的信息量,商品评论可以分析得出评论者对商品
认知科学是研究人类感觉、知觉、精神状态、大脑思维过程和信息处理过程的前沿性尖端学科,该方面的研究对揭示人脑之谜具有重要意义。认知任务的模式分类被广泛用于构建脑机交
传统机器学习技术必须建立在训练数据集和测试数据集来自同一分布的样本集的假设前提下。若测试数据集数据分布发生改变,那么就需要重新训练预测分类器以适应这种变化。然而,新
近年来,在现实生活和科学研究中产生大量的高维海量数据集,使得传统分类器面临着前所未有的挑战。而大量研究表明,特征选择通过剔除不相关特征和冗余特征可以有效地提高分类器的
调试是软件开发的一个重要环节,调试器是软件开发必不可少的工具,一个设计良好、功能完善的调试器能够大大缩短软件开发的时间。目前,国内的调试器技术发展缓慢,而国外的成品调试
起源记录了一个对象是如何演变到当前状态的。近些年,数据起源在计算机领域得到了广泛的研究,大量的研究主要集中在工作流和数据库领域,用于追踪这些应用的起源信息,便于后期
P2P电子商务作为一种新兴的电子商务模式已经在经济发展中得到了广泛的应用。与传统的电子商务模式相比较,P2P对等网络技术在提高获取商品信息的效率方面有很大的优势,表现出更
根据蛋白质序列信息预测其在不同细胞器或细胞区域(即亚细胞,如细胞核、线粒体、细胞质和细胞膜等),称为蛋白质亚细胞定位。它是蛋白质组学与蛋白质功能研究的基础工作。在以往的
计算机和通信技术的发展使得信息业急剧膨胀,信息交流在频率和规模上都呈现出增长的态势,数字化和信息化逐渐成为生活的常态。然而,信息网络的构建在给人们的工作和生活带来
随着当前对互联网的依赖持续增大,对于安全可靠网络环境的需求也随之增加。本文介绍了通过一种改进的遗传算法以及基于开关的神经网络模型,以构建一个有效的应对检测网络攻击