基于强化学习的蜜网主动防御系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:hxffxh2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网快速发展的同时,网络安全问题变得日益严峻,诸如防火墙、入侵检测系统等传统的安全防御机制已很难应对高隐蔽、持续性以及智能化的新型网络威胁。而蜜罐和蜜网等主动防御技术发挥着越来越重要的作用。然而,现有的蜜罐蜜网防护体系主要采用静态部署的方式,难以随着攻击手段的变化而动态响应,很容易被经验丰富的攻击者识别并绕过。随着人工智能的发展,强化学习、博弈论、案例推理等相关技术在智能决策、动态交互、反识别等方面具有良好的表现,因此将人工智能技术与蜜网技术相结合成为当前主动欺骗防御领域的研究热点。本文重点研究基于强化学习的蜜网主动防御技术,主要工作如下:(1)对于不同攻击的分类响应,本文提出了一种基于可信度推理的攻击连接分类机制。本文将攻击连接分为两类,自动化攻击和人为攻击。首先,根据攻击连接的特性建立不同结论的推理知识库,然后评估知识库中每条知识的可信度和信任增长度。鉴于基于可信度的不确定性推理在模糊信息处理上的优势,本文基于建立的推理知识库,通过组合证据的不确定性算法计算不同结论的总体联合可信度。最后根据比较可信度值的大小,得到攻击连接分类结果。(2)本文设计并提出了一种基于Q-learning算法的自适应蜜罐模型。本文首先基于马尔可夫决策过程对自适应蜜罐响应攻击的过程进行建模,将攻击者的命令集以及蜜罐采取的响应动作集分别映射到蜜罐模型的状态空间和动作空间,并设计了一种能够最大程度收集自动化攻击命令的奖励函数。在此基础上,自适应蜜罐通过与攻击者交互进行学习,生成使得攻击者暴露更多有价值的攻击数据的最佳交互策略。(3)本文设计了基于分阶段响应式蜜网架构,在此基础上实现了基于强化学习的蜜网主动防御系统。系统由静态请求响应模块、攻击连接分类模块、攻击行为捕获模块和日志管理模块组成。最后,对蜜网主动防御系统进行了测试,证明系统的可用性及优越性。实验证明,本系统能够分阶段对网络攻击进行响应,对当前网络环境进行模拟、控制攻击者流量、监控和记录攻击者扫描、探测、攻击蜜网的行为并对蜜网日志进行有效展示。本文提出的自适应蜜罐相较于传统中交互蜜罐能够捕获命令总数高达3倍的攻击命令,对比于其他应用了强化学习的蜜罐,其在学习过程中能够以更快的的速度收敛,在第150次攻击学习后呈现出收敛趋势并且蜜罐的响应行为具备明确的优先级,证明了本文提出的自适应蜜罐的优越性。
其他文献
由于互联网通信技术的高速发展,目前连接互联网的途径也越来越多样化。其中无线局域网作为一种重要的连接互联网途径,改变了曾经只能依靠有线组网技术进行互联网通信的局面。随着无线局域网技术的迅猛发展和无线终端设备大规模的普及,目前无线局域网已经广泛的应用于校园、地铁、大型商场等人流量较大的公共场合。无线局域网在给人们带来便利通信的同时,其中的安全风险也是不容忽视。近年来,针对无线局域网的攻击对用户造成财产
人口数据对制定和完善社会政策、推动经济高质量发展有重要意义,人口数据蕴含着丰富价值的同时也具有高度敏感性,然而目前人口数据的发布方法不足以保证为用户发布查询结果时兼顾隐私性和数据可用性。随着社会对隐私保护问题的日益关注,差分隐私因其具有严格的数学定义和可量化的隐私泄露风险而逐渐成为学术界研究的热点,因此本文将在差分隐私保护下进行关于人口数据发布方法的研究工作。首先,本文介绍了人口数据目前的主要发布
针对往复压缩机气量调节系统具有多变量强耦合的特点,设计了一种基于前馈补偿作用的内模解耦PID控制器.该控制器融合了内模控制结构灵活和PID控制易于调参的优势,应用系统辨识的方法建立了气量调节的控制数学模型;采用前馈补偿解耦并将内模控制器调整为PID结构以减少控制系统的参数数量.数值仿真试验表明:各级排气压力在设定值变化或因工艺波动情况下的调节时间均减少约60%,超调量降低至0左右,各项时域性能指标较其他控制器都为最优.研究结果表明本文提出的内模解耦PID控制器具有优异的设定值跟踪性能、解耦及鲁棒性能,具有