分布式恶意网站检测模型研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:baoyuan000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的出现给经济发展带来了新的机遇,但也带来了新的挑战。就在人们对互联网的依赖越来越深的同时,数以百万计的不法分子正在互联网上通过恶意网站进行诈骗和传播恶意软件,这些非法行为无时无刻不威胁着人们的隐私和财产安全。为了保护普通用户的合法权益,恶意网站的检测方法应运而生。然而在黑客技术飞速更新和大数据大行其道的当下,传统的检测方法存在着很多局限性。由此,该文提出了一种基于在线学习的分布式恶意网站检测模型,其主要的工作内容如下:(1)对恶意网站检测方法进行了深入研究分析,分析了现有检测方法的局限性和不足,并重点分析了基于机器学习的恶意网站检测方法;(2)对恶意网站特征进行了详细分析,提出了一种基于WOE算法的域名注册机构特征提取方法。该方法仅使用一个特征来表示不同域名注册机构对恶意网站的相关度,不仅降低了特征向量维度,还可以有效适应新注册机构出现的情况;(3)对在线学习算法进行了深入分析和研究,提出了一种改进的学习率选取方法。该方法采用多维学习率,为每一个特征设置不同的学习率,并根据恶意特征的检出情况来单独进行动态调整,避免了使用统一学习率而导致对低检出率特征学习不足的问题,从而提高了检测效果;(4)对分布式并行策略进行了分析,提出了一种基于特征切分的分布式在线学习模型。该模型将特征的提取以及在线学习的训练过程分布到多台机器之上,具有较好的横向扩展能力,达到了处理大数据的目的。基于以上研究,该文采用Java作为开发语言,设计和实现了基于在线学习算法的分布式恶意网站检测系统,该系统包括特征提取模块,在线学习和预测模块以及WEB交互模块。且通过实验对系统进行了性能分析,实验结果论证了该系统的有效性、正确性和实用性。
其他文献
P2P网络中所出现的各种攻击成为威胁网络正常运作的主要因素,而这都是因为有恶意节点的恶意行为存在所导致的。如何在P2P网络中识别出恶意节点,约束和杜绝节点的恶意行为成为
随着大规模网络的激增,网络的复杂性和异构性的特点日益突出,加强电信网络资源管理成为当前各级电信企业迫切需要解决的重要任务。然而,传统电信网络资源管理大部分只停留在
无线传感器网络融合了网络、信息、通信以及半导体等先进技术,在环境监测、国防军事、工业、公共卫生事业以及野生动物保护方面得到了广泛的应用。长期以来,无线传感器网络的
在网络管理中普遍存在信息安全保障和资源有效分配等方面的问题,这些问题都与用户的操作行为密切相关。本文针对基于Web日志的用户访问模式挖掘问题进行了较为深入的分析和研
当前互联网高速发展,使得海量的、内容丰富的文字信息以计算机可读的形式存在,并且其数量每天仍在急剧增加。为了有效的管理和利用这些分布的海量信息,基于内容的信息检索和
本文以绝经综合征为基础,对中医药临床疗效评价方法进行深入的研究。在国家“十五”攻关项目研究所取得的成果数据库和基本疗效评价指标体系的基础上,以症状指标、生化检查指标
随着网络应用技术的发展与进步,软件架构发生了从C/S到B/S的转变。然而,B/S模式不能解决所有客户端应用问题。人们发现简单的浏览器页面已经不能满足新的需求,丰富快速的用户体验及
近年来,随着计算机技术、多媒体技术的飞速发展,表格影像文档的自动分类、存储和管理日益成为人们研究的热点。而表格影像文档的特征提取是影像文档自动管理领域里重要的研究课
合成孔径雷达因其全天候和高分辨率成像的特点,近年来得以快速发展。与此同时,随着近代的计算机技术和先进的数字信号处理技术的发展,合成孔径雷达在许多领域得到广泛的应用,
随着互联网的快速发展,网络上信息的数量也在急剧增长。互联网给人们提供了大量信息,但同时也给人们快速准确的获取信息带来挑战。为了能有效地利用网页资源,我们需要对网页