基于多维关联规则挖掘的网络行为特征分析技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:caonimalegebicaonima
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet应用的不断深入,网络已经成为人们日常生活中的一个重要组成部分。每天承载着我们活动信息的海量数据,在网络中不停的流动、交换。这些记录人们网络行为的数据中隐含了上网习惯、个人爱好、所属社团等特征信息,而这些特征信息是无法直接得到的。网络行为特征分析技术可以帮助我们从海量、多样的数据中挖掘出这些特征信息,利用这些特征信息,我们可以识别恶意攻击行为,提高网站个性化服务的层次和效率,完善政府、科研机构的决策支持系统。  本文从如何将数据挖掘技术应用到网络行为特征分析的角度出发,在对数据挖掘领域的最新研究成果进行了系统研究和总结的基础上,结合网络行为特征分析的特点,围绕着关联规则挖掘技术应用、网络行为特征分析系统实现这两个方面进行了深入细致的研究,取得了若干创新和成果。  1.本文提出了一种基于多维事务线索树(MTT-tree)的多维关联规则挖掘算法,并将其应用到了网络行为特征分析中。该算法在事务数据库压缩成的多维事务线索树上进行多维关联规则挖掘,节省了内存空间,只需要扫描一遍事务数据库,提高了算法的性能。同时,利用保存了历史数据的MTT-tree,实现了增量式的多维关联规则挖掘。  2.本文针对传统关联规则挖掘模式易产生大量冗余规则的缺点,将约束引入到关联规则挖掘的过程中,结合MTT-tree算法,建立了一个交互式的挖掘模型。该模型分别在频繁模式发现阶段采用了基于维信息的数据约束,在关联规则生成阶段采用了基于兴趣度的规则约束。该模型提高了挖掘算法的针对性,缩小了挖掘范围,提高了挖掘的速度,同时,减小了生成的关联规则的冗余度,使生成的结果是更加有效、更加有趣的规则。  3.本文给出了网络行为特征分析系统的步骤,初步设计并实现了一个基于MTT-tree算法的网络行为特征分析系统。该系统能够对海量、多维、增量的网络节点数据进行高效率的处理分析。同时,采用了交互式的关联规则挖掘模型,提高了用户的参与度和挖掘结果的有效性。
其他文献
随着网络越来越普及,所需的全局IP地址也越来越多,这将势必大力推动IPv6协议的发展。而使用网络地址端口翻译-协议翻译(NAPT-PT),是现阶段实现V6节点和V4节点通信的重要方法之一。
随着技术的进步及互联网产业的发展,以智能手机为代表的智能化设备进入了蓬勃发展的时期,相关软硬件产业也在智能化的浪潮中不断进行着革新与技术突破。智能电视是家电智能化
随着Web应用的不断扩展,基于HTML的Web信息表达方式已经不能适应人们进行信息查询和对Web数据进行管理的需要。XML以其开放性,自描述性,以及平台无关性等优点,成为网络上数据表示
随着多媒体技术的发展,视频信息的飞速增长,能够快速高效地访问海量的视频信息,已成为信息时代人们迫切需要解决的问题。因而,视频检索系统应运而生,但由于多媒体格式种类繁
油品经营企业的数据量比较大,采用手工方法收集数据进行分析,会浪费大量的时间,人力和财力,在很大程度上影响企业的效益。本课题从企业的实际情况出发,着眼于其发展,为其开发
本文对基于GBPEL的网格工作流引擎进行了研究。文章将BPEL4WS的许多特性引入OGSA网格环境中,深入分析了网格服务的生命周期管理机制、服务创建机制和实例管理机制等,并详细阐述
软件定义网络(Software Defined Networking,SDN)是近年来提出的网络架构模型,它能应用在云计算数据中心、企业网络等处,具有易管理性、高安全性等特点。云计算也是近年来提
本文对基于大数据集学习问题的支持向量机训练算法进行了研究。文章首先围绕最大间隔超平面的思想,基于凸包与约简凸包的概念从几何角度对支持向量机进行了分析与解释;其次基于
压缩感知(Compressed Sensing,CS)是近年来提出的一种新的信号采样方式,它指出当信号是稀疏的或可压缩时,可以通过非自适应的线性投影的方式,用远低于奈奎斯特采样定理要求的
随着人类社会的进步和计算机网络技术的发展,数据信息与物质和能量并列成为世界三大资源。在信息爆炸的时代,为了从大规模数据中提取关键信息,迫切需要高效的查询处理技术。Top-