高速网络内容分析识别系统关键技术研究

来源 :国防科学技术大学 | 被引量 : 2次 | 上传用户:Whding713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络技术是当今社会极其重要的信息交流手段,已经深刻地影响到国家的政治、经济、文化等各个领域。与此同时,互联网的开放性和安全漏洞给互联网的健康发展带来了不可忽视的负面效应,各种色情、反动和诈骗等非法信息以及病毒的传播,内部网中机密信息的泄漏等负面效应不仅给国家和个人造成了巨大的经济损失,同时也影响到了社会的稳定。目前,研究如何高效、及时、准确地发现网络中的有害信息,加以控制,进而实现对网络虚拟社会的有效监管已经成为互联网建设过程中一项迫切任务。网络内容分析识别技术是发现与遏制网络安全威胁,滤除有害信息的重要技术手段,是实现网络信息监管的重要基础,对支持互联网的健康有序发展具有重大意义。本文针对现有网络内容分析识别系统空间复杂度过高,处理速率不足以及难以适应正则表达式规则集动态更新要求三个方面的主要问题进行研究,提出了多种改进结构的自动机模型及相关算法。主要内容归纳如下:1、在对高速网络内容分析识别系统进行需求分析的基础上,说明了网络内容分析识别系统的体系架构,并阐明了相关基础理论。首先,从网络内容分析识别系统的功能模型、结构模型、部署位置以及评价指标等方面对网络内容分析识别系统的体系架构进行了阐释。然后,对网络内容分析识别技术涉及的正则表达式的基本理论以及有限自动机理论进行说明,并介绍了有限自动机应用于网络内容分析识别系统的基本过程。2、提出了一种多缺省转移确定型有限自动机MD~2FA,以解决网络内容分析识别系统空间复杂度过大的问题。MD~2FA的主要思想是基于对自动机中不同状态间转移边相似性的观察,以适量增加单个状态中的缺省转移边数量为代价降低系统的空间复杂度。首先,介绍了MD~2FA的基本结构,并证明了其与确定型有限自动机在功能上的等价性。然后,在发现MD~2FA的构建过程等价为集合覆盖问题的基础上,提出了一种启发式的MD~2FA构建算法。最后,在分析了MD~2FA相关参数对网络内容分析识别系统性能影响的基础上,通过实验验证了MD~2FA的各方面性能。MD~2FA存储压缩效率高,构建时间短,因而其更加适用于具有大规模正则表达式规则集的高速网络内容分析识别系统。3、提出了一种基于正则表达式采样的加速模型,以提高网络内容分析识别系统的处理速率。此加速模型借鉴了信号处理技术中的采样思想,通过对正则表达式规则进行采样进而构建采样自动机,并利用采样自动机对采样流量进行分析识别,最后对采样自动机的匹配结果进行综合判定。本文对该加速模型在单处理单元和多处理单元两种不同处理架构下的加速实现方法进行了讨论,两者的不同点主要在于验证方式不同。此加速模型在单处理单元架构下只需对部分网络流量进行分析,在多处理单元架构下可实现高效的任务分解,因此可取得良好的加速效果,提高了网络内容分析识别系统的处理速率。4、提出了一种网络内容分析识别系统的正则表达式规则更新算法,实现了正则表达式规则集的规则增加操作、规则删除操作以及规则修改操作,解决了网络内容分析识别系统规则更新耗费时间过长的问题。从DFA最小化、DFA的增量构建、规则删除三个角度解决网络内容分析识别系统规则更新问题。提出了基于反向深度信息的最小化方法、DFA增量构建算法、规则删除算法,实现了网络内容分析识别系统低时间复杂度的规则更新。综上所述,针对骨干网内容分析识别过程中的若干关键技术问题,本文的研究工作提出了切实可行的解决方案,为构建高速网络内容分析识别系统、实现互联网信息监管等提供了理论和技术层面上的支持。
其他文献
渤海湾泥质海岸带的近现代地质环境变化研究,是通过两种形式(大比例尺区域地质调查和综合研究)在两个方面即垂向的浅表沉积物和平面上的地表形态变化同时展开的.(1)海岸带深
在金融同业竞争日趋激烈的今天,银行“等客上门”的传统将一去不复返,取而代之的是“主动走出去”,主动走进企业、商户、社区,主动提供上门金融服务,其目的是要最大限度地吸引客户
报纸
<正>开发区作为我国经济建设中的先行先试区域,起到先导示范作用,为经济建设做出了应有的贡献。经过多年的发展,很多开发区已经成为地方经济的领头羊。但是,开发区也被苦恼困
会议
本文探讨了不同分子量普洱茶茶褐素对高脂血症SD大鼠的治疗作用。通过45 d的治疗,饲喂TB1和RTB的大鼠血清TCTG和LDL均显著低于高脂模型组(p
以1,3-双咪唑丙烷,3,5-吡啶二羧酸和Zn(NO3)2&#183;6H2O为原料,在水热条件下合成了一个新的Zn(Ⅱ)配合物{[Zn(bbi)(3,5-pdc)]&#183;2H2O}n(1,bbi=1,3-二咪唑丙烷,3,5-pdc=3,5-吡啶二羧
高校图书馆的社会化服务有利于文献资料的合理利用,有利于阅览者分布层次向大众扩展,有利于图书馆提高经济效益。高校图书馆的社会化服务使阅览者生活更方便,分享社会文化资源更
针对高铁牵引电机轴承在工作过程中出现的疲劳剥落现象,通过有限元理论和疲劳分析理论相结合的方法对轴承进行了疲劳寿命预测。将轴承静力学仿真结果作为疲劳分析模型,轴承多
从Revit中创建族命令的基本概念入手,解析了Revit软件中创建族命令的具体内容。通过剖析创建圆形风管变径弯头族的具体步骤,总结了利用Revit创建机电工程中复杂构件族的方法