论文部分内容阅读
随着信息技术的高速发展,网络逐渐成为了人们日常交流的主要工具,同时人们利用互联网获取各种信息也更加便利和快捷,但是随之而来的则是越来越严重的信息安全问题,例如木马、入侵等问题,计算机网络的完整性、安全性、保密性均受到了非常大的挑战。虽然防火墙、入侵检测等传统的网络安全技术能解决一部分问题,但是对于提高网络服务质量、检测流量异常等要求来说,分析并识别流量所使用的协议类型是最基本的要求。目前常用的网络协议识别软件大多采用单一方法,且只能针对特定的网络数据包或数据流进行识别,自动化程度低,识别准确度不高。针对上述情况本文构建了一种新的协议识别系统,该系统将深度包检测和深度流检测相结合,对非加密的数据使用深度包检测技术,在提取数据包特征之后进行自动推理识别;对未知的加密数据则采用深度流检测技术,提取数据流特征之后使用支持向量机进行分类识别。本文第一部分介绍了数据包特征提取技术并构建了数据包特征提取系统,使用多模式匹配算法和关联规则分析算法相结合的方法来提取协议特征字符串,并将结果存储到协议特征库中。对于加密数据,数据包的内容对于用户来说是不可见的,为此,本文构建了数据流特征提取系统,通过提取数据流特征来进行加密数据的协议识别。提取了数据包特征和数据流特征之后,通过推理识别系统和分类识别系统来进行协议的识别。为此,本文第三部分介绍了系统构建使用的训练数据和测试数据的采集以及预处理,然后通过Jena自动推理机来构建基于数据包的协议识别系统,而通过支持向量机来构建基于数据流的协议识别系统。最后,测试数据表明,所构建的系统在保证准确率的情况下,不仅可以识别多层网络协议,而且提高了识别的自动化程度。从而为网络传输数据分析、状态监控、安全防护等提供了新的技术手段。