论文部分内容阅读
目前垃圾邮件泛滥的情况极为严重。垃圾邮件占用了大量的传输,存储和运算资源,造成邮件服务器拥堵,还被用来传播色情,发布反动言论,骗人钱财,妖言惑众,已经对现实社会安全造成了危害。由垃圾邮件而造成的直接和间接经济损失不可估量。
垃圾邮件识别方法有很多种,1.基于IP黑名单的方法;2.基于手工规则集合的方法;3.挑战回应系统;4.蜜罐方法等。上述方法在一定程度上限制了垃圾邮件的传播,但由于上述方法本身的限制及垃圾邮件特征的不断变异,使得上述方法在实际应用中的效果并不理想。
本文应用人工免疫系统的基本原理来解决邮件分类问题,设计并实现了一种新型的基于AIS的双层垃圾邮件分类方法(AISDEC)。该方法包括非垃圾邮件检测器集和垃圾邮件检测器集两部分,通过两次应用检测器对邮件进行分类,从而达到降低垃圾邮件的虚报率的目的。本文实验部分选择中国基础教育科研网(CCERT)的标准中文邮件样本集为实验样本,应用该样本集分别进行双层分类方法与其它分类方法的对比实验,实验结果表明双层分类方法不但有很高的召回率,更为重要的是它有效的降低了虚报率。
本文内容主要包括以下几个部分:
第一部分简单介绍了人工免疫系统和邮件分类的研究状况。
第二部分介绍了人工免疫系统,论述了几种主要的免疫算法。
第三部分介绍了垃圾邮件历史及现状和常用的邮件分类方法。
第四部分介绍了基于人工免疫原理的邮件分类方法研究,着重介绍了一般基于AIS的邮件分类方法的处理流程和新设计的双层分类方法(AISDEC)的原理及设计。
第五部分介绍了邮件分类演示平台(BNUEC)的基本功能及实验部分。
最后对现有工作进行总结和展望。