论文部分内容阅读
垃圾邮件的急剧增加已经对人们日常的电子通讯造成了越来越严重的危害。垃圾邮件不仅耗费掉宝贵的网络带宽和存储空间,并且当它们作为病毒和恶意代码的传播载体时,也对网络安全构成了巨大的威胁和危害。
首先,受自然免疫原理的启发,本文提出了一种基于免疫浓度的邮件特征构造方法。利用‘自己’和‘异己’基因库分别生成‘自己’和‘异己’浓度特征,并随后采用‘自己’和‘异己’浓度特征来构造描述邮件特征的二维特征向量。
其次,与传统的基于统计的方法不同,本文通过对代价函数的动态优化,建立了求解最优浓度特征向量的优化系统框架。通过使用一种基于免疫克隆技术的新型粒子群算法-CPSO,对代价函数动态优化并最终求得最优的浓度特征。仅有两维的免疫浓度特征向量极大的简化了分类器的设计和实现,同时也保证了泛化性能。
再次,在分类器设计方面,本文提出了基于EM-Update技术和滑动窗口技术的SVM动态分类器算法。并给出了具有不同分类准则的八种实现方式。通过使用上述技术我们提出的算法可以在不间断的方式下动态的追踪邮件内容和用户兴趣的变化。
最后,在标准数据集PU1和Ling上,我们对基于免疫浓度的特征构造方法和SVM动态分类器算法进行了大量的实验,并且与现有方法进行了全面的比较。实验结果表明本文所提出的算法在正确率、精确率、召回率和丢失率这四项指标上,取得了比现有各种方法都要出色的性能。