粒子群优化的SVM垃圾邮件过滤研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:fuiegfiusbkufbakuefg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,电子邮件作为一种方便、快捷、费用低廉的通讯方式得到了极大的普及。电子邮件在给人们工作生活带来巨大方便的同时,随之而来的垃圾邮件泛滥也使整个网络不堪重负,占用网络带宽,侵占收件人邮箱空间,耗费收件人的时间,数以万计的垃圾邮件袭击目标网站,造成被攻击网站网路堵塞,最终瘫痪的案例也时有发生。垃圾邮件泛滥降低了整个网络的运行效率,也对现实社会造成了严重危害。如何防范和过滤垃圾邮件引起了人们的极大关注,也是网络安全研究领域的热点问题之一本文针对垃圾邮件的过滤问题进行学习、研究和探讨,提出用粒子群优化的支持向量机(PSO-SVM)进行中文垃圾邮件过滤,并通过与其它如朴素贝叶斯(NB)、支持向量机(SVM)和遗传优化的支持向量机(GA-SVM)等算法进行理论上的横向比较,证明了PSO-SVM较其它常用的垃圾邮件过滤算法更适合进行中文垃圾邮件过滤,实验结果也证明了这一点。本文的内容大致可以分为四部分。首先介绍了垃圾邮件过滤研究的背景、意义、国内外研究现状以及本文的主要研究工作,并给出了各个章节的内容安排。其次,对电子邮件的基本知识进行简要的介绍,主要包括电子邮件的工作原理,电子邮件传输过程中所用到的主要协议,垃圾邮件的定义及其分类,中文电子邮件的预处理过程等。第三部分给出了三种常见的中文垃圾邮件过滤技术,包括基于IP层过滤、基于SMTP协议的过滤和基于内容的过滤。本文主要进行基于内容过滤技术的研究,给出了四种常用的基于内容垃圾邮件过滤算法。提出用PSO-SVM进行中文垃圾邮件的过滤,并且通过理论分析得出结论:PSO-SVM与NB、SVM、GA-SVM等常用的垃圾邮件过滤算法相比能够更快更准确的找到垃圾邮件。最后是本文的实验部分,给出了实验结果及其性能分析。通过比较实验结果可知:在相同的实验条件下,SVM在进行中文垃圾邮件过滤时其过滤性能指标(包括召回率、正确率、准确率和F值)较NB有所提升。经过参数优化的SVM过滤性能明显比未经参数优化的SVM有所提升。PSO-SVM的过滤性能比NB、SVM和GA-SVM等过滤算法有较大的提升,而且用粒子群来优化SVM的参数比遗传算法优化参数所需的进化代数要少,而其优化结果却更好。
其他文献
无线传感器网络具有通信能力有限、电源能量有限、计算速度和存储空间有限、传感器节点配置密集和网络拓扑结构灵活多变等缺陷,不能保证数据信息在传输中机密性,完整性,真实
近年来,虚拟化技术凭借其良好的独立性、高资源利用率和容易管理的特性备受业界关注,已经在数据中心的系统安全、负载均衡、服务器管理整合等方面得到广泛的应用。虚拟化环境
目前,汽车日趋复杂与异构,通常涉及机械、电子、通信、液压、控制等多个学科领域。完整地设计跨领域复杂系统需要对系统进行多领域建模,传统汽车开发方法难以控制系统的复杂
头部姿态估计作为计算机视觉的重要问题,在人脸识别与身份认证系统、智能安全监控系统、视觉注意力监测系统、辅助安全驾驶系统、视频会议系统、人机交互等众多领域中具有广泛
随着博客、论坛、微博等web2.0应用的蓬勃发展,大量用户评论随之产生。通过对这些评论的分析,可以了解大众舆论对于某一事物的看法和一段时间内公众的情绪变化,因此迅速获取和处
车载自组网(Vehicularadhocnetworks,VANETs)为车辆之间的通信提供了一个平台,不仅可以提高道路的通行效率,改善旅客的乘车环境,而且可以最大限度地避免交通事故的发生。但与此同
随着软件系统的规模增长,其复杂程度越来越高。尽管函数式程序的执行效率低,但为解决这类问题提供了一个优美独特的框架。本文通过研究函数式语言Haskell语言的类型推理的语
随着嵌入式技术及无线通信技术的发展,将家庭中各种通讯设备、家用电器、家庭安防设备等利用现代计算机技术、现代通信技术自动控制技术实现家庭内部各种信息的采集、处理、传
Web服务是一些自描述、松耦合、模块化、自包含、平台独立的应用程序,可以发布到互联网上,供需求者发现和调用。然而,单一的Web服务提供的功能有限,不能满足复杂的业务需求,
OPC规范作为工控领域数据交换接口的标准,为硬件制造商与软件开发者提供了一座很好的桥梁。目前应用的传统OPC COM服务器依赖于Microsoft平台,不能满足企业互操作性以及跨平台