论文部分内容阅读
由于互联网的普及,以及电子邮件的廉价性,email正成为日常生活中最流行、最方便、最经济的通信手段。但是电子邮件在成为一种信息交流工具的同时,也正成为一种商业广告和网络犯罪手段。在收到对自己有用信息的同时,用户也从网上收到各种各样的广告邮件,使得用户要花费大量时间和精力来处理这些所谓的垃圾邮件(Spam or Unsolicited Bulk email);垃圾邮件的泛滥也给网络管理员和网络服务提供商ISP带来了无尽的烦恼。用户的时间、带宽和存储资源被无效占用,网络链路也因此造成拥塞,还使得不良信息被到处散发。目前已有一些比较成熟的过滤方法采用通过软件自动过滤与用户设定规则的方式,但这类软件存在着明显的不足:它需要人工设定过滤规则,这要求用户或管理员有较强的专业知识,还要求用户能随着垃圾邮件情况的变化不断调整这些规则。这些要求给人们带来了较大的工作量,而效果也不一定理想,只能过滤掉50%左右的垃圾邮件。因此,我们迫切需要一种更为有效的、更加智能化和人性化的垃圾邮件过滤技术来治理日益猖獗的垃圾邮件问题。本论文课题的主要目标是探索设计一种具体的垃圾邮件过滤系统,实现并测试该系统。研究该系统是否有效、可靠,还要注意此系统自身参数和环境参数调节对过滤性能的影响。本论文主要针对垃圾邮件发送者采用的方法,设计出一个层次化的垃圾邮件过滤系统,该系统具有高度的层次化,包括改进型分布式黑白名单,域名反向解析,以及Na?ve Bayes等过滤技术;该系统还具有可扩展性,用户可以根据自身需要增加或者减少过滤的层次和方法。虽然现在已经存在多种不同的垃圾邮件过滤技术,但是还有许多垃圾邮件的相关问题没有找到好的解决方法,这影响了过滤系统的有效性和可靠性。本论文提出的邮件过滤系统框架解决了其中的一些问题,在一定程度上提高了邮件过滤的有效性和可靠性,因此,本课题的研究是具有意义的。