基于级联方法的图像型垃圾邮件过滤系统的设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:lichlei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,垃圾邮件制造者为了躲避基于邮件文本的传统垃圾邮件过滤系统的拦截,将特定宣传目的的垃圾信息嵌入到图片中,并通过邮件的形式群发给个人和企业用户。这类邮件是一种新型的垃圾邮件,统称为图像型垃圾邮件(Image Spam)。同文本型垃圾邮件相比,图像型垃圾邮件通常含有大量的垃圾信息,如具有特定目的政治宣传信息、宗教宣传和广告推销信息等,这给个人和企业用户带来较大困扰,给正常的工作与生活带来不利的影响。图像型垃圾邮件的标识与过滤已经成为了信息安全领域的研究热点,对图像型垃圾邮件过滤技术的研究具有重要的现实意义。现有的基于邮件文本的传统垃圾邮件过滤系统不能有效的过滤图像型垃圾邮件,因此需要一个系统去高效和准确地过滤图像型垃圾邮件,来完善和补充现有的垃圾邮件过滤系统。本文的研究对象是图像型垃圾邮件中的图像,下文简称为垃圾图像。本文在分析和归纳了垃圾图像的典型特征的基础上,设计了一个递进式的、基于级联方法的并带有反馈机制的双层过滤系统,第一层采用基于垃圾图像近似匹配的过滤方法,第二层采用深度学习中的卷积神经网络方法进行图像分类,实现垃圾图像的过滤。本文的主要工作如下:首先,根据垃圾图像大多是基于模板生产和近似复制的特点,在过滤系统的第一层设计并实现了基于近似匹配的过滤模块。在这一层关键是应用合适的图像匹配算法,本文设计了一系列的模拟垃圾图像变化的过滤实验对图像局部特征描述算法进行测试,基于时间与精确度考虑,最后使用ORB算法作为该层近似匹配算法。其次,基于卷积神经网络对图像的强大的处理能力,在过滤系统的第二层设计并实现了基于深度学习的过滤模块。本文设计了卷积神经网络与支持向量机的级联模型,应用实际的垃圾图像数据库,对模型进行训练并得到分类性能良好的分类模型。最后,本文在详细分析垃圾邮件过滤系统的整体架构基础上,将近似匹配过滤模块与深度学习过滤模型进行级联并集成在现有的垃圾邮件过滤系统中。通过三个对比实验,结果表明,基于级联方法的图像型垃圾邮件过滤模块能有效提高现有垃圾邮件过滤系统对垃圾图像的处理能力,垃圾图像过滤模块可以作为垃圾邮件过滤系统的一个良好补充,系统有一定的工程应用价值。
其他文献
商业银行分行在整个银行内部控制体系中所处环节特殊,不仅具有联动性、全面性、隐蔽性和滞后性的特点,还对整个银行内部控制体系起到承上启下的作用(既是总行内部控制的执行
通过室内试验模拟沥青混合料的多次再生过程,探讨了多次再生沥青物理性质变化特征和组分迁移规律;通过马歇尔试验确定了多次再生沥青混合料的配合比,利用单轴贯入强度试验、
卫星光学遥感器在轨成像会受到颤振的影响,因此图像品质受姿态稳定度的影响很大,而高分辨率图像受到平台误差的影响更加明显。通过研究空间相机的几何模型,提出了一种从地球坐标系到空间光学遥感器坐标系之间的转换关系;分析了在轨卫星的姿态误差和运动源,并在几何模型中加入了内外方位元素特征;然后进行了空间TDICCD相机的成像仿真实验。为了在像面上模拟颤振,分别进行不同模态的颤振仿真,并且对视线范围内多模态综合
基于结构有限元和流体有限体积求解器,采用具有局部能量守恒的边界插值方法,建立了一种气动加热和结构传热松耦合数值模拟方法。对高超声速飞行器(X-34)头部进行流-固-热耦合
目的探讨口腔科门诊老年患者的心理问题,以给临床护理人员进行相应的心理干预提供参考和指导。方法针对口腔门诊老年患者出现的不同的心理问题,采用相应的心理护理干预方法 ,
H.264是一种高压缩比、高视频质量、高复杂度的新一代视频压缩标准,因为其高压缩率的特性,一些常用的水印方案无法直接运用于该视频压缩标准。提出了一种利用运动矢量的区域特性来隐藏水印信息的视频水印方案,该算法的最大特点为简单、实用,并且在隐藏水印信息的过程中还可以降低H.264编码中运动估计部分的运算复杂度。实验结果表明,通过该算法对视频图像嵌入水印后,主观上无法分别图像区别,PSNR值的波动被有效