基于用户反馈和增量学习的垃圾邮件识别方法

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户：heyifeizhu

【摘要】

：

为了提高垃圾邮件识别的准确度,减少识别中的错判,提出了一种交互式垃圾邮件识别方法。该方法用一组具有特定权重的规则识别垃圾邮件,规则权重分布用改进遗传算法训练得到。

【作者】

：

王鑫陈光英段海新李学农

【机构】

：

清华大学信息网络工程研究中心,清华大学信息网络工程研究中心,清华大学信息网络工程研究中心,清华大学信息网络工程研究中心北京100084,北京100084,北京100084,北京100084

【出处】

：

清华大学学报(自然科学版)

【发表日期】

：

2006年01期

【关键词】

：

模式识别电子邮件垃圾邮件识别改进遗传算法用户反馈增量学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了提高垃圾邮件识别的准确度,减少识别中的错判,提出了一种交互式垃圾邮件识别方法。该方法用一组具有特定权重的规则识别垃圾邮件,规则权重分布用改进遗传算法训练得到。增加用户与服务器间的交互,收集用户反馈的错判信息,根据反馈信息用增量学习动态调整规则权重。通过对SpamA ssass in扩展实现了该方法,并应用在邮件服务器上进行了测试。实验中在不影响垃圾邮件识别率的前提下,降低误判率约10%。实验结果表明:该方法不但能有效减少识别中的误判,而且避免了繁琐的重新训练,加快了规则权重的更新速度。 In order to improve the accuracy of spam identification and reduce the misjudgment in identification, an interactive spam identification method is proposed. The method uses a set of rules with specific weight to identify spam, and the rule weight distribution is trained by improved genetic algorithm. Increase the interaction between users and servers, collect wrong feedback information from users, and dynamically adjust rule weight with incremental learning based on feedback information. This method is implemented by extending the SpamA ssass in and is tested on the mail server. Under the premise of not affecting the recognition rate of spam, the false positive rate is reduced by about 10%. Experimental results show that this method not only can effectively reduce the misjudgment in recognition, but also avoids cumbersome retraining and accelerates the update of rule weights.

其他文献

冬季果树刮皮技术要点

在土壤封冻后到果树萌芽前刮皮为宜，甜皮重点部位是在主干及主枝中部以下的粗皮、翘皮。尤其是对已发病部位，一定要刮得彻底仔细。

期刊

刮皮技术果树冬季发病部位萌芽前土壤主枝主干

无公害化学疏花疏果剂——TMN-6

TMN-6中文名称为支链仲醇聚氧乙烯醚，英文名称为BranchedSecondaryAlcoholEthoxylates，是美国DOW化学公司开发的Tergitol系列表面活性剂的一种。pH值为5．4，浊点为36。，亲水亲油平

期刊

化学疏花疏果美国DOW化学公司无公害亲水亲油平衡值聚氧乙烯醚表面活性剂FDA认证中文名称

西安航天复合材料研究所

西安航天复合材料研究所（中国航天科技集团公司第四研究院四十三所）成立于1970年5月是中国航天领域内集研究、开发、生产为一体的专业复合材料及工艺研究所也是我国固体火箭发

期刊

中国航天科技集团公司复合材料研究所西安固体火箭发动机复合材科生产基地导弹发射筒航天领域研究院

冬枣贮藏保鲜研究进展

冬枣营养价值丰富,但易软化、腐烂,不耐贮藏,通过对冬枣的采后生理生化、影响保鲜的因素及保鲜技术进行综述,旨在为冬枣保鲜提供实践指导及理论依据。

期刊

冬枣采后保鲜技术

新媒体背景下IP产业的发展

现如今网络科技发达,新媒体的发展需要借助IP,IP的发展也离不开新媒体。新媒体的广泛运用以及高速发展让影视行业、动画行业的IP产业加速创新与创作。不断发展的新媒体,不仅

期刊

新媒体背景IP产业发展

中国石油2009年十大科技进展

1．渤海湾盆地歧口富油气凹陷整体勘探配套技术取得重要进展2．石油地质研究有效指导非洲邦戈尔盆地勘探新发现3．大庆油田三元复合驱技术取得重大进展4．松辽和准噶尔盆地火山岩气藏

期刊

科技进展中国石油数据采集记录系统三元复合驱技术完井技术勘探开发火山岩气藏准噶尔盆地

航空物探找矿有新突破

期刊

航空物探地质找矿新疆地面能谱测量

Mad2和Survivin在胃癌中的表达及其对胃癌耐药的相互调控作用

纺锤体检测点控制染色体分离的忠诚性。DNA和纺锤体损伤均能激活纺锤体检测点。人胃癌细胞纺锤体检测点普遍存在缺陷,我们前期研究表明纺锤体检测点的缺陷能增强胃癌细胞对“

学位

胃癌Mad2SurvivinATM纺锤体检测点耐药凋亡

普光高含硫气田集输管网优化

针对普光气田自身特点,以集输管网投资最小为目标,以管网各节点的流量、压力及管道的压力限制等为约束条件,建立了树状集输管网布局、管径和阀门数目全局优化数学模型,采用双

期刊

集输管网湿天然气高含硫遗传算法全局优化阀门数目gathering pipe network wet gas high H2S content gen

中国古代《史记》编印与传播效应初探

《史记》作为中国第一部纪传体通史,生动地记载了中华早期文明。它从诞生时的“谤书”到今日历久弥新的经典,经历了古代漫长的编印与传播过程。这个过程从简单的或个人的“要

期刊

《史记》司马迁三家注刊刻讲史史记戏

基于用户反馈和增量学习的垃圾邮件识别方法

其他学术论文