基于用户反馈和增量学习的垃圾邮件识别方法

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:heyifeizhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高垃圾邮件识别的准确度,减少识别中的错判,提出了一种交互式垃圾邮件识别方法。该方法用一组具有特定权重的规则识别垃圾邮件,规则权重分布用改进遗传算法训练得到。增加用户与服务器间的交互,收集用户反馈的错判信息,根据反馈信息用增量学习动态调整规则权重。通过对SpamA ssass in扩展实现了该方法,并应用在邮件服务器上进行了测试。实验中在不影响垃圾邮件识别率的前提下,降低误判率约10%。实验结果表明:该方法不但能有效减少识别中的误判,而且避免了繁琐的重新训练,加快了规则权重的更新速度。 In order to improve the accuracy of spam identification and reduce the misjudgment in identification, an interactive spam identification method is proposed. The method uses a set of rules with specific weight to identify spam, and the rule weight distribution is trained by improved genetic algorithm. Increase the interaction between users and servers, collect wrong feedback information from users, and dynamically adjust rule weight with incremental learning based on feedback information. This method is implemented by extending the SpamA ssass in and is tested on the mail server. Under the premise of not affecting the recognition rate of spam, the false positive rate is reduced by about 10%. Experimental results show that this method not only can effectively reduce the misjudgment in recognition, but also avoids cumbersome retraining and accelerates the update of rule weights.
其他文献
在土壤封冻后到果树萌芽前刮皮为宜,甜皮重点部位是在主干及主枝中部以下的粗皮、翘皮。尤其是对已发病部位,一定要刮得彻底仔细。
TMN-6中文名称为支链仲醇聚氧乙烯醚,英文名称为BranchedSecondaryAlcoholEthoxylates,是美国DOW化学公司开发的Tergitol系列表面活性剂的一种。pH值为5.4,浊点为36。,亲水亲油平
西安航天复合材料研究所(中国航天科技集团公司第四研究院四十三所)成立于1970年5月是中国航天领域内集研究、开发、生产为一体的专业复合材料及工艺研究所也是我国固体火箭发
冬枣营养价值丰富,但易软化、腐烂,不耐贮藏,通过对冬枣的采后生理生化、影响保鲜的因素及保鲜技术进行综述,旨在为冬枣保鲜提供实践指导及理论依据。
现如今网络科技发达,新媒体的发展需要借助IP,IP的发展也离不开新媒体。新媒体的广泛运用以及高速发展让影视行业、动画行业的IP产业加速创新与创作。不断发展的新媒体,不仅
1.渤海湾盆地歧口富油气凹陷整体勘探配套技术取得重要进展2.石油地质研究有效指导非洲邦戈尔盆地勘探新发现3.大庆油田三元复合驱技术取得重大进展4.松辽和准噶尔盆地火山岩气藏
纺锤体检测点控制染色体分离的忠诚性。DNA和纺锤体损伤均能激活纺锤体检测点。人胃癌细胞纺锤体检测点普遍存在缺陷,我们前期研究表明纺锤体检测点的缺陷能增强胃癌细胞对“
针对普光气田自身特点,以集输管网投资最小为目标,以管网各节点的流量、压力及管道的压力限制等为约束条件,建立了树状集输管网布局、管径和阀门数目全局优化数学模型,采用双
《史记》作为中国第一部纪传体通史,生动地记载了中华早期文明。它从诞生时的“谤书”到今日历久弥新的经典,经历了古代漫长的编印与传播过程。这个过程从简单的或个人的“要