基于类别特征选择与反馈学习随机森林算法的邮件过滤系统研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:weige1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对邮件过滤系统中普遍存在的维数灾难、类别主题差异和反馈信息缺失问题,提出一种基于类别特征选择与反馈学习随机森林算法的邮件过滤模型。该方法将隐含的Dirichlet模型引入到邮件的特征选择环节,在不同类型的邮件集中建立各自的生成模型,分别搜寻构成各个主题的特征信息,有效降低冗余信息和噪声数据对分类性能的影响。反馈学习随机森林算法发挥了决策树集成与反馈学习的优势,实现邮件过滤系统的自我调节,及时捕捉垃圾邮件的变化趋势。在公开的语料库CCERT和Trec06上进行测试,并与典型算法进行比较,实验结果表明所提算法的可行性和有效性。
其他文献
本文论述了器械体操学习过程中常见的害怕心理及其表现形式,并对其产生的原因进行了分析探讨,介绍了减少和消除害怕心理的措施。
近代书画大家吴昌硕以诗书画印皆擅长而享誉海内外。其书法诸体皆精,尤以石鼓文最为著名。本文结合时代背景、吴昌硕的身世、追求、以及后人的评价来分析吴昌硕的《石鼓文》
个案工作可以帮助人们解决目前的困境,重塑自我,实现自我,进而提升自我。家庭暴力对妇女的身心造成了严重的伤害,而妇女自身意识的改变,自我的增强等有助于其摆脱家庭暴力,发
众所周知,加强教师队伍的管理与建设,是提高教学质量,促进高校可持续发展的有效途径.在计算机及通讯技术高速发展的今天,以往的管理方式,已经无法满足现代化的需求.一直以来,
随着2013年6月阿里巴巴推出"余额宝",一时间互联网现金理财产品和P2P网贷呈现几何级增长的态势,金融领域成为互联网企业竞争的又一个阵地,传统银行业特别是农村商业银行面临
在1894—1895年的中日甲午战争中,美国表面声称中立,实际却偏袒日本。战前一再拒绝中、朝两国的调停请求和英国的联合调停建议,默认或怂恿日本发动战争。战争期间,美国外交官
为了更彻底地清洗网页噪音,减少网页噪音对新闻内容抽取准确率的影响,提出基于模板页的相同噪音块清洗方法和基于class属性的同类噪音块和特殊噪音块清洗方法;在此基础上,利
语义相关度计算是自然语言处理领域的研究热点。现有的以文本相似度计算代替文本相关度计算的方法存在不足之处。提出从语形相似性和组元相关性两个方面来综合度量短文本之间
在不同的文化背景下,不同的管理决策对员工的心理和行为影响各不相同,进而又影响了整个组织的绩效和发展。当前我国诸多企业采用了末位淘汰制以期提高员工绩效、保持企业活力
针对法人库服务系统建设中存在的部门间信息标准不统一、共享程度低的问题,将SOA(Service-Oriented Arch itectures)思想贯穿于法人库服务系统建设当中,设计基于SOA模型的法