【摘 要】
:
近年来,随着中国手机用户数的增长,手机短消息业务得到了迅猛发展,但同时垃圾短信也以非常快的速度在增长。目前,垃圾短信过滤技术主要有黑名单过滤、关键词过滤和基于文本分
论文部分内容阅读
近年来,随着中国手机用户数的增长,手机短消息业务得到了迅猛发展,但同时垃圾短信也以非常快的速度在增长。目前,垃圾短信过滤技术主要有黑名单过滤、关键词过滤和基于文本分类的内容过滤。黑名单过滤和关键词过滤能快速的过滤垃圾短信,但其过滤的准确率不高;基于文本分类的短信过滤的准确率主要依赖于其训练样本的数量及质量,由于日常短信涉及个人的私隐,短信中心从不对外公布,现有的短信样本很少,因此单纯依靠文本分类的短信过滤其准确率也不高。同时,现有的过滤技术都采用逐条检测的方式,对于每天有大量短信息的短信中心来说,其运算量是很大的,这样会造成短信服务中心网络堵塞。因此,从现有的技术上来说,垃圾短信的过滤在准确率和效率方面仍然不能满足现实需要。本文将针对现有短信过滤技术的不足,研究有效的解决或改进的方法,同时引入新的技术与原有的过滤技术相结合,使垃圾短信过滤系统能够具有更好的过滤性能。本文所做的主要工作如下:1.研究了应用在垃圾短信过滤系统中的关键词查找算法,该算法采用WM算法的多模式匹配思想,通过预处理建立的哈希表来加快匹配速度,并且根据垃圾短信的特征,提出了用压缩存储的TRIE树来组织模式串的方法,加快了查找速度。2.分析了主要的文本分类技术,重点叙述基于最小风险的贝叶斯分类在短信过滤中的应用。3.提出用日志分析的方法来分析已经过滤的短信,提取有用的数据,更新关键词库及分类训练样本,实现系统的自我优化。4.将贝叶斯分类与新的过滤方法(包括流量检测、抽样检测、日志分析)结合,在保证短信过滤准确率的情况下,提高短信过滤效率。最后,给出整个垃圾短信过滤系统的设计与实现。
其他文献
目的 :总结膀胱全切直肠代膀胱乙状结肠腹壁造瘘围手术期的护理经验。方法 :对多发性膀胱肿瘤 10例行膀胱全切 ,直肠代膀胱乙状结肠腹壁造瘘术 ,术前做好心理护理 ,说明手术
随着项目后评价在我国对改进投资效益、提高决策方法等方面起到了重要的作用,项目过程后评价的重要性也随之得到了重视。随着我国铁路投资规模的不断扩大,迫切需要对已建成的
《俄狄浦斯王》被亚里斯多德认为是"十全十美的悲剧",对《俄狄浦斯王》主题的探讨一直是文学评论界的一个热点问题,本文认为《俄狄浦斯王》的主题是个人意志与命运之间的冲突
近年来,随着人力资源管理被企业和社会的重视,工作分析也开始成为企业所关注的问题。目前很多人对工作分析的认识还是远远不到位的,很多管理者把工作分析看作是一种负担或痛
利用多功能摩擦磨损Plint TE-92试验机对镍基高温合金GH4169、F6NM和A不锈钢以不同配副方式组成的4组摩擦副在不同载荷和转速下的摩擦系数进行研究。研究结果表明,F6NM/F6NM
目的了解河南省社区卫生服务的居民满意度,为促进其发展提供参考。方法于2014年3—4月,采用分层抽样法将鹤壁市分为新城区和老城区,在2个区中各随机抽取1家社区卫生服务中心,
目的了解老年慢性病患者的生命质量,并探讨其影响因素。方法采用整群随机抽样法,选取2013年3—12月在南京市秦淮医院进行体检的老年人1 454名。按是否患有慢性病,将其分为慢
自第一个有机半导体发光器件诞生之后,有机半导体吸引了越来越多人的关注,人们采用有机共轭聚合物制成了有机电致发光管和场效应管。如今有机半导体器件已经广泛应用于各行各
宪政是用分权制衡的方式来维护个人自由及权利的控权机制和保障机制。宗教信仰自由是公民依据内心信念,自愿地信仰宗教的自由,包括信教自由、宗教活动自由。纵观世界各国,自
从炮火硝烟的革命战争到热火朝天的社会主义建设,从任人宰割的半殖民地半封建社会到独立自主的社会主义新中国,马克思主义在理论上主导了这一次又一次的历史进程,通过一次又