一种基于MapReduce的分布式文本数据过滤模型研究

来源 :信息网络安全 | 被引量 : 3次 | 上传用户:yztc_yztc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先介绍了文本过滤模型的特点以及发展状况。针对传统信息过滤处理方式无法满足现阶段海量数据环境下业务需求这一现状,该文提出了一种基于MapReduce框架的文本数据过滤模型,实现了传统的向量空间模型的分布式扩展。在实际环境中的测试表明,该模型的过滤精度和速度都较为理想,较好的满足了用户的需求。
其他文献
基于戈壁滩输电线路碎石土地基全掏挖基础试验,在戈壁滩地区全掏挖基础上拔破坏模式研究的基础上,对土体剪切面半径影响参数n、上拔剪切范围内土重等方面进行了研究分析,提出了
7月18日,公安部科技局就国家发改委产业化项目《计算机信息系统安全保护等级评估认证体系及互联网络电子身份认证管理与安全保护平台建设》(即"1110工程")在北京组织召开了验收会。公安部科技局副局长刘烁到会致辞,公安部公共信息网络安全监察局景乾元副处长简略介绍了项目的背景情况。
期刊
考虑时空效应的盾构下穿既有地铁隧道结构受力特征计算,对盾构工程风险控制研究有着重要意义。以南京地铁新建三号线区间盾构下穿既有一号线矿山法区间隧道为例,利用有限差分
根据三峡库区层状岩体高切坡的特性及分布,提出了层状岩体高切坡存在的四种主要破坏模式,即坡面风化剥蚀、坡脚侵蚀、顺向滑移、崩塌掉块。根据这四种不同的破坏模式,提出了