Web文本预处理技术探析

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:gexuefeng1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本预处理是Web数据挖掘的前提和关键,文中介绍了Web文本预处理的四个步骤,给出了TF-IDF权重计算和文本相似度计算的实现方法。
其他文献
极限编程是敏捷方法中最著名的一种基于实践的软件开发方法。文章通过对极限编程在一个校产管理系统中实际开发应用,阐述了极限编程方法在软件项目开发中的应用特点。
用电脑上网、玩游戏、看电影等应用,已经成为家庭用户最常见的日常娱乐,在不同应用环境下,PC用户在性能、节能、噪音等方面都有着不同要求,然而台式机并不能像笔记本那样自动
期刊
对于游戏玩家而言,超频依然是获得高性能最好途径,因而很多主板都内置了超频技术,特别是以超频能力著称的AMD处理器,AMD官方不仅针对芯片组进行了超频设计,同时还推出了对应
期刊
目的 探讨痰热清联合孟鲁司特钠治疗慢性阻塞性肺疾病(COPD)加重期的临床疗效。方法选择2014年10-2015年3月我院收治的COPD患者86例作为研究对象,将其随机分为观察组和对照组,