论文部分内容阅读
本文提出一种基于改进的TF-IDF和贝叶斯算法的新闻分类方法,目的是利用改进的TF-IDF算法提取新闻文本中的特征词集合,然后计算每个特征词的TF-IDF值,并将TF-IDF值形成特征向量作为贝叶斯算法的输入来实现新闻文本的分类。本文随机搜集了大量的不同类别的新闻文本进行分类实验,实验结果表明,该方法对不同类别的新闻都有较好的分类效果。