论文部分内容阅读
基于机器学习的文本分类技术能够自动对给定的文本分门别类,具有广泛的应用前景,因此得到了学者们广泛的关注。文章在基于论文标题和摘要等数据的基础上,采用不同的分类方法对学术论文的学科分类进行了深入的对比研究,旨在找出适合学术论文这一短文本分类问题的最佳分类方案组合和参数组合;此外,提出一种基于分类置信度的二次过滤结构的文本分类方法,进一步提高了分类精度,采用大量的交叉实验验证了该文的思想和方法。